大数据爬虫应用场景(大数据爬虫分析系统)

技术大数据爬虫安装的示例分析这篇文章主要介绍大数据爬虫安装的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!爬虫安装前准备工作:大数据平台安装完成、zookeeper、redis、elast

本文主要介绍大数据爬虫安装的实例分析,非常详细,具有一定的参考价值。感兴趣的朋友一定要看完!

爬虫安装前准备:大数据平台安装完成,zookeeper、redis、elasticsearch、mysql等组件安装启动成功。

1.修改爬虫安装配置文件(最好离线修改后再上传到平台)

大数据爬虫安装的示例分析

大数据爬虫安装的示例分析

2.修改crawler \ dkcrw \ jdbc.properties配置文件(默认情况下只能修改图片中的内容)

大数据爬虫安装的示例分析

Hbase.zookeeper.quorum填写的地址应在DKM监控平台上查看:

大数据爬虫安装的示例分析

Redis相关配置见以下界面:

大数据爬虫安装的示例分析

3.将crawler \ dkc rw \ to \ crawler \ dkc rw-Tomcat-7 . 0 . 56 \ web apps \ root \ web-INF \ class下修改后的jdbc.properties配置文件替换为(有一个未更改的直接替换)

大数据爬虫安装的示例分析

修改后,将修改后的爬虫文件按成压缩文件。

4.上传平台主节点并解压(这里我就不介绍怎么上传了。在本例中,它被上传到根目录,安装包可以上传到任何目录以选择根目录)。

大数据爬虫安装的示例分析

拉开…的拉链

解压缩命令。解压唱完之后,还会多一个cuawler的文件夹。

大数据爬虫安装的示例分析

使用cd crawler命令进入crawler文件夹。

大数据爬虫安装的示例分析

使用mysql -uroot -p123456 numysql.sql命令添加numysql.sql数据库。

大数据爬虫安装的示例分析

5.分发爬网程序文件

大数据爬虫安装的示例分析

每个节点都需要有一个dkcrw文件,dkcrw-tomcat-7.0.56文件只能放在一个节点上,不能放在主节点上(选举放在从节点上)

命令:

scp -r

{您可以填写多个要分发的文件名,如果不在要分发文件的目录中,请添加一个路径} {服务器的ip或分发名称:的路径}

例如:

cd /opt/dkh

scp -r dkcrw dk2:/opt/dkh/

scp-r dkc rw dkc rw-Tomcat-7 . 0 . 56/dk 2:/opt/dkh/

大数据爬虫安装的示例分析

6.在分发dkcrw-tomcat-7.0.56文件的节点上为文件添加权限。

命令:

chmod-R 755 {需要许可的文件等。}

例如:

cd /opt/dkh

chmod-R 755 dk rwd kcrw-Tomcat-7 . 0 . 56/

大数据爬虫安装的示例分析

7.启动爬虫界面。

命令:

CD/opt/dkh/dkc rw-Tomcat-7 . 0 . 56/bin/。/startup.sh

大数据爬虫安装的示例分析

界面启动后,在浏览器中输入启动界面节点的IP,打开爬虫界面,查看启动是否成功(默认为账号密码)。

大数据爬虫安装的示例分析

8.启动每个节点的dkcrw.jar。

命令:

主节点操作

cd /opt/dkh/dkcrw/

nohup java -jar dkcrw.jar主dkcrw.log 21

从节点运行

cd /opt/dkh/dkcrw/

nohup java -jar dkcrw.jar从属dkcrw.log 21

注意:可以先用前台启动爬虫,确保爬虫正确。

前台启动命令Java-jar dk rw . jar主/从

以上就是《大数据爬虫安装实例分析》一文的全部内容,感谢阅读!希望分享的内容对大家有所帮助。更多相关知识,请关注行业资讯频道!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/153429.html

(0)

相关推荐

  • 如何使用Xtrabackup备份MySQL数据库

    技术如何使用Xtrabackup备份MySQL数据库这篇文章将为大家详细讲解有关如何使用Xtrabackup备份MySQL数据库,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。本文则演示

    攻略 2021年10月27日
  • 垂耳兔为什么不吉利,养垂耳兔要注意什么问题

    技术垂耳兔为什么不吉利,养垂耳兔要注意什么问题我养的就是垂耳兔,说要注意什么的,我其实还真没特别注意,我养了两年,到现在一点儿病没有生过,平时都吃兔粮,但是兔粮营养成分不太跟的上,建议不要单一的吃兔粮,所以我后面加了各种

    生活 2021年10月22日
  • jquery如何清除兄弟元素

    技术jquery如何清除兄弟元素这篇文章主要介绍“jquery如何清除兄弟元素”,在日常操作中,相信很多人在jquery如何清除兄弟元素问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”jqu

    攻略 2021年11月19日
  • 视觉皮层的架构

    技术视觉皮层的架构 视觉皮层的架构视觉皮层的架构
    卷积神经网络(CNN)起源于对大脑的视觉皮层的研究,从20世纪80年代起被用于图像识别。在过去几年中,由于计算机计算能力的提高、可训练数据数量的增加,以

    礼包 2021年11月14日
  • 游说的读音,一直想收个高级的游说之舌的巨蜥

    技术游说的读音,一直想收个高级的游说之舌的巨蜥我们华山有把如意以下所有的技能都研发出来的帮派,想体验游说来华山,呵呵现在的问道是罩子和如意圈的天下.光把这三种研究完就很困难了游说的读音,谁还愿意花精力,金钱去研究游说之舌

    生活 2021年10月22日
  • Redis五种数据类型的底层实现

    技术Redis五种数据类型的底层实现 Redis五种数据类型的底层实现简介
    Redis的五大数据类型也称五大数据对象;前面介绍过6大数据结构,Redis并没有直接使用这些结构来实现键值对数据库,而是使

    礼包 2021年11月11日