Python怎样爬取上万条大众点评数据

技术Python怎样爬取上万条大众点评数据今天就跟大家聊聊有关Python怎样爬取上万条大众点评数据,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。中国的快餐市场竞

今天就和大家聊聊Python是如何抓取成千上万条公众评论数据的,可能很多人都不太懂。为了让大家更好地了解,边肖为大家总结了以下内容,希望大家能从这篇文章中有所收获。

Python怎样爬取上万条大众点评数据

中国快餐市场的竞争一直很激烈,江湖上有各种品牌的各种神奇故事,你是知道的。

一线城市最多的快餐品牌是哪家?,沙县小吃真的是中国餐饮巨头吗?,每一家肯德基边上都有一家麦当劳是不是真的?,星巴克VS瑞幸咖啡,谁的热度更高?本文利用Python抓取数万条商业数据的公开评论,告诉你答案!

01

一线城市快餐品牌店铺数量大PK

首先,我们来看看沙县小吃、兰州拉面、星巴克、瑞幸咖啡、肯德基、麦当劳的商铺数量在一线城市的分布情况。

Python怎样爬取上万条大众点评数据

从上面的堆叠图可以看出,沙县小吃的市场在沪、广、深三地最大,而北京的店铺在兰州拉.最多,而在四个一线城市中,沙县小吃加上兰州和拉面是占有了70%以上,的市场,他们是当之无愧的餐饮巨头!

除了沙县小吃和兰州拉面,我们继续看看麦当劳和肯德基这两家西式快餐店。我们可以看到,这两家快餐店的店铺数量在四个城市基本相同。的确,有肯德基的地方就有麦当劳不是谣言!

最后,如果我们看看星巴克和瑞幸,我们可以发现,在上海,仅星巴克的门店数量就超过了其他任何一个城市的两家咖啡店的总和!看来魔都星巴克门店数量全球第一不是在吹牛!

02

肯德基 VS 麦当劳,真的那么近吗?

江湖传闻有肯德基的地方就有麦当劳,是真的吗?我们爬上一线城市评论搜索肯德基和麦当劳关键字下的全部搜索页面,把地址可视化如下。

Python怎样爬取上万条大众点评数据

Python怎样爬取上万条大众点评数据

我们可以看到,肯德基和麦当劳的店铺位置重叠度在任何一个城市都是很高的,甚至在上海的崇明岛上,两者是一起开的。

的店铺!

并且当我们调用geopy通过经纬度对两家店铺计算距离时发现,在每个城市肯德基与麦当劳之间的最短距离是0km!所以当你看到一家肯德基店时,大胆的往前走,一定能再找到一家麦当劳Python怎样爬取上万条大众点评数据

而其他品牌,比如上海市的瑞幸咖啡就没有插手崇明区,而在广州市兰州拉面占领更多市中心店铺,外围区域更多的则是沙县小吃Python怎样爬取上万条大众点评数据


     
03

     

     

沙县小吃 VS 兰州拉面,谁的价格更低?

沙县小吃和兰州拉面,作为市场占比最高的快餐品牌,与其低廉的价格离不开关系,那么在一线城市中,他们的价格是怎样的?我们来看看

Python怎样爬取上万条大众点评数据

Python怎样爬取上万条大众点评数据

以北京为例,我们可以看到,虽然是市场占有第一第二的快餐店铺,但是其价格差距却是明显的,沙县小吃基本上能控制在20元以内,而兰州拉面大多数店铺人均消费在20—50元,在北京一碗兰州拉面可以整两顿沙县小吃了,难怪三和大神最爱沙县大酒店Python怎样爬取上万条大众点评数据

进一步,我们将全部一线城市的快餐品牌均价进行可视化。

Python怎样爬取上万条大众点评数据
 

从图中我们可以看出,不论哪个快餐,北京的店铺均价基本是最高的,而广州的价格大多是最低的,同为一线城市,部分快餐品牌的人均价格竟然相差一倍(兰州拉面),是北京的兰州拉面中的牛肉更厚吗?

另外值得关注的是,星巴克的均价是这六个品牌中最高的一家,而作为其竞争对手的瑞幸咖啡价格则低了近一半,当然看到我瑞幸咖啡卡包中的优惠券还是能够理解的,不过一杯星巴克约等于三份沙县小吃,你怎么选?


     
04

     

     

星巴克 VS 瑞幸咖啡,谁的热度更高?

从上一节的结果来看,星巴克的均价比瑞幸高出近一倍,那么是贵一点星巴克受欢迎还是优惠券多多的瑞幸咖啡更得人心,我们以店铺下面的评价数量作为店铺热度,对数据进行可视化Python怎样爬取上万条大众点评数据

从上面的散点图中我们可以看到,在四个一线城市中,大多数瑞幸咖啡的店铺评价数量集中在0-500,而星巴克店铺的评价数量整体略高一点,所以并不是价格高就没有人喝,当然在很多情况下,去星巴克不是为了喝咖啡。

看完上述内容,你们对Python怎样爬取上万条大众点评数据有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/49012.html

(0)

相关推荐

  • 玩具(Toy)

    技术玩具(Toy) 玩具(Toy)清华OJ——数据结构与算法实验(中国石油大学)玩具(Toy)Description
    ZC God is best at logical reasoning. One d

    礼包 2021年11月27日
  • MySQL 5.6中新增特性、不推荐使用的功能以及废弃的功能有哪些

    技术MySQL 5.6中新增特性、不推荐使用的功能以及废弃的功能有哪些这篇文章给大家分享的是有关MySQL 5.6中新增特性、不推荐使用的功能以及废弃的功能有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随

    攻略 2021年11月3日
  • 153. 寻找旋转排序数组中的最小值

    技术153. 寻找旋转排序数组中的最小值 153. 寻找旋转排序数组中的最小值描述
    已知一个长度为 n 的数组,预先按照升序排列,经由 1 到 n 次 旋转 后,得到输入数组。例如,原数组 nums =

    礼包 2021年11月30日
  • TensorRT——INT8推理

    技术TensorRT——INT8推理 TensorRT——INT8推理原理为什么要使用INT8推理:更高的吞吐量/处理的fps提高以及更低的内存占用(8-bit vs 32-bit)
    将FP32模型转换

    礼包 2021年11月12日
  • PHP函数和魔术常量有哪些

    技术PHP函数和魔术常量有哪些这篇文章主要讲解了“PHP函数和魔术常量有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“PHP函数和魔术常量有哪些”吧!PHP 函数PH

    攻略 2021年11月30日
  • keep it up许慧欣(keepitmac官网)

    技术Keep It for Mac专业笔记工具怎么用本篇文章为大家展示了Keep It for Mac专业笔记工具怎么用,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Mac笔记办

    攻略 2021年12月24日