如何用Python爬取小红书

技术如何用Python爬取小红书如何用Python爬取小红书,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。小红书首先,我们打开之前大家配置好的charles

相信很多没有经验的人对于如何用Python爬小红书都是一窍不通的。因此,本文总结了出现问题的原因和解决方法,希望大家可以通过这篇文章来解决这个问题。

小红书

首先让我们打开大家之前配置的charles。

让我们简单的抓取一下小红书小程序(注意这是一个小程序,不是一个app)。

我没有选择app的原因是小红书的App有点难。我参考了网上的一些想法,选择了一个小程序。

1、通过charles抓包对小程序进行分析

如何用Python爬取小红书

按照我的路径,你可以发现列表中的数据已经被我们抓住了。

但你觉得结束了吗?

不不不

如何用Python爬取小红书

通过这个包捕获,我们知道数据可以通过这个api接口获得。

但是当我们把所有的爬虫写好的时候,我们会发现头中有两个很难的参数。

授权”和“x符号”

这两样东西是不断变化的,不知道从哪弄来的。

因此

2、使用mitmproxy来进行抓包

事实上,通过查尔斯抢包,我们已经清楚了整体的抢包思路。

也就是说,获取’ authorization ‘和’ x-sign ‘两个参数,然后对url发出get请求。

这里使用的mitmproxy和查尔斯几乎一样,是一个抓包工具。

但是mitmproxy可以用Python执行。

这样舒服多了。

举个简单的例子。

defrequest(流):

Print(flow.request.headers)在mitmproxy中为我们提供了这样一个方法,这样我们就可以通过request对象截取请求头中的url、cookies、主机、方法、端口、方案等属性。

这不正是我们想要的吗?

我们直接截取参数‘授权’和‘x符号’。

然后填写标题。

整个完成了。

以上就是我们整个爬行的想法。让我们解释一下如何编写代码。

事实上,代码并不难写。

首先,我们必须拦截搜索api的流,这样我们就可以从中获取信息。

如果‘https://www.xiaohongshu.com/fe _ api/牛蒡/微信/v2/search/notes’流入. request.url3360我们判断流的请求中是否存在搜索API的url。

来决定我们需要抓取的请求。

authorization=re . find all(‘ authorization ‘,)。*?'(.*?)’ \)’,字符串(flow.request.headers))[0]

x_sign=re.findall(‘x-sign ‘,)。*?'(.*?)’ \)’,字符串(flow.request.headers))[0]

Url=flow.request.url通过上面的代码,我们可以得到三个最关键的参数,然后我们将共同解析json。

最后,我们可以得到我们想要的数据。

如何用Python爬取小红书

如果你想得到一个单独的数据,你可以得到文章id并获取它。

‘ https://www . xiaohongshu.com/discovery/item/’

如何用Python爬取小红书

此页眉需要有cookies。当你随意访问一个网站时,你可以得到饼干。目前看来是固定的。

最后,您可以将数据放入csv。

总结

其实小红书爬虫的爬行并不是特别难,关键在于思维和使用的方法。

看完以上,你掌握了用Python爬小红书的方法了吗?如果您想学习更多技能或了解更多相关内容,请关注行业资讯频道。感谢阅读!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/49011.html

(0)

相关推荐

  • 解析JVM内存监控流程的示例分析

    技术解析JVM内存监控流程的示例分析解析JVM内存监控流程的示例分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。你对JVM内存监控是否熟悉

    攻略 2021年10月23日
  • 对象Temessagejs脚本的简单编写方法是什么?

    技术TE对象message js脚本简单写法是什么这篇文章将为大家详细讲解有关TE对象message js脚本简单写法是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

    攻略 2021年12月13日
  • makefile怎么使用(makefile文件使用方法)

    技术makefile怎么使用这篇文章主要讲解了“makefile怎么使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“makefile怎么使用”吧!概述什么是makefi

    攻略 2021年12月21日
  • 能歌善舞类似的成语,描述女子能歌善舞的成语

    技术能歌善舞类似的成语,描述女子能歌善舞的成语【滴粉搓酥】:粉:脂粉;搓:搓摩;酥:润滑柔美。脸上薄施脂粉能歌善舞类似的成语,用手搓摩润滑。形容女子肌肤柔嫩细腻。【婀娜妩媚】:婀娜:轻盈柔美;妩媚:姿态美好。轻盈柔美的姿

    生活 2021年10月30日
  • 抖音刷赞推广平台,抖音粉丝增加方法?

    技术抖音刷赞推广平台,抖音粉丝增加方法?自从短视频火爆以来就产生了一个新的产业,那就是刷数据了,刷粉原理呢就是在一些兼职平台下单,让平台注册的用户帮你去刷这些数据,当然了这是比较高端的方式,其实市面上还是有很多打着真人粉

    测评 2021年10月20日
  • 什么是bootstrap网格

    技术什么是bootstrap网格本篇内容主要讲解“什么是bootstrap网格”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“什么是bootstrap网格”吧!

    攻略 2021年10月29日