当前位置:首页 > 网络黑客 > 正文内容

趣头条登录(趣头条可不可以用QQ登录)

访客3年前 (2021-09-27)网络黑客752

摄影:产品经理

几乎半价,我去了我通常要排队很长时间的餐馆

有一个词叫“March crawler”,意思是有同学来毕业,需要收集数据写毕业论文,于是在网上随便找了几个教程,稍微了解了一下请求甚至urllib和正则表达式,然后开始从网上写爬虫抓取数据。这些爬虫几乎不做任何事情来隐藏自己。他们不改IP,不设报头,不限速。他们很容易被有反爬的网站屏蔽,也很容易对没有反爬的小网站造成流量压力。

后来不知道看了哪篇文章,知道需要使用代理IP,修改UserAgent。因此,他们实际上只在标题中设置了UserAgent,而没有其他。你给他指出来,他还振振有词的说:你看,我这样就能爬到数据上,表头其他项目都没用。

真的是这样吗?

让我们做一个实验。首先,使用Chrome访问http://httpbin.org/headers可以显示您当前的标题。运行效果如下图所示:

然后,使用没有设置头的请求来请求这个URL,运行效果如下图所示:

最后,我们只设置一个用户代理来查看效果:

可以看出,仅仅设置一个用户代理和浏览器访问的标题之间仍然有许多不同。少了很多东西。网站只需要检查这些缺失的条目,然后就可以确定你是用程序发起的请求,还是用浏览器发送的请求。

先说微信网页的问题。很多人通过Python使用wxpy或itchat等第三方库来控制自己的微信号,从而实现了很多自动化操作。但不久之后,我举报自己被限制登录网络版微信,以为自己的行为被微信发现了,比如一秒钟发了几十条消息,或者同时回复了几个人的消息。

但我想说的是,你高估了自己,我们也不用费事去微信找你。它可以直接检查标题。

让我们看看wxpy的源代码,其中涉及到网络请求:

Wxpy基于it hat进行二次开发,登录功能通过it hat实现。让我们看看网络请求在itchat中发起的位置:

自核心是一个请求会话,如下图所示:

看到了吗?在这两个库中,它们只将UserAgent放在头中,而不放在其他字段中。所以在你登录的那一刻,微信已经知道你的账号不是用浏览器登录的!

因此,那些使用wxpy或itchat并被限制登录微信网络版的人,不要怀疑你受到了这两个库的伤害。这两个库涉及到网络请求的相关代码,是一个学了两三天爬虫的人写的。

如果你用这两个库,你会和你的微信号同归于尽。

不仅仅是这两个库,我们来看看很多人使用的Python弹幕包,就更夸张了。在获取宇都信息时,我们直接使用请求来请求URL,甚至没有设置标头,如下图所示:

这纯粹是找死的行为。

现在大网站的机器行为对抗团队,通常会把检测爬虫和禁爬虫分开。因为经过多次反爬虫策略,意外伤害是不可避免的。为了尽可能降低意外伤害率,在检查爬虫时会对请求的可疑性进行打分。当您怀疑有爬虫行为时,会在您的请求中添加一些分数。有些行为得分高,有些行为得分低。当你的总分达到一定水平,再调用被禁进程。

由于HTTP是无状态的,如果你想爬的网站不需要登录,经常换IP可能对你有用(阿布云的代理池就是这样被污染的)。

但是对于需要登录的微信来说,你所有的可疑行为的点数都会和你的账号直接相关。所以,一开始你用wxpy登录微信可能是可以的。此时,你的可疑分数还不够高。可能有一些旧浏览器的标题缺少了很多项目。但你已经在嫌疑人名单上了。一旦你有其他可疑行为,并且可疑评分持续上升,当微信可以100%确定你是使用自动程序登录微信web版时,自然会禁止你。

Python学习交流群

为了让大家即时交流学习更多,我们建立了Python学习交流群。想加入群可以加下面的小助手微信,他会把大家拉进群里~

扫描二维码推送至手机访问。

版权声明:本文由黑客接单发布,如需转载请注明出处。

本文链接:http://therlest.com/71260.html

分享给朋友:

“趣头条登录(趣头条可不可以用QQ登录)” 的相关文章

华流年京东618怎么个便宜法

京东618年中大促作为京东活动力度最大的一个购物节,自然是受到很多人关注的,有些小伙伴一早就想好要在京东618上面买什么东西了,还有些小伙伴连今年京东618怎么个便宜法都不知道,下面就由百思特小编来给大家说说吧! 2020京东618便宜多少...

我老公老是让他家的亲戚来我家,我该怎么办?请各位帮我想想办法,我

我老公老是让他家的亲戚来我家,我该怎么办?请各位帮我想想办法,我 请各位帮我想想办法,开网店怎么找女装货源唔爱神起助您成就财富人生,想做微商?想开实体店?想开淘宝店?什么才是你创业的最重要步骤?货源!想在微商卖童装母婴用品纸尿裤女装,开童装女装店铺,你去哪里找最好的货源?如何找童装女装一手货源呢?...

为什么反复烧开的水会有毒?

为什么反复烧开的水会有毒? 千滚水就是在炉上沸腾了一夜或很长时间的水,还有电热水器中反复煮沸的水。这种水因煮过久,水中不挥发性物质,如钙、镁等重金属成分和亚硝酸盐因浓缩后含量很高。久饮这种水,会干扰人的胃肠功能,出现暂时腹泻、腹胀;有毒的亚硝酸盐还会造成机体缺氧,严重者会昏迷惊厥,甚至死亡。 蒸...

威海海景房价格 - 威海银滩海景房崩盘

他们都觉得环境空气很好,很高兴,较为不银滩习惯。大多数房子都是海景房有装修的,最好有私家车。 我家刚在威海石岛买了海景房但是前几天看新闻,我在09年买了房子,今年夏天在乳山住了十来天,质量怎样比较宽泛,央视关于海景房的报道,建议您到威海市区看看,这个要看你考虑哪个方面,每个楼盘都会有区别。 在海边,...

崔鹏(足球)个人资料简介(简历及图片)

崔鹏(足球)人物概况 本页面提供了崔鹏(足球)个人资料简介(简历及图片),崔鹏(足球)是谁?崔鹏(足球)个人简介资料完整设计了网页求职找工作编辑个人简历作品所需要的崔鹏(足球)网站常用模板元素,不保证崔鹏(足球)人物数据真实,任何问题请联系管理员调整。 崔鹏(足球)图片 崔鹏(足球)个人资料简...

蓖麻油生产设备价格 - 亩产蓖麻过千公斤的种植基地

亩产可到300多斤,价格冲上30000元/吨.国际市场更具优势,可再生型绿色油品资源。目前蓖麻产品不但国内需要,支援国家飞机专用油,蓖麻籽产量一般每亩200-250公斤。 蓖麻亩产以前过千在300公斤左右,均有一定种植面积。纺纱和好;含有蓖麻毒素蛋白的538,云南、山东、蓖麻子含油率高达40-70。...

评论列表

冢渊酒颂
2年前 (2022-08-02)

说微信网页的问题。很多人通过Python使用wxpy或itchat等第三方库来控制自己的微信号,从而实现了很多自动化操作。但不久之后,我举报自己被限制登录网络版微信,以为自己的行为被微信发现了,比如一秒钟发

忿咬晴枙
2年前 (2022-08-01)

摄影:产品经理几乎半价,我去了我通常要排队很长时间的餐馆有一个词叫“March crawler”,意思是有同学来毕业,需要收集数据写毕业论文,于是在网上随便找了几个教程,稍微了解了一下请求甚至urllib和正则表达式,然后开始从

语酌柠木
2年前 (2022-08-02)

库涉及到网络请求的相关代码,是一个学了两三天爬虫的人写的。如果你用这两个库,你会和你的微信号同归于尽。不仅仅是这两个库,我们来看看很多人使用的Python弹幕包,就更夸张了。在获取宇都信息时,我们直接使用请求来请求URL,甚

晴枙珞棠
2年前 (2022-08-01)

和你的账号直接相关。所以,一开始你用wxpy登录微信可能是可以的。此时,你的可疑分数还不够高。可能有一些旧浏览器的标题缺少了很多项目。但你已经在嫌疑人名单上了。一旦你有其他可疑行为,并且可疑评分持续上升,当微信

辞眸鹿鸢
2年前 (2022-08-01)

这些爬虫几乎不做任何事情来隐藏自己。他们不改IP,不设报头,不限速。他们很容易被有反爬的网站屏蔽,也很容易对没有反爬的小网站造成流量压力。后来不知道看了哪篇文章,知道需要使用代理IP,修改UserAgent。因此,他们实际上只在标题中设置了User

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。