2025年新的生活 & 新的开始

新的生活 & 新的开始本号在 10 月因她而创 没想到 11 月她就离我而去 前言 11 月是一个伤感的月份 又悲又离 故想要保留与她有关的缩影 就像快照 在此爬取我当时上的一切状态 创号信息 好友信息 信息 希望能将这些连带着我对她的记忆 封存在计算机冰冷的二进制中

大家好,我是讯享网,很高兴认识大家。

本号在10月因她而创,没想到11月她就离我而去…

前言

11月是一个伤感的月份,又悲又离,故想要保留与她有关的缩影,就像快照,在此爬取我当时上的一切状态:创号信息、好友信息、信息,希望能将这些连带着我对她的记忆,封存在计算机冰冷的二进制中…
(PS:本期博文不发布任何代码,需要者可以私信交流一下。)

第一部分:创号时长爬取

20周年个人轨迹
这是一个手机访问页面,电脑上只会出现用手机扫描二维码,这算是整个爬取过程中最特别的一处了,这里需要Fiddler或其他抓包工具来调试访问该页面,使用Fiddler抓包工具的方法参见手把手带你用Python爬取反爬策略的网站这篇文章,要想抓取手机上的包,需要在打开手机所连接wifi的代理,设置为电脑IP和Fiddler上打开的端口:
在这里插入图片描述
讯享网

在这里插入图片描述
然后手机上返回保存。这样手机上浏览过程就会被电脑上的Fiddler捕捉到。
很快就确定了必须的请求头参数:HostAcceptQ-UA2Q-GUIDQ-QIMEIQIMEI36Q-AuthUser-Agent,带上cookies就能get到手机上显示的网页源代码了!
不过总不能每次爬取都抓包手**,这样直接记录数据得了。所以经过我的多次尝试,从各大官网cookies尝试,最终确定此处的cookies可以用的cookies代替。
正确返回后,不要着急解析整个页面,在我视察整个页面之后,我发现存在“window.syncData”数据于页面其中一个script标签中,这就是数据源,这可比解析整个页面简单又方便多了~
解析出来是一个数据字典,其中
“register_time”就是自身的注册时间戳,registerTime_date是时间戳代表的具体日期时间,用今天减去就再除以60 * 60 * 24能知道自己创号多少天了。里面还有其他数据,比如_days就是注册多少天,_lvl就是等级,vec_packets就是好友分组,very_close_friend就是亲密度排行第一的好友,feed_count就是说说数量,msg_count就是留言数量。当然里面还有其他数据,有兴趣的可以慢慢研究。

第二部分:所有好友爬取

这一部分只需要不断去空间好友部分尝试、观察,总能发现一些特殊的请求地址与请求参数,这里就不多做介绍,附上一些可能用到的爬取接口地址,按需爬取即可:

好友统计

URL = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/potential/potentialpy_homepage.cgi?uin=XXX博主XXX&page=1&num=50&rd=0.00372&fupdate=1&g_tk=&g_tk=" url = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/potential/potentialpy_homepage.cgi" parameters = """ uin: XXX博主XXX page: 1 num: 50 rd: 0.00372 fupdate: 1 g_tk:  """ 

讯享网

亲密度关系

讯享网URL2 = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/tfriend/friend_ship_manager.cgi?uin=XXX博主XXX&do=1&rd=0.40268&fupdate=1&clean=1&g_tk=&g_tk=" url2 = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/tfriend/friend_ship_manager.cgi" parameters2 = """ uin: XXX博主XXX do: 1 rd: 0.40268 fupdate: 1 clean: 1 g_tk:  """ 

最多前200位好友,多了也不必在乎;special_flag为特别关心。

好友分组信息

URL3 = "https://h5.qzone..com/proxy/domain/base.qzone..com/cgi-bin/right/get_entryright.cgi?uin=XXX博主XXX&rd=0.&ver=1&fupdate=1&g_tk=" url3 = "https://h5.qzone..com/proxy/domain/base.qzone..com/cgi-bin/right/get_entryright.cgi" parameters3 = """ uin: XXX博主XXX rd: 0. ver: 1 fupdate: 1 g_tk:  """ 

所有好友信息

讯享网URL4 = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/tfriend/friend_show_friends.cgi?uin=XXX博主XXX&follow_flag=0&groupface_flag=0&fupdate=1&g_tk=&g_tk=" url4 = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/tfriend/friend_show_friends.cgi" parameters4 = """ uin: XXX博主XXX follow_flag: 0 groupface_flag: 0 fupdate: 1 g_tk:  """ 

单独好友详细信息

URL5 = "https://h5.qzone..com/proxy/domain/ic2.qzone..com/cgi-bin/feeds/feeds2_html_friendship_pav?uin=XXX博主XXX&end_time=1370329982&count=10&useutf8=1&outputhtmlfeed=1&query=1&offset=0&frienduin=2717057684&applist=2_4_202_311&total=10&instance=0&g_tk=1898469524"
url5 = "https://h5.qzone..com/proxy/domain/ic2.qzone..com/cgi-bin/feeds/feeds2_html_friendship_pav"
parameters5 = """
uin: XXX博主XXX
end_time: 1370329982
count: 10
useutf8: 1
outputhtmlfeed: 1
query: 1
offset: 0
frienduin: XXX好友XXX
applist: 2_4_202_311
total: 10
instance: 0
g_tk: 1898469524
"""

可获取双向亲密度、加好友日期、加好友天数、共有的群等信息。

单独好友亲密度信息

讯享网URL6 = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/friendship/cgi_friendship?activeuin=XXX博主XXX&passiveuin=XXX好友XXX&situation=1&isCalendar=1&g_tk=&g_tk=" url6 = "https://user.qzone..com/proxy/domain/r.qzone..com/cgi-bin/friendship/cgi_friendship" parameters6 = """ activeuin: XXX博主XXX passiveuin:  situation: 1 isCalendar: 1 g_tk:  """ 

addFriendTime为加好友的时间,可以计算相距天数【相差 + 1】;intimacyScore为亲密度

背景音乐概览

URL7 = "https://u.y..com/cgi-bin/musicu.fcg?data={%22songInfo%22:{%22module%22:%22track_info.UniformRuleCtrlServer%22,%22method%22:%22GetTrackInfo%22,%22param%22:{%22ids%22:[],%22types%22:[2]}}}&platform=y&g_tk=" url7 = "https://u.y..com/cgi-bin/musicu.fcg" parameters7 = """ data: {"songInfo":{"module":"track_info.UniformRuleCtrlServer","method":"GetTrackInfo","param":{"ids":[],"types":[2]}}} platform: y g_tk:  """ 

背景音乐详情

讯享网URL8 = "https://u.y..com/cgi-bin/musicu.fcg?data={%22url_mid%22:{%22module%22:%22vkey.GetVkeyServer%22,%22method%22:%22CgiGetVkey%22,%22param%22:{%22guid%22:%8%22,%22songmid%22:[%22002juNGg4JZchu%22],%22songtype%22:[0],%22uin%22:%22XXX博主XXX%22,%22platform%22:%2223%22}}}&platform=y&g_tk=" url8 = "https://u.y..com/cgi-bin/musicu.fcg" parameters8 = """ data: {"url_mid":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"","songmid":["002juNGg4JZchu"],"songtype":[0],"uin":"XXX博主XXX","platform":"23"}}} platform: y g_tk:  """ 

第三部分:所有爬取

这一部分比爬取好友还容易看出来,毕竟组成元素就那几个:群列表群成员,最多群分为创建的群管理的群加入的群,不过这可以从群成员分类中分析出具体的分类,以下是我从官网发现的一些接口:

好友列表

url1 = "https://qun..com/cgi-bin/qun_mgr/get_friend_list" parameters1 = """ bkn:  """ 

群列表

讯享网url2 = "https://qun..com/cgi-bin/qun_mgr/get_group_list" parameters2 = """ bkn:  """ 

群成员

url3 = "https://qun..com/cgi-bin/qun_mgr/search_group_members" parameters3 = """ gc:  st: 0 end: 20 sort: 0 bkn:  """ 

gc参数为群号码
end 最多比 st 大 40,即每次最多获取41个,序号从0开始,0为创建者。
这个接口还包含了排序方案(sort参数):

讯享网sort 参数表:(0为没有任何排序) Q龄⬆【9】 入群时间⬆【11】 等级(记分)⬆【15】 最后发言⬆【17】 Q龄⬇【8】 入群时间⬇【10】 等级(记分)⬇【14】 最后发言⬇【16】 条件筛选:(左0为0,右0无限大,可以灵活调整) 性别(是女):g: 【0】【1】 Q龄(年):qage: 【0|1】【1|3】【3-5】【5-7】【7|0】 入群时长(月):join_time: 【0|1】【1|3】【3-6】【6-12】【12|0】 等级(levelname):lv: 【1】【2】【3】【4】【5】【6】 【101】【102】【103】【104】【105】【106】【107】【108】【109】 【110】【111】【112】【113】【114】【115】【116】【117】【118】 【197】【198】【199】【10】【11】【12】【13】【14】【15】 最后发言(月):last_speak_time: 【0|1】【1|3】【3-6】【6-12】【12|0】 
小讯
上一篇 2025-02-09 09:27
下一篇 2025-01-14 21:42

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/48425.html