炉石传说爬取全部卡牌

科技前沿 • 2025-02-20 17:52 • 阅读 38

炉石传说爬取全部卡牌之前我 30 行爬了英雄联盟全部皮肤这次爬炉石稍稍麻烦点 50 行网页分析首先我们分析炉石官方网站卡牌工具 https hs blizzard cn cards 通过源代码和 Network 分析发现返回的卡牌是用 post 请求的 json 文件请求数据为 cardClass hunter 卡的类型

大家好，我是讯享网，很高兴认识大家。

网页分析

请求数据为： cardClass: hunter #卡的类型：职业 keywords: standard: 1 t: 45 #时间串 cardSet: #费用 p: 1#页码（每页8张卡）

导入全部所需包

讯享网import urllib.request import urllib.parse import jsonpath import json import os import time

请求并解析全部js

cardClasses=["druid","hunter","mage","paladin","priest","rogue","shaman","warlock","warrior","neutral"] lushi_urls = 'https://hs.blizzard.cn/action/cards/query' headers = { 
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36' } for cardClass in cardClasses: if not os.path.exists(cardClass): os.mkdir(cardClass) print("开始爬{}了".format(cardClass)) for p in range(1,60): print(p) try: lushi_urls = 'https://hs.blizzard.cn/action/cards/query' headers = { 
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36' } data = { 
    'cost': '', 'cardClass': cardClass, 'keywords': '', 'standard': '1', 't': int(time.time()), 'cardSet': '', 'p': p } data = urllib.parse.urlencode(data).encode("utf-8") request = urllib.request.Request(url=lushi_urls, headers=headers, data=data) response = urllib.request.urlopen(request) content = response.read().decode('utf-8') jsondict = json.loads(content) card_names = jsonpath.jsonpath(jsondict, '$..cards..name') card_pics = jsonpath.jsonpath(jsondict, '$..cards..pic')

创建目录并保存文件

讯享网for i in range(len(card_names)): card_path=cardClass+"/"+card_names[i]+".png" urllib.request.urlretrieve(url=card_pics[i], filename=card_path)

完整全代码

import urllib.request import urllib.parse import jsonpath import json import os import time print("努力成为爬虫大神") timestart=time.time() cardClasses=["druid","hunter","mage","paladin","priest","rogue","shaman","warlock","warrior","neutral"] lushi_urls = 'https://hs.blizzard.cn/action/cards/query' headers = { 
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36' } for cardClass in cardClasses: if not os.path.exists(cardClass): os.mkdir(cardClass) print("开始爬{}了".format(cardClass)) for p in range(1,60): print(p) try: lushi_urls = 'https://hs.blizzard.cn/action/cards/query' headers = { 
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36' } data = { 
    'cost': '', 'cardClass': cardClass, 'keywords': '', 'standard': '1', 't': int(time.time()), 'cardSet': '', 'p': p } data = urllib.parse.urlencode(data).encode("utf-8") request = urllib.request.Request(url=lushi_urls, headers=headers, data=data) response = urllib.request.urlopen(request) content = response.read().decode('utf-8') jsondict = json.loads(content) card_names = jsonpath.jsonpath(jsondict, '$..cards..name') card_pics = jsonpath.jsonpath(jsondict, '$..cards..pic') for i in range(len(card_names)): card_path=cardClass+"/"+card_names[i]+".png" urllib.request.urlretrieve(url=card_pics[i], filename=card_path) except: continue timeend=time.time() print("一共用时：{}秒".format(timeend-timestart))

成果

小讯

【图像】焦距与景深的关系

上一篇 2025-04-09 10:31

《深入浅出WPF》——模板学习

下一篇 2025-01-11 08:31

【图像】焦距与景深的关系 1735982645
游戏鼠标的dpi测试软件,普通鼠标怎么调dpi_怎么测鼠标dpi-win7之家 1735982645
世界公认的7大数学难题，没有一个能看明白，你看得懂吗？ 1735982644
java io流_java组件HuTool日期IO流相关工具的使用 1735982643
2025年XNA游戏开发之2D游戏 1735982642
2025年恶意软件样本行为分析——灰鸽子和大白鲨 1735982641
2025年纯C++版俄罗斯方块 1735982640
【UI设计No7】单页 1735982639
2025年O形橡胶密封圈设计标准 1735982638
《深入浅出WPF》——模板学习 1735982647
2025年Elasticsearch ILM 索引生命周期管理常见坑及避坑指南 1735982648
XMB介绍 1735982649
2025年POE技术 1735982650
2048的核心算法的初步实现 1735982652
2025年写信中“敬启者”与“敬启”的区别 1735982653
2025年程序员需要哪些基本能力？ 1735982656
2的31次方和3的21次方哪个大，123组成最大的数是多少？ 1735982658
2025年Jdon框架(JdonFramework)应用系统 1735982658

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/18794.html