爬虫遇到字体动态加密?这样来解决

让我们回忆一下破解大众点评的步骤:
1、下载网站font字体包
2、将font字体包中导入观察得到乱码与数字的关系
3、前缀替换,并将字体名字和它们所对应的乱码构成一个字典
4、根据字典将加密的数字替换
然而,右键刷新页面,字体文件一直在变:
为了探究一下,我们随便下载3个字体文件,对比看看能不能发现其中的规律 。
分别重命名为A.woff,B.woff,C.woff,将他们依次导入中打开
其中A字体的1对应的是【】
B字体的1对应的是【】
C字体的1对应的是【】

爬虫遇到字体动态加密?这样来解决

文章插图
(.*?)
.*?releasetime">(.*?)
.*?'+ 'realtime".*?stonefont">(.*?).*?'+ 'total-boxoffice".*?stonefont">(.*?).*?', re.S)items = re.findall(pattern, html)data = http://www.kingceram.com/post/pd.DataFrame(items,columns=['index','image','title','star','releasetime','realtime','total-boxoffice'])data['star']=data['star'].str[3:]data['releasetime']=data['releasetime'].str[5:]print(data)return data
【爬虫遇到字体动态加密?这样来解决】运行一下 。
get 。
本文相关爬虫代码,仅供学习交流: