可我们想要的是 。
继续找规律 。
这是第一页的网址 。
这是第二页的地址 。
我们发现第一页和第二页的区别只在于start的值 。
那我们就可以通过修改start的值加上for循环来达到目的 。
最终代码
from bs4 import BeautifulSoupimport requestsheaders={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.42"}for num in range(0,250,25):response=requests.get(f"https://movie.douban.com/top250?start={num}",headers=headers)# print(response)# print(response.status_code)html=response.textsoup=BeautifulSoup(html,"html.parser")all_titles=soup.findAll("span",attrs={"class":"title"})for title in all_titles:title_string=title.stringif '/' not in title_string:print(title_string)
爬虫虽好 , 不要贪杯哦 , 不然 。。。
后记
这篇文章是看这个视频做的笔记 。【10-实战课】从源码获取豆瓣电影哔哩哔哩??????
这个up主讲的巨好 , 建议大家都看看 。
- 中秋节为什么要吃柚子呢 中秋节要吃什么食物
- 无法自拔是什么意思 无法自拔的意思是什么
- 铛~铛~铛【我身边的戴尔企业级解决方案】
- 地面坡度较大用什么仪器
- 【独立版】基于ThinkPHP框架开发的智慧表单事务流程CRM系统
- 【Hybrid App】关于Hybrid App技术解决方案的选择
- 一 [Python3][django] 后端框架django学习
- 【Hybrid App】Hybrid App开发实战
- 资源分享 | JavaScript Web应用开发【Nicolas Bevacq
- ant a-checkbox多选框无法选中