python爬虫设置User

读取网页常用以下两个方式:
from .
【python爬虫设置User】

python爬虫设置User

文章插图
使用read()方法,使用text属性即可 。
解析使用
from bs4
soup=(, ‘lxml’)
但是,当启动程序打开一个URL时,如果不设置,服务器获取不到的浏览器类型、操作系统、硬件平台等信息,无法得知发送这个请求的是浏览器,往往判定这是非正常的访问,如程序,则可能会出现
python爬虫设置User

文章插图
: HTTP Error 403:
因此,F12打开开发者工具,选择,搜索User-Agent,找到对应的信息,复制下来,设置给属性,这样就可以顺利访问了 。
把这个字符串赋值给即可 。
最后,在请求访问时就可以获取正常的网页内容解析了 。