python:爬虫-selenium,BeautifulSoup,urllib( 二 )

< int(startIn) + int(numIn):ep = intChangeToStr(counter)downPath = path.replace("001.mp3",ep + ".mp3")flag = download(counter,downPath)if not flag:downEPList.append(counter)counter += 1if len(downEPList) > 0:#没下载成功的集数,这里会重新进行下载 。print("有未下载成功的集数,将重新开始下载:")path = getVideoUrl(u'https://www.ysts8.com/play_14810_49_1_1.html')for each in downEPList:ep = intChangeToStr(each)downPath = path.replace("001.mp3",ep + ".mp3")download(each,downPath)driver.quit() #最终销毁退出浏览器
【python:爬虫-selenium,BeautifulSoup,urllib】最后说下用打包,网上也有很多资料,我看了很多,感觉最后其实忒简单 。因为我是在上开发的,所以这就大大便利的很多 。
首先安装,也是在的工具--环境窗口查找,然后pip安装的 。它最终安装的路径,即可执行文件.exe在vs的安装路径下:X:\\\\\ 。要在cmd中用
pyinstaller -F
命令,就得把这路径配置到环境变量中 。配好之后cmd中直接: -F xxxxx\test.py 就可以了 。最终生成exe文件在的dist文件夹中,至于保存的路径cmd的执行结果中会显示出来 。
最后要执行这个exe,得把这个代码中用的其他资源复制到dist文件夹中,比如说img文件 。这里就用到了.exe,所以就把它复制到dist文件夹下就可以了 。
运行结果:
这个下载算是同步下载的,之前用C#做的是异步下载 。不过相对解析网页和爬取的速度来说,很明显能看出是的快很多 。