1import requests 2artibody_url = 'http://news.sina.com.cn/o/2017-04-18/doc-ifyeimzx6745829.shtml' 3artibody_res = requests.get(artibody_url) 4artibody_res.encoding = 'utf-8' 5print(artibody_res.text) <!DOCTYPE html> <!-- [ published at 2017-04-18 04:22:23 ] --> <!-- LLTJ_MT:name ="环球网" --> <html> <head> <meta …
阅读更多龙云尧个人博客,转载请注明出处 初步了解网络爬虫的工具使用和代码编写 学习地址见网易云课堂《Python网络实战》 前言 工具 1.Python编辑工具 实验中使用到的Python工具为Anaconda,工具的安装参照Anaconda使用总结(Linux下)以及Python科学计算的瑞士军刀——Anaconda 安装与配置(windows下)相关教程。 在视频教学过程中,讲师也会有一点安装指导。 初学过程中推荐使用Jupyter notebook工具在浏览器中编辑,这样可以每次只执行几行函数,而不用一次从头到尾执行完毕。调试完成以后,可以在Spyder中一次运行。 Jupyter notebook工具中,ctrl+enter表示执行 …
阅读更多