走过路过不要错过，这里有一份爬虫课程，你要不要考虑把他收入囊中？

　　SmileSky 是 NVDA 插件——NV宝盒的作者，这是一款集合了验证码识别、 OCR 识别、 QQ增强支持和天气查询等功能的神奇插件，用过的都说好！最近 SmileSky 制作了一套爬虫的付费课程，为答谢SmileSky 对NVDA 中文社区的贡献，本站代发此信息，敢兴趣的可以了解一下！

　　大家好，我是开发NV宝盒的作者，这是最近我闲暇之余录制的一期爬虫付费课程，课程表在下方，有想了解这方面东西的朋友可以和我联系。

课程内容介绍

第一讲什么是爬虫？爬虫解决什么问题？抓包工具（fiddler）的下载、安装与配置。python环境的下载与安装。
第二讲认识tcp/ip与http协议。认识html(超文本标记语言）。http协议是如何规定传输过程的？使用fiddler抓取一个数据包来分析请求和响应。如何使用fiddler对某个数据进行replay模拟发起请求？
第三讲解答学员遇到fiddler的一些难题。如何使用python解释器环境进行调试？如何在记事本中编写python脚本并运行？如何用python发起一个http请求？如何把抓包工具获取的头部信息转换成python的字典？
第四讲解答学员们遇到的问题。详解python变量、函数、缩进。python的字符串类型和字符串处理。如何使用文本切片获取我们想要的信息？
第五讲 Content-Type的说明。什么是json，json的特点，如何使用？fiddler的数据筛选小技巧。json字串与python字典的互转。解析百度语音json接口。
第六讲什么是正规表达式？常用的元字符、特殊字符、限定符的讲解。如何编写搜索和匹配手机号的正规表达式？什么是贪婪和非贪婪模式？使用正规表达式搜索百度知道网页的轮播问答，并用python写入文件。
第七讲实战爬取斗罗小说站点。浏览器层面简单分析，代码层面的深入分析。编写搜索章节列表的正规表达式模板。处理文本乱码、处理网页连接失败的问题。python的字符串格式化和循环语句。把小说章节列表写入文件。
第八讲对第六讲的百度知道的练手任务进行批改。改进第六讲的代码，获取目录列表中每一章节的内容。python使用group方法访问搜索结果的带有括号的子表达式（也叫分组）。批量把章节内容写入文件并输出爬取进度。
第九讲配置fiddler抓取手机数据包。手机爬虫的注意事项。演示抓取手机百度的网页。音频爬虫实战，爬取包图网的首页音效。将音效文件写入到磁盘。
第十讲微软Edge浏览器的开发者工具的简单使用。火狐浏览器的开发者工具的简单使用。真枪实战，给大家演示商业单子——爬取每个城市的优惠券。使用开发者工具层级查看html更直观。python的return语句的注意事项。对前面所有课程的知识点进行综合运用。说说接取商业单子如何闭坑。全套课程完！

　　课程内容不多，也不难，考虑到了零基础的朋友，只要你认真听讲座，绝对能学会。

联系方式

讲师QQ： 1721503872 课程咨询 QQ 群：897104390

走过路过不要错过，这里有一份爬虫课程，你要不要考虑把他收入囊中？

课程内容介绍

联系方式

添加新评论

友情链接

其它