走过路过不要错过,这里有一份爬虫课程,你要不要考虑把他收入囊中?

  SmileSky 是 NVDA 插件——NV宝盒的作者,这是一款集合了验证码识别、 OCR 识别、 QQ增强支持和天气查询等功能的神奇插件,用过的都说好!最近 SmileSky 制作了一套爬虫的付费课程,为答谢SmileSky 对NVDA 中文社区的贡献,本站代发此信息,敢兴趣的可以了解一下!

  大家好,我是开发NV宝盒的作者,这是最近我闲暇之余录制的一期爬虫付费课程,课程表在下方,有想了解这方面东西的朋友可以和我联系。

课程内容介绍

  • 第一讲 什么是爬虫?爬虫解决什么问题?抓包工具(fiddler)的下载、安装与配置。python环境的下载与安装。
  • 第二讲 认识tcp/ip与http协议。认识html(超文本标记语言)。http协议是如何规定传输过程的?使用fiddler抓取一个数据包来分析请求和响应。如何使用fiddler对某个数据进行replay模拟发起请求?
  • 第三讲 解答学员遇到fiddler的一些难题。如何使用python解释器环境进行调试?如何在记事本中编写python脚本并运行?如何用python发起一个http请求?如何把抓包工具获取的头部信息转换成python的字典?
  • 第四讲 解答学员们遇到的问题。详解python变量、函数、缩进。python的字符串类型和字符串处理。如何使用文本切片获取我们想要的信息?
  • 第五讲 Content-Type的说明。什么是json,json的特点,如何使用?fiddler的数据筛选小技巧。json字串与python字典的互转。解析百度语音json接口。
  • 第六讲 什么是正规表达式?常用的元字符、特殊字符、限定符的讲解。如何编写搜索和匹配手机号的正规表达式?什么是贪婪和非贪婪模式?使用正规表达式搜索百度知道网页的轮播问答,并用python写入文件。
  • 第七讲 实战爬取斗罗小说站点。浏览器层面简单分析,代码层面的深入分析。编写搜索章节列表的正规表达式模板。处理文本乱码、处理网页连接失败的问题。python的字符串格式化和循环语句。把小说章节列表写入文件。
  • 第八讲 对第六讲的百度知道的练手任务进行批改。改进第六讲的代码,获取目录列表中每一章节的内容。python使用group方法访问搜索结果的带有括号的子表达式(也叫分组)。批量把章节内容写入文件并输出爬取进度。
  • 第九讲 配置fiddler抓取手机数据包。手机爬虫的注意事项。演示抓取手机百度的网页。音频爬虫实战,爬取包图网的首页音效。将音效文件写入到磁盘。
  • 第十讲 微软Edge浏览器的开发者工具的简单使用。火狐浏览器的开发者工具的简单使用。真枪实战,给大家演示商业单子——爬取每个城市的优惠券。使用开发者工具层级查看html更直观。python的return语句的注意事项。对前面所有课程的知识点进行综合运用。说说接取商业单子如何闭坑。全套课程完!

  课程内容不多,也不难,考虑到了零基础的朋友,只要你认真听讲座,绝对能学会。

联系方式

讲师QQ: 1721503872
课程咨询 QQ 群:897104390

标签: none

添加新评论