MARC状态:审校 文献类型:中文图书 浏览次数:35
- 题名/责任者:
- Python爬虫实战基础/李科均著
- 出版发行项:
- 北京:清华大学出版社,2023.06
- ISBN及定价:
- 978-7-302-62656-5/CNY109.00
- 载体形态项:
- X, 414页;26cm
- 个人责任者:
- 李科均 著
- 学科主题:
- 程序语言-程序设计
- 非控制主题词:
- Python
- 中图法分类号:
- TP312
- 提要文摘附注:
- 本书介绍Python网络爬虫开发从业者必备的基础能力体系。本书以网络爬虫为核心, 涉及大大小小数十个能力体系。本书前半部分介绍爬虫开发的基础内容, 包括爬虫开发必备的环境搭建、开发中常用工具的使用方法和技巧、网页的构成原理和网页信息提取的方法、常用数据库的使用方法和应用场景, 如通过Redis内置的布隆过滤器实现大规模URI地址的去重任务。本书后半部分主要讲解网络爬虫开发所需的必要能力, 包括网络通信的底层原理、背后涉及的互联网协议标准及如何对这些协议进行分析并加以利用, 使用bocker部署网络爬虫所需的环境和爬虫项目的打包部署, 使用网络爬虫的核心请求requests实现与服务器的通信和交互, 使用自动化神器Selenium对复杂的爬虫需求进行快速实现, 以及网络爬虫的多任务开发, 重点是通过多线程和多进程来提高爬虫效率。基本上每个章节都有一个或多个项目案例, 读者通过本书的学习, 可以达到网络爬虫从业者的基本能力水准。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 校区—馆藏地 | 书刊状态 | 还书位置 |
TP312/370 | B00811004 | 西校区—自然书库(西校区) | 可借 | 自然书库(西校区) | |
TP312/370 | B00811005 | 西校区—自然书库(西校区) | 可借 | 自然书库(西校区) |
显示全部馆藏信息