MARC状态:订购 文献类型:中文图书 浏览次数:38
- 题名/责任者:
- 网络爬虫开发/纪娜,张笑主编
- 出版发行项:
- 上海:上海交通大学出版社,2023.08
- ISBN及定价:
- 978-7-313-29326-8/CNY49.00
- 载体形态项:
- 188页;26cm
- 个人责任者:
- 纪娜 主编
- 个人责任者:
- 张笑 主编
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.561
- 提要文摘附注:
- 本书的基本框架分为八个项目,项目一、初识爬虫,包括认识爬虫,以及网站robots协议和反爬虫技术三个学习任务;项目二、网页基础,包括HTTP原理、网页基础知识、会话和COOKIE机制、谷歌浏览器开发者工具的使用等四个学习任务;项目三、Python基础,包括搭建python开发环境、python基础语法等六个任务。项目四、常用爬取库,包括认识HTTP请求、urllib网络请求库基础、初识requests网络请求库三个学习任务;项目五、常用解析库,包括网页解析基础、XPath解析网页、BS解析网页、PyQuery解析库四个学习任务。项目六、数据存储,包括数据存储在文本文件、实战案例篇;关系型数据库介绍、Mysq数据库的安装与启九个学习任务;项目七、动态网页数据爬取,包括动态网页的含义、Selenium的安装和使用案例、AJAX的概念和AJAX的分析方法、AJAX分析与爬取实战四个学习任务。高级篇:项目八Scrapy爬虫框架,包括Scrapy安装与使用、案例分析两个学习任务。
- 使用对象附注:
- 本书适合等院校的大数据技术专业学生使用,也适合对爬虫技术感兴趣的学生选用
全部MARC细节信息>>



