会员
网络爬虫开发
更新时间:2023-12-27 11:38:27 最新章节:参考文献
书籍简介
本书共有八个项目,围绕网络爬虫三部曲“爬取—解析—存储”较为全面地介绍关于不同场景下利用Python爬取网络数据的基础知识和方法,让读者通过编写简单的静态爬虫和动态爬虫,使用Scrapy爬虫框架完成对爬虫理论和实践技能的学习。内容分为基础知识篇、中阶知识篇和实战篇。项目一至项目三介绍爬虫的基本概念、网页基础知识和Python基本语法等;项目四和项目五利用实例演示介绍有关爬取库、解析库等爬虫中阶知识;项目六至项目八则是实战篇,主要介绍数据存储的实例和利用动态网页爬取数据的综合案例,再次完整展现爬虫三部曲“爬取—解析—存储”,以及Scrapy爬虫框架的概念和实施。本书面向对网络爬虫技术感兴趣的读者,介绍了使用Python语言编写爬虫的各种技巧和方法,可供大数据技术等相关专业的学生参考使用,也可作为大数据技术爱好者的自学用书。
上架时间:2023-11-01 00:00:00
出版社:上海交通大学出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
纪娜 张笑主编
同类热门书
最新上架
- 会员建设创新型国家,核心是要坚持守正创新,增强自主创新的能力。创新引领,方法先行。苏联科学家阿奇舒勒投入毕生精力,致力于创新研究。他率领团队创建了一种由解决技术问题、实现技术创新的各种方法组成的理论体系——TRIZ。长期以来,国家科技部等有关部委多次明确指出要推进TRIZ等国际先进技术创新方法与中国本土需求融合……特别是推动TRIZ中成熟方法的培训……本书从创新思维与创新方法的学习出发,面向创新三师(教材教辅20.4万字