会员
网络数据采集技术:Java网络爬虫实战
更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结
书籍简介
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
同类热门书
最新上架
- 会员《Python数据分析从入门到精通(第2版)》从数据分析初学者角度出发,以通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析程序开发应掌握的各方面技术。全书共分21章,包括数据分析基础、搭建数据分析开发环境、NumPy模块之数组计算、Pandas模块基础、Pandas模块之数据的读取、Pandas模块之数据的处理、Pandas模块之数据的清洗、数据的计算与格式化、数据统计及透视计算机16.7万字
- 会员《SpringBoot从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细讲解了使用SpringBoot进行程序开发需要掌握的知识。全书分为18章,内容包括SpringBoot概述及其环境搭建,第一个SpringBoot程序,SpringBoot基础,配置SpringBoot项目,处理HTTP请求,过滤器、拦截器与监听器,Service层,日志的操作,JUnit单元计算机14.2万字
- 会员《HBase从入门到实战》系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。本书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java计算机5.2万字
- 会员本书系统讲解了音视频流媒体及播放器的基础理论及案例应用。本书为FFmpeg音视频流媒体系列丛书的第五本,前4本分别是《FFmpeg入门详细讲解——音视频原理及应用》《FFmpeg入门详细讲解——流媒体直播原理及应用》《FFmpeg入门详细讲解——命令行及音视频特效原理及应用》《FFmpeg入门详细讲解——SDK二次开发及直播美颜原理及应用》。计算机13.8万字
- 会员在智能手机快速发展的背景下,越来越多的人开始喜爱使用各种App。《AppUI设计案例实操》主要介绍了手机AppUI(用户界面)设计思路和制作过程。《AppUI设计案例实操》适合想要快速掌握UI设计制作方法的人员,也适合广大平面设计爱好者和相关行业从业人员,同时,也可作为高等院校的教学辅导用书。计算机6.5万字
- 会员全书分为3篇。第1篇介绍编译器基础知识,包括中间表示,重点介绍SSA、数据流分析、支配、循环等知识,此外还介绍了LLVM的后端描述语言TableGen。第二篇剖析分LLVM代码生成,其中对代码生成的每一步骤都有提及,着重介绍指令选择、指令调度、寄存器分配和编译优化。同时还以BPF后端为例总结了如何基于LLVM开发一款新后端的编译器。第三篇附录主要总结了LLVM代码生成过程中使用的IR、BPF指令集计算机22.5万字
- 会员《Vue.js3.x+ElementPlus从入门到精通:视频教学版》通过对Vue.js(简称Vue)的示例和综合案例的介绍与演练,使读者快速掌握Vue.js3.x框架的用法,提高Web前端的实战开发能力。《Vue.js3.x+ElementPlus从入门到精通:视频教学版》共分15章,内容包括Vue.js3.x的基本概念、Vue.js模板应用、组件的方法和计算属性、表单的双向绑定、处计算机6.4万字
- 会员本书以Python3.10.7为平台,以实际应用为背景,通过概述+算法+经典应用的形式,深入浅出地介绍Python数据分析的相关知识。全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用计算机10.1万字