Hadoop 3.x大数据开发实战在线阅读
会员

Hadoop 3.x大数据开发实战

张伟洋
开会员,本书免费读 >

计算机网络数据库17.7万字

更新时间:2023-07-17 19:30:24 最新章节:16.14 动手练习

立即阅读
加书架
下载
听书

书籍简介

本书以Hadoop3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解VMware中CentOS7操作系统的安装;第2章讲解操作系统集群环境的配置;第3~16章讲解Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过案例演示了各个框架的实际应用。读者即使没有任何大数据基础,通过阅读本书,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。本书通俗易懂,内容丰富,适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读,也可作为培训机构和大专院校大数据专业课程的教学用书。
品牌:清华大学
上架时间:2022-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

张伟洋
主页

最新上架

  • 会员
    本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。
    张平文 邱泽奇编著计算机14.5万字
  • 会员
    本书共5篇,分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1-3章),主要针对初学者,从零开始,系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4-6章),介绍了PowerBI数据的整理操作、表格中行/列数据的管理,以及PowerBI数据的高级处理、M函数的使
    凤凰高新教育编著计算机0字
  • 会员
    《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
    刘伟计算机0字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。
    袁昕编著计算机8.5万字
  • 会员
    本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,
    赵明渊 唐明伟主编计算机12万字
  • 会员
    本教材共介绍7个项目,项目1为云数据中心认知,主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计,主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型,主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云
    戴经国 何丰 王国滨 郭炳宇 姜善永计算机12.1万字
  • 会员
    本书共8章,第1章介绍新媒体数据分析的基础知识;第2章介绍各种新媒体数据分析指标;第3章介绍新媒体数据的采集;第4章介绍新媒体数据处理;第5章介绍新媒体数据分析的思维和方法;第6章介绍新媒体数据可视化;第7章介绍不同新媒体平台的数据分析方法和实战技能;第8章介绍新媒体数据分析报告的制作。
    赵春红计算机9.2万字
  • 会员
    本书本书基于业务问题,就如何搭建分析框架,厘清分析思路,按照标准分析步骤对数据进行怡当的预处理,选择合适的分析方法和分析模型,使用恰当的分析工具对数据进行分析,以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解,帮助业务专家做出合适的业务判断,制定准确的业务策略。
    傅一行计算机13万字

同类书籍最近更新

  • 会员
    本书围绕Kubernetes云原生数据基础设施,介绍了如何通过Kubernetes管理数据存储,如何通过Helm和Operator在Kubernetes上自动部署和管理数据库,阐述了数据流式传输和数据分析的过程,探讨了在机器学习及其他新兴用例中如何使用Kubernetes云原生数据等。本书不仅深入阐述了云原生基础设施的发展历程和处理方式,而且分门别类地为每个场景提供了可以直接运行的示例代码,以便读
    (美)Jeff Carpenter(杰夫·卡彭特)等数据库16.3万字
  • 会员
    这是一本从背景、技术、产业、政策等多个维度深度解读如何实现数据要素安全流通的专业指导书。来自40余所高校、科研机构、企业的超100位业界专家参与编撰,来自中科院、公共大数据国家重点实验室、南京航空航天大学、阿里巴巴、腾讯等单位的10余位知名专家亲自指导。本书理论和实践兼备。书中囊括了数据可信确权、数据资产化、数据安全保障三大领域技术方案,从核心产业、基础设施、咨询服务三个维度划分数据要素安全流通
    华东江苏大数据交易中心组编数据库14.4万字
  • 会员
    本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。首篇从历史与系统的角度介绍数据隐私与数据治理的基础,后三篇分别侧重大规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,
    孟小峰等编著数据库12.6万字
  • 会员
    随着医学研究和信息技术的快速发展,多元数据分析方法广泛应用于医学各个领域。R是一款优秀的开源软件,有着实用的统计计算与可视化功能。本书使用R语言,结合精选的医学实例介绍常用多元统计分析方法。统计分析方法只有在实际应用中才能得到直接、生动的验证。本书强调实战和应用,尽量淡化统计公式的推导和计算过程。通过本书的学习,读者能熟练使用R语言及相关包实现多元统计计算,还能更深入地理解多元数据分析方法。本书可
    赵军 戴静毅编著数据库7.4万字
  • 会员
    本书不仅是一本业务数智化体系的科普书,还是作者多年在真实业务场景下进行数智化实践的经验总结。本书系统总结了一套完整的数智化解决方案——3M数智化体系。全书共包括11章,第1~3章主要对数字化和数智化进行介绍;第4~8章围绕3M数智化体系展开,详细说明了业务数智化的适用范围和准备工作、整体构思、思想、落地方法和落地产品;第9~11章介绍了内容行业、O2O行业、生产制造业的数智化实践,以案例形式进行实
    高远数据库18.5万字
  • 会员
    本书基于流行稳定版Flink1.13进行讲解,从Flink数据处理思想开始讲起,带领读者深入理解Flink的基本架构,进而由浅入深结合具体案例进行讲解,详细剖析了Flink中DataStreamAPI的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐释。同时,本书还对实际开发常用的FlinkSQL、CEP等高层级API进行了细致讲解,以电商网站中的实际应用为场景,提供
    尚硅谷教育编著数据库19.9万字