会员
Hadoop大数据分析技术
更新时间:2023-07-17 19:54:51 最新章节:11.3.5 数据可视化开发
书籍简介
伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。
品牌:清华大学
上架时间:2022-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
迟殿委 陈鹏程主编
同类热门书
最新上架
- 会员本书主要讲解了搭建一个企业级数据仓库项目的全过程,从项目需求入手,逐步讲解项目架构的设计、技术框架的选型、数据仓库项目的理论基础。接着分别讲解了大数据的数据采集、数据计算、数据仓库分层、全流程调度和指标结果可视化。本书涉及的数据仓库的数据源更加丰富、更加贴近实际开发,各技术框架的版本也进行了全面升级,数据仓库搭建过程的思路分析更加详细,并配了更多思路讲解图,更有利于读者理解。本书IT互联网程序员、计算机9.6万字
- 会员本书为UiPath的入门工具书。第1~3章介绍RPA与UiPath的基础知识;第4~5章依次介绍流程自动化基础知识与流程搭建的方法论,建议没有相关技术背景的读者详细阅读;第6~8章是UiPath流程开发的关键章,建议读者通读并跟练,便于加深记忆,熟练掌握相关知识,其中的关键知识可以根据章节索引,在实际开发时按需查阅;第9~10章介绍更深层次的云UiPathOrchestrator和机器人企业框架计算机11.2万字
- 会员本书是一本C#10的技术指南,在上一版的基础上进行了全面更新,围绕概念和用例进行组织,系统、全面、细致地讲解了C#10从基础知识到各种高级特性的命令、语法和用法。本书首先介绍C#和.NET,第2—4章详细介绍C#语言的语法、类型和变量。其余各章则涵盖.NET6基础类库的功能,包括LINQ、XML、集合、并发、I/O和联网、内存管理、反射、动态编程、属性、加密和原生互操作性等主题。第5章和第6计算机38.2万字
- 会员本书旨在介绍RISC-V体系结构的设计和实现。本书首先介绍RISC-V体系结构基础知识、实验环境搭建、基础指令集、函数调用规范与栈,然后讲解GNU汇编器、链接器与链接脚本、内嵌汇编代码,接着讨论RISC-V体系结构中的异常处理、中断处理与中断控制器、内存管理、高速缓存、缓存一致性、TLB管理、原子操作、内存屏障指令、合理使用内存屏障指令、与操作系统相关的内容、可伸缩矢量计算与优化,最后阐述RISC计算机26.2万字
- 会员本书基于Python语言介绍自动化测试的基本概念和技术,旨在帮助读者了解和掌握自动化测试的实现方法。本书覆盖Python基本语法、自动化测试框架、测试用例的设计方法、集成测试的自动化等重要知识,并通过实际案例演示如何使用Python编写自动化测试脚本。本书适合测试人员和开发人员阅读。计算机6.5万字
- 会员本书提供了关于适应度函数、自动化架构治理和演进式数据的技术、知识和技巧。本书分为三个部分:第一部分包括定义演进式架构机制的章节——介绍团队如何使用技术和工具来构建适应度函数、部署管道以及其他管理和演进软件项目的机制;第二部分包括围绕耦合、复用和其他相关结构考虑因素的架构风格和设计原则,以帮助读者实现清晰的长期演进;第三部分探讨了第一部分中介绍的工程实践与第二部分中的结构考虑因素的交叉点。计算机12.8万字
- 会员openGauss数据库是华为公司在多年数据库领域研发经验基础上开发的数据库产品,为企业级场景需求而设计。本书由浅入深地介绍了openGauss数据库的开发过程,主要内容包括openGauss数据库的安装和配置、体系结构和主要运行机制、GUC参数、用户管理和审计、数据类型、表和索引、SQL基础、常用函数、过程化SQL程序设计,以及数据库的备份与恢复等。本书通过实战帮助读者深入理解openGauss计算机9.5万字
同类书籍最近更新
- 会员本书注重理论与实践紧密结合,系统介绍算法设计方法、分析技巧和C++编程实战。作者本着“易理解,重实用”的指导思想,结合多年的教学经验,以算法设计策略为主线,沿着“算法思想—算法设计—构造实例—算法描述—算法分析—C++实战”的思路组织学习内容,共包括算法及基础知识、贪心法、分治法、动态规划、搜索法、随机化算法、线性规划问题与网络流、数论算法及计算几何算法和NP完全理论等9章内容。程序设计16.9万字