前言

在线教育,即互联网远程线上学习,指的是用户通过互联网传播知识和学习知识的一种方法。在线教育市场拥有多个细分领域,包括学前教育、K12教育(基础教育)、高等教育、留学教育、职业培训、语言教育等,其中K12教育、职业培训和语言教育占据了主要地位,市场占比也最高。近年来,居民教育消费意愿有显著提升,体现为中国家长对于子女教育越来越重视、居民对于自我提升的需求也越来越大。

随着互联网技术的迅猛发展,人们的生活习惯发生了重大变化。跨越空间的生活、工作和学习方式得以实现,知识获取的方式已经发生了根本性的变化,知识的传播不再受时间和空间的限制。越来越多的在线教育企业不断涌现,在线教育行业已经进入到快速发展期。

大数据技术发展至今,已经在各行各业都得到了充分应用,并且已经大大改变了各行各业的业务方式,众多大型企业利用大数据提升了它们的行业地位。随着时间的推移,在线教育行业中的数据量也在逐渐积累增加,已经有越来越多的在线教育企业利用大数据为自己的业务决策提供支持。在线教育行业中应用大数据分析,有助于评估用户体验、指导项目开发人员进一步改进;通过课程表现的有效反馈,帮助创作者进一步调整课程内容,提升课程质量;可以追踪学生的实时表现、评估学习效果,有助于教育管理者了解学生、帮助学生。构建数据仓库是企业开始使用大数据分析的第一步,是大数据领域的重点项目。在了解了数据仓库的全开发流程后,用户就可以更透彻地了解大数据的各项特点。在知晓了大数据的各项特点后,对于大数据的传输、存储和分析计算等各种操作也就更有的放矢,知道如何针对不同的数据特点设计合理的数据仓库架构。

继《剑指大数据——企业级数据仓库项目实战(电商版)》出版后,本书是尚硅谷教育推出的第二本项目实战图书。在现在的图书市场中,理论书籍相当丰富,但缺乏项目开发指导书籍,本书便应运而生。

技术开发人员在开展项目前,都需要查阅大量的资料,获取足够多的项目开发经验和架构设计思路。本书以在线教育行业为核心,从项目需求分析入手,以项目需求驱动架构设计、框架选型和数据模型设计。

本书着重讲解了在线教育的数据种类与结构、数据建模过程、数据仓库搭建详细流程,以及全流程自动化调度和可视化图表的构建。对于数据仓库建设中必不可少的数据治理部分,如元数据管理、权限管理、数据质量管理、集群监控和安全认证等功能,读者可以参考《剑指大数据——企业级数据仓库项目实战(电商版)》一书,书中对数据治理进行了详尽阐述。

阅读本书要求读者具备一定的编程基础,至少掌握一门编程语言(如Java)和SQL查询语言。如果读者对大数据的一些基本框架(如Hadoop、Hive等)有一定了解,那么学习本书将事半功倍。如果读者不具备以上基础,那么可以关注“尚硅谷教育”公众号,在聊天窗口发送关键字“大数据”,即可免费获取相关学习资料。

本书涉及的所有安装包、源码及视频教程等,均可通过在“尚硅谷教育”公众号发送关键字“在线教育数据仓库”免费获取。书中难免有疏漏之处,如在阅读本书的过程中发现任何问题,也欢迎在“尚硅谷教育”官网留言反馈。