1.7 总结

本章讲述了如何构建一个鱼类识别学习系统,并讲述了如何在TensorFlow和Keras的帮助下使用几行代码来构建复杂的应用程序,如识别鱼类的应用程序。这个代码示例并不要求读者理解,而是为了展示构建的复杂系统的可见性,以及在一般和特定的深度学习中数据科学如何成为一种易于使用的工具。

本章还展示了数据科学家在构建学习系统时可能遇到的一些挑战。

本章还研究了构建学习系统的典型设计周期,并解释了此周期中涉及的每个组件的总体思路。

最后,本章介绍了不同的学习类型,大企业或小公司每天都产生的大数据,大量的数据如何对构建可扩展的工具造成挑战,以及这些工具如何从数据中分析和挖掘到有价值的东西。

对于目前所提到的这些内容,读者可能会感到有点不知所措。不用担心,本章所讲到的大部分内容都会在其他章节中继续讨论,包括数据科学的挑战以及鱼类识别示例。本章的主要目的是让读者对数据科学及其开发周期有一个总体的了解,但不要求读者对其中的挑战和代码示例有深刻的理解。本章展示了一些代码示例以克服数据科学领域大多数新手的恐惧,并向他们展示如何用几行代码完成鱼识别等复杂系统。

接下来,本书将通过一个例子来讲解数据科学的基本概念,开启实战之旅。下一部分将主要通过著名的“泰坦尼克”示例来为后面的高阶内容做准备。本书还将讨论许多概念,包括回归和分类的不同学习方法,不同类型的性能错误,哪种性能错误更应该关注,以及一些与解决数据科学挑战和处理不同形式的数据样本相关的问题。