封面
版权信息
审稿人评论 Reviewers’ Comments
译者序 The Translator’s Words
前言 Preface
作者简介 About the Authers
开始阅读本书之前 Before you begin
第一部分 Python基础知识快速入门
第1章 Python及大数据概述
1.1 简介
1.2 快速回顾面向对象技术的基础知识
1.3 Python
1.4 Python库
1.5 试用IPython和Jupyter Notebook
1.6 云和物联网
1.7 大数据有多大
1.8 案例研究:大数据移动应用程序
1.9 数据科学入门:人工智能—计算机科学与数据科学的交叉学科
1.10 小结
第2章 Python程序设计概述
2.1 简介
2.2 变量和赋值语句
2.3 算术运算
2.4 print函数、单引号和双引号
2.5 三引号字符串
2.6 从用户处获取输入
2.7 决策:if语句和比较运算符
2.8 对象和动态类型
2.9 数据科学入门:基础的描述性统计
2.10 小结
第3章 控制语句
3.1 简介
3.2 控制语句概述
3.3 if语句
3.4 if...else和if...elif...else语句
3.5 while语句
3.6 for语句
3.7 增强赋值
3.8 序列控制迭代和格式化字符串
3.9 边界值控制的迭代
3.10 内置函数range:深入讨论
3.11 使用Decimal类型处理货币金额
3.12 break和continue语句
3.13 布尔运算符and、or和not
3.14 数据科学入门:集中趋势度量—均值、中值和众数
3.15 小结
第4章 函数
4.1 简介
4.2 函数定义
4.3 多参数函数
4.4 随机数生成
4.5 案例研究:一个运气游戏
4.6 Python标准库
4.7 math模块中的函数
4.8 在IPython中使用制表符自动补全
4.9 默认参数值
4.10 关键字参数
4.11 不定长参数列表
4.12 方法:属于对象的函数
4.13 作用域规则
4.14 import:深入讨论
4.15 向函数传递参数:深入讨论
4.16 递归
4.17 函数式编程
4.18 数据科学入门:离中趋势度量
4.19 小结
第5章 序列:列表和元组
5.1 简介
5.2 列表
5.3 元组
5.4 序列解包
5.5 序列切片
5.6 使用del声明
5.7 将列表传递给函数
5.8 列表排序
5.9 序列搜索
5.10 列表的其他方法
5.11 使用列表模拟堆栈
5.12 列表推导式
5.13 生成器表达式
5.14 过滤、映射和归约
5.15 其他的序列处理函数
5.16 二维列表
5.17 数据科学入门:模拟和静态可视化
5.18 小结
第二部分 Python数据结构、字符串和文件
第6章 字典和集合
6.1 简介
6.2 字典
6.3 集合
6.4 数据科学入门:动态可视化
6.5 小结
第7章 使用NumPy进行面向数组的编程
7.1 简介
7.2 从现有数据创建数组
7.3 数组属性
7.4 用特定值填充数组
7.5 从范围创建数组
7.6 列表与数组的性能比较:引入%timeit
7.7 数组运算符
7.8 NumPy计算方法
7.9 通用函数
7.10 索引和切片
7.11 视图:浅拷贝
7.12 视图:深拷贝
7.13 重塑和转置
7.14 数据科学入门:pandas Series和DataFrame
7.15 小结
第8章 字符串:深入讨论
8.1 简介
8.2 格式化字符串
8.3 拼接和重复字符串
8.4 去除字符串中的空白字符
8.5 字符大小写转换
8.6 字符串的比较运算符
8.7 查找子字符串
8.8 替换子字符串
8.9 字符串拆分和连接
8.10 字符串测试方法
8.11 原始字符串
8.12 正则表达式介绍
8.13 数据科学入门:pandas、正则表达式和数据治理
8.14 小结
第9章 文件和异常
9.1 简介
9.2 文件
9.3 文本文件处理
9.4 更新文本文件
9.5 使用JSON进行序列化
9.6 关注安全:pickle序列化和反序列化
9.7 关于文件的附加说明
9.8 处理异常
9.9 finally子句
9.10 显式地引发一个异常
9.11 (选学)堆栈展开和回溯
9.12 数据科学入门:使用CSV文件
9.13 小结
第三部分 Python高级主题
第10章 面向对象编程
10.1 简介
10.2 自定义Account类
10.3 属性访问控制
10.4 用于数据访问的property
10.5 模拟“私有”属性
10.6 案例研究:洗牌和分牌模拟
10.7 继承:基类和子类
10.8 构建继承层次结构:引入多态性
10.9 鸭子类型和多态性
10.10 运算符重载
10.11 异常类层次结构和自定义异常
10.12 具名元组
10.13 Python 3.7的新数据类简介
10.14 使用文档字符串和doctest进行单元测试
10.15 命名空间和作用域
10.16 数据科学入门:时间序列和简单线性回归
10.17 小结
第四部分 人工智能、云和大数据案例研究
第11章 自然语言处理
11.1 简介
11.2 TextBlob
11.3 使用柱状图和词云可视化词频
11.4 使用Textatistic库进行可读性评估
11.5 使用spaCy命名实体识别
11.6 使用spaCy进行相似性检测
11.7 其他NLP库和工具
11.8 机器学习和深度学习自然语言应用
11.9 自然语言数据集
11.10 小结
第12章 Twitter数据挖掘
12.1 简介
12.2 Twitter API概况
12.3 创建一个Twitter账户
12.4 获取Twitter凭据,创建应用程序
12.5 什么是推文
12.6 Tweepy
12.7 通过Tweepy进行Twitter身份验证
12.8 获取一个Twitter账户的相关信息
12.9 Tweepy Cursor简介:获得一个账户的关注者和朋友
12.10 搜索最新的推文
12.11 热门话题发现:Twitter热门话题API
12.12 推文分析前的清理或预处理
12.13 Twitter流API
12.14 推文情感分析
12.15 地理编码和映射
12.16 存储推文的方法
12.17 Twitter和时间序列
12.18 小结
第13章 IBM Watson和认知计算
13.1 简介
13.2 IBM云账户和云控制台
13.3 Watson服务
13.4 额外的服务和工具
13.5 Watson开发者云Python SDK
13.6 案例研究:旅行者翻译伴侣APP
13.7 Watson资源
13.8 小结
第14章 机器学习:分类、回归和聚类
14.1 简介
14.2 案例研究:用k近邻算法和Digits数据集进行分类(第1部分)
14.3 案例研究:利用k近邻算法和Digits数据集进行分类(第2部分)
14.4 案例研究:时间序列和简单线性回归
14.5 案例研究:基于加利福尼亚房价数据集的多元线性回归
14.6 案例研究:无监督学习(第1部分)—降维
14.7 案例研究:无监督学习(第2部分)—k均值聚类
14.8 小结
第15章 深度学习
15.1 简介
15.2 Keras内置数据集
15.3 自定义Anaconda环境
15.4 神经网络
15.5 张量
15.6 用于视觉的卷积神经网络:使用MNIST数据集进行多分类
15.7 用TensorBoard可视化神经网络的训练过程
15.8 ConvnetJS:基于浏览器的深度学习训练和可视化
15.9 针对序列的递归神经网络:使用IMDb数据集进行情感分析
15.10 调整深度学习模型
15.11 在ImageNet上预训练的CNN模型
15.12 小结
第16章 大数据:Hadoop、Spark、NoSQL和IoT
16.1 简介
16.2 关系数据库和结构化查询语言
16.3 NoSQL和NewSQL大数据数据库简述
16.4 案例研究:MongoDB JSON文档数据库
16.5 Hadoop
16.6 Spark
16.7 Spark流:使用pyspark-notebook Docker堆栈计算Twitter主题标签
16.8 物联网和仪表板
16.9 小结
索引
更新时间:2021-08-13 17:17:52