封面
版权信息
作者简介
译者介绍
数字版权声明
版权声明
O'Reilly Media Inc.介绍
赞誉
译者序
前言
学习数据科学的概念性方法
写给教师们
其他技能及概念
本书结构及体例
示例的使用
SafariBooks Online
联系我们
致谢
电子版
第1章 绪论:数据分析式思维
1.1 数据机遇无处不在
1.2 案例:飓风Frances
1.3 案例:预测用户流失
1.4 数据科学、数据工程和数据驱动型决策
1.5 数据处理和“大数据”
1.6 从大数据1.0到大数据2.0
1.7 数据与数据科学能力:一种战略性资产
1.8 数据分析式思维
1.9 关于本书
1.10 重新审视数据挖掘和数据科学
1.11 数据科学:一门新兴的实验性学科
1.12 小结
第2章 商业问题及其数据科学解决方案
2.1 从商业问题到数据挖掘任务
2.2 有监督方法与无监督方法
2.3 数据挖掘及其结果
2.4 数据挖掘流程
2.5 管理数据科学团队的含义
2.6 其他分析技巧与技术
2.7 小结
第3章 预测建模导论:从相关性到有监督的划分
3.1 建模、归纳与预测
3.2 有监督的划分
3.3 划分的可视化
3.4 把树视作规则组
3.5 概率估计
3.6 示例:用树型归纳解决用户流失问题
3.7 小结
第4章 用模型拟合数据
4.1 根据数学函数分类
4.2 通过数学函数进行回归
4.3 类概率估计和逻辑“回归”
4.4 示例:对比逻辑回归和树型归纳
4.5 非线性函数、支持向量机和神经网络
4.6 小结
第5章 避免过拟合
5.1 泛化能力
5.2 过拟合
5.3 过拟合检验
5.4 示例:线性函数的过拟合
5.5 *示例:过拟合为何有害
5.6 从保留评估到交叉验证
5.7 用户流失数据集回顾
5.8 学习曲线
5.9 避免过拟合与控制复杂度
5.10 小结
第6章 相似性、近邻和簇
6.1 相似性和距离
6.2 最近邻推理
6.3 与相似性和最近邻相关的一些重要技术细节
6.4 聚类
6.5 退一步:解决业务问题与数据探索
6.6 小结
第7章 决策分析思维(一):如何评估一个模型
7.1 对分类器的评估
7.2 分类问题的推广
7.3 一个重要的分析框架:期望值
7.4 评估、基线性能以及对数据投资的意义
7.5 小结
第8章 模型性能的可视化
8.1 排序,而不是分类
8.2 利润曲线
8.3 ROC图像和曲线
8.4 ROC曲线下面积
8.5 累积响应曲线和提升曲线
8.6 示例:用户流失模型的性能分析
8.7 小结
第9章 证据和概率
9.1 示例:向线上目标用户投放广告
9.2 根据概率合并证据
9.3 将贝叶斯法则应用到数据科学中
9.4 证据“提升度”的模型
9.5 示例:Facebook“点赞”的证据提升度
9.6 小结
第10章 文本的表示和挖掘
10.1 为什么文本很重要
10.2 为什么文本很难处理
10.3 表示法
10.4 示例:爵士音乐家
10.5 *IDF和熵的关系
10.6 词袋模型之外的方法
10.7 示例:通过挖掘新闻报道预测股价变动
10.8 小结
第11章 决策分析思维(二):面向分析工程
11.1 为慈善机构寻找最佳捐赠人
11.2 更复杂的用户流失示例回顾
11.3 小结
第12章 其他数据科学任务与技术
12.1 共现和关联:寻找匹配项
12.2 用户画像:寻找典型行为
12.3 链路预测和社交推荐
12.4 数据约简、潜在信息和电影推荐
12.5 偏差、方差和集成方法
12.6 数据驱动的因果解释和一个病毒式营销示例
12.7 小结
第13章 数据科学和经营战略
13.1 数据分析式思维,终极版
13.2 用数据科学取得竞争优势
13.3 用数据科学保持竞争优势
13.4 吸引和培养数据科学家及其团队
13.5 检验数据科学案例分析
13.6 做好准备,接受来源各异的创意
13.7 做好准备,评估数据科学项目提案
13.8 企业的数据科学成熟度
第14章 总结
14.1 数据科学的基本概念
14.2 数据做不到的:圈中人回顾
14.3 隐私、道德和挖掘个人数据
14.4 数据科学是否还有更多内容
14.5 最后一例:从众包到云包
14.6 最后的话
附录A 提案评估指南
A.1 业务和数据理解
A.2 数据准备
A.3 建模
A.4 评估和部署
附录B 另一个提案示例
情景和提案
术语表
参考文献
关于作者
书评
更新时间:2020-04-22 12:26:31