图书介绍

大数据分析 方法与应用【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

大数据分析 方法与应用
  • 王星等编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302334170
  • 出版时间:2013
  • 标注页数:294页
  • 文件大小:77MB
  • 文件页数:305页
  • 主题词:统计分析-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据分析 方法与应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 大数据分析概述1

1.1 大数据概述1

1.1.1 什么是大数据1

1.1.2 数据、信息与认知2

1.1.3 数据管理与数据库5

1.1.4 数据仓库7

1.1.5 数据挖掘的内涵和基本特征9

1.2 数据挖掘的产生与功能10

1.2.1 数据挖掘的历史10

1.2.2 数据挖掘的功能12

1.3 数据挖掘与相关领域之间的关系13

1.3.1 数据挖掘与机器学习14

1.3.2 数据挖掘与数据仓库14

1.3.3 数据挖掘与统计学15

1.3.4 数据挖掘与智能决策16

1.3.5 数据挖掘与云计算17

1.4 大数据研究方法18

1.5 讨论题目19

1.6 推荐阅读20

第2章 数据挖掘流程22

2.1 数据挖掘流程概述22

2.1.1 问题识别23

2.1.2 数据理解25

2.1.3 数据准备26

2.1.4 建立模型27

2.1.5 模型评价27

2.1.6 部署应用30

2.2 离群点发现30

2.2.1 基于统计的离群点检测31

2.2.2 基于距离的离群点检测32

2.2.3 局部离群点算法34

2.3 不平衡数据级联算法36

2.4 讨论题目41

2.5 推荐阅读43

第3章 有指导的学习45

3.1 有指导的学习概述45

3.2 k-近邻49

3.3 决策树51

3.3.1 决策树的基本概念51

3.3.2 分类回归树53

3.3.3 决策树的剪枝54

3.4 提升方法58

3.5 随机森林树63

3.5.1 随机森林树算法的定义64

3.5.2 如何确定随机森林树算法中树的节点分裂变量64

3.5.3 随机森林树的回归算法65

3.6 人工神经网络68

3.6.1 人工神经网络基本概念68

3.6.2 感知器算法69

3.6.3 LMS算法72

3.6.4 反向传播算法74

3.6.5 神经网络相关问题讨论79

3.7 支持向量机83

3.7.1 最大边距分类84

3.7.2 支持向量机问题的求解85

3.7.3 支持向量机的核方法87

3.8 多元自适应回归样条91

3.9 讨论题目93

3.10 推荐阅读95

第4章 无指导的学习97

4.1 关联规则97

4.1.1 静态关联规则算法Apriori算法98

4.1.2 动态关联规则算法Carma算法102

4.1.3 序列规则挖掘算法104

4.2 聚类分析106

4.2.1 聚类分析的含义及作用106

4.2.2 距离的定义106

4.2.3 系统层次聚类法108

4.2.4 k-均值算法108

4.2.5 BIRCH算法110

4.2.6 基于密度的聚类算法111

4.3 基于预测强度的聚类方法113

4.3.1 预测强度115

4.3.2 预测强度方法的应用115

4.3.3 案例分析115

4.4 聚类问题的变量选择122

4.4.1 高斯成对罚模型聚类122

4.4.2 各类异方差成对罚模型聚类123

4.4.3 几种聚类变量选择的比较127

4.5 讨论题目128

4.6 推荐阅读129

第5章 贝叶斯分类和因果学习130

5.1 贝叶斯分类130

5.2 决策论与统计决策论132

5.2.1 决策与风险132

5.2.2 统计决策136

5.3 线性判别函数和二次判别函数138

5.4 朴素贝叶斯分类143

5.5 贝叶斯网络145

5.5.1 基本概念145

5.5.2 贝叶斯网络的应用146

5.5.3 贝叶斯网络的构建148

5.6 案例:贝叶斯网络模型在信用卡违约概率建模中的应用155

5.7 讨论题目157

5.8 推荐阅读160

第6章 高维回归及变量选择161

6.1 线性回归模型161

6.2 模型选择173

6.2.1 模型选择概述174

6.2.2 偏差-方差分解179

6.2.3 模型选择准则180

6.2.4 回归变量选择184

6.3 广义线性模型188

6.3.1 二点分布回归188

6.3.2 指数族概率分布190

6.3.3 广义线性模型192

6.3.4 模型估计193

6.3.5 模型检验与诊断194

6.4 高维回归系数压缩202

6.4.1 岭回归203

6.4.2 LASSO204

6.4.3 Shooting算法205

6.4.4 路径算法207

6.4.5 其他惩罚项及Oracle性质211

6.4.6 软件实现213

6.5 总结214

6.6 讨论题目214

6.7 推荐阅读216

第7章 图模型217

7.1 图模型基本概念和性质218

7.1.1 图矩阵220

7.1.2 概率图模型概念和性质220

7.2 协方差选择222

7.2.1 用回归估计图模型222

7.2.2 基于最大似然框架的方法225

7.3 指数族图模型229

7.3.1 基本定义229

7.3.2 参数估计及假设检验231

7.4 谱聚类234

7.4.1 聚类和图划分234

7.4.2 谱聚类235

7.5 总结242

7.6 讨论题目242

7.7 推荐阅读243

第8章 客户关系管理245

8.1 协同推荐模型245

8.1.1 基于邻域的算法246

8.1.2 矩阵分解模型249

8.2 客户价值随机模型252

8.2.1 客户价值的定义252

8.2.2 客户价值分析模型253

8.2.3 客户购买状态转移矩阵254

8.2.4 利润矩阵257

8.2.5 客户价值的计算259

8.3 案例:银行卡消费客户价值模型259

8.4 推荐阅读265

第9章 社会网络分析266

9.1 社会网络概述266

9.1.1 社会网络概念与发展266

9.1.2 社会网络的基本特征269

9.1.3 社群挖掘算法271

9.1.4 模型的评价272

9.2 案例:社会网络在学术机构合作关系上的研究273

9.3 讨论题目278

9.4 推荐阅读278

附录A 本章R程序279

第10章 自然语言模型和文本挖掘281

10.1 向量空间模型282

10.1.1 向量空间模型基本概念282

10.1.2 特征选择准则283

10.2 统计语言模型284

10.2.1 n-gram模型284

10.2.2 主题n-元模型286

10.3 LDA模型287

10.4 案例:LDA模型的热点新闻发现290

10.5 推荐阅读293

热门推荐