图书介绍

数据科学理论与实践pdf电子书版本下载

数据科学理论与实践
  • 朝乐门编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302480549
  • 出版时间:2017
  • 标注页数:294页
  • 文件大小:72MB
  • 文件页数:312页
  • 主题词:数据处理-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

数据科学理论与实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 基础理论 1

如何开始学习 1

1.1 术语定义 2

1.2 研究目的 7

1.3 发展简史 11

1.4 理论体系 14

1.5 基本原则 16

1.6 数据科学家 23

如何继续学习 28

习题 32

参考文献 32

第2章 理论基础 34

如何开始学习 34

2.1 数据科学的学科地位 35

2.2 统计学 36

2.3 机器学习 42

2.4 数据可视化 56

如何继续学习 58

习题 59

参考文献 59

第3章 流程与方法 61

如何开始学习 61

3.1 基本流程 62

3.2 数据加工 70

3.3 数据审计 79

3.4 数据分析 83

3.5 数据可视化 86

3.6 数据故事化 96

3.7 项目管理 101

如何继续学习 103

习题 104

参考文献 104

第4章 技术与工具 106

如何开始学习 106

4.1 技术体系 107

4.2 MapReduce 112

4.3 Hadoop 119

4.4 Spark 129

4.5 NoSQL与NewSQL 136

4.6 R与Python 148

4.7 发展趋势 149

如何继续学习 153

习题 154

参考文献 154

第5章 数据产品及开发 156

如何开始学习 156

5.1 定义 157

5.2 主要特征 159

5.3 关键活动 163

5.4 数据柔术 164

5.5 数据能力 175

5.6 数据战略 183

5.7 数据治理 185

如何继续学习 188

习题 189

参考文献 189

第6章 典型案例及实践 190

如何开始学习 190

6.1 2012年美国总统大选 191

6.2 统计分析 195

6.3 机器学习 198

6.4 数据可视化 213

6.5 SparkR编程 215

如何继续学习 229

习题 229

参考文献 230

附录A R语言学习笔记与参考手册 231

学习与参考指南 231

1.R变量定义方法 233

2.R语句的写法 234

3.R中的赋值语句 234

4.R的文件读写路径——当前工作目录 235

5.R的变量查找机制——搜索路径 235

6.R中查看帮助的方法 237

7.R区分大小写字母 237

8.R的注释 238

9.R的语句 238

10.R中的变量命名规范 238

11.R中的关键字/保留字 239

12.R中的默认数据类型 240

13.R中数据类型的判断与强制类型转换 241

14.R中的向量 241

15.R中的列表 245

16.R中的数据框 248

17.R中的因子类型 253

18.R中的循环语句 254

19.R中的选择语句 255

20.R中的特殊运算符 256

21.R中的快速生成数列的方法 257

22.R中自定义函数 258

23.R中常用的数学函数 259

24.R中的字符串处理函数 260

25.R中的常用统计函数 262

26.R中的随机数 263

27.R包的用法 264

28.R中的矩阵 265

29.R中的数组 268

30.R中的面向对象编程 269

31.R中的S4类 270

32.R中的数据可视化 273

33.R的输入输出 274

34.R中的正则表达式 275

35.R的数据集 278

36.R第三方包——R的灵魂 279

37.基于R的数据加工 280

附录B 数据科学的重要资源 285

1.学术期刊 285

2.国际会议 285

3.研究机构 286

4.课程资源 286

5.硕士学位项目 286

6.专家学者 287

7.相关工具 287

附录C 术语索引 288

后记 293

精品推荐