数据科学导论(Introductory of Data Science)
1
前言(Prerequisites)
2
R及Python语言简介
2.0.1
R简介
2.0.2
R语言安装及环境配置
2.0.3
Rstudio软件安装
2.0.4
R基础
2.0.5
python语言安装及环境配置
3
数据描述
3.0.1
数据的意义及获取
3.0.2
简单的数据汇总
3.0.3
数据的可视化
4
数据整理和清理
4.1
数据的筛选
4.2
数据合并
4.3
数据的缺失
4.3.1
缺失值的审视与标记
4.3.2
删除缺失值的方法及问题
4.3.3
利用可预测模型来填补缺失值
4.3.4
处理缺失值的R包
4.3.5
实例
5
有监督学习概论
5.0.1
机器学习
5.0.2
机器学习实例
5.1
模型及拟合
5.2
训练最小二乘线性回归模型的例子
5.3
模型评价
5.4
Exercise
6
最小二乘线性回归法
6.1
相关概念
6.2
线性模型
6.2.1
模型的估计
6.2.2
简单线性模型(Simple Linear Model,SLM)
6.2.3
多元线性回归(Multiple Linear Model,mlm)
6.2.4
回归实例
6.2.5
练习
7
Logistic回归
7.1
相关概念
7.2
Logistic模型
7.3
模型估计
7.3.1
损失函数(Loss function)
7.3.2
代价函数(Cost funtion)
7.3.3
模型估计(estimation)
7.3.4
模拟数据模型
7.3.5
Logistic回归实例模型
8
决策树及其组合方法
8.1
决策树
8.2
实例
9
github使用
10
支持向量机和神经网络
10.1
支持向量机(support vector machine,SVM)
10.2
神经网络(Neural Networks, NN)
11
github使用
References
References
Published with bookdown
数据科学导论(Introductory of Data Science)
References