A Rattle Book for Data Mining
Preface
1
Rattle
1.1
裝置
1.2
外部資料載入 .csv
1.3
載入R內建資料data (mtcars)
2
樣本性質分析
2.1
Summary– 資料的敘述統計
2.1.1
Summary- 簡易性質摘要
2.1.2
Describe
2.1.3
Basics
2.1.4
Kurtosis
2.1.5
Skewness
2.1.6
Show Missing
2.2
Distribution– 資料的分佈性質
2.3
Correlation– 資料的相關係數矩陣
3
資料性質檢定與轉換
3.1
獨立變數之雙樣本檢定
3.1.1
Kolmogorov-Smirnov test
3.1.2
Wilcoxon’s rank-sum test
3.1.3
T-test
3.1.4
F-test
3.2
關聯樣本關係檢定
3.2.1
Correlation相關性檢定
3.2.2
Wilcoxon sign-rank test
3.3
資料轉換 Transform
4
視覺化與探索性資料分析
4.1
基本探索分析圖
4.2
GGobi互動式繪圖
4.2.1
刷一刷(Automatic Brushing)上色
4.2.2
新型散佈矩陣圖(New Scatterplot Matrix)
4.2.3
New Parallel Coordinates
4.2.4
新堆疊長條圖(Stacked Bar Chart)
5
迴歸分析- 線性模式與廣義線性模式
5.1
線性模式lm的估計
5.1.1
樣本期望值的代表性問題
5.1.2
線性迴歸估計條件期望值
5.1.3
當解釋變數有類別變數
5.2
廣義線性模型glm
5.2.1
二元變數之Probit/Logit GLM
5.2.2
計數型變數之Poisson GLM
5.2.3
多元選擇 GLM— Multinomial Probit/Logit
6
分類方法
6.1
決策樹
6.1.1
原理
6.1.2
rattle實做
6.2
支援向量機 SVM
6.2.1
原理
6.2.2
rattle實做
6.3
類神經網路 Neural network
6.3.1
原理
6.3.2
rattle實做
7
強化式學習法
7.1
隨機森林
7.1.1
原理
7.1.2
rattle實做
7.2
推進 Boosting 方法
7.2.1
原理
7.2.2
rattle實做
8
主成份分析法
8.1
原理
8.2
rattle實做
9
集群分析
9.1
集群分析的基本概念與原理
9.1.1
集群分析的原理
9.1.2
距離衡量方法
9.1.3
階層集群法
9.2
rattle實做
9.2.1
以k-Mean 集群分析犯罪類型
9.2.2
以階層式集群由體型區分男女
10
關聯分析
10.1
原理簡介
10.2
rattle實做
10.3
語法輔助分析
10.4
所得預測
11
存活分析
11.1
原理簡介
11.2
rattle實做
References
Published with bookdown
A Rattle Book for Data Mining
Lecture 10
關聯分析
10.1
原理簡介
10.2
rattle實做
10.3
語法輔助分析
10.4
所得預測