• A Rattle Book for Data Mining
  • Preface
  • 1 Rattle
    • 1.1 裝置
    • 1.2 外部資料載入 .csv
    • 1.3 載入R內建資料data (mtcars)
  • 2 樣本性質分析
    • 2.1 Summary– 資料的敘述統計
      • 2.1.1 Summary- 簡易性質摘要
      • 2.1.2 Describe
      • 2.1.3 Basics
      • 2.1.4 Kurtosis
      • 2.1.5 Skewness
      • 2.1.6 Show Missing
    • 2.2 Distribution– 資料的分佈性質
    • 2.3 Correlation– 資料的相關係數矩陣
  • 3 資料性質檢定與轉換
    • 3.1 獨立變數之雙樣本檢定
      • 3.1.1 Kolmogorov-Smirnov test
      • 3.1.2 Wilcoxon’s rank-sum test
      • 3.1.3 T-test
      • 3.1.4 F-test
    • 3.2 關聯樣本關係檢定
      • 3.2.1 Correlation相關性檢定
      • 3.2.2 Wilcoxon sign-rank test
    • 3.3 資料轉換 Transform
  • 4 視覺化與探索性資料分析
    • 4.1 基本探索分析圖
    • 4.2 GGobi互動式繪圖
      • 4.2.1 刷一刷(Automatic Brushing)上色
      • 4.2.2 新型散佈矩陣圖(New Scatterplot Matrix)
      • 4.2.3 New Parallel Coordinates
      • 4.2.4 新堆疊長條圖(Stacked Bar Chart)
  • 5 迴歸分析- 線性模式與廣義線性模式
    • 5.1 線性模式lm的估計
      • 5.1.1 樣本期望值的代表性問題
      • 5.1.2 線性迴歸估計條件期望值
      • 5.1.3 當解釋變數有類別變數
    • 5.2 廣義線性模型glm
      • 5.2.1 二元變數之Probit/Logit GLM
      • 5.2.2 計數型變數之Poisson GLM
      • 5.2.3 多元選擇 GLM— Multinomial Probit/Logit
  • 6 分類方法
    • 6.1 決策樹
      • 6.1.1 原理
      • 6.1.2 rattle實做
    • 6.2 支援向量機 SVM
      • 6.2.1 原理
      • 6.2.2 rattle實做
    • 6.3 類神經網路 Neural network
      • 6.3.1 原理
      • 6.3.2 rattle實做
  • 7 強化式學習法
    • 7.1 隨機森林
      • 7.1.1 原理
      • 7.1.2 rattle實做
    • 7.2 推進 Boosting 方法
      • 7.2.1 原理
      • 7.2.2 rattle實做
  • 8 主成份分析法
    • 8.1 原理
    • 8.2 rattle實做
  • 9 集群分析
    • 9.1 集群分析的基本概念與原理
      • 9.1.1 集群分析的原理
      • 9.1.2 距離衡量方法
      • 9.1.3 階層集群法
    • 9.2 rattle實做
      • 9.2.1 以k-Mean 集群分析犯罪類型
      • 9.2.2 以階層式集群由體型區分男女
  • 10 關聯分析
    • 10.1 原理簡介
    • 10.2 rattle實做
    • 10.3 語法輔助分析
    • 10.4 所得預測
  • 11 存活分析
    • 11.1 原理簡介
    • 11.2 rattle實做
  • References
  • Published with bookdown

A Rattle Book for Data Mining

A Rattle Book for Data Mining

何宗武- 臺師大全營所

2023-09-21

Preface

Dataset download: https://web.ntnu.edu.tw/~tsungwu/bookdown/rattle/rattle.zip