第 1 章 RStudio and R

1.1 RStudio裝置

本書執行程式的介面和程式編輯器以RStudio為主,下載的網站如下:

https://posit.co/download/rstudio-desktop/


進入RStudio官網如圖1.1:

圖 1.1: RStudio官網

有兩個選項:
1: Install R。如果你的電腦還沒有R的系統,可以循此去裝置R的系統。
2: Install RStudio。選這個可以直接進入下載區,圖1.1滾動滑鼠至下半部,會發現RStudio支援的所有作業系統,框起來的是Window版,如果讀者是用Linux,就可以依指示下載相關的Tarballs檔案;如果是用Mac,就選 .dmg下載

圖 1.2: RStudio的四方面板主介面

視窗版的RStudio下載大約82MB,裝置完畢後,會在電腦桌面產生一個圖樣,啟動RStudio的介面如圖1.2。RStudio的四個區塊,可以說是將時常使用的環境功能整合起來。右邊上下分別是「物件暫存區」和「其他」兩個筆記本模式。「物件暫存」可以讓我們看到在程式中產生的資料物件或載入的數據有哪些,筆者的筆記本頁面還有一個Spark,因為RStudio已經把大數據資料庫整合進來,從這個管道就可以連結Spark資料庫。右下角的「其他」則把很多功能併入,包括了電腦檔案(Files),繪圖(Plots),套件(Packages),說明(Help),和快速檢視(Viewer)。 左邊上下分別是「程式碼編輯區」和「主控台」,也就是說,啟動RStudio就會連帶啟動R的主程式。這和R Commander完全不同, R Commander是 GUI , 必須先啟動R的主控台再以套件方式才能啟動。RStudio則是針對開發者所設計的介面,不是應用的GUI。

圖 1.3: 執行程式

執行程式碼,先用滑鼠將要執行的程式框起來,然後按「程式碼編輯區」的Run就可以,執行結果會在下方主控台出現。如果要執行整個程式檔,可以由選單Code進入多個選項。如圖1.3

RStudio內有許多資源,可以依照圖1.4的指示下載說明便利抄Cheatsheets。因為R的開放的,所以,學習的項目無法在本書涵蓋一切,盡可能要取得網路資源,也可以查詢更多的學習項目。

圖 1.4: 便利貼下載

1.2 變更四方面板

如果使用上不習慣RStudio四方面板的安排,這是可以改的。如圖1.5,先進入面板Pane

圖 1.5: 進入四方面版選項 Pane Layout

1.6四方面版內筆記本的選項,如右邊的兩塊都可以依照使用者需要調整。

圖 1.6: 四方面版內筆記本的選項,都可以調整

如果要更換四方面版,如圖1.7,只要擇一就會自動置換,如果要把四方格換成三格或兩格,須要進階設定。

圖 1.7: 把Environment 和Console對調

最後一個重要個功能是「指定工作目錄」。一般啟動R程式,可以透過電腦得檔案總管,找到R程式的位置,滑鼠快點兩下,只要在系統將 .R的程式和RStudio關聯,就會直接載入RStudio。這時候,工作目錄會自動設成程式所在位置。

但是,我們有時候不會這樣打開程式,而是直接打開RStudio,然後從最近使用的程式中(Files -> Recent Files),點選要繼續工作的程式檔。這樣的話,就必需指定工作目錄,如圖1.8;如果這個程式有很多參照工作目錄的「路徑」時,如存取資料,這樣的工作就更重要了。如果要讀取的數據檔mydata.csv是存放在主目錄的下一層data,就是 “data/”,可以如下路徑為例:

data/mydata.csv

如果 “data/mydata.csv” 是在工作目錄上一層,則:

“../data/mydata.csv”


同理,上兩層,則:


../../data/mydata.csv


大多數的IDE都有這功能,也都須要宣告。因為專案,資料夾,工作路徑等等設定,會隨著時間或大量使用而修改,最好的方法就是使用雲端資料夾,如Google Drive, OneDrive, Dropbox等服務,確保工作隨時更新。

如果用程式碼,就把以下命令,放在程式第一行,也可以達到相同功能。

setwd(dirname(rstudioapi::getActiveDocumentContext()$path))


setwd()可以迅速指定工作目錄

setwd = Set Working Directory


圖 1.8: 把Environment 和Console對調


因為本書是R動態文件製作,所以不會系統性介紹R的基礎語法。如果須要相關學習資源,在Google打「R語言」,就會出現很多存取各種資料格式的教學網站2和R語言入門教學。接下來有遇到須要解說的語法,本書會另外用Box講解。

再進入第2章之前,再強調一次,RStudio是使用動態文件製作與編輯最好的IDE,整合性極好。我們也將會在RStudio內打開markdown文件,對於這項工具,務必熟悉。 本書使用的數據,主要使用網路可擷取之開放數據和R內建數據,少量為作者提供的外部資料。


  1. 如須要推薦書,可以參考「劉正山(2018)民意調查資料分析的實戰手冊」,此書前五章對各種格式的外部資料存取,有詳細說明,還有基礎統計功能的解說。↩︎