ug-tactic

週 06_資料清理技巧(下)

演練這個單元時,建議開啟原論文code-book.pdf,搭配演練過程隨時參考。

[dplyr](https://dplyr.tidyverse.org/),[ggplot2](https://ggplot2.tidyverse.org/)的開發者有說明網站,程式碼有用到這些函式但遇到卡關的話,可先從說明網站找找可行範例。

單元4~單元9建議同學可參考電子書講義課前自行演練,上課會有最佳學習效果。

單元6的作業檔案改編自”stub-wrangling-2.Rmd”。

這個單元我們透過第5週的工作成果– 從 @woodworthDataWebbasedPositive2018 的公開資料裡挑出的summarydata,運用第6週學到的dplyrggplot2函式,視覺化未滿65歲,不同收入狀況的參與者的憂鬱量表分數。

最後有項延伸練習,談談大家目前學到的技巧,能否重製 @woodworthWebBasedPositivePsychology2017 的圖表?(論文全文附在單元作業複本,也可以自己試著找找看)

練習1: 匯入資料

第5週的練習1。

練習2: 挑出要處理的欄位

第5週的練習6。

試著說明summarydata為何不必納入所有變項/欄位。

練習3: 排序資料欄位

演練電子書6.4的操作,回答有關ahiTotal的問題。

練習4: 過濾符合條件的參與者資料

演練電子書6.5的操作,回答有關filter()執行後的問題。

練習5: 計算收入中間值

演練電子書6.6的操作,回答有關”median score”的問題。

收入中位數及平均數分別存在物件data_mediandata_mean

練習6: 使用分組變項進行描述統計

演練電子書6.7的操作,配合第5週的練習7成果,說明為何使用這個分數分組?

課後演練:採用occasion分組,說明65歲以下的參與者被分成幾組?各組的cesdTotal中位數?

練習7: 視覺化描述統計

演練電子書6.8的操作,回答有關不同收入分組及憂鬱分數的問題。

練習8: 重製評估

開啓 @woodworthWebBasedPositivePsychology2017 檢閱Table 2與Figure 3

活用 以到目前我們已探討的資料內容,談談如何運用目前已知的``dplyrggplot2`函式,重製這兩個圖表。