ug-tactic

週 06_資料清理技巧(下)

演練這個單元時，建議開啟原論文與code-book.pdf，搭配演練過程隨時參考。

[dplyr](https://dplyr.tidyverse.org/),[ggplot2](https://ggplot2.tidyverse.org/)的開發者有說明網站，程式碼有用到這些函式但遇到卡關的話，可先從說明網站找找可行範例。

單元4~單元9建議同學可參考電子書與講義課前自行演練，上課會有最佳學習效果。

單元6的作業檔案改編自”stub-wrangling-2.Rmd”。

這個單元我們透過第5週的工作成果– 從 @woodworthDataWebbasedPositive2018 的公開資料裡挑出的summarydata，運用第6週學到的dplyr及ggplot2函式，視覺化未滿65歲，不同收入狀況的參與者的憂鬱量表分數。

最後有項延伸練習，談談大家目前學到的技巧，能否重製 @woodworthWebBasedPositivePsychology2017 的圖表？(論文全文附在單元作業複本，也可以自己試著找找看)

同第5週的練習1。

同第5週的練習6。

試著說明summarydata為何不必納入所有變項/欄位。

演練電子書6.4的操作，回答有關ahiTotal的問題。

演練電子書6.5的操作，回答有關filter()執行後的問題。

演練電子書6.6的操作，回答有關”median score”的問題。

收入中位數及平均數分別存在物件data_median與data_mean

演練電子書6.7的操作，配合第5週的練習7成果，說明為何使用這個分數分組？

課後演練：採用occasion分組，說明65歲以下的參與者被分成幾組？各組的cesdTotal中位數？

演練電子書6.8的操作，回答有關不同收入分組及憂鬱分數的問題。

開啓 @woodworthWebBasedPositivePsychology2017 檢閱Table 2與Figure 3

活用以到目前我們已探討的資料內容，談談如何運用目前已知的``dplyr與ggplot2`函式，重製這兩個圖表。