第 7 週 06_資料清理技巧(下)

演練這個單元時,建議開啟原論文code-book.pdf,搭配演練過程隨時參考。

[dplyr](https://dplyr.tidyverse.org/),[ggplot2](https://ggplot2.tidyverse.org/)的開發者有說明網站,程式碼有用到這些函式但遇到卡關的話,可先從說明網站找找可行範例。

單元4~單元9建議同學可參考電子書講義課前自行演練,上課會有最佳學習效果。

單元6的作業檔案改編自“stub-wrangling-2.Rmd”。

這個單元我們透過第5週的工作成果– 從 Woodworth et al. (2018) 的公開資料裡挑出的summarydata,運用第6週學到的dplyrggplot2函式,視覺化未滿65歲,不同收入狀況的參與者的憂鬱量表分數。

最後有項延伸練習,談談大家目前學到的技巧,能否重製 Woodworth et al. (2017) 的圖表?(論文全文附在單元作業複本,也可以自己試著找找看)

7.1 練習1: 匯入資料

第5週的練習1。

7.2 練習2: 挑出要處理的欄位

第5週的練習6。

試著說明summarydata為何不必納入所有變項/欄位。

7.3 練習3: 排序資料欄位

演練電子書6.4的操作,回答有關ahiTotal的問題。

7.4 練習4: 過濾符合條件的參與者資料

演練電子書6.5的操作,回答有關filter()執行後的問題。

7.5 練習5: 計算收入中間值

演練電子書6.6的操作,回答有關“median score”的問題。

收入中位數及平均數分別存在物件data_mediandata_mean

7.6 練習6: 使用分組變項進行描述統計

演練電子書6.7的操作,配合第5週的練習7成果,說明為何使用這個分數分組?

課後演練:採用occasion分組,說明65歲以下的參與者被分成幾組?各組的cesdTotal中位數?

7.7 練習7: 視覺化描述統計

演練電子書6.8的操作,回答有關不同收入分組及憂鬱分數的問題。

7.8 練習8: 重製評估

開啓 Woodworth et al. (2017) 檢閱Table 2與Figure 3

活用 以到目前我們已探討的資料內容,談談如何運用目前已知的`dplyrggplot2函式,重製這兩個圖表。

References

Woodworth, Rosalind J., Angela O’Brien-Malone, Mark R. Diamond, and Benjamin Schüz. 2017. “Web-Based Positive Psychology Interventions: A Reexamination of Effectiveness.” Journal of Clinical Psychology 73 (3): 218–32. https://doi.org/10.1002/jclp.22328.
———. 2018. “Data from, Web-Based Positive Psychology Interventions: A Reexamination of Effectiveness.” Journal of Open Psychology Data 6 (February): 1. https://doi.org/10.5334/jopd.35.