第 7 週 06_資料清理技巧(下)
演練這個單元時,建議開啟原論文與code-book.pdf,搭配演練過程隨時參考。
[dplyr](https://dplyr.tidyverse.org/)
,[ggplot2](https://ggplot2.tidyverse.org/)
的開發者有說明網站,程式碼有用到這些函式但遇到卡關的話,可先從說明網站找找可行範例。
單元6的作業檔案改編自“stub-wrangling-2.Rmd”。
這個單元我們透過第5週的工作成果– 從 Woodworth et al. (2018) 的公開資料裡挑出的summarydata
,運用第6週學到的dplyr
及ggplot2
函式,視覺化未滿65歲,不同收入狀況的參與者的憂鬱量表分數。
最後有項延伸練習,談談大家目前學到的技巧,能否重製 Woodworth et al. (2017) 的圖表?(論文全文附在單元作業複本,也可以自己試著找找看)
7.1 練習1: 匯入資料
同第5週的練習1。
7.3 練習3: 排序資料欄位
演練電子書6.4的操作,回答有關ahiTotal
的問題。
7.4 練習4: 過濾符合條件的參與者資料
演練電子書6.5的操作,回答有關filter()
執行後的問題。
7.6 練習6: 使用分組變項進行描述統計
演練電子書6.7的操作,配合第5週的練習7成果,說明為何使用這個分數分組?
課後演練:採用occasion
分組,說明65歲以下的參與者被分成幾組?各組的cesdTotal中位數?
7.7 練習7: 視覺化描述統計
演練電子書6.8的操作,回答有關不同收入分組及憂鬱分數的問題。
7.8 練習8: 重製評估
開啓 Woodworth et al. (2017) 檢閱Table 2與Figure 3
活用 以到目前我們已探討的資料內容,談談如何運用目前已知的`dplyr
與ggplot2
函式,重製這兩個圖表。
References
Woodworth, Rosalind J., Angela O’Brien-Malone, Mark R. Diamond, and Benjamin Schüz. 2017. “Web-Based Positive Psychology Interventions: A Reexamination of Effectiveness.” Journal of Clinical Psychology 73 (3): 218–32. https://doi.org/10.1002/jclp.22328.
———. 2018. “Data from, ‘Web-Based Positive Psychology Interventions: A Reexamination of Effectiveness’.” Journal of Open Psychology Data 6 (February): 1. https://doi.org/10.5334/jopd.35.