演練這個單元時,建議開啟原論文與code-book.pdf,搭配演練過程隨時參考。
[dplyr](https://dplyr.tidyverse.org/)
,[ggplot2](https://ggplot2.tidyverse.org/)
的開發者有說明網站,程式碼有用到這些函式但遇到卡關的話,可先從說明網站找找可行範例。
單元6的作業檔案改編自”stub-wrangling-2.Rmd”。
這個單元我們透過第5週的工作成果– 從 @woodworthDataWebbasedPositive2018 的公開資料裡挑出的summarydata
,運用第6週學到的dplyr
及ggplot2
函式,視覺化未滿65歲,不同收入狀況的參與者的憂鬱量表分數。
最後有項延伸練習,談談大家目前學到的技巧,能否重製 @woodworthWebBasedPositivePsychology2017 的圖表?(論文全文附在單元作業複本,也可以自己試著找找看)
同第5週的練習1。
同第5週的練習6。
試著說明summarydata
為何不必納入所有變項/欄位。
演練電子書6.4的操作,回答有關ahiTotal
的問題。
演練電子書6.5的操作,回答有關filter()
執行後的問題。
演練電子書6.6的操作,回答有關”median score”的問題。
收入中位數及平均數分別存在物件data_median
與data_mean
演練電子書6.7的操作,配合第5週的練習7成果,說明為何使用這個分數分組?
課後演練:採用occasion
分組,說明65歲以下的參與者被分成幾組?各組的cesdTotal中位數?
演練電子書6.8的操作,回答有關不同收入分組及憂鬱分數的問題。
開啓 @woodworthWebBasedPositivePsychology2017 檢閱Table 2與Figure 3
活用 以到目前我們已探討的資料內容,談談如何運用目前已知的``dplyr與
ggplot2`函式,重製這兩個圖表。