第 12 週 09_10_不誠實的誠實研究資料
本次單元作業比照電子書的AQ data and recap,使用部落格datacolada揭露Shu等人(2012,已被撤銷)的可疑資料,做為單元912的演練材料。這次的課堂作業是認識這份資料檔案的內容,演練如何自建Rmarkdown檔案,以及復習單元58學到的資料整頓技巧。
12.1 資料編碼簿
開始演練前,教練會解釋每份資料檔案的變項,在Shu等人的研究結果所發揮的角色與功能。
id | varname | files | description |
---|---|---|---|
var1 | id | averages.csv, car1~4.csv, condition.csv, font.csv | Masked policy id |
var2 | condition | condition.csv | Sign on top vs sign on bottom of forms with miles being submitted |
var3 | font | font.csv | Is car #1 shown in Calibri or Cambria font in originally posted data (this variable was added for the Colada post) |
var4 | baseline_car1 | car1.csv | var4-var11: baseline 1-4 is the odometer reading before the experiment, update1_4 is the odometer submitted in the experiment |
var5 | update_car1 | car1.csv | NA |
var6 | baseline_car2 | car2.csv | NA |
var7 | update_car2 | car2.csv | NA |
var8 | baseline_car3 | car3.csv | NA |
var9 | update_car3 | car3.csv | NA |
var10 | baseline_car4 | car4.csv | NA |
var11 | update_car4 | car4.csv | NA |
var12 | baseline_average | averages.csv | Average of baseline values for the up to four cars |
var13 | update_average | averages.csv | Average of update values for the up to four cars |
var14 | diff_average | averages.csv | DV in original paper: average difference update-baseline for up to four cars |
根據教練的說明,在[討論區]的對應貼文回覆以下問題:
condition
欄位裡的Sing Top和Sign Bottom分別表示什麼?為何car2~4.csv這些檔案裡有許多
NA
?“averages.csv”的數值是如何總計的?
12.2 演練1: 取得資料檔案
領取作業複本,建立作業專案,確認其中有壓縮檔“dishonest_data.zip”。 解壓縮至儲存演練資料的資料夾,確認每個檔案的欄位配置符合“資料編碼簿”。
12.3 演練2: 自建Rmarkdown檔案
參考電子書的示範,在作業專案建立“Assignment.Rmd”文件檔。檔案選單的標題與姓名必須是英文,例如“Dishonest data,”“John Doe”,才能建立YAML前置設定區。
12.4 演練3: 建立R chunk
參考電子書的示範,為匯入每一個資料檔案準備一個R chunk。
建議1:新建的Rmarkdown文件檔預設第一個R chunck是“setup”,應把要用到的package如tidyverse
在此載入。
建議2:參考課前示範影片,為每個chunk命名,有利在編輯視窗設定索引捷徑
12.5 演練4: 匯入資料檔
在每個R chunk運用read_csv()
匯入資料檔。
12.6 演練5: 檢視資料檔
除了電子書示範的summary()
,也建議試試課前影片示範的head()
,tail()
,str()
等。在每個R chunk之後紀錄你對那一份檔案的認識。
下課前完成以上演練,並成功生成“Assignment.html”,完成推送就能獲得“準時推送”與“演練充分度”最高評分。以下是獲得“演練活用度”評分的課後問題。
- “averages.csv”的每個欄位數值是如何從“car1.csv”到“car4.csv”的
baselin_car?
與update_car?
總計的?下次上課開始之前,在[討論區]的對應貼文回覆你的方法,被教練標註就能獲得“演練活用度”評分。