第 12 週 09_10_不誠實的誠實研究資料

本次單元作業比照電子書的AQ data and recap,使用部落格datacolada揭露Shu等人(2012,已被撤銷)的可疑資料,做為單元912的演練材料。這次的課堂作業是認識這份資料檔案的內容,演練如何自建Rmarkdown檔案,以及復習單元58學到的資料整頓技巧。

12.1 資料編碼簿

開始演練前,教練會解釋每份資料檔案的變項,在Shu等人的研究結果所發揮的角色與功能。

id varname files description
var1 id averages.csv, car1~4.csv, condition.csv, font.csv Masked policy id
var2 condition condition.csv Sign on top vs sign on bottom of forms with miles being submitted
var3 font font.csv Is car #1 shown in Calibri or Cambria font in originally posted data (this variable was added for the Colada post)
var4 baseline_car1 car1.csv var4-var11: baseline 1-4 is the odometer reading before the experiment,
update1_4 is the odometer submitted in the experiment
var5 update_car1 car1.csv NA
var6 baseline_car2 car2.csv NA
var7 update_car2 car2.csv NA
var8 baseline_car3 car3.csv NA
var9 update_car3 car3.csv NA
var10 baseline_car4 car4.csv NA
var11 update_car4 car4.csv NA
var12 baseline_average averages.csv Average of baseline values for the up to four cars
var13 update_average averages.csv Average of update values for the up to four cars
var14 diff_average averages.csv DV in original paper: average difference update-baseline for up to four cars

根據教練的說明,在[討論區]的對應貼文回覆以下問題:

  • condition欄位裡的Sing Top和Sign Bottom分別表示什麼?

  • 為何car2~4.csv這些檔案裡有許多NA?

  • “averages.csv”的數值是如何總計的?

12.2 演練1: 取得資料檔案

領取作業複本,建立作業專案,確認其中有壓縮檔“dishonest_data.zip”。 解壓縮至儲存演練資料的資料夾,確認每個檔案的欄位配置符合“資料編碼簿”。

12.3 演練2: 自建Rmarkdown檔案

參考電子書的示範,在作業專案建立“Assignment.Rmd”文件檔。檔案選單的標題與姓名必須是英文,例如“Dishonest data,”“John Doe”,才能建立YAML前置設定區。

12.4 演練3: 建立R chunk

參考電子書的示範,為匯入每一個資料檔案準備一個R chunk。

建議1:新建的Rmarkdown文件檔預設第一個R chunck是“setup”,應把要用到的package如tidyverse在此載入。

建議2:參考課前示範影片,為每個chunk命名,有利在編輯視窗設定索引捷徑

12.5 演練4: 匯入資料檔

在每個R chunk運用read_csv()匯入資料檔。

12.6 演練5: 檢視資料檔

除了電子書示範summary(),也建議試試課前影片示範的head(),tail(),str()等。在每個R chunk之後紀錄你對那一份檔案的認識。

下課前完成以上演練,並成功生成“Assignment.html”,完成推送就能獲得“準時推送”與“演練充分度”最高評分。以下是獲得“演練活用度”評分的課後問題。

  • “averages.csv”的每個欄位數值是如何從“car1.csv”到“car4.csv”的baselin_car?update_car?總計的?下次上課開始之前,在[討論區]的對應貼文回覆你的方法,被教練標註就能獲得“演練活用度”評分。