跳到主要內容區
 

沒有透露的小小數據

最後更新日期 : 2026-03-16

沒有透露的小小數據

資料來源:《統計數據會說謊》,【美】達萊爾·哈夫(Darrell Huff)著,

靳琰、武鈺璟譯,中信出版集團,2018

 

報紙上廣告上的大字標題:「用戶調查,使用**牙膏後蛀牙減少了23%!」接著往下看,你發現這個結論來自某個「獨立」實驗室,並且還附註了知名會計師的背書。這樣還有什麼不放心的?其實,你也用過**牙膏,並沒有覺得有什麼特別,那麼這家公司怎麼還這麼明目張膽的做這個的廣告,他們是在說謊嗎?不,他們不必說謊,調查的結果真的就是這樣!如果你注意看到了那些小字,會發現參加測試的用戶僅有12個,這就是運用了「有限樣本」的技巧。該公司讓一個小組(有12人)先數好自己的蛀牙數量,然後堅持使用了6個月該公司的牙膏。實驗結束以後的結果,不外以下三者之一:蛀牙明顯增多、蛀牙明顯減少、沒有變化。如果出現了第一或第三種結果,公司就把實驗歸檔,然後繼續實驗。他們遲早會得到第二種結果,於是就大作廣告來宣傳。他們有做假嗎?沒有,參加那次實驗的人也都願意發誓作證:絕對沒有!這告訴我們,只有樣本數足夠大時,才會是一個有用的描述或猜測。那麼,要多少樣本才夠呢?這取決於你抽樣研究的樣本數和種類。

有時,樣本中單位數量看上去蠻多的,但實際上卻不足。有一個小兒麻痹疫苗的實驗可以說明:一個地區的450名兒童注射了疫苗,沒注射的有680名,不久後,該地區出現疫情,注射過疫苗的兒童中沒有一個患上小兒麻痹症,這能證明就是注射疫苗的效果嗎?不行!因為,對照組中也沒有兒童患病!原來,小兒麻痹症的發病率很低,在一般情況下,以上大小的群體中可能只會出現2例。如果想得到有意義的結論,實驗組需要多15~20倍的兒童作樣本才行。

由於受到公眾壓力過大及新聞上的需求,在數據背景還模糊不清時,許多的「治療措施」就很快被廣泛使用,而事實上他們連疾病的原理都還沒弄清楚,也缺乏一定的邏輯。那麼要怎樣才能不被愚弄,就必需配合顯著性的檢驗方法,例如,5%的顯著水準就意味著有95%的概率是真實的。對於大多數的情況,5%的顯著水準已經足夠,1%那就更好了。

還有一種沒有被透露的數據,缺了它也會影響數據的準確性,那就是要告訴我們「誤差範圍」。例如,根據統計數據,美國一般家戶的平均人口數為3.6人,這個數字精確到令人信服而權威。如果建商按照這個規模建造住房,結果就是,有二間臥室的房屋太多,更大或更小的房子太少,實情是3人或4人的家庭總數占全美家庭的45%,1人和2人的家庭占35%,4人以上家庭則占20%。其實,幾乎沒有人能在任何方面都達到絕對的標準,就像拋100次硬幣,要得到50次正面的結果幾乎是不可能的。

1952年,Colliers雜誌發表了一篇文章〈現在就能知道你的孩子會多高〉,文章附了兩張圖表,一張是男孩的、一張是女孩的,上面畫的是孩子在每個年齡段最高身高可能性的百分比。然而,並非所有孩子的成長過程都是一模一樣的,有些孩子一開始長得很快,有些孩子則發育比較慢,到後來才趕上。對父母而言,他們關心的只是自己的孩子,所以這樣的圖表可以說根本毫無用處!Fortune雜誌上曾刊登了一個廣告代理商的圖表,圖上的線條顯示出這家公司的傲人業績,然而圖表上並沒有數據!在沒有數據的情況下,千萬不要輕信一個平均數或一條趨勢線,否則,你就會像只憑平均氣溫選擇露營地的人一樣無知和盲目。你看看,奧克拉荷馬城曾宣稱60年來(1890~1952)的平均氣溫是60.2OF(約16 OC),可是隱藏在後面的是足足有130OF(約54 OC)的溫差。

 

心得分享:

很多人也常聽說一句形容嬰兒成長狀態的俗語 --- 「七坐八爬」,意即嬰兒七個月大就會坐、八個月大就會爬。於是,如果自己的孩子比這個標準早做到就很高興,沒有在這個時段坐起來、爬起來,就會引起父母的擔心,煩惱孩子是不是發育遲緩。要是父母以此來強迫自己的孩子遵從這個「標準」,不是反倒會對孩子產生不良的影響嗎?

 
瀏覽數: