跳到主要內容區
 

如何正確認識統計數據

最後更新日期 : 2026-05-09

如何正確認識統計數據

資料來源:《統計數據會說謊》,【美】達萊爾·哈夫(Darrell Huff)著,

靳琰、武鈺璟譯,中信出版集團,2018

 

那麼我們要如何看穿那些偽劣的統計資料?要如何從眾多騙術中識別出真實可用的數據?我們可以提出以下5個簡單的問題,並通過問題的答案,來避免被一些明顯似是而非的東西迷惑:

 

  • 是誰這麼說的?

首先,要找的第一樣東西是偏差。比如說,某實驗室為了研究理論、獲取名利而證實某事;報社為了發表一條能上頭版的新聞;發生利害衝突時要動手腳……等,這些都是產生偏差的原因。

有意識的偏差,可以使用直接的錯誤陳述或是含糊不清的措辭,一般情況下人們不容易察覺到有問題。還有一招就是選擇對自己有利的數據,剔除不利的數據。還可以改變衡量的標準、改變基期或使用不恰當的計算方式……等等,目的就是要掩蓋真相。

更要注意的是那些無意識的偏差,因為它危害更大。例如經濟結構中出現的漏洞被過於樂觀地忽略,專家們不但引用各式各樣的證據,還從統計學的角度予以支持,試圖說明國家已進入繁榮時期。

為了找出「是誰說的」,我們要看清楚文中的描述。不是所有與醫學專業相關的人都是「專家」、知名研究機構和名校的聲譽只是作者的護身符,結論是他自行研究得出的。我們要知道,所謂的專家、不具名的高層、內部權威人士,也許只是沾了邊而已,或者根是空穴來風。

 

  • 他怎麼知道的?

要格外注意那些帶有偏差的樣本。所以,要了解它是怎麼取樣的、有效樣本占多少%、樣本規模是否足夠大……等等,以上這些訊息披露了沒有?這些項目本來都是應該交待的,沒提到通常都是有意不說。

同樣的,當我們看到關於「相關性」的報導時也要想想:它的規模是否大到足以說明問題?案例(樣本數)是否多到具備顯著性?一般讀者只要仔細看,也能發現有些內容缺乏足夠數量的案例,無法令人信服。

 

  • 漏掉了什麼?

當數據關係到利益時,不提供數據相關訊息當然讓人產生懷疑。同樣,一個相關如果缺乏可信的檢驗(比如概率誤差、標準誤差),那就沒必要把這個相關當真。

要留心那些未加說明的平均數,因為無論在什麼時候,平均值(常常也稱為平均數)和中位數都有著本質上的差別。

有些數據由於沒有其他數據可以對比,所以這個數據也變得沒什麼意義。有時,只給出了百分數,卻沒有給原始數據,這種數據也常帶有欺騙性。例如,有一個傑出女性名人錄中的16人總共有60個學位,育有18個孩子,但真相是其中的二人學位加起來就占了60個學位的1/3,而有一位就育有12個孩子。

如果只提供了一個指數,我們要問,是不是漏掉了什麼?因為這個指數也許是被挑出來用以扭曲事實的,有時候漏掉的正是會導致變化的因素,這種遺漏往往暗示著這個其他因素,才是導致變化發生的主要原因。一項對比今年4月和去年4月的零售銷售額,目的是要證明今年經濟處於復蘇階段,但遺漏的是,去年復活節假期在3月,而今年則是在4月。

 

  • 有人偷換了概念嗎?

在分析一份統計數據時,要注意原始數據和最終結論之間,有沒有什麼地方被偷換了概念。例如,某個候選人在一場非官方的民意測驗中獲勝,並不意味著他在真正的選舉中也會獲勝;某種病上報紙的多,並不意味著患這種病的人就多;雖然讀者說自己喜歡看某類報導,並不意味刊登此類文章就會提高銷量;媒體中用大字標題大量報導某地區犯罪案件,並不表示該地區治安就很差。許多調查得到的,只是受訪者聲稱的行為,而非他真實的行為。

美國曾有議員呼籲:「把**監獄的犯人轉為安置到**酒店,這樣可以更省錢」。這就是把監獄的全部開銷,偷換成了旅館住房費的好例子。

如果以6%的利率向銀行借款100元,以每月定額償還的形式在一年內還清。如果是以利息6元共106元來每月攤還,那麼實際承擔的利率大概為12%,因為6個月後已經償還一半了。大部分的購車貸款利息就是用這種方式算的,真是太狡猾了!

 

(註:網路上的地下貸款,初看起來利率也不致高得嚇人,但利息的計算就是利用這種方法偷換概念的,難怪越來越多人背債終身!)

 

將因果關係搞亂是偷換概念的另一種方式,也就是把「相關關係」說成「因果關係」,反對核電、基地台…等都是。

有時,有心人也會拿詞意作文章,以達到偷換概念的目的。「剩餘」是一個讓人不愉快的詞語,美國會計師協會就建議,可以使用類似「留存收益」或「固定資產增值」等描述性術語來代替。

 

(註:可不是嗎?用「轉進」代替「撤退」、用「終戰」代替「投降」、用「日治」代替「日據」、用「獨裁」代替「集權」、用「反恐」代替「侵略」…,例子可真是無處不在啊!

 

調查的目的也常會影響結果。例如,為徵兵和為賑災而做的人口普查,結果一定相差很多。要想知道每個人的準確年齡,要詢問的是出生年月日,而不是問幾歲!

 

  • 這是否合乎情理?

如果我們看到一個以未經證實假設為基礎的統計資料,就要先問問:「這是否合乎情理」?

有不少方法是將一些不可衡量的東西簡化為數據,然後用計算來代替判斷。這就是利用數據的神奇力量,來使常識失效的方法。例如,美國曾有一位神經科名醫估計每12個美國人中就有1個患有偏頭痛,而慢性頭痛患者中,偏頭痛患者占1/3,這就是說,有1/4美國人遭受著頭痛的折磨,是嗎?

請問:「美國石油工業委員會的報告中聲稱,每年每輛汽車平均納稅51.13美元。」這則報導哪裡有問題?

外推法相當有用,尤其是在「預測趨勢」的過程中。但我們必須時刻謹記:「過去到現在數據雖是事實,但是未來的趨勢不過是預測者的猜測。」。外推的假設是目前的趨勢還將繼續,但是,所有的事情不會一成不變,否則,生活就會變得無聊透頂!

1874年,馬克吐溫在《密西西比河上的生活》中就指出了外推法的荒謬之處:

「176年之內,密西西比河下游縮短了242哩,平均每年縮短1.33哩。因此,任何一個既不瞎也不蠢的冷靜之人都知道,到明年11月的整整100萬年前,密西西比河下游長度超過了130萬哩,就像一個魚竿似的伸到了墨西哥彎裡。同樣的,所有人也都知道,自現在算起的742年之後,密西西比河下游會縮短到1.75哩,而開羅和新奧爾良的街道將會連在一起。」

(本書完)

 
瀏覽數: