National Yang-Ming University + 886 2 2826 7391

相關性和因果關係

A 和 B 相關是否意味著 A 導致 B?還是 B 導致 A? 最近有一篇報導寫到,體適能進步,學測跟著好,原始研究報告見此。主要結論是體適能和學測成績,有些微的相關性。雖說原作者沒有明顯地強調「因為」學生體適能進步,「所以」學測考得比較好,但是該文,以及作者對外的記者會等pdf公關活動,都隱隱指出兩者有因果關係。他們建議教育部加強體育課,因為體適能好的孩子,大學學測考得比較好。

因果關係 (causality) 理論上是無法證明的。舉例來說,我們懷疑「考試前用功讀書和考試得高分」有因果關係。我們可以找一個學生 (或很多個學生),先要求他大玩特玩之後再去考試,看看考出來幾分。如果有時光機器的話,我們回到過去,這次命令他拼命用功之後再去考試。看看兩個考試分數有沒有差異。這方法叫做「反事實法 (counterfactual reasoning)」。更進一步可以比較這差異在很多個測試學生身上是否明顯。

很明顯事實上時光機器是不存在的,所以科學家必須用其他方式來推測因果關係。以考試的例子而言,同卵雙胞胎是個方法。雙胞胎之一考前不準備,另外一個考前拼命苦讀,比較兩者的考試成績,勉強可以取代之前使用時光機器的實驗。

話說回來,真實世界哪來那麼多同卵雙胞胎。所以一般科學實驗採用的是隨機取樣法 (randomization)。隨機取一千人,命令他們考前打電動不讀書。隨機再取一千人,叫他們考前認真讀書。我們假設這兩群隨機選出的學生,除了考前用功不用功這個變因,其他所有先天上差異,例如智力,家世背景等等,都因為隨機選取的關係而平均掉了 (the two groups of students are very likely to be equal in all aspects except studying)。也就是第一群一千人,和第二群一千人,實際上等於兩個同卵雙胞胎。

另一個古典的例子,某人觀察到冰淇淋和泳裝的銷售量有明顯正向相關 (positively correlated)。我們可不可以下結論「因為某人買冰淇淋,所以他也會買泳裝」?還是「因為某人買泳裝,所以他也會買冰淇淋」?很明顯都不是。背後的潛在因子 (confounding factor) 其實是天氣炎熱與否。那我們要怎樣用實驗數據來否定冰淇淋和泳裝銷售之間的因果關係?

假設我們有 10,000 人的數據。有些人有買冰淇淋,另一些有買泳裝,還有一些是兩者都有買。我們在有買冰淇淋的人之中,隨機選 1,000 人,把他們叫做第一組。正常情況下這一組人有的是因為天氣炎熱而買冰淇淋,有些是冷天也去買。換句話說,天氣這個變因在這一組中應該不重要,這組中有天氣熱的,也有天氣不熱的。然後我們在沒買冰淇淋的人之中,再隨機選 1,000 人,叫做第二組。如果「冰淇淋銷售導致泳裝銷售」,則第一組人會去買泳裝的比例,應該遠大於第二組。如果實驗數據顯示,兩組人買泳裝比例相差不大,則原先假設的因果關係應該不存在。

以上的例子可以看出隨機的重要性,在於能不能將 confounding factor 平均分配到兩組裡,造成兩組唯一的差異就是買冰淇淋和不買冰淇淋。

回到最開頭的體適能和學測。真的要研究兩者有沒有因果關係,應該要排除學校教學,地緣,家長經濟狀況等因素的影響。例如隨機選出 10,000 名所謂體適能優異的學生,裡面有來自天龍國和偏鄉的,有家境富裕和清貧的,有明星學校和偏遠學校的。再隨機選出 10,000 名體適能低落的學生。看看這兩群學生在學測成績上有沒有顯著差異。