於此不一定因此 / 相關不見得因果
Causal Model and the Logic of Causality
神掌打通任督二脈‧易筋經以簡馭繁
什麼是因果邏輯
Correlation does not imply causation
因果關係/相關關係並不相同
"Correlation does not imply causation" 是統計學上的重要專業術語,亦即:於此有關不一定因此有關,存在相關關係、不見得具備因果關係。也有文獻譯為「相關不蘊涵因果」。
符號表示:
↔ 相關
→ 因果
如果要建構「因果理論」、發展因果模型,必須確立「前因」與「後果」的邏輯。
因果邏輯的定義:下列三個條件都要成立,才可以得出X導致Y的結論:
X發生在Y之前
若X不發生則Y也不發生
若X發生則Y一定發生
如果A發生、同時Y也發生,
但前面2項中任何一項不符合,A與Y存在的僅是相關關係,
1. 可能是在知識論上不合邏輯的偽關係(spurious relationship),
2. 可能因理論建構不完整,另存在間接因果-中介關係。
偽效果的存在與辨識 Spurious Effect
如果變項之間有相關關係,有可能存在的是「偽效果(spurious effect),而非真正因果關係。
當我們發現:A ↔ Y
有可能既非:A → Y
也非:Y → A
而是存在被忽略的因子、即真正自變項 X,事實應是:X → A, X → Y
而發生了 A ↔ Y
教學上常被引用的2個例子是:
冰淇淋的銷量:偽效果實例
以相關分析發現: 冰淇淋的銷量最高的時期,就是各游泳場所遇溺事故發生得最多的時候。
若誤認此為「因果關係」,則會導出以下理論:若禁止冰淇淋的銷售,則可以減少遇溺事故。
以冰淇淋的銷量為影響遇溺事故的原因,就是一個偽關係。實際上,兩者都可能是由於氣候發生熱浪引起的應變項,而氣候才是自變項。
鸛鳥送子:偽效果實例
歐洲有鸛鳥送子的傳說,而荷蘭有一項研究的統計數字顯示,鸛鳥巢的數目與人類嬰兒出生數目之間呈現正相關。
若誤認此為「因果關係」,則會導出以下理論:若飼養鸛鳥,則可以減少不孕症。
兩者之間其實也沒有因果關係,而是鸛鳥與人類的生殖周期相同,它們卻都跟數據觀測之前9個月的天氣相關。
Confounder、Confounding Variable、Confounding Factor 混擾變項/因子
狹義指產生偽效果的自變項‧廣義包括:共變項
在以上 X → A, X → Y 關係,或可標示為 A ← X → Y 關係存在時,X 稱為 Confounder、Confounding variable、或 Confounding Factor 混擾變項/因子。
中文也有譯為干擾因子,但易與 intervening variable 混淆,故不建議使用。
另外,在不嚴謹的語境下,中英文獻均發現使用這個名詞,但實際是指共變項。
間接因果關係
上述「X → Y」是直接因果關係。
然而,也可能真正的影響因素以「中介變項」的形式存在,造成間接因果關係,如「A → M → Y」。
年齡與工作滿意度:間接因果關係-中介效果實例
譬如,有一項研究發現,年齡與工作滿意度呈正相關。
如果此項理論成立,則將導出奇怪的應用:聘用員工的時候,聘年齡愈高的愈好。
進一步發現,真正影響工作滿意度的因素其實是「薪資」,因為薪資為隨著年資、也就是年齡而成長,所以表面看起來年齡會影響工作滿意度。
但如果薪資並沒有增加,亦即真正的因素沒有發生,年齡變大並不會提升工作滿意度。
3個變項兩兩相關‧不能判別因果關係
如果發現3個變項兩兩相關,無法證明「因果邏輯」的前2項,故不能判別因果關係。
許多論文在資料分析過程,只作了相關分析,即主觀的判定誰是應變項、自變項、中介變項,屬實基本邏輯能力之不足。
間接因果關係之證明與中介模型建構
中介變項的辨別、證明與中介模型建構,請參考本神掌系列「中介模型」篇。
The term "spurious relationship" is commonly used in statistics and in particular in experimental research techniques, both of which attempt to understand and predict direct causal relationships (A → Y). A non-causal correlation can be spuriously created by an antecedent which causes both (A → M and M → Y). Intervening variables (A → M → Y), if undetected, may make indirect causation look direct. Because of this, experimentally identified correlations do not represent causal relationships unless spurious relationships can be ruled out.
於此不一定因此 / 相關不見得因果 其他例證
https://en.wikipedia.org/wiki/Correlation_does_not_imply_causation
SPSS 應用範例:探索式因徑模型建構
統雄數學樂學/統計神掌易經筋-問卷