
列聯表/交叉表
類別資料之差異理論檢定
Chi-square Analysis for
Contingency table/ Cross tab
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:
統雄快訣
延伸閱讀
進階議題
警示訊息
卡方分析的假設檢定第一式
卡方分析的假設檢定第二式
卡方分析的顯著水準
細格校正
資料分析的程序:卡方分析適用列聯表Contingency table,或稱交叉表Cross tab中類別資料之差異理論檢定。可不究其應變、自變關係,而只檢定變項間是否獨立,故以「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形;「多向(Multi-way)列聯表」就是行變項、或列變項超過2的情形;而「單向(One-way)列聯表」就是單一類別變項,其水準之間是否有差異的情形。介述卡方分配、自由度、卡方分析的假設檢定第一式、假設檢定第二式、顯著水準、細格校正。下載SPSS範例,進行實作。 |
列聯表Contingency table/交叉表Cross tab
資料分析的程序
這是論文結構中的「研究發現」或「資料分析」章節,應包括以下幾個部分:
1.對象(樣本)分析:樣本代表性為何?有沒有推論意義?還是僅具參考意義?
2.測量工具(量表信度)分析:如果是採用量表測量變項,至少應作信度分析,檢定量表的信度為何?有沒有測量意義?並視研究的規模與需求,是否增作效度分析。
3.理論建構檢定與分析:又包括:
(1)整體分析(單變項分析):針對個別變項的「單變項分析」,若是僅報告樣本統計值,便採用「描述」方法;若要推論母群,則應用「估計」的方法,又因資料型態為「類別型」或「連續型」而不同。
(2)交叉分析(雙變項分析):分析兩個變項間的關係,常為各一應變項、自變項,與兩者關係。雙變項可能只具備關聯關係,而不具備因果關係,亦即無法辨別何者為自變項、何者為應變項。常用、也最實用的統計工具包括:卡方分析、變異數分析、與相關分析。
(3)進階理論模型建構(多變項分析):以上各部分是任何研究都應該具備的。除此之外,可依研究的特性增加各種進階的「多變項分析」。
以類別陣列呈現的表格,特稱為列聯表Contingency table,或稱交叉表Cross tab。
分析行列間差異或關聯的統計工具有很多,其中最常用、也最適用的就是卡方分析。由於研究目的包括:探索行與列是否呈「自變項à應變項」關係;或可不究其應變、自變關係,而只檢定變項間是否獨立,故以「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形;「多向(Multi-way)列聯表」就是行變項、或列變項超過2的情形;而「單向(One-way)列聯表」就是單一類別變項,其水準之間是否有差異的情形。
In statistics, a contingency table (also referred to as cross tabulation or cross tab) is a type of table in a matrix format that displays the (multivariate) frequency distribution of the variables. The term contingency table was first used by Karl Pearson in "On the Theory of Contingency and Its Relation to Association and Normal Correlation", part of the Drapers' Company Research Memoirs Biometric Series I published in 1904.
類別資料差異:卡方分析Chi-square
理論類型:差異/雙變項分析或多變項分析均可
資料型態:類別資料
目的:(1)列聯表內細格的次數分配是否相同?(2)2個以上的類別變項是否彼此獨立?-無差異即為獨立。
列聯表通常以自變項為列,應變項為欄(SPSS稱為直行);但有時資料無法區別自變項、應變項,而是分析2變項是否互相獨立,即分析目的2。
核心觀念:卡方值
O: 觀察值
E: 期待值
到底是什麼意思?
與變異數同理,避免總加後為0,所以平方。
概念上的「絕對比」(統計書上沒有這個詞,但卻是理解的關鍵。)
因屬於類別資料-即次數,故只有正值。
卡方分配
卡方分配屬於Gamma分配的一種。
自由度(df)
(r-1)*(c-1)
為什麼?
大風吹原理(df愈大,愈接近常態分配)
應用觀念和常態分配一樣,譬如在K=1時(即2*2列聯表),95% 的 χ2 <3.的一種。
自由度(df)
(r-1)*(c-1)
為什麼?
大風吹原理(df愈大,愈接近常態分配)
應用觀念和常態分配一樣,譬如在K=1時(即2*2列聯表),95% 的 χ2 <3.84,而當K=3時,95% 的 χ2 <7.82。
卡方分配檢定,若用手算太複雜,練習時可以採用:
線上卡方分配計算器
SPSS 範例檔案下載
以下介紹使用SPSS達成所有分析步驟的過程。
下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe
下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar
下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z
下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe
下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe
雙向卡方分析應用 Two-way Chi-square Analysis
「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形

理論敘述
網路使用行為是否有性別差異?
假設檢定
H0 為 Null Hypothesis, H1 (有些書作 HA) 為 Alternative Hypothesis
假設第一式
設 i:性別, i=1,2 j:網路使用行為 j=1,2
H0 : Pi1= Pi2,
H1 : 至少有1個i 的 Pi11 : 性別與網路使用行為不是彼此獨立的
註:第一式稱為 test of goodness-of-fit,第二式稱為 the chi-square test of
independence。第一式必須增加檢驗卡方值是否趨近於0,不過,對於初學者,可視為相同。
〉分析
選擇「卡方分析」,其他多種統計量,一般作為「無母數統計」範疇。
自變項為列,應變項為欄
卡方分析的目的是「百分比的差異」,但「計算對象是次數,不是百分比」。
「列」百分比最重要,但3種百分比,可展現全面涵義。
如要節省空間,可只報告「次數」「列百分比」。
檢定可只報告 Pearson 卡方。
顯著性差異
顯著不一定重要
重要的是「差異的大小」
顯著更不表示有「因果」關係
「顯著」只表示,差異不是誤差造成的-亦即,樣本數夠大而已。樣本數大,一定顯著。
差異「未達顯著水準」,就沒有列表、闡述的必要。差異「達到顯著水準」,還必須進一步分析。
註:
Two-tailed test 中譯常作「雙尾檢定」,對常態分配尚易理解;對卡方分配則常令學生不解,其實其意義應為「無大小、方向性檢定」,若達到顯著水準,僅證實
Pi1 ≠ Pi2 ,而不論何者為大。
細格校正
細格次數不宜 < 5,不得 = 0。
細格次數如果 < 5 ,(1)若為2×2 表格,且不超過1格,可使用 Yates 連續性校正檢定、或 Fisher 檢定;(2)現在多主張「合併變項類別」 ,使所有(或至少〉20%) 之細格次數﹦〉5。
Exact Method 直接機率(精確)檢定法
SPSS 報表附有「Fisher's 精確檢定」,其翻譯得有點奇怪,Exact probability test 是「直接機率檢定」的意思,就是在 2×2 ,且小樣本(<30)時,直接從最基本機率(即排列比)計算起,解決 c2 在小樣本會膨脹的問題;並不是別的檢定法就「不精確」。
統雄老師一再指出:行為研究之樣本宜大於200,若少於30。生物研究或許還可以改用「直接機率檢定」以取代卡方檢定,但對行為已幾乎無意義,不如只用百分比作「質的比較」。
註: SPSS 新版,已將Exact Method 獨立為介面的一個選項。
批次卡方分析
卡方分析可以批次進行,一次作若干個雙向分析,如下所示。
統雄數學樂學/統計神掌易經筋-問卷




