列聯表/交叉表 單向卡方分析
One-way Chi-square Analysis for Contingency table/ Cross tab
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:統雄快訣 延伸閱讀 進階議題 警示訊息
卡方分析的假設檢定第一式
卡方分析的假設檢定第二式
卡方分析的顯著水準
細格校正
資料分析的程序:卡方分析適用列聯表Contingency table,或稱交叉表Cross tab中類別資料之差異分析。可不究其應變、自變關係,而只檢定變項間是否獨立,故以「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形;「多向(Multi-way)列聯表」就是行變項、或列變項超過2的情形;而「單向(One-way)列聯表」就是單一類別變項,其水準之間是否有差異的情形。單向卡方檢定應用於:比較同1個類別變項,「水準間有沒有差異」。或是比較同1個類別變項、但「2組資料有沒有差異」。下載SPSS範例,進行實作。 |
列聯表Contingency table/交叉表Cross tab
以類別陣列呈現的表格,特稱為列聯表Contingency table,或稱交叉表Cross tab。分析行列間差異或關聯的統計工具有很多,其中最常用、也最適用的就是卡方分析。由於研究目的包括:探索行與列是否呈「自變項à應變項」關係;或可不究其應變、自變關係,而只檢定變項間是否獨立,故以「向(Way)」表示其變項數,最常用的「雙向(Two-way)列聯表」就是行變項、與列變項各1的情形;「多向(Multi-way)列聯表」就是行變項、或列變項超過2的情形;而「單向(One-way)列聯表」就是單一類別變項,其水準之間是否有差異的情形。
In statistics, a contingency table (also referred to as cross tabulation or cross tab) is a type of table in a matrix format that displays the (multivariate) frequency distribution of the variables. The term contingency table was first used by Karl Pearson in "On the Theory of Contingency and Its Relation to Association and Normal Correlation", part of the Drapers' Company Research Memoirs Biometric Series I published in 1904.
單向卡方檢定 One-way Chi Square Test
適用時機有二:
1.有時我們只想單純比較同1個類別變項,「水準間有沒有差異」,譬如今年使用者首頁設定之入口網站,其間差異是否達到顯著水準。
2.或是,比較同1個類別變項、但「2組資料有沒有差異」,譬如今年使用者首頁設定的入口網站,和去年的差異是否達到顯著水準。
以上這2種分析方法,就稱為單向卡方檢定(One-way Chi Square Test)。
勿為名詞所惑:「向(way)」就是「變項」,這種用法,可不分自變項或應變項。
在第二種情形時,我們就用去年的資料人數「視同」:
E: 期待值
而以今年的人數作為:
O: 觀察值
SPSS 範例檔案下載
以下介紹使用SPSS達成所有分析步驟的過程。
下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe
下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar
下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z
下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe
下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe
單向卡方檢定應用範例 One-way Chi Square Test
「水準間有沒有差異」檢定
生活統計
統雄神掌
研究問題的「理論建構」化
以上問題是個「單向」的「理論建構」型式。
要到那些入口網站刊登廣告的原因,就是要知道那些入口網站的人氣最高,故要檢定各網站是否有差異。而以使用者瀏覽器上首頁設定的入口網站,作為估計變項。
理論建構可以用「 理論敘述」或是「假設檢定」的方式呈現如下:
理論敘述
各入口網站在使用者瀏覽器上首頁的設定,是否有差異?
假設檢定
H0 為 Null Hypothesis, H1 (有些書作 HA) 為 Alternative Hypothesis
設 i:入口網站, i=1, ...,n
H0 : Pi= P2=...=Pn
H1 : 至少有1個i 的 Pi 是不相等的
〉分析
〉無母數統計
〉卡方
如果是20版以後:
〉無母數統計
〉歷史對話記錄
〉卡方
〉待檢定變項集 Test Variable List
q10_1
可作批次分析,即輸入多個變項。
〉期望值
故選〈所有類別相同 All categories equal〉。
報表輸出與詮釋
結果顯示各入口網站間人氣,達到.000顯著差異。
「2組資料間差異檢定」檢定
生活統計
統雄神掌
研究問題的「理論建構」化
這個問題的決策,是在問各入口網站的人氣,是否有所變化,而應調整投資。
理論敘述
各入口網站在使用者瀏覽器上首頁的設定,與去年是否有差異?
假設檢定
H0 為 Null Hypothesis, H1 (有些書作 HA) 為 Alternative Hypothesis
設 i:去年設定, i=1,2 j:今年設定 j=1,2
H0 : Pi1= Pi2,
H1 : 至少有1個i 的 Pi1、 Pi2 是不相等的
這種檢定的理論建構、理論敘述、統計假設的作法,與雙向卡方檢定相同。
差別只在期望值不是由機率決定,而是以去年資料決定。
〉分析
〉無母數統計
〉卡方
如果是20版以後:
〉無母數統計
〉歷史對話記錄
〉卡方
〉待檢定變項集 Test Variable List
q10_1
可作批次分析,即輸入多個變項。
〉期望值
按照去年各類別的次數,假設依序為:20, 60, 5, 10, 5。
在〈值〉依序鍵入次數後,再按〈增加〉。
報表輸出與詮釋
各入口網站的人氣,與去年比較沒有達到顯著差異。