統雄-統計與理論建構篇
Statistics and Theory Building
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:統雄快訣 延伸閱讀 進階議題 警示訊息
科學邏輯4大實證程序:建構理論、收集資料、分析數據、辯難詮釋。理論建構3種呈現形式:概念模型、理論敘述、統計假設。理論的組成與變項類型,如何依據理論類型選擇統計方法/統計工具。生活統計想一想。 |
科學邏輯四大實證程序
研究的目的是探索科學知識,而知識是經由科學邏輯四大實證程序而產生的。
1、建構理論(建立統計假設)
2、收集資料
3、分析數據(統計假設檢定)
4、辯難詮釋:正反檢討,反覆驗證,修正或產生新理論最後獲得科學知識;達到:解釋、預測、控制且一致的目標。
西方著作對第四步驟的命名常為「結論」,亦即歸納資料的意義,但在此也應增加「辯難」與「詮釋」的動作。
「辯難」是中華傳統智慧,指收集資料的目的,不僅在於「證明自己的想法對」,也要勇於「反證自己是否錯」;亦即,發現錯誤,也是知識的獲得。
「詮釋」是「知識論」的意義,不僅報告結果與數字,還要能透視數字後面的品質、內涵、所得知識的「框架性」或「基礎性」。
理論建構3種呈現形式
理論建構(Theory Building 或 Theory Construction)是對事物未經適當方法驗證前的敘述與解釋。
理論由變項組成,包括變項的定位、分析,與變項之間的關係。
變項的數目與其理論建構的關係,包括:
單變項(Univariate)理論:對單一變項的描述(對樣本)或估計(對母群)分析。
雙變項(Bivariate)理論:包括兩變項,常為各一應變項、自變項,與兩者關係。雙變項可能只具備關聯關係,而不具備因果關係,亦即無法辨別何者為自變項、何者為應變項。自變項亦稱為因子(Factor)。
多變項(Multivariate)理論:2個以上應變項或自變項,其中若應變項仍只有一個、自變項多個,則為多因子(即多自變項, Multifactorial)理論,其間還可能還包括調節變項、共變項、中介變項。
其他變項名稱Latent Variable 等同 Construct/ Factor:潛在變項或構念,或是因素分析中之「因素」,指無法用物理方式觀察、測量出來的變項,如動機、創新…等等。 Manifest Variable 等同 Item:測量項目,指「一組」用來間接測量潛在變項的項目。包括可以用物理方式觀察、測量出來的項目,如以身高、體量、血壓…等測量「健康」;也包括各種態度量表,如總加量表中的項目。 Extraneous Variable:有人譯為外變項、客變項…,事實就是「自變項」,通常強調屬於人口變項:性別、年齡…,或社經變項:職業、收入…,但不指潛在變項或構念。有的文獻,還再細分為更多子變項。這個名稱在心理學、或實驗法中較會使用。 Criterion variable 與 Predictor variable:
|
理論類型有:描述(對樣本)/估計(對母群推論)、差異、相關、分類/萃取、多變項模型等5大類型。
多變項的進階關係則有:多元迴歸、調節、共變、中介、因徑(結構方程)、對數、雙曲…等。
理論可由以下3種形式呈現,由概略到精緻為:
概念模型、理論敘述、統計假設。
統計應用的目標,是為了建構理論;統計方法的選擇,就是基於資料型態、和理論類型。
概念模型:圖形與意義
概念模型是以圖形、視覺方式表現自變項、應變項之間的:差異、或相關之關係。
在理論建構中,通常使用的圖形與意義為:
對稱幾何形(圓形、矩形…):變項/有些會加注變項的水準,但要注意,變項不要和水準發生混淆。
單箭頭線形:箭頭所指為應變項,來源為自變項。
雙箭頭線形:箭頭雙方為「相關」,不表示因果關係。
雙變項(Bivariate)理論概念模型
概念模型通常表現雙變項、或多變項模型中,各應變項與自變項的關係。
如「小鬼當家-科學知識產生程序」的第三理論建構,可用「概念模型」呈現如下:
應變項的水準,包括2個:Y 可燃、 N 不可燃。
自變項的水準,可有2種不同的分類方法:
1. 分為:2個水準:Y 木質、 N 非木質。
2. 分為若干個水準,如:木質、金屬、陶瓷、塑膠…等。
以上2種分法的說明,詳見「固定效果模式與隨機效果模式」。
共變項概念模型
共變項模型是多變項模型的一種
如果發現,材質會受到濕度影響,愈乾燥的愈易燃,反之則不易燃。濕度就是材質的共變項,但不是可燃的自變項。
共變項的概念模型使用雙箭頭表示,並可以共變項分析證明。如果共變項存在,我們希望加以排除,淨化自變項的真正效果。
而「年輕」「美麗」都是「吸引力」的自變項,且互為共變項。
其他多變項模型中,還可能包括「調節變項」「中介變項」…。
理論敘述:類型與統計方法
理論敘述可以直述句/或疑問句方式為之。
主詞表現自變項、受詞表現應變項,動詞表現變項之間的關係。
如「小鬼當家-科學知識產生程序」的第三理論建構,可用「理論敘述」呈現如下:
直述句時:材質會影響可燃性;木質與非木質不同,木質可燃,而非木質不可燃。
疑問句時:材質是否會影響可燃性?
這種理論類型是為「差異型理論」。
統計工具的選擇基於:資料型態與理論類型:
理論類型: 估計、差異、相關、分類/萃取、多變項模型;
多變項模型屬於 進階類型,則有:多元迴歸、調節、共變、中介、因徑(結構方程)、對數、雙曲…等。
一般論文的「研究目的」,就是以理論敘述(Theory Statement)的方式呈現。
類型 |
理論敘述形式 |
類別資料 |
連續性資料 |
|
單
|
估計 |
..平均..為.. |
%, Mode, Median |
|
|
..區間..為.. |
% ±E |
±E |
|
|
..總數..為.. |
n |
sum |
|
|
最小值、最大值為.. |
min, max |
min, max |
|
|
..變異..為.. |
(MAD) |
σ, σ2 |
|
雙變
|
差異 |
..與..不同.. |
|
F, (t) |
相關 |
..與..有關 |
(C) |
r |
|
多
|
分類/萃取 |
..與..與..與..為一類 |
因素分析(Factor Analysis)或集群分析(Cluster Analysis) |
|
多變項模型 |
各種多變項進階關係 |
多元迴歸模型、交互作用/調節模型、共變項模型、中介模型、因徑/結構方程分析(Path Analysis/ SEM)…。 |
理論建構必須以統計工具證明。
行遐自邇:從簡單理論建構、單變項、雙變項分析開始。(雖然「行為研究」在內涵上常是不簡單的-但形式上也不會「太」複雜。)
循序漸進:建構複雜理論,如SEM/ Path Analysis…,須借助各種多變項分析。亦即多變項理論不能以雙變項工具證明。
深入檢討:複雜的多變項線性分析,可能比簡單的單變項分析,更不具知識的真實。
登堂入室:如果探索到真正的行為基礎理論,甚至無法使用既有的統計軟體(亦即理論框架),而必須發展創新的理論模式與統計方法。
統計假設:目的與形式
統計假設是同時配對使用兩種假設形式: H0, H1
分別代表反面假設、正面假設。
統計假設源於實驗法,但當前也可援用於各種方法。
如「小鬼當家-科學知識產生程序」的第三理論建構,可用「理論敘述」呈現如下:
H0 : 材質與可燃性是彼此獨立的(即無關)
H1 : 材質與可燃性不是彼此獨立的(即有關)
資料分析時,如果是物理實驗,因為物理對象通常具備「反身性、等加性」,所以實驗樣本的結果,通常不會和母群不同。
但如果是生理、或行為實驗,對象一定不具備「反身性、等加性」,所以實驗樣本的結果,不一定會和母群相同。亦即觀察樣本的「大」不一定「全體真正大」,觀察樣本的「小」也不一定「全體真正小」。
如果研究對象符合「常態分配」,就可以依據「中央極限定理」使用統計方法的「假設檢定」程序,來確認樣本效果的大小,是否可以推論為母群效果的大小。
統計方法是一種「逆向思想方法」,從「無法證明『兩者相同』」,而推論「兩者相異」。當然,有時研究對象不僅「兩者」,而是「多者」。
所以「統計假設」一定「成對」出現:
統雄曰H0 為 Null Hypothesis,一般譯為虛無假設。 H1 (有些書作HA) 為 Alternative Hypothesi,一般譯為對立假設。 這樣的直譯,似乎不能達意。 Fisher當初創造 Null 這個詞,意指「預設『無關』(即為0)」。而我們去作一個實驗,通常是希望發現「有關」。所以我建議譯為「反面假設」與「正面假設」。 |
H0: 反面假設:假設兩者相同。
H1: 正面假設:假設兩者相異。
假設統計呈現的要件,經常包括:統計參數(如平均數、變異數、百分比、相關係數…)的等式、不等式、或邏輯敘述式。
有些文獻資料上,只出現一個H,而且呈現的形式接近「理論敘述」而不是統計假設的要件,反映作者可能並不知道統計假設的專業意義,而當成一個常識名詞,這種作法不值得鼓勵。
詳細應用,請參考:統雄-統計神掌SPSS篇
生活統計想一想
統計的故事
星座與壽命
章魚哥Paul的世足賽預測
常態分配的遊戲學習
線上工具:常態分配曲線變化
統計符號與英讀
統計常用符號與其英語讀法,及進一步的參考,請按這裡。