Sampling Analysis by SPSS
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:統雄快訣 延伸閱讀 進階議題 警示訊息
論文「研究發現」章-資料分析的程序第一步:樣本代表性檢定-有效樣本的正確定義。實務應用的檢定指標:連繫率、回應率。下載SPSS範例,進行實作。 |
SPSS 範例檔案下載
以下介紹使用SPSS達成所有分析步驟的過程。
下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe
下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar
下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z
下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe
下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe
樣本代表性檢定
什麼是樣本代表性?
數理意義的樣本代表性檢定,與資料分析中的顯著性檢定,為一體兩面。
實務應用意義的樣本代表性檢定
有效變項率/樣本率檢定
定義明確、應用有困難,實務上錯誤或可疑事例甚多, 建議慎用、少用。
「有效」(Valid)率基本係針對「變項」而言,每一個變項都不一樣。其定義是指:觀察值不是迷失(Missing或譯遺漏)值,就是有效值。有效值占該變項的總數百分比,就是有效變項率。
而樣本是指一位受訪者。實務上通常不會只訪問一個變項(即問題),所以,有效樣本是指所有變項都是有效值的樣本。
有效變項率
SPSS 預設是「變項排除(pair-wise)」,報表中列出排除有迷失(Missing或譯遺漏)值後的各有效變項率,實作如下。
〉分析
〉報表
〉觀察值摘要
以<shift>方式選擇變項移往右欄。
按〈貼上語法〉將會另開啟一個語法視窗,儲存程式。
預設排除的報表如下。
其中中文「包括」的英文就是「Valid」-有效。
亦即每個「有效變項率」的百分比可能是不同的。
不敏感、非細節性問題,每個人多會回答;而敏感、與細節性問題,就有較多人不答,形成迷失(Missing或譯遺漏)值。
有效樣本率
「有效樣本」係指「樣本排除(list-wise)」,任一變項具Missing值的樣本均被排除。
〉選項
〉排除含有遺漏值的觀察值
有效樣本率的報表如下。
亦即每個「有效變項率」的百分比是相同的。
由於各變項之間的交互作用,「有效樣本」的比例會大幅降低,也浪費了許多資訊。
實務上過高的「有效樣本率」有可能:(1)不瞭解何謂有效(2)作假。
統雄老師建議的修正方案
連繫率檢定
連繫率﹦連繫樣本數/存在樣本數
﹦各「有效變項率」的最高值
以本報表為例,就是100%。
存在樣本是指採用RDD法時,剔除空號…等之樣本。
亦即找到受訪者者的比率,而不論是否回答問題。這個比率反映「隨機性」滿足的程度。
在2000年前,研究者如果努力,可以達成90%以上,但近年已日益困難。
回應率檢定
回應率﹦回應樣本數/存在樣本數
回應指回答了「核心問題」或「核心題組」,這個作法可以在保留最大可推論資料,而避免損失隨機性。
如在網路使用行為調查中,我們最需要知道的是「網路使用率」,重視這1題的隨機性。至於「收入」等,就較無所謂。
以「核心題組回應率」作為檢定參考。
以本報表為例,就是100%。
樣本與已知人口變項比較法
在二項分配的推論檢定講義中再介述
量表信度檢定
如果是採用量表測量變項,則在理論檢定與變項分析之前,必須先作量表的信度檢定,程序請按這裡。
信度檢定是相關分析的發展與應用,所以在本系列安排在相關分析之後,和論文寫作的結構順序並不相同。
單變項分析/描述-估計
單變項分析又名獨變項分析:是論文中「研究發現(或資料分析)」章、「整體分析」節報告的方法,若是僅報告樣本統計值,便採用「描述」方法;若要推論母群,則應用「估計」的方法,又因資料型態為「類別型」或「連續型」而不同。
交叉分析/雙變項分析
分析兩個變項間的關係,常為各一應變項、自變項,與兩者關係。雙變項可能只具備關聯關係,而不具備因果關係,亦即無法辨別何者為自變項、何者為應變項。常用、也最實用的統計工具包括:卡方分析、變異數分析、與相關分析。