SPSS 變項轉換/資料轉換: Compute 建構新變項
Variables and Data Transformation of SPSS, 2
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:統雄快訣 延伸閱讀 進階議題 警示訊息
資料分析的程序應包括:1.對象(樣本代表性)分析。2.測量工具(量表信度/效度)分析。3.理論建構檢定與分析:又包括:(1)整體分析(單變項分析)(2)交叉分析(雙變項分析)(3)進階理論模型建構(多變項分析)。SPSS的檔案、介面、與資料操作。SPSS的副檔名包括:sav:資料檔,sps:程式檔,spo:輸出檔。資料檔的介面有:變項檢視介面,資料檢視介面。下載SPSS範例,進行實作。 |
SPSS Transform 轉換與應用時機
SPSS Transform 轉換,包括變項轉換與資料轉換,最常用的有SPSS Recode 重新編碼,與SPSS Compute 建構新變項等,其應用時機與轉換方法介述如下。
下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe
下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar
下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z
下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe
下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe
SPSS Compute 就原有變項建構(計算)新變項
就原有1個、或多個變項建構新變項,SPSS 直譯為「計算」,並不十分貼切。
建構新變項可包括Dummy Variable 虛擬變項,或各種建構變項。
二階段 建構新變項範例
建構新變項有時必須多階段完成,以下舉一個二階段建構新變項的範例。
建構「網路使用程度」變項,設計採用總加量表,測量從事7種網路使用行為的項目數,為變項之值。
q14 至 q20,共有7種網路使用行為,原始分數為:否﹦1,是﹦2。
建構步驟1:先重新編碼 SPSS Recode
將q14 至 q20,原始分數重新編碼為:否﹦0,是﹦1。
〉轉換
〉重新編碼成不同變數
可使用批次法,將q14 至 q20,重新輸出為 use14 至 use20。
每重編1個變項:
〉變更
全部完成後:
〉舊值與新值
將舊值重編為新值
〉新增
全部完成如下。
檢查「資料檢視」設定
檢查「資料檢視」各項設定,尤其注意〈測量〉必須為「尺度」。
建構步驟2:將7新變項相加以建構 SPSS Compute
將7新變項相加,就是其有從事網路使用行為的項目數,也就是新「網路使用程度」變項的值。
使用 SPSS Compute 的程序如下:
〉轉換
〉計算變數
出現對話框。
〉目標變數
設定新變項名稱為 Use。
〉類型&標記
出現對話框。
〉標記
虛擬標題,使用中文。
〉數值
〉數值運算式
將use14 至 use20 逐項相加。
〉確定
產生新變項。
新變項檢查:修訂變項檢視介面
所有新轉換變項,都必須檢查相關設定,包括:
類型、小數、標記、值、遺漏、測量…等。
一階段 簡易建構新變項範例
以上「二階段 建構新變項範例」,也可以一階段、簡易建構方法為之。
因為第一階段,為各變項減 1,故 7 變項可直接相加而減 7,結果相同。
亦即:
Use = (q14+q15+….+q20)-7
注意:採用「一階段‧簡易建構新變項」方法,必須確認各原始變項,均已做好 Missing 設定,否則會產生 Missing (如 -1,-2,-3、或9×…等)值、誤為真實值而加入計算過程。
將「出生年」重新建構為「年齡」
就資料的長效性,以及理論建構的應用彈性,對「年齡」變項的測量,統雄老師一貫主張在收集資料時,以「出生年」測量。
如果有不同年代的資料彙整應用時,再重新建構為「年齡」。
重新建構的方法,就是採用 SPSS Compute。
設定方法如下:
〉目標變數
設定新變項名稱,實體名稱使用英文,假設為 Age。
〉標記
虛擬標題,使用中文「年齡」。
〉數值運算式
因習題教材之「出生年(民國)」為 q42
故:
分析年度(民國)- q42
新變項檢查:修訂變項檢視介面
所有新轉換變項,都必須檢查相關設定,包括:
類型、小數、標記、值、遺漏、測量…等。
SPSS 的線上說明
資料集與SPSS實作
本系列文章多使用以下教材為範例:
下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe
學習實作請使用以下教材:
下載SPSS多變項分析與習作範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar
樣本代表性檢定
數理意義的樣本代表性檢定,與資料分析中的顯著性檢定,為一體兩面。
量表信度檢定
如果是採用量表測量變項,則在理論檢定與變項分析之前,必須先作量表的信度檢定。
信度檢定是相關分析的發展與應用,所以在本系列安排在相關分析之後,和論文寫作的結構順序並不相同。
單變項分析/描述-估計
單變項分析又名獨變項分析:是論文中「研究發現(或資料分析)」章、「整體分析」節報告的方法,若是僅報告樣本統計值,便採用「描述」方法;若要推論母群,則應用「估計」的方法,又因資料型態為「類別型」或「連續型」而不同。
交叉分析/雙變項分析
分析兩個變項間的關係,常為各一應變項、自變項,與兩者關係。雙變項可能只具備關聯關係,而不具備因果關係,亦即無法辨別何者為自變項、何者為應變項。常用、也最實用的統計工具包括:卡方分析、變異數分析、與相關分析。