連續資料的視覺檢視:變項清理與啟發
Visual Data Screening of Continuous Data
神掌打通任督二脈‧易筋經以簡馭繁
符號意義:統雄快訣 延伸閱讀 進階議題 警示訊息
論文「研究發現」章-資料分析程序的第三步:整體分析-即單變項分析。介述推論估計與敘述統計的比較-不同的資料型態如何推論誤差區間。 連續資料主要的統計量是:平均數、變異數、標準差,而推論則強調以標準誤為單位的區間估計。 下載SPSS範例,進行實作。 |
單變項分析/描述-估計
單變項分析又名獨變項分析:是論文中「研究發現(或資料分析)」章、「整體分析」節報告的方法,若是僅報告樣本統計值,便採用「描述」方法;若要推論母群,則應用「估計」的方法,又因資料型態為「類別型」或「連續型」而不同。
SPSS 範例檔案下載
以下介紹使用SPSS達成所有分析步驟的過程。
下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe
下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar
下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z
下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe
下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe
報表輸出檢視
連續資料的視覺檢視可以提供進階的研究效果,包括:資料視覺清理與資料視覺啟發。
﹙1﹚ 資料視覺清理
檢視是否存在不合理值:最大、最小值合理性。
﹙2﹚ 資料視覺啟發
樣本分配是否太偏,而嚴重不符常態分配。當樣本數有限時,不易形成明顯的常態分配;所謂嚴重不符,包括成為「凹」形、或「』」形等。
而根據其分配,有可能啟發、探索「進階理論」。
本變項最小值為0,合理;最大值為9200,在合理性的邊際,為進一步確認,進行「視覺檢視與清理」如下,並介述SPSS 統計圖應用。
SPSS 統計圖應用
〉統計圖
〉歷史對話記錄
〉散布圖
「歷史對話記錄」是個完全不通的中譯,原文為 Legacy Dialogs,意思是「可多重選擇的視覺範本」。
這個選項相對於「圖表建立器」,後者為一繪圖引擎,可以繪製純個人化的圖表。
〉簡單圖形
單變項分析,必選簡單圖形,
〉X軸變數
在左方選擇欲檢視與清理的變項。
〉標題
通常只寫〉第1行
要增加更多資訊也可以。
〉選項
通常都選〉不對稱
視覺檢視報表分析
視覺檢視發現:呈凹形,且右側可能有特異值。
資料視覺清理:特異值處理
「消費者」組固然較接近常態分配,但右側的單一樣本,更像特異值。
如果要制訂較保守的策略,就應在資料集中將其刪除,是為資料清理作業。
如果選其他的呈現方法也可以,範例如下。
〉選項〉對稱
報表如下。
〉選項〉平面
報表如下。
資料視覺啟發:凹形處理
將左側為0的資料單獨分開後,發現呈現以2000元為中心的凹形。
由此可以啟發:以以2000元為界,可能可以將樣本分為「低消費」和「高消費」2組。
而重新估計「2消費」組的消費金額,並建立、探索新理論,如:
●網路消費會形成「陡階現象」而分為「低消費」和「高消費」2組。
●「2消費」組的消費行為特徵為何?其進階差異、或相關理論為何?