利用spss對數據進行聚類分析

本例分享如何使用spss對數據進行聚類分析。

工具/原料

spss
raw data

建立數據指標及類型並輸入數據

該步驟筆者已經在《利用spss對數據進行回歸分析》中詳細分享,具體參見https://jingyan.baidu.com/article/eb9f7b6d8bd2aa869264e877.html

對數據進行無量綱化處理

因為數據量綱不同將影響聚類分析的結果,所以在分析之前要對數據進行無量綱化處理,無量綱化處理的方法有很多種,我們可以根據自己的實際需要進行選擇。本經驗示例較為簡單,只需要對有序尺度數據進行無量綱化。

對於有序尺度,可以採用數值編碼的方式將其轉換為間距型。

如:優、良、中、及格、不及格

5     4      3      2         1

首選將外語的數據類型改成數值型,然後將各個數據屬性值改為「5」,「5」,「4」,「4」,「4」,「2」分別對應之前的優,優,良、良、良和及格。

對數據進行標準化處理

指標類型中有「極大型」、「極小型」、「居中型」和「區間型」指標,所以在聚類之前必須對指標的類型進行一致化處理。

本例一致化處理見附圖。

對數據進行系統聚類分析

選擇「分析」--》「分類」--》「系統聚類」進入系統聚類設置選項卡。

進入選項卡,將標準化後的數據作為變量。然後可以在當中選擇聚類的各種方式方法及要生成的圖標,這裡我們勾選上樹狀圖後其他默認。點擊確定即可看到spss自動處理輸出的結果。

根據spss輸出的結果進行分析。

本文內容整理自網絡, 文中所有觀點看法不代表淘大白的立場