例题:
从21个工厂中抽出同类产品,每个产品测两个指标,欲将各厂的质量情况进行分类。
工厂指标1指标2106205325423544643751862961107011-4312-2213-3214-3015-521611170-1180-219-1-120-1-321-3-5
解:
1.MATLAB
dt = xlsread('Kmeans.xlsx');
gc = dt(2:end, 1);
data = zscore(dt(2:end, 2:3));
idx = kmeans(data, 4, 'replicates', 10);
[S, H] = silhouette(data, idx);
gc(idx == 1), gc(idx == 2), gc(idx == 3), gc(idx == 4)
编译得
ans =
17
18
19
20
21
ans =
7
8
9
10
ans =
2
3
4
5
6
16
ans =
11
12
13
14
15
由柱状图可知,分四类效果基本上是可以的。
2.SPSS
聚类成员
案例号 工厂 聚类 距离
1 1 2 2.836
2 2 2 2.181
3 3 2 1.152
4 4 2 .869
5 5 2 2.148
6 6 2 2.308
7 7 4 1.000
8 8 4 1.000
9 9 4 .000
10 10 4 1.414
11 11 1 1.342
12 12 1 1.414
13 13 1 .447
14 14 1 1.844
15 15 1 1.612
16 16 2 2.983
17 17 3 1.720
18 18 3 1.077
19 19 3 1.400
20 20 3 .600
21 21 3 3.280