1 | data=iris[,1:4] |
1 | model1=hclust(dist.e) |
1 | model2=kmeans(data,centers=3) |
1 | library(MASS) |
附加题
Prepare:首先将两个附件中数据提取到csv文件中,分别命名为file1.csv,file2.csv
1.利用附件1中数据对各省进行聚类分析,说明应分成几类,各类包括哪些省份.
1 | #read file1 |
方法1:系统聚类(层次聚类)
1 | #calculate distance |
若指定聚类数k和分类高度h,令k=3,h=200:1
2print("result:")
cutree(hc,k=3,h=200)
方法2:k-均值聚类
1 | kmeans(x,center=3,iter.max=100,nstart=2333) |
2.利用附件2中数据对广东和西藏进行判别,说明其属于哪个类别.
1 | file2=read.csv('/home/fantasy/Desktop/task3/file2.csv') |
1 | D=dist(xx) |
1 | library(MASS) |
1 | plot(l) |
1 | #make prediction |