博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
k-means聚类
阅读量:6638 次
发布时间:2019-06-25

本文共 527 字,大约阅读时间需要 1 分钟。

算法:

(1) 随机选择k个初始中心点。

(2) 计算每个数据点到中心点的距离,数据点距离哪个中心点最近就划分到哪一类中。
(3) 把中心点转移到得到的cluster内部的数据点的平均位置。
(4) 重复以上步骤,直到每一类中心在每次迭代后变化不大为止。

 

k值确定:拐点图:组内误差平方和,SSE(sum of squared error)

                 SSE= 

#初始点选择

  (1)首先随机选择一个点作为第一个初始类簇中心点。

  (2)选择距离该点最远的那个点作为第二个初始类簇中心点

  (3)再选择距离前两个点的最近距离最大的点作为第三个初始类簇的中心点。

    (4) 以此类推,直至选出K个初始类簇中心点。

 

#结果评估:平均Silhouette值为:当 大于0.5 时,表明聚类合适

                    

                    s ( i ) =( b( i )- a ( i ) )   /   max ( a ( i ) , b ( i ) )

                    a(i);对象i到同一簇内其他对象的距离平均值                                --凝聚度

                    b(i) : 计算对象i到其他簇B(j)内所有对象的距离平均                   --分散度

                             遍历其他簇B,计算出最近距离

 

转载于:https://www.cnblogs.com/hapyygril/p/10019373.html

你可能感兴趣的文章
网页设计与平面设计有什么不同
查看>>
mysql的varchar真实存储大小
查看>>
easyui与java后台数据库实现下拉联动
查看>>
python 字段转换
查看>>
MYSQL函数编写一
查看>>
eclipse中maven项目failonmissingwebxml错误的修复
查看>>
loadrunner模拟文件上传代码示例
查看>>
欢迎留言讨论
查看>>
yii2.0用户登陆
查看>>
WordPress 3.9 Released – Install Using LAMP or LEMP on RHEL, CentOS & Fedora
查看>>
SQL Server中Rowcount与@@Rowcount的用法
查看>>
物联网技术为农业注入“智慧基因”
查看>>
java连接数据库
查看>>
我的友情链接
查看>>
MODIS数据的简介和下载(四)——HTTPS服务下载说明
查看>>
Python 循序渐进教程系列 之基础02 基础数据类型
查看>>
Solr客户端自定义开发
查看>>
maven 工程 配置log4j
查看>>
mangodb的安装
查看>>
我的友情链接
查看>>