成果基本信息 | ||||||
关键词: | ||||||
成果类别: | 应用技术 | 技术成熟度: | 初期阶段 | |||
体现形式(基础理论类): | 论文 | 体现形式(应用技术类): | 新技术 | |||
成果登记号: | 资源采集日期: |
研究情况 | |||||
单位名称: | 技术水平: | 未评价 | |||
评价证书号: | 评价单位: | ||||
评价日期: | 评价证书号: |
转化情况 | |||||
转让范围: | 产权转让 | 推广形式: | 产权转让 | ||
已转让企业数(个): |
联系方式 | |||||
联系人(平台): | 孵化基地 | 联系人(平台)电话: | 0771-3394012 | ||
*成果单位详细联系方式请登录会员;还不是会员,马上注册! |
成果简介 | |||||
本发明公开了一种基于数据密度和Huffman树的k均值数据处理方法,该方法包括以下步骤:1)对给定的数据集U,计算数据集U中每一个点Pi的密度;2)计算数据集U中每一个点Pi平均密度Mav;3)将密度大于Mav的点放到集合V中,在集合V中生成Huffman树;4)逆序删除生成的Huffman树的k-1个点,获得k个点; 5)设定剩下的k个点为初始的聚类中心;6)计算数据U中所有的点到这k个点的距离,将点归到离其最近的聚类里;7)调整聚类中心,将聚类的中心移动到类的几何中心处;8)重复步骤(6)(7)直到聚类中心不再移动,获得聚类结果。本发明方法在保证了在分类正确率的前提下,大大的减少了算法的运行时间。 |