| 成果基本信息 | ||||||
| 关键词: | 不完备大数据填补 | |||||
| 成果类别: | 应用技术 | 技术成熟度: | 初期阶段 | |||
| 体现形式(基础理论类): | 其他 | 体现形式(应用技术类): | 新技术 | |||
| 成果登记号: | 资源采集日期: | |||||
| 研究情况 | |||||
| 单位名称: | 武汉理工大学 | 技术水平: | 未评价 | ||
| 评价证书号: | 评价单位: | ||||
| 评价日期: | 评价证书号: | ||||
| 转化情况 | |||||
| 转让范围: | 合作开发 | 推广形式: | 合作开发 | ||
| 已转让企业数(个): | |||||
| 联系方式 | |||||
| 联系人(平台): | 孵化基地 | 联系人(平台)电话: | 0771-3394012 | ||
| *成果单位详细联系方式请登录会员;还不是会员,马上注册! | |||||
| 成果简介 | |||||
本发明公开了一种基于完备相容类的云平台不完备大数据填补方法,通过不完备大数据中的完备信息并行填补其缺失属性。本方法提高不完备数据填补的效率,有效填补缺失值过多的不完备大数据。建立了完备数据和不完备数据更为直接的联系,结合缺失属性的倒排索引和不完备数据的相容类,将数据集划分为若干完备相容类。获取完备部分中各缺失属性的频繁项集,根据频繁项集生成填补信息,并行填补具有相容关系的不完备数据,充分利用大数据的完备信息的频繁项集,并行填补具有相容关系的不完备数据。采用并行填补的方式也即采用多台机器同时去填补不同记录的缺失值也加大了填补的效率 |