栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

《Parallel batch k-means for Big data clustering》 SCI (聚类k-means)

《Parallel batch k-means for Big data clustering》 SCI (聚类k-means)

  • 将数据集拆分为等分区并减少计算的指数增长。目标是保留特征数据集的同时提高聚类速度。为每个分区计算簇的中心,它们被合并并在以后聚集。还考虑了确定最佳批量大小的方法。

本文通过将复杂计算分成多个简单运算(大小一致),先并行对多组数据进行聚类寻找中心,然后获得多个中心,将中心再用于聚类得到最终中心

每一组的数量计算 k 是簇数,r 是相对差异,v(a)是依表所得。

总结:这篇论文的改进比较简单,总的思想就是“大事化小“,将复杂问题拆分成同规模的简单小问题(小问题可以并行处理),然后在此基础上再解决问题。

终于读完了所有内容!完结撒花*★,°*:.☆( ̄▽ ̄)/$:*.°★* 。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/683206.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号