栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

排序整数的压缩算法

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

排序整数的压缩算法

如果您知道数据的真实分布,则可以进行最佳压缩。如果可以为每个整数提供概率分布,则可以使用算术编码或其他 熵编码 技术将其压缩为理论上的最小大小。

诀窍在于准确预测。

首先,您可能应该压缩数字之间的 距离 ,因为这可以使您做出统计报表。如果直接压缩数字,则很难建模,因为它们只会出现一次。

接下来,您可以尝试建立一个非常简单的 模型来预测 下一个距离。保留所有以前看到的距离的直方图,并根据频率计算概率。

您可能需要考虑缺失值(您显然无法为它们分配0的概率,因为这无法表达),但是您可以为此使用启发式方法,例如逐位编码下一个距离并分别 预测每个位
。您几乎不需要为高阶位支付任何费用,因为它们几乎始终为0,并且熵编码会将其最优化。

如果您 知道
分布情况,
那么所有这些操作都将更加简单。示例:您正在压缩所有素数的列表,因此您知道距离的理论分布,因为存在公式。这样您已经有了一个完美的模型。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/418444.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号