参见McIlroy
在其酒吧页面上的“拼写列表的开发”。关于在小型计算机上进行拼写检查的经典旧论文,该约束出人意料地很好地映射到了您列出的内容。详细分析词缀剥离和两种不同的压缩方法:布隆过滤器和相关方案霍夫曼编码稀疏位集;我可能会优先使用Bloom过滤器,而不是他选择的方法,后者会以明显的速度消耗更多的kB。(
Programming Pearls 在本文中有一小章。)
__
另请参阅用于在全文搜索系统中存储词典的方法,例如Information Retrieval简介。与上述方法不同,这没有误报。



