对于大量数据,您应该考虑是否 需要
将所有数据都保留在列表中。如果您一次处理每个字符串,则可以创建一个生成器,该生成器将产生每个连接的字符串,但不会使它们全都占用内存:
new_data = (' '.join(w) for w in sixgrams)如果您还可以从生成器中获取原始元组,则可以避免将该
sixgrams列表也存储在内存中。

对于大量数据,您应该考虑是否 需要
将所有数据都保留在列表中。如果您一次处理每个字符串,则可以创建一个生成器,该生成器将产生每个连接的字符串,但不会使它们全都占用内存:
new_data = (' '.join(w) for w in sixgrams)如果您还可以从生成器中获取原始元组,则可以避免将该
sixgrams列表也存储在内存中。