如何解决HDFStore异常：无法找到正确的原子类型

面试问答更新时间：2026-05-22 02:27:48 发布时间：1631天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

您提供的链接可以很好地存储框架。逐列表示仅指定data_columns = True。它将单独处理这些列，并提出问题。

诊断

store = pd.HDFStore('test0.h5','w')In [31]: for chunk in pd.read_csv('Train.csv', chunksize=10000):   ....:     store.append('df', chunk, index=False, data_columns=True)

在生产中，您可能希望将data_columns限制为要查询的列（也可以为None，在这种情况下，您只能在索引/列上查询）

更新：

您可能会遇到另一个问题。read_csv根据每个块中看到的内容来转换dtypes，因此，如果块大小为10,000，则追加操作将失败，因为块1和2在某些列中具有看似整数的数据，然后在块3中您具有一些NaN，所以它是因为浮点数。预先指定dtype，使用较大的块大小，或运行两次操作以确保块之间的dtype。

我已经更新pytables.py在这种情况下有一个更有用的异常（以及告诉您列是否包含不兼容的数据）

感谢您的举报！

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/624593.html

上一篇如何使用python db-api安全地生成SQL LIKE语句

下一篇 Python：无法连接到HTTPS URL，因为SSL模块不可用

面试问答相关栏目本月热门文章

关于我们文章归档网站地图联系我们