栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

pandas数据框内存python

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

pandas数据框内存python

尝试这个:

from sklearn.feature_extraction.text import TfidfVectorizervect = TfidfVectorizer(sublinear_tf=True, analyzer='word', stop_words='english', tokenizer=tokenize, strip_accents='ascii',dtype=np.float16)X = vect.fit_transform(df.pop('Phrase'))  # NOTE: `.toarray()` was removedfor i, col in enumerate(vect.get_feature_names()):    df[col] = pd.SparseSeries(X[:, i].toarray().reshape(-1,), fill_value=0)

更新: 对于Pandas 0.20+,我们可以

SparseDataframe
直接从稀疏数组构造:

from sklearn.feature_extraction.text import TfidfVectorizervect = TfidfVectorizer(sublinear_tf=True, analyzer='word', stop_words='english', tokenizer=tokenize, strip_accents='ascii',dtype=np.float16)df = pd.SparseDataframe(vect.fit_transform(df.pop('Phrase')),  columns=vect.get_feature_names(),  index=df.index)


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/639858.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号