1、安装tensorflow应注意操作系统类型,且只支持windows64位系统。
2、在anaconda下,直接使用pip install tensorflow即可安装。不要activate tensorflow,否则即使安装好,在spider下无法引用到tensorflow。因为cmd会搜索到tensorflow并按照全局库来进行对待。而在anaconda创建的虚拟环境tensorflow下安装,spider会报错。
3、感觉tensorflow也在支持微软和厂商卖电脑。换新电脑后两分钟不到就安装好了。
4、imdb数据下载网址:
训练集:25000条,正负各12500条
测试集:25000条,正负各12500条
Sentiment Analysishttp://ai.stanford.edu/~amaas/data/sentiment/
5、词向量模型网址:
GloVe: Global Vectors for Word Representationhttps://nlp.stanford.edu/projects/glove/
6、使用gensim库加载已经训练好的word2vectoor模型(文件)的方法,包括bin、txt、model三种文件的方法。
调用gensim包的word2vec模型加载方法_K837871735的博客-CSDN博客word2vec加载向量模型方法这里分了三个方法,分别是调用.txt文件的、调用.bin文件的和调用.model文件的方法。前提是这三个文件都是没有向量残损的,如果有会报出其他的一些错误。调用.model文件from gensim.models import word2vecfilepath = '文件绝对路径' # 没有文件后缀名model = word2vec.Word2Vec.load(filepath)调用.txt文件import gensimfilepath = '文件绝对路https://blog.csdn.net/K837871735/article/details/1101877677、glove模型和word2vector模型的不同在于后者的首行会有文件的行列数。
使用gensim库可以将二者进行转换:
from gensim.scripts.glove2word2vec import glove2word2vec
glove_file=datapath(os.path.join(path, "glove.6B.50d.txt"))
tmp_file=get_tmpfile(os.path.join(path,"word2vec.txt"))
glove2word2vec(glove_file, tmp_file)
8、gensim库使用word2vector词向量模型
(1)加载词向量模型model=gensim.models.KeyedVectors.load_word2vec_format('D:\PrgramFiles\20211001\glove.6B\word2vec.txt',binary=False,unicode_errors='ignore')
(2)获取所有的词组成的列表wordsList = model.index_to_key ###返回的是所有的词组成的列表
(3)wordList.index(“the”)查找改词在词向量模型的索引
model[2] # 查看第二个词的嵌入向量
model["the"] ##查看the的词向量
9、过程
(1)对数据进行预处理,删除标点符号等,只留下字母、数字,去停词,英文的话可以都转化为小写,并进行分词。
(2)加载词向量模型,可以使用现成的模型。将字转化为索引。将每个样本转化为词向量。



