ITdaan
首页
最新
原创
最火
关于
搜索答案
搜索本文相关内容
gensim的LSI模型来计算文档的相似度
本文转载自
tiryzheng
查看原文
2015/09/19
570
文档
/
python
/
LSI
/
文档相似度
/
计算
/
模型
收藏
0
0
[python]
view plain
copy
from
gensim
import
corpora,models,similarities
dictionary=corpora.Dictionary.load(
'/tmp/deerwester.dict'
)
corpus=corpora.MmCorpus(
'/tmp/deerwester.mm'
)
print
(corpus)
lsi=models.LsiModel(corpus,id2word=dictionary,num_topics=
2
)
doc=
"human computer interaction"
vec_bow=dictionary.doc2bow(doc.lower().split())
vec_lsi=lsi[vec_bow]
#convert the query to LSI space
print
(vec_lsi)
#transform corpus to space and index it
index=similarities.MatrixSimilarity(lsi[corpus])
index.save(
'/tmp/deerwester.index'
)
sims=index[vec_lsi]
sims=sorted(enumerate(sims),key=
lambda
item:-item[
1
])
from
pprint
import
pprint
pprint(sims)
利用gensim的LSI模型计算文档的相似度
智能推荐
×
注意!
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。
猜您在找
lsi计算文档相似度
使用Gensim建立bow TFIDF LSI模型对文本相似度计算
使用gensim计算文档的相似度
gensim基于lsa算法的文档相似度计算
gensim similarity计算文档相似度
【No453】最新TypeScript精讲教程 视频+文档+源码
【No495】2019年音频文档MySQL实战45讲教程
【No194】2017年深度学习项目实战视频课程-Seq2Seq序列生模型视频教程
智能推荐
© 2014-2019 ITdaan.com
粤ICP备14056181号
×
收藏本文
添加到收藏夹 *
赞助商广告