栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

人工智能Java SDK:学术论文搜索模型提供了学术论文的特征提取与相似性比对能力

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

人工智能Java SDK:学术论文搜索模型提供了学术论文的特征提取与相似性比对能力

学术论文语义搜索 SDK【英文】

学术论文搜索模型提供了学术论文的特征提取与相似性比对能力。
传入的参数为文章的[标题,摘要]([title, abstract])组成。
subword级切词,最大长度 max_sequence_length: 256(按经验上限平均130个单词左右)。

使用的模型:
https://github.com/allenai/specter/blob/master/README.md
该模型是symmetric search,向量空间由title & abstract组成。

  • 特征向量提取

  • 特征向量空间(由title & abstract组成)

SDK功能:
  • paper [title, abstract]特征向量提取
  • 相似度计算
运行例子 - SemanticSearchPublicationsExample

运行成功后,命令行应该看到下面的信息:

...
# 测试语句:
[INFO ] - paper1 [title, abstract]: [BERT, We introduce a new language representation model called BERT]
[INFO ] - paper2 [title, abstract]: [Attention is all you need, The dominant sequence transduction models are based on complex recurrent or convolutional neural networks]

# 向量维度:
[INFO ] - Vector dimension: 768

# 生成向量:
[INFO ] - paper1[title, text] embeddings: [-0.83961445, 1.1465806, ..., 0.5574437, 0.4750324]
[INFO ] - paper2[title, text] embeddings: [-0.23870255, 1.2555068, ..., 0.052179076, 0.47623542]

#计算相似度:
[INFO ] - Similarity: 0.82421297

目录:

http://www.aias.top/

Git地址:

https://github.com/mymagicpower/AIAS
https://gitee.com/mymagicpower/AIAS

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/397291.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号