2021SC@SDUSC
一、 solr是什么Solr是java搜索引擎Lucene的更高一层封装,通过webapp服务器实现可视化界面,方便使用人员配置、访问和调用。
Solr 使程序员能够轻松地开发具有高级功能的复杂、高性能的搜索应用程序。它是一个独立的企业级搜索应用服务器,它对外提供 API 接口。用户可以通过 HTTP 请求或者使用 Http Get 提出查找请求。
Solr是基于Lucene的,Lucene 支持强大的匹配能力,如短语,通配符,连接,分组和更多不同的数据类型。它使用 Apache Zookeeper特别针对高流量进行优化。Apache Solr提供各式各样的功能:
1.先进的全文搜索功能。
2.XML,JSON和HTTP - 基于开放接口标准。
2.高度可扩展和容错。
4.同时支持模式和无模式配置。
5分页搜索和过滤。
6.支持像英语,德语,中国,日本,法国和许多主要语言
7.丰富的文档分析。
*最新版的Solr下载地址*
目前的最新的版本是8.10.0
如果想观看solr源代码包,建议下载后缀为src.tgz的包
下载完压缩包解压以后可以看到文件目录:
bin目录
此目录中包含几个重要的脚本,这些脚本将使使用 Solr 更容易。
post
Post Tool,它提供了用于发布内容到 Solr 的一个简单的命令行界面。
contrib目录
Solr 的contrib目录包含 Solr 专用功能的附加插件。
dist目录
该dist目录包含主要的 Solr .jar 文件。
docs目录
该docs目录包括一个链接到在线 Javadocs 的 Solr。
example目录
该example目录包括演示各种 Solr 功能的几种类型的示例。有关此目录中的内容的详细信息,请参阅下面的 Solr 示例。
server目录
此目录是 Solr 应用程序的核心所在。此目录中的 README 提供了详细的概述,但以下是一些特点:
Solr 的 Admin UI(server/solr-webapp)
Jetty 库(server/lib)
日志文件(server/logs)和日志配置(server/resources)。有关如何自定义 Solr 的默认日志记录的详细信息,请参阅配置日志记录一节。
示例配置(server/solr/configsets)
启动
进入solr的bin目录,执行 solr start 启动命令
启动命令:solr start 关闭命令:solr stop -all 重启solr:solr restart –p p_num
启动日志中看出默认端口为8983.
此时solr部署完成,接下来就可以访问:
http://localhost:8983/solr/
Solr工作简要流程:首先通过documents界面提交文档数据以及进行增删改查操作,数据在通过分词等操作之后将会以倒排表的结构来组织,之后按照索引条件进行索引查找。
所以总的来说solr主要功能分为文档管理,数据分析过滤,查询处理。需要分析的主要代码也集中于此。
组内分工:我的主要任务是对查询处理的源码进行分析。



