栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

Solr源码分析——综述

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Solr源码分析——综述

2021SC@SDUSC

一、 solr是什么

Solr是java搜索引擎Lucene的更高一层封装,通过webapp服务器实现可视化界面,方便使用人员配置、访问和调用。
Solr 使程序员能够轻松地开发具有高级功能的复杂、高性能的搜索应用程序。它是一个独立的企业级搜索应用服务器,它对外提供 API 接口。用户可以通过 HTTP 请求或者使用 Http Get 提出查找请求。

二、solr的用处

Solr是基于Lucene的,Lucene 支持强大的匹配能力,如短语,通配符,连接,分组和更多不同的数据类型。它使用 Apache Zookeeper特别针对高流量进行优化。Apache Solr提供各式各样的功能:
1.先进的全文搜索功能。
2.XML,JSON和HTTP - 基于开放接口标准。
2.高度可扩展和容错。
4.同时支持模式和无模式配置。
5分页搜索和过滤。
6.支持像英语,德语,中国,日本,法国和许多主要语言
7.丰富的文档分析。

三、solr安装和环境配置

*最新版的Solr下载地址*

目前的最新的版本是8.10.0
如果想观看solr源代码包,建议下载后缀为src.tgz的包

下载完压缩包解压以后可以看到文件目录:

bin目录

此目录中包含几个重要的脚本,这些脚本将使使用 Solr 更容易。
post
Post Tool,它提供了用于发布内容到 Solr 的一个简单的命令行界面。

contrib目录

Solr 的contrib目录包含 Solr 专用功能的附加插件。

dist目录

该dist目录包含主要的 Solr .jar 文件。

docs目录

该docs目录包括一个链接到在线 Javadocs 的 Solr。

example目录

该example目录包括演示各种 Solr 功能的几种类型的示例。有关此目录中的内容的详细信息,请参阅下面的 Solr 示例。

server目录

此目录是 Solr 应用程序的核心所在。此目录中的 README 提供了详细的概述,但以下是一些特点:
Solr 的 Admin UI(server/solr-webapp)
Jetty 库(server/lib)
日志文件(server/logs)和日志配置(server/resources)。有关如何自定义 Solr 的默认日志记录的详细信息,请参阅配置日志记录一节。
示例配置(server/solr/configsets)

启动
进入solr的bin目录,执行 solr start 启动命令

启动命令:solr start  

关闭命令:solr stop -all

重启solr:solr restart –p p_num

启动日志中看出默认端口为8983.

此时solr部署完成,接下来就可以访问:
http://localhost:8983/solr/

Solr工作简要流程:首先通过documents界面提交文档数据以及进行增删改查操作,数据在通过分词等操作之后将会以倒排表的结构来组织,之后按照索引条件进行索引查找。

所以总的来说solr主要功能分为文档管理,数据分析过滤,查询处理。需要分析的主要代码也集中于此。

组内分工:我的主要任务是对查询处理的源码进行分析。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/282408.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号