如何在Ubuntu 14/15上配置Apache Solr

时间:2020-03-05 15:31:50  来源:igfitidea点击:

我们好,欢迎阅读我们今天在Apache Solr上发表的文章。
关于Apache Solr的简短描述是,它是开源最著名的搜索平台,后端有Apache Lucene用于,使我们能够轻松创建用于搜索,数据库和文件的搜索引擎。
它可以索引和搜索多个站点,并根据搜索到的文本返回相关内容的推荐。

Solr与HTTP可扩展标记语言(XML)一起使用,该XML提供了Javascript对象符号,Python和Ruby的应用程序接口(API)。
根据Apache Lucene项目的介绍,Solr提供的功能已使其受到管理员的欢迎,其中包括许多功能,例如:

  • 全文搜索
  • 多面导航
  • 片段生成/加高
  • 拼写建议/自动完成
  • 自定义文档排名/排序

准备工作:

在安装了最少软件包的新Linux Ubuntu 14/15上,我们只需要满足一些准备工作即可安装Apache Solr。

1)系统更新

使用非root用户sudo用户登录到Ubuntu服务器,该用户将用于执行安装和使用Solr的所有步骤。

成功登录后,发出以下命令以使用最新更新和补丁程序更新系统。

$sudo apt-get update

2)JRE设定

Solr设置需要将Java Runtime Environment作为基本要求安装在系统上,因为solr和tomcat都是基于Java的应用程序。
因此,我们需要使用最新的Java安装和配置其家庭环境。

要在Oracle Java 8上安装最新版本,我们需要使用以下命令安装Python软件属性。

$sudo apt-get install python-software-properties

完成后,运行安装程序的存储库以获取最新版本的Java 8.

$sudo add-apt-repository ppa:webupd8team/java

现在,我们可以通过发出以下命令来更新软件包源列表并安装Java,从而使用“ wget”安装最新版本的Oracle Java 8.

$sudo apt-get update
$sudo apt-get install oracle-java8-installer

在Java安装和配置过程中,单击“确定”按钮,将要求我们接受Java SE平台产品和JavaFX的Oracle二进制代码许可协议。

安装过程完成后,运行以下命令以测试Java的成功安装并检查其版本。

kash@solr:~$java -version
java version "1.8.0_66"
Java(TM) SE Runtime Environment (build 1.8.0_66-b17)
Java HotSpot(TM) 64-Bit Server VM (build 25.66-b17, mixed mode)

输出表明我们已经通过安装Java成功满足了Solr的基本要求。
现在转到下一步以安装Solr。

安装Solr

可以通过两种不同的方法在Ubuntu上安装Solr,但是在本文中,我们更愿意从源代码中安装其最新软件包。

要从源代码安装Solr,请从官方上下载最新版本的可用软件包,复制链接地址并使用“ wget”命令获取它。

$wget http://www.us.apache.org/dist/lucene/solr/5.3.1/solr-5.3.1.tgz

运行以下命令以将存档的服务提取到“/bin”文件夹中。

$tar -xzf solr-5.3.1.tgz solr-5.3.1/bin/install_solr_service.sh --strip-components=2

然后运行脚本以启动Solr服务,该服务将创建一个新的“ solr”用户,然后将solr作为服务安装。

$sudo bash ./install_solr_service.sh solr-5.3.1.tgz

要检查Solr服务的状态,请使用以下命令。

$service solr status

创建Solr集合:

现在,我们可以使用Solr用户创建多个集合。
为此,只需提及我们要创建的集合的名称并指定其配置集(如下所示),即可运行以下命令。

$sudo su - solr -c "/opt/solr/bin/solr create -c myfirstcollection -n data_driven_schema_configs"

我们已经为我们的第一个集合成功创建了新的核心实例目录,可以其中添加新数据。
要在目录'/opt/solr/server/solr/configsets/data_driven_schema_configs/conf'中查看其默认模式文件。

使用Solr Web

可以在默认的8983 Solr端口上访问Apache Solr。
打开我们喜欢的浏览器,然后导航到http://your_server_ip:8983/solr或者http://your-theitroad.com:8983/solr。
确保防火墙中允许该端口。

http://172.25.10.171:8983/solr/

在Solr Web控制台中,单击左侧列中的“ Core Admin”按钮,然后我们将看到我们先前使用CLI创建的第一个集合。
虽然我们也可以通过指向“添加核心”按钮来创建新的核心。

我们还可以添加文档并从文档中查询,如下图所示,方法是选择特定集合并指向文档。
如框中所示,以指定的格式添加数据。

{
"number": 1,
"Name": "George Washington",
"birth_year": 1989,
"Starting_Job": 2002,
"End_Job": "2009-04-30",
"Qualification": "Graduation",
"skills": "Linux and Virtualization"
}

添加文档后,单击“提交文档”按钮。