Apache Solr:企业级全文搜索服务器

Apache Solr是一个基于Apache Lucene的企业级全文搜索服务器。类REST的API,可以通过HTTP设置索引和查询结果,支持的参数格式包括JSON、XML、CSV和二级制类型。


主要功能

  • 先进的全文检索功能:Solr提供了强大的匹配能力,包括词组、通配符、连接、分组等等。
  • 为高流量进行了性能优化:在世界各地的应用中已被证明。
  • 基于标准的开放接口:XML、JSON和HTTP等。
  • 综合管理界面:Solr内置了一个用户管理界面,使你的Solr实例更易于管理和控制。
  • 轻松的监控:Solr通过JMX导出统计信息用于监控。
  • 高度可扩展性及容错性:由于建立在久经考验的Apache Zookeeper上,Solr很容易扩展和裁剪。
  • 灵活性、适应性、配置简单:适应各种需求的同时简化配置。
  • 准实时索引:Solr利用了Lucene的准实时索引功能。
  • 可扩展的插件架构:Solr发布了很多定义良好的扩展点,使其很容易的插入索引和时间查询等插件。

更多功能

  • Schema模式和Schemaless模式:Schemaless(数据驱动模式)模式易于开始,Schema(配置模式)模式用于生产环境。
  • 强大的扩展:Solr附带了插件,用于索引富内容(如:PDF、Word)、语言检测、搜索结果聚类等。
  • 分面搜索和筛选:按你认为适合使用分面算法的方式切分你的数据(Slice and dice your data as you see fit using a large array of faceting algorithms)。
  • 地理信息搜索:Solr内置空间搜索功能,所以支持基于位置的搜索。
  • 高级可配置的文本分析:Solr支持目前被广泛使用的语言(英语、汉语、日语、德语、法语等)及很多其他分析工具。
  • 高度可配置和用户扩展缓存:Solr内置的了细粒度的缓存控制,因此很容易优化其性能。
  • 性能优化:Solr已被调整用于处理世界上最大的网站。
  • 内置安全性:Solr的安全基于SSL,包括可插拔的身份认证和基于角色的授权。
  • 高级存储选项:基于Lucene的高级存储能力,Solr很容易根据你的应用需求调整数据存储。
  • 可监控的日志:很容易从管理解界面访问Solr的日志文件。
  • 搜索建议:Solr支持自动完成(预输入搜索)、拼写检查等高级功能。
  • 你的数据你做主:支持JSON,CVS,XML等数据格式。
  • 富文档解析:Solr内置了Apache Tika,所以易于索引富内容(rich content),如:PDF,Word等文件。
  • Apache UIMA:Solr集成在Apache UIMA中,所以很容易将自然语言处理和其他工具添加到你的应用中。
  • 多重搜索索引:Solr支持多租户架构,所以易于隔离用户和内容。

官方文档

官方网站:http://lucene.apache.org/solr/
开源地址:https://github.com/apache/solr


猜你喜欢

转载自blog.csdn.net/wenlin_xie/article/details/79975601