一、ES集群管理

1.1、ES是如何解决高并发

ES是一个分布式全文检索框架，隐藏了复杂的处理机制，核心内容分片机制、集群发现、分片负载均衡请求路由。

1.2、ES基本概念名词

（1）Cluster

代表一个集群。

集群中有多个节点，其中一个为主节点（通过选举产生）这是集群内部来说的。ES是去中心化的（无中心节点），这是集群外部来说的，因为外部来看ES集群是一个整体，与任何一个节点的通信和与整个ES集群通信是等价的。

（2）Shards——主分片

代表索引分片。

ES可以把一个完整的索引分成多个分片，好处是把一个大的索引拆分成多个，分布到不同节点上，构成分布式搜索。（分片数量只能在索引创建前指定，创建之后不能更改）

（3）replicas——副分片

代表索引副本。

ES可以说设置多个索引副本，副本的作用1：是提高系统的容错性，当某个节点某个分片损坏或者丢失时可以从副本中恢复；作用2：提高ES的查询效率，ES会自动对搜索请求进行负载均衡。

注意：做主分片和副分片，是为了做容错

注意：分片数，设置为服务器（节点）的平方个最好

（4）Recovery

代表数据恢复（数据重新恢复）。

ES在节点加入或者退出时会根据机器的负载对索引分片进行重新分配，挂掉的节点重新启动时也会进行数据恢复。

1.3、ES为什么要集群

ES集群中的索引可能由多个分片构成，并且每个分片可以拥有多个副本。通过将一个单独的索引分为多个分片，可以处理不能在一个单一服务器上面运行的大型索引。由于每个分片有一个或者多个副本，通过将副本分配到多个服务器上，可以提高查询的负载能力。

1.4、ES集群原理分析

（1）每个索引会被分成多个分片shards进行存储（默认5个分片），每个分片都会分布式部署在多个不同的节点上进行部署。

注意：索引主分片primary shards定义好后，后面不能做修改。

（2）主分片可以有对应的备份片replics shards，replic shards分别承载了容错、请求的负载均衡。

注意：主分片对应的备分片不能存放在同一台服务器上，主分片primary shards可以和其他副分片replics shards不能存放在同一个node节点（服务器）上。

1.5、一些常见问题

（1）为什么主分片定义好后不能再修改（副分片可以改）？

（1）主分片为什么不能和副分片放在同一个服务器上？

二、集群环境搭建

（1）准备三台服务器集群

服务器名称	IP地址
node-1	192.168.212.182
node-2	192.168.212.183
node-3	192.168.212.184

（2）服务集群配置

其中一台服务器配置：

vi elasticsearch.yml

cluster.name: myes ###保证三台服务器节点集群名称相同

node.name: node-1 #### 每个节点名称不一样其他两台为node-1 ,node-2

network.host: 192.168.212.180 #### 实际服务器ip地址

discovery.zen.ping.unicast.hosts: ["192.168.212.184", "192.168.212.185","192.168.212.186"]##多个服务集群ip

discovery.zen.minimum_master_nodes: 1

关闭防火墙 systemctl stop firewalld.service

默认底层开启9300 集群

其余两台直接克隆就行了。

（3）验证集群效果

http://192.168.212.185:9200/_cat/nodes?pretty

注意克隆data文件会导致数据不同步

报该错误解决办法

failed to send join request to master

因为克隆导致data文件也克隆呢，直接清除每台服务器data文件。

三、 SpringBoot整合ES

案例：SpringBoot整合ES实现网盘搜索引擎

3.1、数据结构分析

OST /clouddisk/_mapping/disk
{
        "disk": {
        "properties": {
          "baiduaddres": {
            "type": "keyword"
          },
          "browsetimes": {
            "type": "long"
          },
          "collectiontime": {
            "type": "date"
          },
          "describe": {
            "type": "text",
            "analyzer": "ik_smart"
          },
          "filesize": {
            "type": "float"
          },
          "name": {
            "type": "text",
            "analyzer": "ik_smart"
          },
          "sharpeople": {
            "type": "keyword"
          },
          "shartime": {
            "type": "date"
          },
          "source": {
            "type": "keyword"
          }
        }
      }
  
}

3.2、Maven依赖

<parent>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-parent</artifactId>
		<version>2.0.0.RELEASE</version>
		<relativePath /> <!-- lookup parent from repository -->
	</parent>
	<dependencies>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-web</artifactId>
		</dependency>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-data-elasticsearch</artifactId>
		</dependency>
		<dependency>
			<groupId>org.projectlombok</groupId>
			<artifactId>lombok</artifactId>
		</dependency>

		<dependency>
			<groupId>com.google.collections</groupId>
			<artifactId>google-collections</artifactId>
			<version>1.0-rc2</version>
		</dependency>
		<!-- springboot整合freemarker -->
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-freemarker</artifactId>
		</dependency>

	</dependencies>

3.3、application信息

spring:
  data:
    elasticsearch:
    ####集群名称
     cluster-name: myes
    ####地址 
     cluster-nodes: 192.168.212.180:9300
  freemarker:
    # 设置模板后缀名
    suffix: .ftl
    # 设置文档类型
    content-type: text/html
    # 设置页面编码格式
    charset: UTF-8
    # 设置页面缓存
    cache: false
    # 设置ftl文件路径
    template-loader-path:
      - classpath:/templates
  # 设置静态文件路径，js,css等
  mvc:
    static-path-pattern: /static/**

三层结构：

3.4、实体类层

@Data
@Document(indexName = "clouddisk", type = "disk")
public class CloudDiskEntity {
	@Id
	private String id;
	// 名称
	private String name;
	// 来源
	private String source;
	// 描述
	private String describe;
	// 分享时间
	private Date shartime;
	// 浏览次数
	private Long browsetimes;
	// 文件大小
	private Double filesize;
	// 分享人
	private String sharpeople;
	// 收录时间
	private String collectiontime;
	// 地址
	private String baiduaddres;

3.5、repository（dao层）层

ElasticsearchRepository是整合好的矿建，直接继承它就可以用

public interface CloudDiskDao extends ElasticsearchRepository<CloudDiskEntity, String> {

}

3.6、控制层

@RestController
public class CloudDiskController {
	@Autowired
	private CloudDiskDao cloudDiskDao;

	// springboot 整合 es 查询
	// 根据id查询文档信息
	@RequestMapping("/findById/{id}")
	public Optional<CloudDiskEntity> findById(@PathVariable String id) {
		return cloudDiskDao.findById(id);

	}

	// 实现分页查询
	@RequestMapping("/search")
	public List<CloudDiskEntity> search(String name, String describe,
			@PageableDefault(page = 0, value = 2) Pageable pageable) {
		// 1.创建查询对象
		BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
		if (!StringUtils.isEmpty(name)) {
			MatchQueryBuilder matchQuery = QueryBuilders.matchQuery("name", name);
			boolQuery.must(matchQuery);
		}
		if (!StringUtils.isEmpty(describe)) {
			MatchQueryBuilder matchQuery = QueryBuilders.matchQuery("describe", describe);
			boolQuery.must(matchQuery);
		}
		// 2.调用查询接口
		Iterable<CloudDiskEntity> search = cloudDiskDao.search(boolQuery, pageable);
		// 3.将迭代器转换为集合
		return Lists.newArrayList(search);
	}
}

条件查询：

@Controller
public class SearchController {
	@Autowired
	private CloudDiskDao cloudDiskDao;

	@RequestMapping("/search")
	public String search(String keyword, String describe, @PageableDefault(page = 0, value = 5) Pageable pageable,
			HttpServletRequest req) {
		Long startTime = System.currentTimeMillis();
		// 1.创建查询对象
		BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
		if (!StringUtils.isEmpty(keyword)) {
            //模糊查询
			MatchQueryBuilder matchQuery = QueryBuilders.matchQuery("name", keyword);
			boolQuery.must(matchQuery);
		}
		if (!StringUtils.isEmpty(describe)) {
            //精确查询
			MatchQueryBuilder matchQuery = QueryBuilders.matchQuery("describe", describe);
			boolQuery.must(matchQuery);
		}
		// 2.调用查询接口
		Page<CloudDiskEntity> page = cloudDiskDao.search(boolQuery, pageable);

		req.setAttribute("page", page);
		// 记录总数
		req.setAttribute("total", page.getTotalElements());
		req.setAttribute("keyword", keyword);
		// 计算分页总数
		int totalPage = (int) ((page.getTotalElements() - 1) / pageable.getPageSize() + 1);
		// 分页总数
		req.setAttribute("totalPage", totalPage);
		Long emdTime = System.currentTimeMillis();
		req.setAttribute("time", emdTime - startTime);
		return "search";
	}

}

V瑞

发布了52 篇原创文章 · 获赞 116 · 访问量 5万+

私信关注

elasticsearch学习（四）——ES集群搭建与整合SpringBoot