ElasticSearch中如何使用Spark - 代码天地

ElasticSearch中如何使用Spark

其他 2020-04-24 15:09:24 阅读次数: 0

ElasticSearch是一个基于Lucene的搜索服务器, 它提供了一个分布式多用户能力的全文搜索引擎, 基于RESTful web接口, 底层是用Java开发的。

本文将通过Spark的方式来读取ES，基于以下版本开发测试。

scala-version：2.11.8

spark-version：2.2.0

elasticsearch-version：5.5.0

接下来正式开始了。

1. 添加Maven依赖

<dependencies>

     <dependency>
          <groupId>org.elasticsearch</groupId>
          <artifactId>elasticsearch-spark-20_2.11</artifactId>
          <version>6.2.4</version>
     </dependency>

</dependencies>

2. Spark 读取ES

import org.apache.spark.{SparkConf, SparkContext}
import org.elasticsearch.spark.rdd.EsSpark
object ES2Spark {

  def main(args: Array[String]): Unit = {

      val conf = new SparkConf().setMaster("local").setAppName("ES2Spark")
        .set("es.index.auto.create", "true")
        .set("es.nodes", "127.0.0.1")
        .set("es.port", "9200")

      val sc = new SparkContext(conf)

      val rdd = EsSpark.esJsonRDD(sc, "indexName", "?q=*1*")

      rdd.foreach(println(_))
      sc.stop()
  }
}

雷禄辉

发布了84 篇原创文章 · 获赞 28 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/a544258023/article/details/89711376

ElasticSearch中如何使用Spark

如何使用Spark快速将数据写入Elasticsearch

spark on yarn 如何集成elasticsearch

在spring data中如何使用elasticsearch

使用spark访问elasticsearch的数据

elasticsearch如何使用？

spark读取elasticsearch中数组类型的字段

如何使用hive on spark

elasticsearch使用spark sql来实现join

ElasticSearch在springboot中的使用

elasticsearch在php中的使用

ElasticSearch 中boolQueryBuilder的使用

spark使用中的优化

linux中如何安装elasticsearch

Elasticsearch中数据是如何存储的

Elasticsearch 如何使用RESTful API

CDH中如何升级Spark

spark中如何划分stage

Elasticsearch 中如何巧妙地使用聚合函数达到数据库中having的效果

ElasticSearch(5.5.2)在java中的使用

Elasticsearch中Head插件的使用

elasticsearch在C#中的使用

elasticsearch中ik分词的使用

elasticSearch 在 SpringBoot中的使用（三）

ElasticSearch在开发中的使用总结

使用Akka来优化Spark+ElasticSearch的准实时系统

spark中缓存cache的使用

[Spark] RDD中JOIN的使用

Spark中DataSet的基本使用

Spark中SimpleDateFormat的安全使用

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)