spark篇2：spark通过KuduContext操作kudu - 代码天地

spark篇2：spark通过KuduContext操作kudu

其他 2020-04-12 23:35:18 阅读次数: 0

spark篇2：spark通过KuduContext操作kudu

废话不多说，直接上干货

创建kudu表

package kudu.sparkKudu

import org.apache.kudu.spark.kudu.KuduContext
import org.apache.spark.sql.SparkSession
import org.apache.spark.{SparkConf, SparkContext}

object SparkKuduTest {
  def main(args: Array[String]): Unit = {
   val sparkSession = SparkSession.builder()
       .master("local")
      .appName("appName")
      .config("spark.testing.memory","471859200")
      .getOrCreate()
    //构建KuduContext对象
    val kuduContext = new KuduContext("cdh2:7051", sparkSession.sparkContext)

    //1.创建表操作
    createTable(kuduContext,"table_boy")
     }
 private def createTable(kuduContext: KuduContext, tableName: String): Unit = {
    //定义表的schema
    val schema = StructType(
        StructField("id", IntegerType, false) ::
        StructField("name", StringType, false) ::
        StructField("age", IntegerType, false) :: Nil
    )

    val primaryKey = Seq("id")
    //定义表的主键
    val list: util.List[String] = new util.LinkedList[String]
    list.add("id")

    //定义表的选项配置
    val options = new CreateTableOptions

    options.setRangePartitionColumns(list)
    options.setNumReplicas(1)

    //创建表
    if (!kuduContext.tableExists(tableName)) {
      kuduContext.createTable(tableName, schema, primaryKey, options)
    }
  }
  }

春江花夜月

发布了11 篇原创文章 · 获赞 4 · 访问量 690

私信关注

猜你喜欢

转载自blog.csdn.net/qq_38740498/article/details/103475225

spark篇2：spark通过KuduContext操作kudu

Java Spark 操作 Apache Kudu

使用Spark 2.2.1 + Kudu 1.5.0 操作Kudu大数据系统

spark篇3：spark操作ftp

Spark通过Dataframe操作hive

[Spark]-Streaming-操作篇

spark系列-应用篇之通过livy提交Spark任务

《Spark篇》------ Spark基础

Spark-kudu学习—删除数据

[Spark SQL]Spark SQL读取Kudu，写入Hive

【Spark】Spark基本操作

0030-如何在CDH中安装Kudu&Spark2&Kafka

spark 通过 phoenix 操作hbase 表

Oozie操作篇--Oozie Spark Action 配置

Spark之键值对操作-Java篇（三）

spark(2)

大数据学习整理篇（三）Ubuntu 16.04 Server版安装Kudu,Impala,Spark 2.3.4,以及Scala语言使用Spark RDD访问HBase

2 Spark入门reduce、reduceByKey的操作

spark-steaming的2种操作

spark2的transformation和action操作

Spark Sql教程(2）———DataFrame基本操作

Spark（四）Spark 键值对操作

spark/java连接 kudu incompatible RPC? Error is: step 异常解决

Update(Stage5)：Kudu_javaApi使用_Spark整合

spark系列-应用篇之通过yarn api提交Spark任务

第68课：Spark SQL通过JDBC操作MySQL

Spark—通过Java、Scala API实现WordCount案例的基本操作

spark-sql入门（一）通过spark-shell命令行操作

spark通过spark shell执行WordCount

spark

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)