Spark缓存策略 - 代码天地

Spark缓存策略

其他 2018-09-03 00:32:43 阅读次数: 0

版权声明：转载请备注出处，https://blog.csdn.net/jiaxinhong https://blog.csdn.net/jiaxinhong/article/details/82145793

这里写图片描述

持久化的单位是partition，2是指partition的备份数，不是指持久化到几个节点上

package com.bjsxt.spark.persist

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.storage.StorageLevel

object CacheTest {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf()
      .setAppName("CacheTest")
      .setMaster("local")

      val sc = new SparkContext(conf)
      sc.setCheckpointDir("G://checkpoint")

      var liensRDD  = sc.textFile("userLog")
      /**
       * 1、cache的返回值  必须赋值给一个新的变量  ， 在其他的job中直接使用这个变量就可以
       * 2、cache是一个懒执行，必须有action类的算子触发
       * 3、cache算子的后面不能立即添加action类算子
       * 
       * 
       * cache默认会将rdd中的数据持久化到内存中
       * 
       * persist和cache有什么区别？
       * cache是persist的一个简化版   persist里面可以手动指定其他的持久化级别   cache = persists（StorageLevel.MEMORY_ONLY）
       * 
       */
//      liensRDD = liensRDD.cache()
      liensRDD.checkpoint()
      liensRDD = liensRDD.persist(StorageLevel.MEMORY_ONLY)


      val startTime = System.currentTimeMillis()
      val count1 = liensRDD.count
      val endTime = System.currentTimeMillis()
      println("总共耗时：" + (endTime - startTime) + "ms\t Count:" + count1)


      val startTime1 = System.currentTimeMillis()
      val count2 = liensRDD.count
      val endTime1 = System.currentTimeMillis()
      println("总共耗时：" + (endTime1 - startTime1) + "ms\t Count:" + count2)
  }
}

猜你喜欢

转载自blog.csdn.net/jiaxinhong/article/details/82145793

Spark缓存策略的优化

Spark缓存策略

缓存策略

spark缓存

WEB缓存_缓存过期策略

spark优化策略

用户信息缓存策略

文件下载的缓存策略

Redis缓存逐出策略

缓存策略概述

Integer缓存策略

Hibernate 缓存策略

memcached缓存策略

常用的缓存替换策略

[转]网站缓存策略

ASIHTTPRequest缓存策略的设置

RN的缓存策略探索

Android 缓存策略

缓存设计策略

认识Http的缓存策略

nginx设置缓存策略

redis 缓存策略

Redis缓存淘汰策略

Hystrix缓存策略

NSURLRequestCachePolicy—iOS缓存策略

Redis 缓存淘汰策略

缓存的替换策略

NSURLRequestCachePolicy 缓存策略

Android中的缓存策略

mybatis 使用缓存策略

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)