spark结合实例分析stage的划分

版权声明:原创文章,转载请注明出处 https://blog.csdn.net/xianpanjia4616/article/details/84796858 昨天在群里有一个同学问了一个spark中关于stage的一个问题,关于spark中stage的划分可以看这个,当时我大致看了一下,简单的回答了一下他,可能说的也不太清楚,今天把这个问题写了一个小demo,总结了一下. 问题是这样的,从oracle中读取一个表,然后对某个字段进行重分区,再从oracle中读取另外一张表,同样也对某一个字段
分类: 其他 发布时间: 01-28 22:45 阅读次数: 0

sparksql中dataframe的用法

版权声明:原创文章,转载请注明出处 https://blog.csdn.net/xianpanjia4616/article/details/84891231 Spark SQL 是 Spark 处理结构化数据的一个模块.与基础的 Spark RDD API 不同, Spark SQL 提供了查询结构化数据及计算结果等信息的接口.在内部, Spark SQL 使用这个额外的信息去执行额外的优化.有几种方式可以跟 Spark SQL 进行交互, 包括 SQL 和 Dataset API.当使用相
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

极端恢复时用到的几个隐藏参数 Oracle hidden corruption recovery parameters

Oracle hidden corruption recovery parameters Note: Oracle hidden parameters are undocumented and unsupported by Oracle. Make sure that you thoroughly test all hidden parameters before placing them in your production environment. Parameter Name      
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

Day 13 20190128 老男孩python学习第13天 内容整理

视频看了5个小时 二进制 bin() 八进制 oct() 十六进制 hex() 因为二进制不易观察,所以使用十六进制便于观察, 1-9, abcdef,共15个 4个二进制对应一个16进制 ASCII 码表最低表示字符的单位是8bit,即1byte,8 bit = 2 * hex,2个十六进制位可以表示一个byte(字节),4个bit对应一个十六进制数 unicode占用了2-4个字节,虽然收录了几乎所有的语言,但是由于占体积太大,相比ASCII的1个字节,体积大了一倍多。 支持语言多是优势,
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

PGP NO_PUBKEY

horizon@horizon-pc ~ $ sudo apt-get update Ign http://packages.linuxmint.com rebecca/upstream Translation-en Ign http://packages.linuxmint.com rebecca/upstream Translation-zh_CN Fetched 15.4 kB in 21s (706 B/s) Reading package lists... Done W: GPG e
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

_proto_和prototype

_proto_和prototype 实例对象中有一个属性,_proto_,也是对象,叫原型,不是标准的属性,浏览器使用的, 构造函数中有一个属性,Prototype,也是对象,叫原型,是标准属性,程序使用
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

Luogu4735 最大异或和

题目蓝链 Description 给你一个序列,你需要支持以下两个操作: A x: 在序列尾部添加一个整数\(x\),序列的长度增加\(1\) Q l r x: 询问操作,你需要找到一个位置\(p \in [l, r]\),使得:\(x \bigoplus a_p \bigoplus a_{p + 1} \bigoplus \ldots \bigoplus a_n\)最大,输出最大值是多少 Solution 首先我们需要打一个可持久化的\(trie\)树来维护\(a_i\)的前缀和,这样我们就
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

hibernate(四) 双向多对多映射关系 hibernate(四) 双向多对多映射关系

hibernate(四) 双向多对多映射关系 序言           莫名长了几颗痘,真TM疼,可能是现在运动太少了,天天对着电脑,决定了,今天下午花两小时去跑步了,           现在继上一章节的一对多的映射关系讲解后,今天来讲讲多对多的映射关系把,明白了一对多,多对多个人感觉还是比较容易的,需要理清楚其数据库关系图,那么你就拿下了它。映射文件的配置还是那么些死东西。                                                 --WH 一、小疑问
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

[WC2007]剪刀石头布

洛古 一句话题意:给定一张图,每两点之间有一条有向边或无向边,把所有无向边定向,使图中三元环个数尽量多 因为原图是一个完全图,假设图中任意三点都能构成三元环,那么途中三元环的个数为:\(\binom{n}{3}\)。 那么如果一个三元组不是三元环,那么有一个点的出度为2。 我们假设一个点的出度为d,那么对于这个点,三元环会减少\(\frac{d (d-1)}{2}\) 所以三元环的数量为:\(\binom{n}{3}- \sum_{i=1}^n\binom{d[i]}{2}=\binom{n}
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

002649:spring异步监听实现

一、背景描述   1、今天接到一个老需求改造:如果一个用户多次提交不同的订单,则将该用户(依据手机号)设置成一个专业投诉人或取消设置。   2、系统存储数据时采用的是同一个人不同的单据则存放成不同的实体。   3、存在租户的概念,本次更新的范围也是租户下所有该用户(依据手机号)   二、具体分析   1、因为系统使用的是微服务实现,订单信息在另外一个服务上,新增一个根据手机号进行批量更新的接口代价大且用途有限。     2、因为系统已经运行很久有很多历史数据,所以该功能除了要完成实现还要考了性
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

Git操作相关记录

1. 本地更新fork来的项目,与原项目同步更新 git remote add upstream <origin_repo_addr> git remote -v git fetch upstream ### fetch后会被存储在一个本地分支upstream/master上 git merge upstream/master ### 切换到本地master分支,合并upstream/master分支 git log git push origin master 未完待续......
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

获取本机安装的软件清单

实现效果:    知识运用:   RegistryKey类的GetSubKeyNames方法   public string[] GetSubKeyNames()  //j检索用来包含 所有子项名称的字符串数组 实现代码: private void button1_Click(object sender, EventArgs e) { try { RegistryKey regMa
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

可以提高php编程效率的20个要点

  整理了可以提高php编程效率的20个要点,发博客记录一下,需要的朋友可以参考。   1、如果能将类的方法定义成static,就尽量定义成static,它的速度会提升将近4倍。   2、$row['id'] 的速度是$row[id]的7倍。   3、echo 比 print 快,并且使用echo的多重参数(译注:指用逗号而不是句点)代替字符串连接,比如echo $str1,$str2。   4、在执行for循环之前确定最大循环数,不要每循环一次都计算最大值,最好运用foreach代替。   
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

Spring Cloud 整合 Swagger2

详细用法: https://www.cnblogs.com/softidea/p/6251249.html 原文链接(注意文末):https://blog.csdn.net/ityqing/article/details/81217383 一、引入依赖: <dependency> <groupId>io.springfox</groupId> <artifactId>springfox-swagger2</artifactId>
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

JZOJ 4228. 【五校联考3day2】C

题目 Description 在远古的YL国大地上,有n个祭坛,每个祭坛上四个方向写有“艄、毜、鼛、瓯”四个大字,其实这在YL国古代分别是“东、南、西、北”的意思。 YL国每年都要举行祈福消灾的祭祀活动,这个时候,每个祭坛都要在艄毜鼛瓯四个方向中选一个方向,祭坛将向这个方向发出一道隐形的光线,如果两个祭坛发出的光线相交,或者祭坛发出的光线经过了别的祭坛,则祭祀不仅不能成功还将遭到上天的惩罚,如果这些条件都满足则祭祀将成功,YL国在接下来的一年内将不会有任何灾难,甚至只会有人出生不会有人死亡。
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

POJ1573 ZOJ1708 UVA10116 UVALive5334 HDU1035 Robot Motion【DFS+BFS】

Robot Motion Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 16166 Accepted: 7643 Description A robot has been programmed to follow the instructions in its path. Instructions for the next direction the robot is to move are laid down in a
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

carbondata1.5.1编译

版权声明:原创文章,转载请注明出处 https://blog.csdn.net/xianpanjia4616/article/details/84894447 What is CarbonData? Apache CarbonData is an indexed columnar data format for fast analytics on big data platform, e.g. Apache Hadoop, Apache Spark, etc. 因为我的spark是2.3.1的
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

scala之list用法史上最全

版权声明:原创文章,转载请注明出处 https://blog.csdn.net/xianpanjia4616/article/details/84930779 Scala 列表类似于数组,它们所有元素的类型都相同,但是它们也有所不同:列表是不可变的,值一旦被定义了就不能改变,其次列表 具有递归的结构(也就是链接表结构)而数组不是 下面是list的常用方法,当然了这不是所有的.但都是最常用的.具体看下面的demo.具体可以看代码里面的注释 package test object listDe
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

sparksql中UDF的使用

版权声明:原创文章,转载请注明出处 https://blog.csdn.net/xianpanjia4616/article/details/84945043 UDF(User Defined Function):spark SQL中用户自定义函数,用法和spark SQL中的内置函数类似;是saprk SQL中内置函数无法满足要求,用户根据业务需求自定义的函数。hive中UDF的使用请看这里 下面看一个UDF在sparksql中的使用的简单demo: package spark impo
分类: 其他 发布时间: 01-28 22:44 阅读次数: 0

Flink基于EventTime和WaterMark处理乱序事件和晚到的数据(三)

版权声明:原创文章,转载请注明出处 https://blog.csdn.net/xianpanjia4616/article/details/84971274 在实际的业务中,我们经常会遇到数据迟到的情况,这个时候基于窗口进行计算的结果就不对了,Flink中watermark就是为了解决这个问题的,理解watermark之前,先来说一下flink中的三个与流数据相关的概念,ProcessTime、EventTime、IngestionTime,不然很难理解watermark是怎么回事. 我们先
分类: 其他 发布时间: 01-28 22:43 阅读次数: 0