Spark

【Big Data 每日一题】Spark开发性能调优总结

【Big Data 每日一题20180821】Spark中ml和mllib的区别？

【Big Data 每日一题20180828】Maven 中 jar 包的 Snapshot 和 Release 版本区别？

【Big Data 每日一题20180829】Spark on Yarn 的两种运行模式？

【Big Data 每日一题20180830】关于 Metrics ？

【Big Data 每日一题20180831】Spark 的 tasks 信息， Locality Level 种类？

【Big Data 每日一题20180905】Spark Shuffle FetchFailedException解决方案

【Big Data 每日一题20180906】Spark性能调优篇一之任务提交参数调整

【Big Data 每日一题20180907】Spark性能调优篇二之重构RDD架构及RDD持久化

【Big Data 每日一题20180908】Spark性能调优篇三之广播方式传输数据

【Big Data 每日一题20180909】Spark性能调优篇四之使用Kryo进行序列化操作

【Big Data 每日一题20180910】Spark性能调优篇五之使用fastUtil工具包

【Big Data 每日一题20180911】Spark性能调优篇六之调节数据本地化等待时长

【Big Data 每日一题20180912】Spark性能调优篇七之JVM相关参数调整

【Big Data 每日一题20180913】Spark性能调优篇八之shuffle调优（重要）

【Big Data 每日一题20180914】Spark性能调优九之常用算子调优

【Big Data 每日一题20180915】Spark编码时，static 变量慎用？

【Big Data 每日一题20180916】Spark累加器(Accumulator)陷阱及解决办法

【Big Data 每日一题20180917】数据本地化的几种级别

【Big Data 每日一题20180919】Spark内核分析之spark作业的三种提交方式

【Big Data 每日一题20180920】org.apache.spark.SparkException: Task not serializable

【Big Data 每日一题20180921】Spark 序列化问题

【Big Data 每日一题20180922】sparkstreaming同时消费多个topic的数据实现exactly-once的语义

【Big Data 每日一题20180923】Structured Streaming 实现思路与实现概述

【Big Data 每日一题20180924】Structured Streaming 之 Source 解析

【Big Data 每日一题20180925】Structured Streaming 之 Sink 解析

【Big Data 每日一题20180926】Structured Streaming 之状态存储解析

【Big Data 每日一题20180927】Structured Streaming 之 Event Time 解析

【Big Data 每日一题20180928】Structured Streaming 之 Watermark 解析

【Big Data 每日一题20180929】对spark2.3.0中Structured Streaming低延迟持续处理模式的介绍

【Big Data 每日一题20180930】StructuredStreaming官方文档翻译

【Big Data 每日一题】sparkstreaming 反压机制

【Big Data 每日一题】spark shuffle 过程

【Big Data 每日一题】spark yarn 运行模式

【Big Data 每日一题】spark master client关系？

【Big Data 每日一题】spark pageCache

【Big Data 每日一题】KryoSerializer 使用场合

【Big Data 每日一题】spark cpu 死

【Big Data 每日一题】structured streaming

Spark学习之10：Task执行结果返回流程

https://blog.csdn.net/ktlinker1119/article/details/45870969

swap机制

spark 性能调优

Hadoop

1、journalnode 作用

2、journal Quorum 调度

问题：
hive hdfs 关系
集群的关系

Hbase

【Big Data 每日一题20180816】数组为什么比list 效率高？

【Big Data 每日一题20180815】 HBase 与 zookeeper 之间的关系？

【Big Data 每日一题20180814】hadoop中有几个文件，spark就会有几个Partition么？

HIVE

【Big Data 每日一题20180918】 Hive filter pushdown ？ (英)

KAFKA

【Big Data 每日一题20180901】 Kafka相对传统技术有什么优势

【Big Data 每日一题20180902】 Kafka 最大的特点？

【Big Data 每日一题20180903】 Kafka的Zookeeper关系？

【Big Data 每日一题20180904】ISR策略(in-sync Replica) ？

YARN

JVM

【Big Data 每日一题XXXX】调优

【Big Data 每日一题20180822】Java动态编译优化——URLClassLoader 内存泄漏问题解决

【Big Data 每日一题20180824】为什么有栈内存和堆内存之分

Linux

【Big Data 每日一题20180823】Linux 中 ulimit 作用

【Big Data 每日一题20180824】Linux传统Huge Pages与Transparent Huge Pages ????

【Big Data 每日一题20180825】Linux中SELinux ？？？？？

【Big Data 每日一题20180826】 Kernel ？？？？

【Big Data 每日一题20180827】linux 管道命令与管道通信

Ansible

其他

待编辑【Big Data 每日一题】多版本并发控制是什么？

待编辑【Big Data 每日一题】Kylin 的 Cube 模型?

待编辑【Big Data 每日一题】OLAP引擎 ---- Kylin 介绍?

【Big Data 每日一题】目录