Spark:java.lang.ClassCastException

版权声明:转载请注明出处 https://blog.csdn.net/qiaojialin/article/details/80774226

Spark程序运行中可能会遇到这个异常:

Caused by: cannot assign instance of scala.collection.immutable.List$SerializationProxy to field org.apache.spark.rdd.RDD.org$apache$spark$rdd$RDD$$dependencies_ of type scala.collection.Seq in instance of org.apache.spark.rdd.MapPartitionsRDD

第一种情况是自己定义的类没实现 Serializable 接口,
比如在 RDD 中的 MyClass。Spark 在节点间无法传输这个 RDD,就出现了这个异常。

第二种情况是在一个程序中访问远程 Spark 集群,但是他们版本不一样!比如 2.1.0 的 Client 和 2.1.2 的集群在读 csv 的时候就会出现这个问题。

欢迎关注个人公众号:数据库漫游指南

这里写图片描述

猜你喜欢

转载自blog.csdn.net/qiaojialin/article/details/80774226