org.apache.spark.SparkConf Импорт ;
Импорт org.apache.spark.api.java.JavaRDD ;
Импорт org.apache.spark.api.java.JavaSparkContext ;
Импорт java.util.Arrays ;
Импорт java.util.List ;
/ **
* операторы sampleTake:
* Возьмите первый образец , а затем
* первый аргумент: то ли повторяются
* второй аргумент: Возьмем (п)
* третий параметр: представитель случайного числа семян является начальным значением алгоритма выборки
* /
класс TakeSampleOperator общественности {
государственной статической силы основных (String [] арг) {
SparkConf = конф . SparkConf новый новый () а setMaster ( "локальный") setAppName (. "sampleTake") ;
JavaSparkContext SC = новый новый JavaSparkContext (конф) ;
Список <String> список = Массивы. asList ( "w 1 " , "w 2" , "W3" , "W4" , "W5") ;
JavaRDD <String> listRDD = sc.parallelize (список) ;
List <String> reuslt = listRDD.takeSample ( ложь, 2 , 1) ;
Система. err.println (reuslt) ;
}
}
Микро-канал двумерный код сканирования Следующий рисунок Jiaru Бо главная планета знаний для более больших объемов данных, искусственного интеллекта, алгоритмов и других учебных материалов, свободных Oh!