Próbuję przetworzyć plik dziennika. Najpierw odczytałem plik dziennika i podzieliłem te pliki zgodnie z moimi wymaganiami i zapisałem każdą kolumnę w oddzielnym JavaRDD. Teraz muszę przekonwertować te JavaRDD na DataFrames dla przyszłych operacji. Jest to kod, co starałem dotąd:Konwersja JavaRDD do DataFrame w Spark java
SparkConf conf = new SparkConf().setAppName("AuctionBid").setMaster("local");
JavaSparkContext sc = new JavaSparkContext(conf);
JavaRDD<String> diskfile = sc.textFile("/Users/karuturi/Downloads/log.txt");
JavaRDD<String> urlrdd=diskfile.flatMap(line -> Arrays.asList(line.split("\t")[0]));
System.out.println(urlrdd.take(1));
SQLContext sql = new SQLContext(sc);
i jest to sposób w jaki próbuję przekonwertować JavaRDD do DataFrame:
DataFrame fileDF = sqlContext.createDataFrame(urlRDD, Model.class);
Jednak powyższa linia nie jest mylące o working.I Model.class.
Czy ktoś może mnie zasugerować.
Dzięki.
Powyższy kod został napisany w Sparku 2.0+. – mrsrinivas
Co jeśli chcę przekonwertować 'JavaRDD' z' SparseVector'? –