2016-08-03 83 views
10

Używam Apache Spark 2.0 i tworzę case class dla wzmianki o schemacie dla DetaSet. Kiedy próbuję zdefiniować niestandardową Koder według How to store custom objects in Dataset? dla java.time.LocalDate mam następujący wyjątek:Apache Spark 2.0: java.lang.UnsupportedOperationException: Nie znaleziono kodera dla java.time.LocalDate

java.lang.UnsupportedOperationException: No Encoder found for java.time.LocalDate 
- field (class: "java.time.LocalDate", name: "callDate") 
- root class: "FireService" 
at org.apache.spark.sql.catalyst.ScalaReflection$.org$apache$spark$sql$catalyst$ScalaReflection$$serializerFor(ScalaReflection.scala:598) 
at org.apache.spark.sql.catalyst.ScalaReflection$$anonfun$9.apply(ScalaReflection.scala:592) 
at org.apache.spark.sql.catalyst.ScalaReflection$$anonfun$9.apply(ScalaReflection.scala:583) 
at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241) 
at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241) 
at scala.collection.immutable.List.foreach(List.scala:381) 
at scala.collection.TraversableLike$class.flatMap(TraversableLike.scala:241) 
............ 

Poniżej kodem:

case class FireService(callNumber: String, callDate: java.time.LocalDate) 
implicit val localDateEncoder: org.apache.spark.sql.Encoder[java.time.LocalDate] = org.apache.spark.sql.Encoders.kryo[java.time.LocalDate] 

val fireServiceDf = df.map(row => { 
val dateFormatter = java.time.format.DateTimeFormatter.ofPattern("MM/dd /yyyy") 
FireService(row.getAs[String](0), java.time.LocalDate.parse(row.getAs[String](4), dateFormatter)) 
}) 

Jak możemy zdefiniować enkoder partyjnego api trzeciej iskry?

Aktualizacja

gdy tworzę enkoder dla całej klasy przypadek, df.map.. map przedmiot na binarne, jak poniżej:

implicit val fireServiceEncoder: org.apache.spark.sql.Encoder[FireService] = org.apache.spark.sql.Encoders.kryo[FireService] 

val fireServiceDf = df.map(row => { 
val dateFormatter = java.time.format.DateTimeFormatter.ofPattern("MM/dd/yyyy") 
FireService(row.getAs[String](0), java.time.LocalDate.parse(row.getAs[String](4), dateFormatter)) 
}) 

fireServiceDf: org.apache.spark.sql.Dataset[FireService] = [value: binary] 

Oczekuję mapę dla FireService, ale powrót binarny mapy .

Odpowiedz

4

Jako ostatni komentarz jest napisane: "jeśli klasa zawiera pasek pola, potrzebujesz enkodera dla całego obiektu." Musisz dostarczyć niejawny koder dla samej siebie; inaczej Spark skonstruuje jeden dla ciebie używający SQLImplicits.newProductEncoder[T <: Product : TypeTag]: Encoder[T]. Możesz zobaczyć z typu, że nie używa parametrów enkodera implicit dla pól, więc nie może korzystać z obecności localDateEncoder.

Iskrę można zmienić, aby sobie z tym poradzić, np. używając biblioteki Shapeless lub bezpośrednio używając makr; Nie wiem, czy taki jest plan w przyszłości.

+0

Hej @Alexey Dostałem twój punkt jeszcze Nie mam dokładnego powodu, dlaczego potrzebowaliśmy formatera pełnego obiektu? –

+0

Mam twój punkt. Aktualizuję również pytanie, ponieważ teraz moje dane są konwertowane na Binary. Kiedy używam znacznika czasu zamiast LocalDate, kompilacja dataschema jako FireService inaczej jako plik binarny. –

+0

Proszę zadać to jako osobne pytanie. Ogólnie nie edytuj pytania, aby zadać inne pytanie. –