Jeśli chcę zapisać Algebraiczny Typ Danych (ADT) (tj. Scala zaplombowana hierarchia cech) w kolumnie Spark DataSet, jaka jest najlepsza strategia kodowania?Zakoduj hierarchię ATT/zapieczętowanej cechy w kolumnie Zestawu danych Spark
Na przykład, jeśli mam ADT gdzie rodzaje liści przechowywać różne rodzaje danych:
sealed trait Occupation
case object SoftwareEngineer extends Occupation
case class Wizard(level: Int) extends Occupation
case class Other(description: String) extends Occupation
Co najlepszym sposobem skonstruować:
org.apache.spark.sql.DataSet[Occupation]