Spark官方文档在Dataset
API中建议以下内容:
通过在
Enprers
上调用静态方法来指定Java编码
器
。
List<String> data = Arrays.asList("abc", "abc", "xyz");Dataset<String> ds = context.createDataset(data, Enprers.STRING());编码器可以组成元组:
Enprer<Tuple2<Integer, String>> enprer2 = Enprers.tuple(Enprers.INT(), Enprers.STRING());List<Tuple2<Integer, String>> data2 = Arrays.asList(new scala.Tuple2(1, "a");Dataset<Tuple2<Integer, String>> ds2 = context.createDataset(data2, enprer2);
或由Java
Beans由Enprers#bean构造:
Enprers.bean(MyClass.class);



