您的输入文件中每行需要有一个json对象,请参阅http://spark.apache.org/docs/latest/api/python/pyspark.sql.html#pyspark.sql.DataframeReader.json
如果您的json文件看起来像这样,它将为您提供预期的数据帧:
{ "a": 1, "b": 2 }{ "a": 3, "b": 4 }....df.show()+---+---+| a| b|+---+---+| 1| 2|| 3| 4|+---+---+


