好吧,您的确切问题的答案是
coalesce函数。但是,正如已经提到的那样,它根本效率不高,因为它将迫使一个工作人员读取所有数据并顺序写入。
df.coalesce(1).write.format('json').save('myfile.json')顺便说一句,结果文件不是有效的json文件。它是每行带有json对象的文件。

好吧,您的确切问题的答案是
coalesce函数。但是,正如已经提到的那样,它根本效率不高,因为它将迫使一个工作人员读取所有数据并顺序写入。
df.coalesce(1).write.format('json').save('myfile.json')顺便说一句,结果文件不是有效的json文件。它是每行带有json对象的文件。