我认为
sortBy()更为简洁:
b = sc.parallelize([('t', 3),('b', 4),('c', 1)])bSorted = b.sortBy(lambda a: a[1])bSorted.collect()...[('c', 1),('t', 3),('b', 4)]实际上,它根本没有效率,因为它涉及按值进行键控,按键进行排序,然后获取值,但它比后面的解决方案漂亮。在效率方面,我认为您不会找到更有效的解决方案,因为您将需要一种方法来转换数据,从而使值成为您的键(然后最终将数据转换回原始模式)。



