哪种并行排序算法具有最佳的平均案例性能？

一尘不染

algorithm

在串行情况下，排序需要O（n log n）。如果我们有O（n）个处理器，我们希望线性加速。存在O（log
n）并行算法，但是它们具有很高的常数。它们也不适用于没有O（n）处理器的商品硬件。对于p个处理器，合理的算法应花费O（n / p log n）时间。

在串行情况下，快速排序平均具有最佳的运行时复杂性。并行快速排序算法易于实现。但是，由于最初的步骤是将整个集合分区在单个内核上，因此执行效果并不理想。我发现了许多并行排序算法的信息，但到目前为止，我还没有发现任何指向明确赢家的信息。

我正在寻找一种在8到32个内核上运行的JVM语言中100万到1亿个元素的列表的排序方式。

阅读 433

2020-07-28

共1个答案

一尘不染

以下文章（PDF下载）是对各种体系结构上的并行排序算法的比较研究：

根据这篇文章， 样本排序 似乎在许多并行体系结构类型上都是最好的。

更新以解决Mark对年龄的关注：

以下是一些较新的文章，介绍了一些更新颖的内容（从2007年开始，顺便说一下，仍然可以与样本排序进行比较）：

前沿（大约在2010年，有些才几个月）：

2013年更新： 这是大约在2013年1月的前沿。（注意：一些链接是Citeseer上的论文，需要免费注册）：

2020-07-28