Rust性能优化踩坑：当Rust跑输Python的惨痛教训

故事是这样开始的

事情其实很简单，就是想把一个Python写的数据管道用Rust重写一遍。动机嘛，你懂的——Rust快啊，编译器严格啊，内存安全啊，重写完了还能在代码评审的时候小小装一下，说"看，性能提升了10倍"。

结果呢？Python跑完只要412毫秒，我那个精心重写的Rust版本居然要1.2秒。没看错，Rust比Python慢了将近3倍。我当时真的是反复跑了好几次，加了时间戳，加了日志，甚至把性能分析器都搬出来了，结果铁证如山——Rust确实更慢。

这感觉就像你花大价钱买了辆法拉利，结果在马路上被一辆五菱宏光超了。那一刻我的自尊心碎得满地都是。

Rust不是魔法，是工具

后来冷静下来想想，问题其实很清楚：Rust不是自动快，而是"有潜力"快。这就像你买了一套顶级厨具，不代表你就能做出米其林大餐。厨具再好，你要是把盐当糖放，做出来的东西照样没法吃。

Rust给你的是内存的精确控制、生命周期的管理、零成本抽象、无畏并发这些好东西。但它救不了你糟糕的数据结构选择，救不了你到处乱clone的坏习惯，也救不了你脑子进水的代码设计。换句话说，Rust给你一把好枪，但瞄不准照样打不中靶子。

我到底写了什么鬼东西

好，让我给你看看那段让我丢人的代码：

fn filter_and_sum(data: &Vec<i64>) -> i64 {
    let mut total = 0;
    for v in data.iter() {
        if data.contains(v) {     // 罪魁祸首就在这里
            total += v;
        }
    }
    total
}

如果你是写过Rust的人，看到这里估计眼皮子都在跳了。问题出在哪呢？data.contains(v) 在 Vec 上的时间复杂度是 O(n)，也就是说每检查一个元素，它都要从头到尾扫描一遍整个数组。外层循环遍历n个元素，每个元素里面又扫描n次，总共就是 O(n²)。

打个比方吧，这就好比你去超市买东西，每拿一件商品都要把购物车里所有东西翻一遍确认"我是不是已经有这个了"。买10件东西要翻100次，买100件东西要翻10000次，这能不慢吗？

O(n) vs O(1) 查找对比

再看看Python版本怎么写的：

def filter_and_sum(data):
    total = 0
    s = set(data)  # 关键在这里
    for v in data:
        if v in s:
            total += v
    return total

Python用了set，查找复杂度是O(1)，整个循环就是O(n)。同样是去超市，Python版本是把购物清单贴在手机上，看一眼就知道有没有，根本不用翻购物车。

修复之后世界都亮了

知道问题在哪之后，修复其实很简单，把Vec换成HashSet就行了：

use std::collections::HashSet;

fn filter_and_sum(data: &Vec<i64>) -> i64 {
    let set: HashSet<i64> = data.iter().cloned().collect();
    let mut total = 0;
    for v in data.iter() {
        if set.contains(v) {
            total += v;
        }
    }
    total
}

改完之后再跑一次，Rust只要38毫秒，比Python的412毫秒快了10倍多。这才是正常的剧本嘛。但前提是你得用对工具，不然再快的语言也救不了你。

Vec vs HashSet 数据结构对比

那些让Rust比Python还慢的骚操作

其实我不是一个人在犯蠢，很多Rust新手都会踩这些坑。

首先是到处.clone()的问题。借用检查器一报错，新手的第一反应就是加.clone()，能编译过就行。但你可能没意识到，clone一个3MB的结构体要花好几毫秒呢。这就像你每次出门都复印一份身份证，虽然方便但复印机迟早冒烟。

然后是紧循环里用unwrap()。每个unwrap都有一次分支判断，在热路径上这些分支会积少成多。还有就是该用&str的时候用String，String要在堆上分配内存，&str是借用不分配，能借用就别分配，这是基本功。

再就是强行并行化的问题。Python的单线程模型虽然看起来土，但至少不会让你搬起石头砸自己的脚。Rust的并发能力很强，但用不好就是在给自己加负担，线程调度、锁竞争、通道开销，一个都不会少。

最后还有过度抽象和什么都用Vec的毛病。泛型确实是"零成本抽象"，但滥用会导致单态化膨胀。Vec很好用，但不是万能的，该用HashSet的时候用HashSet，该用HashMap的时候用HashMap，别偷懒。

什么时候Rust能赢

说了这么多坑，那Rust到底什么时候能发挥真正的实力呢？其实性能优化的条件也不复杂：选对数据结构、避免不必要的内存分配、提前分配容量、避免clone风暴、正确使用迭代器、减少IO阻塞、算法复杂度在线。做到这些，Rust的性能优势自然就出来了。

反过来说，如果你乱用Vec、到处clone、跟借用检查器对着干写一堆变通代码、算法本身就是错的、没分析过Python版本就直接重写，那Python赢你也是正常的。

最后聊两句

折腾完这一圈，我最大的感悟就是：Python没有打败Rust，是我打败了我自己。Rust给了我自由，我用这份自由写出了慢代码；Python给了我限制，这些限制反而保护了我。如果你不懂时间复杂度、内存分配、所有权模型、数据结构选型，Rust不会拯救你，它只会暴露你。

所以最后问你一句：你有没有写过比Python还慢的Rust代码？有没有因为借用检查器报错就疯狂clone？有没有因为"Vec好用"就什么都往Vec里塞？欢迎在评论区聊聊你的故事，毕竟Rust是快的，但前提是你也得快。

觉得这篇文章有用吗？

如果这篇文章帮你避免了一次自我怀疑，不妨点个赞让更多人看到这个坑，或者转发给你的Rust群友，说不定他们正在犯同样的错误。关注梦兽编程的话，我还有很多类似的踩坑故事要讲。有什么问题或者你自己的惨痛经历，评论区见，说不定你的故事比我的更精彩。

故事是这样开始的#

Rust不是魔法，是工具#

我到底写了什么鬼东西#

修复之后世界都亮了#

那些让Rust比Python还慢的骚操作#

什么时候Rust能赢#

最后聊两句#