Qwen
共 1 篇

Rust让Qwen LLM模型效率再次炸裂,6倍速 tokenizer 黑科技。
bpe-qwen:Rust 重写 BPE 分词核心,面向 Qwen 系列模型,实测 6x–12x 提速且兼容 HuggingFace API,一行替换即可加速推理流水线。
October 16, 2025 · 2 min · 379 words · 梦兽编程
共 1 篇

bpe-qwen:Rust 重写 BPE 分词核心,面向 Qwen 系列模型,实测 6x–12x 提速且兼容 HuggingFace API,一行替换即可加速推理流水线。