小米首席语音科学家 Daniel Povey：AI 发展的本质就像生物进化，不开源要慢 1000 倍

AI资讯5个月前发布 ainav

136 0 0

以下是原文的改写版本：

—

**AI发展的本质就像生物进化：小米语音首席科学家张力为在MEET2026大会上分享**

AI的发展与生物进化的模式极其相似。我们需要在多个不同的任务上不断探索新的思路。因为很难预判哪种生物最终会胜出，就像啮齿类动物最初只是为了吃竹子种子这种极具体的目的而进化，却反而演化出了极强的“通才”式生存能力一样。

**论文中的数学理论往往不够具体，无法落地。我们需要的是在实践中不断探索和尝试。**

在进化过程中，“通才”与“专才”的权衡至关重要。如果环境长期稳定，自然界往往会涌现出大量像熊猫这样的“专才”，它们虽然只擅长某一领域，却能在这个领域做到极致；而一旦环境变得动荡多变，像老鼠这种适应力极强的“通才”往往更具生存优势。

**因此，我们需要让模型在多个不同的生态位里同时演进。每个物种通常都有其最适应的特定生存空间。如果我们能同时保留多种不同的技术路线，说不定其中某一条经过进一步打磨后，就能带来巨大的回报。**

目前，大多数大型机构采取两头并重的策略：既要沿用像Transformer这样的成熟模型，同时也得投入一些资源去做探索性研究，寻找下一个技术突破口。

**我的团队目前正在研发一种针对语音的新模型架构——Zapformer，这是一个通用声音基座。相较于去年推出的Zipformer而言，Zapformer实现了三大跨越：**

1. **从“人声”到“万声”的跨越**：从专注于人声建模，到成为能同时理解人声、环境音等多元信息的通用声音基座；
2. **从优化结构到创新理论的跨越**：通过引入梯度流（Gradient Flow）理论指导模型设计，在已属业界标杆的Zipformer基础上，将语音识别精度再次显著提升10%-15%；
3. **从专用优化到通用健壮的跨越**：为适应海量数据训练移除了Dropout层，增强了大数据拟合能力，同时将优化器升级为TransformAdam，在保持极速收敛的同时，大幅提升了训练的通用性与稳定性。

所有这些成果全都是开源的，因为我是开源的坚定信徒。开源能够加速技术的发展和传播，这也是我选择小米的原因之一。

—

**关于作者：**

张力为，小米语音首席科学家，主要负责探索性研究工作。他的团队尝试了大量不同的方向，希望能找到能产生巨大影响的成果。他认为，尽管大多数点子最终可能无法成为颠覆性的技术，但只要坚持探索，就有可能取得突破。

—

**总结：**

AI的发展就像生物进化，充满了试错和多样性。通过开源协作和多路径探索，我们可以为未来的技术突破奠定基础。尽管无法预判下一个“大杀器”会是什么，但保持多样性和开放性是关键。

# AI资讯