高通支持OpenAI小型开源模型在骁龙终端流畅运行

261 0 0

# 开源AI模型新突破：gpt-oss-20b首次实现在骁龙平台本地推理

8月11日消息，在AI领域又迎来一项重要进展。OpenAI于8月6日正式发布其最小开源模型gpt-oss-20b，该模型在标准测试中的表现与备受瞩目的o3‑mini模型相当。高通公司今日宣布，这是OpenAI首个能够在搭载骁龙平台的终端设备上本地运行的开源推理模型。

据官方新闻稿显示，高通表示gpt-oss-20b模型的思维链推理能力可以在配备骁龙旗舰处理器的终端设备上直接运行。此前，OpenAI的复杂模型仅限于云端部署，而这次合作实现了历史性突破——首次将大型语言模型的能力带到终端侧。

高通认为这是一个重要的转折点，标志着AI技术发展的新方向：复杂的助手式推理能力即将实现实本地化运行。这一成果充分体现了AI生态系统的成熟，开发者和合作伙伴可以借助骁龙处理器，直接采用OpenAI等领先企业的开源创新。通过在终端侧部署gpt-oss-20b模型，不仅能够有效保护用户隐私，还能显著降低延迟，同时为云端AI解决方案提供强大的智能体支持。

高通表示，在集成测试中提前获取并运行gpt-oss-20b模型，充分验证了其卓越的推理能力，该模型能够完美支持终端侧的复杂计算任务。开发者将可通过Hugging Face和Ollama等主流平台获取这一模型，并在搭载骁龙处理器的设备上充分发挥其性能优势。

值得注意的是，通过将Ollama轻量级开源LLM服务框架与强大的骁龙平台相结合，开发者和企业不仅能够直接在骁龙计算平台上运行gpt-oss-20b模型，还可以轻松实现网页搜索等默认功能，无需额外配置。用户体验方面，用户也可以通过Ollama的Turbo模式深入探索该模型的更多潜力。

# AI资讯