近日,人工智能研究机构Anthropic在其官方博客发布消息,正式推出了一款名为”Circuit Tracer”的开源工具。
这款创新工具能够以图形化的方式展示大语言模型的内部思维过程。通过构建”归因图”(Attribution Graph),研究人员可以更直观地观察AI模型的运行机制,并进行交互式的研究和分析。
Circuit Tracer目前已在GitHub平台上以开源库的形式对外发布。研究人员可以通过Decode Research团队运营的Neuronpedia平台,使用其交互式前端界面来查看和分析”归因图”。
该工具为研究人员提供了强大的功能支持:不仅能够生成自定义的归因图,追踪模型的内部逻辑,还允许用户对图形进行标注、分享,并通过调整特征值实时观察模型输出的变化,从而验证研究假设。
Anthropic指出,目前学术界和产业界对AI模型内部结构的理解程度远远落后于其功能的发展速度。Circuit Tracer等开源工具的推出,将为更广泛的社区提供研究平台,帮助深入探究语言模型的运行机制,并为进一步优化和完善相关技术奠定基础。
相关参考资料:
-
Circuit Tracer开源项目介绍
-
GitHub项目页面
-
Neuronpedia上的Gemma-2-2B归因图示例
© 版权声明
文章版权归作者所有,未经允许请勿转载。