DeepSeek-R1是杭州深度求索人工智能基础技术研究有限公司发布的高性能AI推理模型,旨在对标OpenAI的o1正式版。模型通过大规模强化学习技术进行后训练,仅需极少量标注数据,便能在数学、代码和自然语言推理等任务上取得卓越表现。DeepSeek-R1遵循MIT License开源,支持模型蒸馏,训练其他模型。