近日凌晨,阿里巴巴集团宣布开源全新打造的Qwen3-Embedding 系列模型,该系列包含表征模型和排序模块,专为文本理解、检索与排序任务设计。这一系列模型基于性能强劲的 Qwen3 基础大语言模型进行优化训练。
据官方介绍,Qwen3-Embedding 系列模型在多项基准测试中展现出色性能。特别是在文本相似度计算、语义检索等任务中,其表现优于现有多种主流模型。其中,8B 参数规模的版本更是在权威评测榜单 MTEB 中取得了当前最佳成绩。
该系列模型具有以下显著特点:
- 强大的适应能力:支持多种语言和多领域任务,能够快速适配不同应用场景
- 灵活的架构设计:提供轻量化版本和全尺寸模型,满足不同性能需求
- 高效的推理速度:优化了计算效率,在保持高准确率的同时实现快速响应
- 优秀的可扩展性:支持分布式训练和在线更新,便于大规模部署
此外,模型还提供了丰富的接口和工具链,方便开发者进行集成和二次开发。阿里方面表示,希望通过开源这一系列模型,推动自然语言处理技术在实际应用中的落地。
如需获取 Qwen3-Embedding 系列模型 的代码、文档和技术报告,可通过以下渠道访问:
官方平台链接:
- https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48
- https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f
Hugging Face 社区:
- https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371f
- https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea
GitHub 开源地址:
- https://github.com/QwenLM/Qwen3-Embedding
技术文档下载:
- https://github.com/QwenLM/Qwen3-Embedding/blob/main/qwen3_embedding_technical_report.pdf
此次开源标志着阿里在大语言模型领域又一重要进展,为开发者和研究者提供了新的工具和资源。相信这一系列模型将在实际应用中发挥重要作用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。