Florence-2指的是什么
微软 Azure AI 团队开发了 Florence-2 这个多功能视觉处理工具,它能够胜任包括生成图片描述、识别物体、进行视觉定位以及执行图像分割在内的多种计算机视觉相关任务。该模型采用 Transformer 架构,并通过序列到序列的学习方法运作:其编码器负责将输入的图像转换成一个序列表征形式,而解码器则进一步将其转化为具体的文本输出结果。为了训练 Florence-2,团队使用了一个庞大的数据集 FLD-5B,这个集合包含了1.26亿张图片以及总计超过54亿个标签的数据,并且通过自动化的图像标注技术与持续的模型迭代优化来保障了其高质量和丰富的多样性。
Florence-2的核心特性
© 版权声明
文章版权归作者所有,未经允许请勿转载。