Florence-2 – 多功能视觉语言模型，由微软 Azure AI 团队开发

AI工具10个月前发布 ainav

160 0 0

Florence-2指的是什么

微软 Azure AI 团队开发了 Florence-2 这个多功能视觉处理工具，它能够胜任包括生成图片描述、识别物体、进行视觉定位以及执行图像分割在内的多种计算机视觉相关任务。该模型采用 Transformer 架构，并通过序列到序列的学习方法运作：其编码器负责将输入的图像转换成一个序列表征形式，而解码器则进一步将其转化为具体的文本输出结果。为了训练 Florence-2，团队使用了一个庞大的数据集 FLD-5B，这个集合包含了1.26亿张图片以及总计超过54亿个标签的数据，并且通过自动化的图像标注技术与持续的模型迭代优化来保障了其高质量和丰富的多样性。

Florence-2的核心特性

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

DeepSeek-OCR：开源高效精准的视觉语言模型

ainav

12 0

FoxBrain：鸿海研究院推出的大语言模型

ainav

148 0

VibePPT – AI智能PPT制作工具，自动生成最佳模板与布局

ainav

115 0

中科院携手多家学术单位发布提升多元媒体音乐创作能力的架构——VMB

ainav

157 0

360发布的新款AI文本转视频工具——FancyVideo

ainav

139 0

人工智能代理合集：e2b开发团队的GitHub精选

ainav

95 0

一站式AI工具导航平台！汇聚超800+免费AI工具，涵盖AI写作、智能绘画、论文生成、视频制作、编程辅助、音频处理等全场景工具。每日更新热门 AIGC工具（如 Sora、AI Agent），助您快速找到提升办公、创作、学习效率的实用工具！立即访问ai-nav.net，探索 AI 新可能！

按下Ctrl+D或⌘+D 感谢收藏 ai-nav.net

友链申请免责声明广告合作关于我们站点地图提交AI工具

 度加创作工具百度AI开放平台 Bing新必应搜外友链 Manus GPTBots.ai Claude Code

Copyright © 2025 AI工具导航站粤ICP备2025438650号-2