苹果发布FastVLM视觉语言模型 助力智能眼镜与穿戴设备
近日,苹果公司机器学习团队在GitHub平台开源了一款名为FastVLM的视觉语言模型,该模型提供三种不同规模的版本:0.5B、1.5B和7B。据官方介绍,FastVLM基于苹...
苹果携手复旦大学推出StreamBridge端侧视频大语言模型框架,支持AI实时响应视频流
近日,科技媒体MarkTechPost报道称,苹果公司与复旦大学达成合作,共同推出了StreamBridge端侧视频大语言模型框架,该技术专为实时流视频理解设计。 直播流...
## OpenAI高管预测:AI将实现知识自主生成,商业与科研迎来重大变革
近日,科技媒体The Decoder发布了一篇博文,引发了广泛关注。文中援引OpenAI高级模型开发负责人Jakub Pachocki的观点,他表示人工智能推理模型正在展现出一种...
英伟达与麻省理工推出Audio-SDS:参数化AI音效生成技术
5月13日讯息,科技媒体Marktechpost昨日发布博文称,英伟达与麻省理工学院(MIT)联合推出了一项突破性技术——Audio-SDS,这是一项基于文本条件的音频扩散模型...
OpenAI 升级 ChatGPT AI 连接器接入微软 OneDrive 和 SharePoint
近日,OpenAI在其官方日志中宣布了一项重要更新:即日起面向ChatGPT Plus、Pro及Team版本用户(不包括EEA、瑞士和英国地区),新增了对微软OneDrive和SharePo...
昆仑万维开源Matrix-Game大模型:10B+参数,领先的空间智能,助力《我的世界》开发
5月13日,昆仑万维对外宣布了一项重要进展——其Matrix-Game大模型(参数量达17B+)正式开源。这一模型属于Matrix-Zero世界模型中的可交互视频生成模块。 作为...
OpenAI开源HealthBench医疗测试基准
近日,人工智能研究领域的领军机构OpenAI宣布推出了一款专注于医疗领域的大模型测试评估集合——HealthBench,并将其开源。这一举措旨在为评估人工智能系统在医...
Manus全面开放注册:用户可享每日免费任务
5月13日,曾被炒到高达10万元一码难求的AI智能体平台Manus(https://manus.im/)宣布向所有用户开放注册。 根据官方公告,自即日起,Manus将全面开放注册...
逆强化学习揭示Reddit用户互动模式及抬杠行为
5月12日讯,在当今社会中,线上社群的功能早已超越了简单的'聊天室'概念。它们不仅塑造公众讨论的方向,还能影响舆论的走向和集体行动,甚至能够对现实中的决...
腾讯混元 T1-Vision 新功能:深度图像理解
5月12日,腾讯混元官方宣布其旗下T1-Vision功能正式上线,并在元宝平台中得到深度应用。这一全新功能采用了先进的多模态原生长思维链技术,能够实现对图像内...