超半数互联网内容已由人工智能生成

AI资讯1个月前发布 ainav
25 0

10月15日,一家专注于SEO的公司Graphite发布了一份研究报告。该报告对2020年1月至2025年5月期间发表的6.5万篇英文文章进行了分析。

研究中采用了一款名为Surfer的人工智能检测工具,将内容中有50%以上由大型语言模型生成的文章归类为AI创作。结果显示,自ChatGPT发布以来,AI生成文章的比例呈现快速增长态势。

从数据来看,AI文章的占比在2022年底约为10%,到2024年这一比例跃升至超过40%。进入2024年后,虽然增速放缓,但依然维持稳定增长。今年5月数据显示,新的AI生成文章占内容发布总量的52%

需要注意的是,这个数据可能并未完全反映真实情况。研究人员使用的Common Crawl数据集包含数千亿网页,但由于AI公司利用这些数据训练大语言模型,导致很多付费网站已阻止被该数据库索引。因此可以推断,大量由人类创作的内容未被统计在内

关于检测工具的准确性问题,Graphite团队也承认其局限性。测试结果显示,Surfer将真正的人类创作文章误判为AI生成的比例达4.2%,而将AI生成的文章误判为人写的概率仅0.6%。

对于AI生成内容为何进入”平台期”,目前尚无定论。Axios援引Graphite另一份报告指出,AI内容工厂已发现低质量AI生成内容逐渐失去市场青睐。在谷歌搜索中,86%的文章仍由人类创作,仅有14%来自AI。

另一方面,越来越多的作者开始在创作过程中使用AI工具作为辅助,这使得AI与人结合的内容界限变得越来越模糊。

UCLA计算机科学教授、亚马逊云服务副总裁Stefano Soatto向Axios表示:”当前的情况更像是一种共生关系,而不是简单的非此即彼的对立。”这种观点也为未来内容创作的发展方向提供了新的思考角度。

© 版权声明

相关文章