近日,香港特区立法会与科大讯飞共同推出了一款创新的智能记录系统——”智识听”。该系统通过先进的语音识别技术,在会议直播中实现文字和视频画面同步显示,为公众提供了实时获取政策资讯的新渠道。
“智识听”系统经过深度学习训练,整合了2.5亿字的多语言语料库、400小时的高质量音频数据以及超过20万个香港本地特色词汇。特别值得一提的是,该系统能够精准识别粤语俚语和法律术语,并通过声纹识别技术有效处理议员们的特殊口音问题。目前,实时字幕的整体准确率已达到96%,结合人工辅助校对后更可提升至99%。
据悉,这一智能系统经历了长达三年的研发周期。从最初的1.0版本具备基础的录音转写功能,到2.0版本实现实时文字转换,再到如今3.0版本支持同步字幕显示,每一次升级都代表着技术能力的重大突破。为了应对粤语环境下的复杂语言场景,立法会特别整理了中英文对照资料库和大量高频粤语词汇,为系统优化提供了坚实的数据基础。
相比传统的人工记录方式,”智识听”系统的应用使议事录的发布时间从原来的七个工作日缩短至会议次日即可发布。目前,第四代开发计划正在推进中,未来将重点打造多语种字幕功能,并结合星火大模型技术进一步推动立法会智慧办公系统的发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。