科大讯飞多项语音技术亮相中关村论坛 大模型技术加持让语音合成更“拟人”

2024-04-30 14:04:17 来源: 科大讯飞集团 作者:iFLYTEK
利好

  4月25日-4月29日,2024中关村论坛年会在北京举行。本届论坛以“创新:建设更加美好的世界”为主题,聚焦人工智能、空间科学、生命健康、碳达峰碳中和、未来产业等科技前沿和热点议题。国内外科技人员、企业负责人、政府官员和国际组织代表等约1000人参加了开幕式。

  在25日上午的开幕式上,集中发布了十项具有创新性、前瞻性、颠覆性的重大科技成果,涉及基础研究、前沿技术、科技基础设施等各方面。科大讯飞参与并运用先进的语音合成技术,为整个视频环节进行了AI配音,语音合成技术对传统会议模式的创新突破效果显著。借助先进的深度学习技术,可将文本转化成拟人化的语音,即“赋予机器像人一样自然流畅说话的能力”,是语音交互、语音翻译的关键接口能力。

  讯飞语音合成技术为十项重大科技成果发布进行AI配音

  自上世纪90年代,科大讯飞002230)开始在语音领域的探索,确立了“让机器能听会说,能理解会思考;用人工智能建设美好世界”的公司使命。坚持源头技术创新,2006年到2019年,连续14年蝉联国际语音合成大赛冠军,持续走在世界前列,展示了雄厚卓越的语音技术实力。

  2024年1月30日,讯飞星火V3.5正式发布。大模型技术加持下,语音合成的韵律表现力和拟人度有了大幅提升,超拟人语音合成MOS达到4.5,拟人度达到83%+。在语音合成领域,通常采用MOS(Mean Opinion Score,平均得分法)对语音质量进行评价,分值为1-5分,分值越高语音质量和自然度也越高。其合成效果类似人类在日常生活的口语化表达状态,像人一样拥有副语言(呼吸、叹气)、变换语速、口误、 停顿思考、轻重读等副语言表达能力,让合成听起来更具“人味儿”。目前超拟人语音合成功能已经上线科大讯飞旗下讯飞开放平台、讯飞智作官网。

  今年也是讯飞同传连续服务中关村论坛年会的第5年,本届年会共计服务全体会议、国企发现与发明论坛、全球数字化应用创新论坛等80场。为各项会议全程提供中英转写、翻译上屏,线上直播字幕,多语种语音播报技术支持。值得一提的是,本届中关村论坛年会中,全面开展线上语音直播频道,所有观众可通过扫描二维码,通过讯飞同传小程序进行多语种播报收听,打造多元化的创新参会模式。

  随着2024年中关村论坛年会的圆满落幕,讯飞语音合成技术与同传技术的成功应用为大会增添了一抹亮色。不仅为与会者带来了便捷的交流体验,也向世界展示了中国在智能语音领域的技术实力。未来,随着人工智能技术的不断进步,讯飞将在更多的国际舞台上发挥作用,为全球科技创新合作搭建更加坚实的桥梁。

关注同花顺财经(ths518),获取更多机会

0

+1
小牛诊股诊断日期:2024-05-17
科大讯飞
击败了30%的股票
短期趋势弱势下跌过程中,可逢高卖出,暂不考虑买进。
中期趋势
长期趋势已有756家主力机构披露2023-12-31报告期持股数据,持仓量总计7.20亿股,占流通A股33.39%
综合诊断:近期的平均成本为42.92元。该股资金方面呈流出状态,投资者请谨慎投资。该公司运营状况尚可,多数机构认为该股长期投资价值较高,投资者可加强关注。