谷歌发布实时语音互译模型 Gemini 3.5 Live Translate:可识别 70 余种语言,谷歌翻译 App 就能用

2026-06-09 23:35:23
来源:IT之家
分享
AIME

问财摘要

1、谷歌发布最新实时语音互译音频模型Gemini3.5Live Translate,可自动识别70多种语言,并生成流畅、自然的翻译语音,同时保留说话者的语调、语速和音高。 2、该模型可以自动处理多语言输入,无需手动调整设置,抗噪能力也能帮助应用适应嘈杂、复杂和不可预测的环境,开发者可以用于多语言通话、会议、课程、直播和广播等场景,提供实时口译体验。
免责声明 内容由AI生成

IT之家6月9日消息,北京时间9日(今天)晚间,谷歌正式发布最新的实时语音互译音频模型Gemini3.5Live Translate,迈出实时翻译的下一步。

Gemini3.5Live Translate可自动识别70多种语言,并生成流畅、自然的翻译语音,同时保留说话者的语调、语速和音高。

根据介绍,传统轮流式系统通常要等说话者说完后才开始翻译,Gemini3.5Live Translate则会连续生成语音,在“等待更多上下文以提升翻译质量”和“即时翻译以跟上说话者节奏”之间取得平衡。整个会话过程中,翻译音频可以保持流畅,避免尴尬停顿,并始终只比说话者慢几秒。

Gemini3.5Live Translate今起陆续登陆谷歌产品:

开发者可通过Gemini Live API和Google AI Studio使用公开预览版

企业客户可从本月起在Google Meet中使用私有预览版

普通用户可通过Android和iOS版谷歌翻译使用

Gemini3.5Live Translate会在语音流式传输过程中同步处理内容,让跨语言交流更加顺畅。模型可以自动处理多语言输入,无需手动调整设置,抗噪能力也能帮助应用适应嘈杂、复杂和不可预测的环境。开发者可以把Gemini3.5Live Translate用于多语言通话、会议、课程、直播和广播等场景,提供实时口译体验。

据IT之家了解,Gemini3.5Live Translate将登陆全球Android和iOS版谷歌翻译应用。用户使用实时翻译功能时,只需连接任意耳机,就可以在70多种语言中获得更顺畅的翻译,并让译文语音更接近说话者的语气。

Android用户还将陆续获得基于3.5Live Translate的全新“聆听模式”。用户可以像接电话一样把手机贴到耳边,直接通过手机听筒收听翻译音频。在没有耳机、又不希望旁人听见翻译内容时,这种模式会更方便。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈