谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词

依依百科 百科资讯 1

4 月 7 日消息,谷歌当地时间周一在 iOS 平台悄然推出了一款主打离线使用的语音听写应用“Google AI Edge Eloquent”,以此与 Wispr Flow、SuperWhisper、Willow 等同类产品展开竞争。

据了解,该应用可免费下载,在完成基于 Gemma 模型的自动语音识别(ASR)模型下载后,用户即可在手机上开始语音听写。应用内可实时查看转录文本,按下暂停键时,软件会自动过滤“嗯”“啊”等填充词,并对文本进行润色优化。

转录文本下方设有“要点”“正式化”“精简”“详细”等选项,可对文本进行格式转换。

用户还可关闭云端模式,仅使用本地处理功能。(开启云端模式时,应用会借助云端 Gemini 模型完成文本优化。)若有需要,Google AI Edge Eloquent 可从用户的 Gmail 账户中导入特定关键词、姓名及专业术语,此外用户也可自行添加自定义词汇。

该应用会记录语音转录会话历史,并支持全文检索。同时能显示上一次会话中口述的单词、每分钟输入字数以及总发言字数。

谷歌在 App Store 的应用介绍中写道:“Google AI Edge Eloquent 是一款高端语音听写应用,旨在打通自然语音与专业、可直接使用的文本之间的壁垒。不同于普通听写软件逐字记录卡顿和填充词的模式,Eloquent 依托 AI 精准捕捉用户的核心意图。它会自动剔除‘嗯’‘呃’等语气词以及语句中途的自我修正内容,输出整洁、精准的文本。”

目前该应用仅登陆 iOS 平台,但其 App Store 介绍中提及了安卓版本。

据应用介绍,Eloquent 将实现“安卓系统无缝适配”,可被设为默认键盘,在任意文本输入框实现全系统调用。此外,该应用还将搭载悬浮按钮功能,与 Wispr Flow 在安卓端的功能类似,方便用户随时随地开启语音转录。

随着语音转文本模型不断优化,AI 驱动的转录类应用愈发受到用户青睐。谷歌也凭借这款试验性应用加入这一赛道。