Anthropic 将于本月推出“AI语音助手”,支持 Airy、Mellow 和 Buttery 三种声音模式。
站长之家(ChinaZ.com) 4月17日 消息:被视为 “OpenAI 劲敌” 的 Anthropic 将推出一款基于其公司 AI 聊天机器人 Claude” 的全新语音助手产品。如今,搭载生成式人工智能的 “AI语音助手” 如雨后春笋般纷纷涌现,成为全球大型科技公司新的角逐战场,在这样的情况下,Anthropic 能否借此提升自身存在感,收获更多的关注呢?
据彭博社 16 日报道,Anthropic 预计将在本月内将推出一项 AI语音助手产品,随着这项语音支持功能的引入,预计用户能够比通过文本输入更加自然方便地与 AI 进行交流。
据悉,初期预计只会推出有限的服务,或将引入 “空灵风(Airy)”、“柔和风(Mellow)” 以及英式腔调的 “醇厚风(Buttery)” 等三种语音模式。
此前有消息称,Anthropic 为了给 “Claude” 添加语音功能,正在与语音人工智能初创公司 ElevenLabs 以及亚马逊展开合作。Anthropic 的管理层也曾透露正在开发语音选项,但具体的发布时间和详细信息并未公布。
Anthropic 将推出 “语音模式” 的消息是由应用研究员 M1Astra 在 Anthropic 的代码中发现的,之后其将这一消息分享给了媒体,才得以曝光。目前,Anthropic 尚未就此事发表官方立场。
业内人士将 Anthropic 的这一举措解读为:缩小与竞争对手 OpenAI 差距的行动!很多人认为,Anthropic 最近添加的 “Claude Research” 功能也是为了制衡 OpenAI 在今年 2 月发布的 “Deep Research” 。此外,谷歌的 “Gemini”、Mistral 的 “LlaMA” 也都提供网络搜索功能。
除此之外,Anthropic 还计划不久后添加一项功能,使 Claude 的用户能够在 Gmail(谷歌邮箱)、Google Calendar(谷歌日历)、Google Docs(谷歌文档工具)中进行搜索,旨在通过强化功能来抢占市场主导权。
业内相关人士表示:“Anthropic 引入语音功能的时间相比竞争对手稍晚一些。OpenAI、谷歌、xAI 等公司早已公开了语音功能,meta 也在准备推出强化了语音模式的‘Llama 4’。”
鉴于 Anthropic 引入语音功能的时间比竞争对手稍晚,对于它能否比竞争对手做得更出色,仍存疑。目前,AI 语音助手市场中,亚马逊的 “Alexa Plus”、三星电子的 “Bixby”、谷歌的 “Gemini Live”、苹果的 “Siri” 等,以及 OpenAI 都在展开竞争。特别是自去年 OpenAI 的 GPT-4o 推出后,AI 语音助手市场的技术正迅速向更高的水平发展。
业内相关人士解释称:“像 Alexa、Siri、Bixby 等现有的语音助手服务,是先将语音转换为文本进行识别,回答也是先以文本形式生成,然后再合成为语音。而在 GPT-4o 推出之后,能够直接对语音进行识别,处理过程加快了,并且还能够识别出语音中包含的情感以及混合在背景中的声音,在这方面存在相当大的技术差异。”
在这种利用生成式人工智能的语音 AI 助手市场中,随着大型科技公司之间的竞争日益激烈,对相关市场的前景预期也较为乐观。根据日本市场调研机构 Global Information 的数据显示,去年使用人工智能和机器学习(ML)的智能虚拟助手(IVA)的市场规模约为 147.7 亿美元。2023 年至 2030 年的年均增长率为 26.2%,预计到 2030 年市场规模将达到 474 亿美元。
业内相关人士表示:“大家都坚信生成式 AI 语音助手有很大的市场空间,以大型科技公司为主的企业都在积极推出相关服务。能听会说的 AI 给整个产业带来的变化程度是难以估量的。”
彭博社指出:“语音助手有望改变人们与聊天机器人的交互方式,并提高用户的生产效率,因此已成为 OpenAI、谷歌等人工智能开发企业的核心功能。然而,随着 AI 语音产品的出现,人们对其模仿他人说话风格的担忧也在加剧。”
0 条