推荐使用国际直连GPT,立即访问: www.chatgp1.com
Hume AI发布Empathic Voice Interface (EVI):情感智能对话新纪元
Hume AI近期推出了一款名为Empathic Voice Interface (EVI)的对话式人工智能,该创新产品凭借其情感智能脱颖而出。EVI能够洞悉用户的语气,为每次交流增添深度,并据此灵活调整其回应,营造出近乎与人对话的真实感。
EVI作为一种前沿的人工智能系统,擅长理解和生成富有表现力的语音,其背后是数百万次人类对话的精心训练。如今,开发人员只需利用Hume提供的API,便能轻松将EVI无缝融入各类应用程序中,为用户带来独一无二的语音界面体验。
EVI的共情能力独具特色:
- 类似人类的语调:EVI以与人类表情相仿的语调作出回应,极大地丰富了对话的沉浸感。
- 响应式语言:它根据用户的表达灵活调整语言,精准满足用户需求。
- 先进的检测机制:EVI凭借用户的语气精准判断对话的结束,确保交互过程无缝衔接。
- 中断处理能力:即便在对话被打断时,EVI也能轻松从断点恢复,继续流畅交流。
- 自我完善:EVI从用户反馈中不断学习,持续优化,提升用户满意度。
除了共情功能,EVI还具备快速可靠的转录和文本转语音功能,使其应用场景广泛且灵活。它可与任意语言模型库(LLM)无缝集成,进一步增强了其实用性和灵活性。
EVI计划于4月面向公众发布,为开发人员提供一款打造沉浸式、富有同理心语音界面的创新工具。渴望率先体验EVI API的开发人员,可通过访问https://bit.ly/evi-waitlist上的表格表达兴趣。
Hume AI成立于2021年,是一家致力于确保人工智能服务于人类目标和情感健康的研究实验室和技术公司。公司由谷歌AI前研究员Alan Cowen创立。
Cowen在LinkedIn上表示:“我们坚信,语音界面将成为我们与人工智能互动的默认方式。语音比打字快四倍,解放了眼睛和双手,且其旋律、节奏和音色中蕴含着丰富的信息。这正是我们打造首个具备情商的人工智能,以理解超越文字的声音的原因。它能根据你的声音,更精准地预测何时开口、说什么以及如何说。”
Hume AI已从EQT Group、Union Square Ventures、Nat Friedman、Daniel Gross、Northwell Holdings、Comcast Ventures、LG Technology Ventures和Metaplanet等投资机构筹集了5000万美元的B轮融资。
OpenAI的语音计划
据X平台用户透露,OpenAI正在积极开发语音引擎。该引擎将涵盖语音和语音识别、语音命令处理以及文本与语音之间的转换等功能。
此外,它还将具备自动语音和语音识别与生成能力,以及基于自然语言提示、语音、视觉提示、图像和视频创建和生成语音和音频输出的功能。
在比尔·盖茨的“Unconfuse Me”节目中,Altman透露,OpenAI正沿着“这条漫长而连续的曲线”前行,致力于创建更新、更强大的模型。他强调了多模态性的重要性,这是GPT-5的关键特征之一,使其能够处理视频输入并生成新视频,同时确认该模型的开发工作已全面展开。
Altman还与盖茨深入探讨了GPT-5将如何注重定制化和个性化。Altman表示:“GPT-5将能够了解你、你的电子邮件、你的日历、你的预约方式,以及与其他外部数据源的连接——所有这些都将成为最重要的改进领域。”
去年,OpenAI在Android和iOS上的ChatGPT应用中推出了语音助手功能,使用户能够进行双向对话。ChatGPT的语音功能包括Ember、Sky、Breeze和Cove等多种声音。
最近,OpenAI与Figure AI携手合作,打造了由生成式AI驱动的Humanoids。在Figure最近发布的一段视频中,人形机器人Figure 01与人类进行了自然流畅的对话,并递给他苹果。
情商至关重要
理解情商的对话式人工智能聊天机器人正成为未来的发展趋势。“具备礼貌、理解情绪等能力的聊天机器人将带来更好的业务表现。更接近人类、能够感知情感和情绪的聊天机器人将带来商业利润,这令人倍感兴奋。”印度理工学院孟买分校教授兼计算机科学家Pushpak Bhattacharyya在接受AIM独家采访时说道。