OpenAI为ChatGPT提供新的语音和图像功能

AI产品新闻1年前 (2023)发布 yundic
503 0 0

OpenAI已经为ChatGPT推出了语音和图像功能,将在未来几周内推出适用于这款应用和浏览器的功能。

可以说,OpenAI已经依靠ChatGPT获得的桂冠,ChatGPT并没有与竞争对手Anthropic的Claude和Google的Bard集成相同级别的功能。

今年早些时候,OpenAI为ChatGPT添加了浏览器搜索功能,允许该工具访问互联网,但它的工作效果并不好,并因可能侵犯版权而从付费网站“打印”文本而被删除。

话虽如此,GPT—4是迄今为止最复杂的大型语言模型(LLM),这使得OpenAI一直处于生成性AI的首位。

OpenAI现在已经增强了聊天机器人的功能,同时随着行业竞争的加剧,ChatGPT一直处于聚光灯下。

有什么新鲜事吗?

OpenAI正在为ChatGPT添加以下内容:

  • 语音交互:用户现在可以直接与ChatGPT对话,作为回报,人工智能可以使用其五个合成声音中的一个进行音频响应。这一语音功能得到了高级文本到语音转换模型的支持,该模型是OpenAI使用语音演员的样本进行训练的。ChatGPT利用耳语OpenAI的开源语音系统,用于识别语音。
  • 图像交互:除了语音,用户现在可以为ChatGPT提供图像,为对话增加了视觉维度。例如,如果用户分享了一张损坏的设备的照片,ChatGPT可能会诊断问题并提出解决方案。在移动平台上,已经集成了一个绘图工具,允许用户圈出或精确定位人工智能要关注的图像的特定区域。图像功能是由GPT-3.5和GPT-4模型的多模式版本驱动的,这些模型已经进行了微调,以解释和推理视觉输入。

有了这些新功能,用户可以与聊天机器人进行来回对话,并向它询问有关图像内容的具体信息等。

毫无疑问,社区将找到有趣的方法来测试新ChatGPT的限制。

OpenAI在X上发布了以下宣传演示:

© 版权声明

相关文章

暂无评论

暂无评论...