OpenAI为ChatGPT提供新的语音和图像功能

AI产品新闻1年前 (2023)发布 yundic

512 0 0

OpenAI已经为ChatGPT推出了语音和图像功能，将在未来几周内推出适用于这款应用和浏览器的功能。

可以说，OpenAI已经依靠ChatGPT获得的桂冠，ChatGPT并没有与竞争对手Anthropic的Claude和Google的Bard集成相同级别的功能。

今年早些时候，OpenAI为ChatGPT添加了浏览器搜索功能，允许该工具访问互联网，但它的工作效果并不好，并因可能侵犯版权而从付费网站“打印”文本而被删除。

话虽如此，GPT—4是迄今为止最复杂的大型语言模型（LLM），这使得OpenAI一直处于生成性AI的首位。

OpenAI现在已经增强了聊天机器人的功能，同时随着行业竞争的加剧，ChatGPT一直处于聚光灯下。

有什么新鲜事吗？

OpenAI正在为ChatGPT添加以下内容：

语音交互：用户现在可以直接与ChatGPT对话，作为回报，人工智能可以使用其五个合成声音中的一个进行音频响应。这一语音功能得到了高级文本到语音转换模型的支持，该模型是OpenAI使用语音演员的样本进行训练的。ChatGPT利用耳语OpenAI的开源语音系统，用于识别语音。
图像交互：除了语音，用户现在可以为ChatGPT提供图像，为对话增加了视觉维度。例如，如果用户分享了一张损坏的设备的照片，ChatGPT可能会诊断问题并提出解决方案。在移动平台上，已经集成了一个绘图工具，允许用户圈出或精确定位人工智能要关注的图像的特定区域。图像功能是由GPT-3.5和GPT-4模型的多模式版本驱动的，这些模型已经进行了微调，以解释和推理视觉输入。

有了这些新功能，用户可以与聊天机器人进行来回对话，并向它询问有关图像内容的具体信息等。

毫无疑问，社区将找到有趣的方法来测试新ChatGPT的限制。

OpenAI在X上发布了以下宣传演示：

使用您的声音与ChatGPT进行来回对话。在旅途中与它交谈，要求一个睡前故事，或解决一个餐桌上的辩论。

声音在电子邮件www.example.com

# AI产品新闻

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Meta宣布推出新的生成交互式人工智能体验

yundic

498

甲骨文发布医疗保健AI临床数字助理

yundic

208

OpenAI提交了GPT—5的商标：AGI即将到来吗？

yundic

200

微软推出Copilot的全套功能和工具’

yundic

516

全方位介绍云典Ai百科智库：AI工具、AI导航网、AI软件大全

yundic

873

Nvidia软件增强了H100推理性能

yundic

348

暂无评论

暂无评论...