OpenAI为ChatGPT提供新的语音和图像功能

AI产品新闻8个月前发布 yundic

429 0 0

OpenAI已经为ChatGPT推出了语音和图像功能，将在未来几周内推出适用于这款应用和浏览器的功能。

可以说，OpenAI已经依靠ChatGPT获得的桂冠，ChatGPT并没有与竞争对手Anthropic的Claude和Google的Bard集成相同级别的功能。

今年早些时候，OpenAI为ChatGPT添加了浏览器搜索功能，允许该工具访问互联网，但它的工作效果并不好，并因可能侵犯版权而从付费网站“打印”文本而被删除。

话虽如此，GPT—4是迄今为止最复杂的大型语言模型（LLM），这使得OpenAI一直处于生成性AI的首位。

OpenAI现在已经增强了聊天机器人的功能，同时随着行业竞争的加剧，ChatGPT一直处于聚光灯下。

有什么新鲜事吗？

OpenAI正在为ChatGPT添加以下内容：

语音交互：用户现在可以直接与ChatGPT对话，作为回报，人工智能可以使用其五个合成声音中的一个进行音频响应。这一语音功能得到了高级文本到语音转换模型的支持，该模型是OpenAI使用语音演员的样本进行训练的。ChatGPT利用耳语OpenAI的开源语音系统，用于识别语音。
图像交互：除了语音，用户现在可以为ChatGPT提供图像，为对话增加了视觉维度。例如，如果用户分享了一张损坏的设备的照片，ChatGPT可能会诊断问题并提出解决方案。在移动平台上，已经集成了一个绘图工具，允许用户圈出或精确定位人工智能要关注的图像的特定区域。图像功能是由GPT-3.5和GPT-4模型的多模式版本驱动的，这些模型已经进行了微调，以解释和推理视觉输入。

有了这些新功能，用户可以与聊天机器人进行来回对话，并向它询问有关图像内容的具体信息等。

毫无疑问，社区将找到有趣的方法来测试新ChatGPT的限制。

OpenAI在X上发布了以下宣传演示：

使用您的声音与ChatGPT进行来回对话。在旅途中与它交谈，要求一个睡前故事，或解决一个餐桌上的辩论。

声音在电子邮件www.example.com

# AI产品新闻

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

探索AI时代：全面了解AI工具、导航网、软件大全与云典Ai百科智库

yundic

345

Nvidia软件增强了H100推理性能

yundic

189

AI工具、AI导航网、AI软件大全、云典Ai百科智库综合介绍

yundic

443

Meta推出AI工具，用于创建生成AI广告

yundic

429

Meta’s Nougat使科学文本机器可读

yundic

478

探索 AI 世界：AI 工具、导航网、软件大全、云典 Ai 百科智库

yundic

393

暂无评论

暂无评论...