OpenAI已经为ChatGPT推出了语音和图像功能,将在未来几周内推出适用于这款应用和浏览器的功能。
可以说,OpenAI已经依靠ChatGPT获得的桂冠,ChatGPT并没有与竞争对手Anthropic的Claude和Google的Bard集成相同级别的功能。
今年早些时候,OpenAI为ChatGPT添加了浏览器搜索功能,允许该工具访问互联网,但它的工作效果并不好,并因可能侵犯版权而从付费网站“打印”文本而被删除。
话虽如此,GPT—4是迄今为止最复杂的大型语言模型(LLM),这使得OpenAI一直处于生成性AI的首位。
OpenAI现在已经增强了聊天机器人的功能,同时随着行业竞争的加剧,ChatGPT一直处于聚光灯下。
有什么新鲜事吗?
OpenAI正在为ChatGPT添加以下内容:
- 语音交互:用户现在可以直接与ChatGPT对话,作为回报,人工智能可以使用其五个合成声音中的一个进行音频响应。这一语音功能得到了高级文本到语音转换模型的支持,该模型是OpenAI使用语音演员的样本进行训练的。ChatGPT利用耳语OpenAI的开源语音系统,用于识别语音。
- 图像交互:除了语音,用户现在可以为ChatGPT提供图像,为对话增加了视觉维度。例如,如果用户分享了一张损坏的设备的照片,ChatGPT可能会诊断问题并提出解决方案。在移动平台上,已经集成了一个绘图工具,允许用户圈出或精确定位人工智能要关注的图像的特定区域。图像功能是由GPT-3.5和GPT-4模型的多模式版本驱动的,这些模型已经进行了微调,以解释和推理视觉输入。
有了这些新功能,用户可以与聊天机器人进行来回对话,并向它询问有关图像内容的具体信息等。
毫无疑问,社区将找到有趣的方法来测试新ChatGPT的限制。
OpenAI在X上发布了以下宣传演示:
使用您的声音与ChatGPT进行来回对话。在旅途中与它交谈,要求一个睡前故事,或解决一个餐桌上的辩论。
声音在电子邮件www.example.com
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...