ChatGTP

ChatGPT更新加入多模态功能,可看图说话

OpenAI的聊天机器人ChatGPT近日发布重磅更新,加入语音与图像功能,使其“能看、会说、会听”,为用户提供更丰富和便捷的AI体验。

ChatGPT更新加入多模态功能,可看图说话

ChatGPT的图像理解能力基于OpenAI的GPT-4V(ision)模型,该模型能根据用户输入的图片或文字生成图像或文本内容,并分析、解释、推理或执行各种任务。ChatGPT的语音识别与生成功能基于OpenAI的专业配音演员合作,提供5种不同的声音,还与Spotify展开合作,通过这一功能将播客翻译为其他语言,同时保留播客主持人的声音。

VeryKen智评:尽管存在缺陷和风险,但OpenAI仍赋予了ChatGPT“看听说”的能力,这是其在生成式AI领域的又一次创新和迄今为止最大的变革之一。多模态功能已成为AI大模型的竞争焦点,将推升其训练推理算力需求大幅攀升。

相关推荐

ChatGPT制作高质量PPT:详解操作步骤与实际体验  (2023-10-22 11:38:50)

ChatGPT:通过指令玩转人工智能,技巧一网打尽  (2023-10-18 13:58:19)

ChatGPT-4:数据分析与图表生成的强大能力  (2023-10-14 17:35:46)

ChatGPT4.0:超实用指令合集  (2023-10-13 10:16:44)

验血结果和完整病例提交给了ChatGPT-4,能获得指导和建议吗?  (2023-10-8 9:55:54)

中国为何禁用ChatGPT:分析中国禁用ChatGPT的原因和背景  (2023-9-30 17:29:4)

了解ChatGPT:功能、使用方法和下载方式  (2023-9-29 8:52:47)

ChatGPT怎么下载?详细步骤带你轻松获取ChatGPT  (2023-9-28 9:21:53)

必应ChatGPT:必应搜索引擎推出的智能机器人  (2023-9-27 17:26:44)

ChatGPT在线问答免费:介绍ChatGPT在线问答功能的免费使用方法  (2023-9-26 8:4:45)

发表评论:

验证码

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。