恐怖,ChatGPT 王炸级更新,到底有多厉害

我们都知道哈,前几天 ChatGPT 进行了王炸级别的更新,也就是多模态功能。

简单来说,除了文本交互之外,ChatGPT 现在可以理解语音和图像了。

语音这个还好,不算什么,毕竟本质上还是 TTS 的技术,让文本和语音之间互相转化就行了,这应该不算难事。

但读取图像这个能力就有点逆天了,它不是那种以图搜图的传统模式,而是用 OCR 技术去真的识别用户发过去的图片,哪怕这个图片是用户现拍的、没有在网上出现过,ChatGPT 也能做出理解并调用大模型进行回应。

先让大家看个恐怖如斯的视频:

拍了自行车的照片问ChatGPT怎么调整座椅高度,你们可以感受一下什么叫恐怖如斯。

对了,根据 OpenAI 的说法,这个多模态版本在10个月前就训练好了,之前一直藏着。

今天一大早,我还看到一个有意思的内容,是 ChatGPT 对图片的识别,不仅仅只是识别,还能 ChatGPT 还能根据用户的提示和提问进行图片的编辑操作。

请看图片:

c0e79dedef48d6b26fd2b02cb82f08f1.jpeg

14d6ca6a7dbe1b69d547b3bd33069422.jpeg

3aeb58d9298ef419e302b50bc56bed87.jpeg

d6fbb8828b1d861ffbe23aea66ece621.jpeg

6c9cdcbc5c63a1587ccf35fb9662e16c.jpeg

e1f8e8db6a23208d64c7e63e6f74cfd5.jpeg

是不是被 ChatGPT 的图片处理能力惊到了!!!!!

点击下方公众号卡片,关注我

在公众号对话框,回复关键字 “1024”

免费领取副业赚钱实操教程

85b117cdb9a7dcf9cecc13e1699382f7.png

猜你喜欢

转载自blog.csdn.net/loongggdroid/article/details/133502009