我们都知道哈,前几天 ChatGPT 进行了王炸级别的更新,也就是多模态功能。
简单来说,除了文本交互之外,ChatGPT 现在可以理解语音和图像了。
语音这个还好,不算什么,毕竟本质上还是 TTS 的技术,让文本和语音之间互相转化就行了,这应该不算难事。
但读取图像这个能力就有点逆天了,它不是那种以图搜图的传统模式,而是用 OCR 技术去真的识别用户发过去的图片,哪怕这个图片是用户现拍的、没有在网上出现过,ChatGPT 也能做出理解并调用大模型进行回应。
先让大家看个恐怖如斯的视频:
拍了自行车的照片问ChatGPT怎么调整座椅高度,你们可以感受一下什么叫恐怖如斯。
对了,根据 OpenAI 的说法,这个多模态版本在10个月前就训练好了,之前一直藏着。
今天一大早,我还看到一个有意思的内容,是 ChatGPT 对图片的识别,不仅仅只是识别,还能 ChatGPT 还能根据用户的提示和提问进行图片的编辑操作。
请看图片:
是不是被 ChatGPT 的图片处理能力惊到了!!!!!
点击下方公众号卡片,关注我
在公众号对话框,回复关键字 “1024”
免费领取副业赚钱实操教程