课程: ChatGPT 基础知识

免费学习该课程!

今天就开通帐号,25,300 门业界名师课程任您挑!

图像识别功能

图像识别功能

ChatGPT是有多模态能力的, 简单来说,它不仅能读文字、写文字。 还能看图、懂图,甚至能生图。 这节课我们就来测试一下它关于图片的能力。 我在网上看到一张图, 我想让它给我解释一下。 所以我可以右键复制一下这张图片。 我可以按option加空格键, 快速地调取本地的ChatGPT软件, 将图片粘贴过来, 并且写提示词, 让它给我解释一下这张图。 我可以调整一下窗口的大小和位置。 好,可以看到它给我一个非常快速的回答。 我觉得它的回答还是非常的准确的, 看来它的识图能力还是非常强的, 它给我解释了这张图的核心意思。 好,我点击这里可以随时切换为大窗口。 接下来,我想让它帮我生成4个类似的创意。 我要求它结合中国、日本、美国、欧洲的典型建筑风格。 我让它简单回复我就好。 但是我给它选择一个思考的模型, 让它多思考一会。 可以看到它思考了4秒钟, 给我一个非常简洁的回复。 接下来我们来测试一下它的生图能力。 我让它帮我绘制出来,用图片四宫格的形式展现你刚才说的这4个创意。 现在我们还是使用这个思考模型, 这样它就会有更长的时间去思考如何出这张图, 通常会给我们一个更好的效果。 可以看到它思考了12秒钟, 然后开始创建图片。 绘制完成。 我觉得效果还是非常不错的, 我们点击一下还可以查看大图。 它确实将不同地区的建筑融合到了衣服当中。 我觉得非常的不错。 接下来我们来演示一下, 手机端如何快速的帮我们解读图片? 比如,我现在在微信公众号上看到一张图片。 最常规的方法当然是选中这张图片, 将它保存到本地, 然后再上传给ChatGPT。 但是我们还可以直接拖动这张图片。 然后我们退出微信, 然后再打开ChatGPT, 将它拖动到窗口当中。 接下来我们就可以直接写提示词, 让它解释一下这张图片。 可以看到它确实读懂了这张图, 告诉我这是一个误会, 中国人以前确实把长颈鹿误认为了麒麟。 接下来我们再来看一个更贴近工作场景的案例。 我让ChatGPT帮我整理一下出差报销的发票。 前段时间去了一趟日本出差, 攒了不少发票, 想干脆一次性丢给它, 让它帮我整理一下。 可以看到我已经拍好照片了。 它最多支持上传10张图片, 所以我打算分两次上传。 我先上传一部分,比如我这次先选择6张。 并且我给它写一个提示词, 让它按照日期和金额帮我整理发票, 并用表格的形式呈现出来。…

内容