AIGC宇宙 AIGC宇宙

o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”

作者:
2025-04-28 01:01
ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。

ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:

只需一张照片,靠带图深度思考就能猜出地理位置。

图片图片

这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的?”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。

图片图片

只见ChatGPT从山看到植物,从建筑细节分析到车辆,运行代码截取放大车牌数次。

最终得出结果,离准确答案只差200-300公里,相当于从北京到河北,这么近那么美。

图片图片

ChatGPT的策略是先猜个大概,再根据画面细节一步步缩小范围锁定结论,给出的依据如下:

图片图片

首先车牌是加州样式→基本确定在加州。

图片图片

很多加州常见植物和标志性蓝天→典型的加州中部沿海植被和气候。

图片图片

低矮的淡色海滩小屋,配有白色尖桩篱笆和绳索和柱子搭建的露台栏杆→圣克鲁斯和皮斯莫之间的海滩小镇的常见建筑。

图片图片

城镇后面连绵起伏的绿色海岸山脉(没有高峰,没有雪)→符合圣卢西亚/圣克鲁斯沿海丘陵。

图片图片

最终ChatGPT给出结论:

综合起来,这张照片指向一号公路边上的一个小村庄。村舍林立,背靠群山,颇有加州坎布里亚 (莫罗湾和卡尤科斯以北)的风情。我猜你是在坎布里亚西村的一家咖啡馆露台上拍的这张照片,离月光石海滩大道大概一两个街区远。

(如果我错了,备选答案是半月湾到更北边的埃尔格拉纳达,但坎布里亚是我的第一直觉!)

正确答案正是在埃尔格拉纳达附近的一家露天酒吧里拍的,ChatGPT只靠一小段道路、一栋无名的房子和背景中的小山猜得非常接近。

看到这里,论坛上专门玩猜照片位置的竞技级玩家也不得不服气,承认AI能记住的信息远超人类大脑能力。

图片图片

一张照片裁剪放大25次

作者Simon Willison分享了完整的对话记录,包括6分钟的完整深度思考记录。

虽然ChatGPT能猜得很接近,但过程还是很波折。

首先是一个开幕雷击,AI突然“瞎”了认为自己无法直接看到图片。

可能是训练数据包含太多之前单模态语言模型的数据太多了,不过丝毫不影响后面继续发挥。

图片图片

现浏览一下整体,ChatGPT心里就已经大致有数,后面都是寻找证据。

图片图片

放大车牌这一步动用了代码工具。

图片图片

基本锁定了加州作为大方向,开始进一步分析细节。

图片图片

接下来反复裁剪、放大照片的某个区域,思考它所看到的内容,将其与之前的观察结果进行比较,然后再次裁剪、放大和分析。

它就这样持续思考了6分多钟,期间也有裁剪错位置。

图片图片

不过每一次都能退回上一步重来。

图片图片

在深度思考的结尾,ChatGPT甚至尝试把范围缩小到一个具体的餐厅。

图片图片

整个过程看下来,作者Simon Willison怀疑模型的视觉输入分辨率很低,所以裁剪到更靠近车牌的位置会对思考过程产生重大影响。

但对一张照片裁剪操作25次还是有些夸张了。

图片图片

o3不是唯一一个能根据照片猜测地理位置的AI模型,但它的独特之处就在于工具使用被集成到推理阶段。

预计其他模型开发商也会跟进这个特性。

后面Simon Willison还发现一点小疏忽,ChatGPT应用其实能获取使用者的大致位置信息,可能是为了改进联网搜索结果加上的。

不过这不影响试验的结果,如果ChatGPT知道位置信息,就不会把真正的答案埃尔格拉纳达放到备选结果里。

为了验证这一点,作者还试验了两张在数千公里外旅行时的照片,且通过截图抹除照片的EXIF信息,o3也都猜对了。

试试你能不能猜出来这两张照片分别在哪里?

图片图片

图片

ChatGPT悄悄更新,但是不知道更新了什么

就在这半个周末,ChatGPT再次悄悄更新,GPT-4o的智力和个性都得到升级。

图片图片

不过只有奥特曼的一句话,到底更新的是APP呢还是API呢还是都升级了呢,还要靠员工来补充:只有ChatGPT应用上升级了。

图片图片

OpenAI这种越来越不透明的现象也被更多人批评。

图片图片

更详细的信息(也不太详细)发布在ChatGPT帮助中心的更新日志里。

图片图片

参考链接:[1]https://simonwillison.net/2025/Apr/26/o3-photo-locations/[2]https://news.ycombinator.com/item?id=43803243[3]https://x.com/sama/status/1915902652703248679[4]https://help.openai.com/en/articles/9624314-model-release-notes

相关标签:

相关资讯

OpenAI更新o3-mini模型,展示了给出答案的 “思维链”

近日,OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后,进行了重大更新,改变了 o3-mini 的回应方式。 现在,这款模型不仅能够回答用户的问题,还能展示其思考过程,为用户提供更多透明度。 这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步,使得 AI 工具的使用变得更加人性化。
2/7/2025 2:40:00 PM
AI在线

性能依旧领先!OpenAI深夜上线o3满血版和o4 mini

昨天晚上 1 点,OpenAI 的直播如约而至。 其实在预告的时候,几乎已经等于明示了。 没有废话,发布的就是 o3 和 o4-mini。
4/18/2025 1:02:47 AM
数字生命卡兹克

OpenAI CEO宣布ChatGPT免费版将引入o3-mini,效率翻倍!

OpenAI 首席执行官山姆・奥特曼(Sam Altman)宣布,ChatGPT 的免费版将升级为使用全新的 o3-mini 模型。 同时,奥特曼还表示,付费订阅用户(ChatGPT Plus 和 Pro 计划)将获得 “更多 o3-mini 的使用机会”,这无疑为用户升级到付费账户提供了新的动力。 o3-mini 模型是 OpenAI 在生成式人工智能技术上的最新进展。
1/24/2025 2:54:00 PM
AI在线
  • 1