AIGC宇宙 AIGC宇宙

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

作者:清源
2024-03-10 02:30
谷歌 Gemini 修改 bug 让网友大开眼界!X 一小伙分享,为测试 Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了 3 个 bug,并分别录制了网页 bug 视频。接着把代码库打包成文件连同视频一起输给了 Gemini 1.5 Pro,提示它找到并修复代码中的所有 bug,且要提供一个简要指南以及所做更改的说明。没想到,Gemini 1.5 Pro 还真就分分钟正确识别并修复了每一个 bug。小伙将这种玩法 po 出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。其本人还在评论区强调,

谷歌 Gemini 修改 bug 让网友大开眼界!X 一小伙分享,为测试 Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了 3 个 bug,并分别录制了网页 bug 视频。

接着把代码库打包成文件连同视频一起输给了 Gemini 1.5 Pro,提示它找到并修复代码中的所有 bug,且要提供一个简要指南以及所做更改的说明。

没想到,Gemini 1.5 Pro 还真就分分钟正确识别并修复了每一个 bug。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

小伙将这种玩法 po 出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。

其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini 这小汁前途不可限量啊。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI 不会取代程序员”

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

但甭管怎么说,AI 可以给程序员提供帮助是有目共睹的。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

接下来我们展开来看 Gemini 1.5 Pro 修复 bug 的经过。

事件经过

正如开头提到的,网友先是在编写网页代码时故意写错了 3 处:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了 3 处无法正常运行的视频,每个视频十几秒。

然后将视频连同代码库一起输给了 Gemini 1.5 Pro。

prompt 为:

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it's for a complete PR so I am make the changes.(修复我代码中的 bug,为我创建一个简单的 Markdown 指南以修复 bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的 Pull Request 一样,这样我才能进行更改。)

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

随后,Gemini 1.5 Pro 立刻准确识别了 3 个 bug:

点击一个待办事项并不会将其标记为完成 / 未完成

主题切换器不会切换主题

点击登录按钮不会触发任何操作

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

紧接着就分别给出了修复方案,附带代码:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

小伙仔细对照自己敲的代码,确认 Gemini 1.5 Pro 给出的答案是正确的:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

小伙还强调,这 3 个 bug 在代码库文件中其实离着很远,这也就意味着 Gemini 1.5 Pro 确实读完了完整的上下文。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

“想要访问权限”

网友看到这一系列操作后激动搓手,直呼想要 Gemini 1.5 Pro 访问权限:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

除坐等外,还有网友表示用 GPT-4 帮忙修复代码也很好使,顺带畅想了一下 GPT-5:

接下来可能是实时交互?或许能与 GPT-5 进行屏幕共享?

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

而另一边已经获得访问权限的网友早就玩嗨了。

比如,一次性输给 Gemini 1.5 Pro 最新的 10 篇论文,让它从中找到一个作者的电子邮件地址。

结果 Gemini 1.5 Pro 第一次就成功找到了:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

然后又让 Gemini 1.5 Pro 从超 360000token 的《哈利・波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro 也成功找到了。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

测试继续上难度,一次性输入三本书,Gemini 1.5 Pro 最后用时约 1 分钟再次成功找到对应的说话人:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

惊讶之余,这位测试者总结了 Gemini 1.5 Pro 的逻辑推理能力:

对于常规提示,接近 GPT-4 的性能。

但当我添加数十个例子时,Gemini 的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

沃顿商学院教授 Ethan Mollick 也来整活了。输给 Gemini 1.5 Pro 一本 352 页的《太空 60 年》规则手册,约 250000token,然后要求它扮演一个角色。

即使说明书分散在很多页上,而且非常复杂,但 Gemini“似乎明白了”:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

Ethan Mollick 教授表示,对所有其他 AI 进行这项测试都是失败的,只有 Gemini 1.5 Pro 成功了。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

这位网友想要编译整个 X 算法的代码存储库并将其上传到 Gemini 1.5 Pro,正在线向网友征集想问的问题。

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

只见编译完成后,共 310489token,Dogan Ural 向 Gemini 1.5 Pro 提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前 5 件事是什么?”

Gemini 1.5 Pro 很轻松地给出了这样婶儿的答案:

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

你还见过哪些有趣的玩法?欢迎评论区分享~

参考链接:

[1]https://twitter.com/mckaywrigley/status/1762175776726663267

[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw

本文来自微信公众号:量子位 (ID:QbitAI),作者:西风

相关标签:

相关资讯

自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
12/22/2024 4:31:00 PM
机器之心

谷歌确认 Gemini Nano 本地大模型不会上线 Pixel 8 手机

谷歌官方表示,由于硬件限制,AI 语言大模型 Gemini Nano 不会上线谷歌 Pixel 8 手机,但未来会出现在其他高端设备上。IT之家获悉,Gemini 的前身是谷歌在 2023 年 2 月发布的聊天机器人 Bard,后者在 2024 年 2 月 8 日更名为 Gemini。谷歌计划将 Gemini 整合进旗下所有产品,并加入 Google One 订阅中。Gemini Nano 作为谷歌为移动设备推出的 Gemini 大模型版本,能够处理不需要连接外部服务器的本地任务,仅支持谷歌 Pixel 8 Pro
3/8/2024 5:56:25 PM
归泷(实习)

谷歌:手机运行人工智能模型将占用大量内存

谷歌在 3 月初发布了一个奇怪的声明,称旗下两款新手机 Pixel 8 和 Pixel 8 Pro 中,只有 Pixel 8 Pro 能够运行其最新的人工智能模型“Google Gemini”。尽管两款手机的配置非常相似,但谷歌却以神秘的“硬件限制”为由拒绝在 Pixel 8 上运行该模型。这番言论让人费解,因为谷歌一直宣称 Pixel 8 是以人工智能为核心的手机,并且还专门针对智能手机设计了“Gemini Nano”模型,然而这两者居然无法兼容运行。几周后,谷歌似乎开始松口,宣布即将在 6 月的季度更新中为 P
3/31/2024 12:08:38 PM
远洋
  • 1