AIGC宇宙 AIGC宇宙

大模型

因使用受版权保护书籍训练 AI 平台,英伟达被三名作者起诉

感谢据美国福克斯电视台北京时间今日报道,科技巨头英伟达已被三名作者起诉,因为英伟达在训练其 AI 平台 NeMo 时,未经许可使用了他们受到版权保护的书籍。三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称,自己的作品被收录在一个包含约 196640 本书籍的数据集内,这些书籍帮助训练 NeMo 模拟普通书面语言,但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)作者们在 3 月 8 日晚提交
3/11/2024 4:46:10 PM
清源

Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限

谷歌 Gemini 修改 bug 让网友大开眼界!X 一小伙分享,为测试 Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了 3 个 bug,并分别录制了网页 bug 视频。接着把代码库打包成文件连同视频一起输给了 Gemini 1.5 Pro,提示它找到并修复代码中的所有 bug,且要提供一个简要指南以及所做更改的说明。没想到,Gemini 1.5 Pro 还真就分分钟正确识别并修复了每一个 bug。小伙将这种玩法 po 出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。其本人还在评论区强调,
3/10/2024 2:30:22 PM
清源

谷歌确认 Gemini Nano 本地大模型不会上线 Pixel 8 手机

谷歌官方表示,由于硬件限制,AI 语言大模型 Gemini Nano 不会上线谷歌 Pixel 8 手机,但未来会出现在其他高端设备上。IT之家获悉,Gemini 的前身是谷歌在 2023 年 2 月发布的聊天机器人 Bard,后者在 2024 年 2 月 8 日更名为 Gemini。谷歌计划将 Gemini 整合进旗下所有产品,并加入 Google One 订阅中。Gemini Nano 作为谷歌为移动设备推出的 Gemini 大模型版本,能够处理不需要连接外部服务器的本地任务,仅支持谷歌 Pixel 8 Pro
3/8/2024 5:56:25 PM
归泷(实习)

谷歌优化 Gemini:可重新生成、缩短、扩充指定聊天内容

谷歌近日升级了 Gemini 聊天机器人,用户和其聊天过程中,可以指定部分聊天内容,进行修改、缩短、扩充等操作。谷歌近日更新了 Gemini,让用户只需点击几下,就能修改回复的特定部分。过去,用户必须重新生成整个回复,但现在不再需要这样做了。只需选择要修改的回复部分,然后单击铅笔图标即可进行编辑。IT之家附上截图如下:用户点击该图标之后,可以要求 Gemini 基于指定内容执行重新生成、缩短、扩充、移除操作。用户还可以对所选文本应用提示并进行相应更改。当然,恢复更改也同样简单,只需单击一下即可。
3/8/2024 9:02:24 AM
故渊

「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑

Karpathy:中肯的,一针见血的。如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」这一流程的人很少。我们普遍认为,储备技术人才是前提,掌握核心算法是关键,但实际上,工程实践中冒出来的挑战,也实在令人头疼。一年前,乘着大模型的热潮,Yi Tay 离开了工作 3 年多的谷歌,参与创办了一家名为 Reka 的公司并担任首席科学家,主攻大型语言模型。在谷歌时,Yi T
3/7/2024 3:14:00 PM
机器之心

Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节

作者:赖文昕编辑:陈彩娴自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。 “世界模型”作为Sora的一大核心亮点,被OpenAI写在技术报告中。 但Sora是否真的如Open AI所说,是一个世界模型,却引起了行业内的争论。
3/7/2024 3:13:00 PM
赖文昕

谷歌被曝翻车内幕:内部群龙无首,生图机制过分“多元化”

感谢IT之家网友 rolan6 的线索投递!谷歌 Gemini 文生图风波还未平,更劲爆的内幕消息又被曝出来了。Pirate Wires 爆料,Gemini 这次的翻车,谷歌内部此前并不是毫不知情,翻车甚至是“故意”导致的。具体来说,谷歌设置了一个“安全”架构,Gemini 要生成一张图实际上要经过三个模型。大概来说,流程是这样的:用户在聊天界面请求 Gemini 生成一张图片,Gemini 收到请求后,会把请求发送给一个较小的模型。这个较小的模型的作用是根据公司的“多元化”政策重写用户的提示。为做到这一点,这个较
3/7/2024 3:07:36 PM
清源

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真正实现语言和图像的架构统一?在这一命题上,最近的一项研究 VisionLLaMA 取得了进展。VisionLLaMA 在图像生成(包含 Sora 依赖的底层的 DIT)和理解(分类、分割、检测、自监督)等多个主流任务上相较于原 ViT 类方法提升显著。论文标题:VisionLLaMA: A Unified LLaMA Interfac
3/7/2024 2:53:00 PM
机器之心

“国家队”评测30个大模型数学能力,九章、文心、星火位列前三

去年ChatGPT横空出世后,我国也迎来“百模大战”,大模型能力测评成为业界前沿课题。近日,大模型数学能力权威测评基准MathEval围绕数学能力,对国内外30个大模型(含同一模型的不同版本)开展测评。根据测评结果,学而思九章、百度文心一言4.0、讯飞星火V3.5摘得前三名。其中,学而思旗下九章大模型在整体表现和中文、英文、各学段子榜单中,都具备领先优势。 数据显示,截至去年10月,国内累计发布大模型超200个。大模型越来越多地被运用到数学应用领域,包括数学问题解决、数据分析、学术研究、学习辅导等。目前,通用或垂类
3/1/2024 6:01:00 PM
新闻助手

拿下微软合作、旗舰模型对标GPT-4,认识一下「欧洲版 OpenAI」

机器之能报道编辑:SiaMistral 目前法国科技界的骄傲和喜悦,也是开源力量的代表。它的初期成功要归功于能巧妙地将AI技术与政治结合起来。问题是Mistral能否将这种诱人的技术与政治混合优势转化为实实在在的利润。这家法国 AI 初创的崛起就像西北风一样轻快,这也是它名字 Mistral 的由来。Mistral 翻译过来是密史脱拉风,法国南部罗纳河谷一带特有的强风,干寒强烈,持续时间长。据说,梵高和高更的决裂也与普罗旺斯刮起的密史脱拉风有关。Mistral位于巴黎的办公室,它们也是法国目前最有前途的大模型初创公
2/29/2024 8:14:00 PM
机器之能

仅用 53 秒,商汤办公小浣熊就能助你化身高级打工人

作者丨郭思编辑丨陈彩娴继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能文生视频大模型Sora,其火爆效果被誉为即将重塑视频内容创作的未来。 而无论是ChatGPT还是Sora,众多身处职场的「男工女工」都在一边期待一边害怕,工作方式被彻底颠覆。 这一切都是因为AI可以通过现有的网络、数据、资料、知识,展示出超出一般人类的记忆、逻辑、分析、综合能力,如果它能够突破与人交互的界面(语言也是一种界面),那这种能力不仅会超过人类,而且超过几万倍,能较大限度地提高生产效率,也可能会取代部分传统工种。
2/28/2024 10:44:00 AM
郭思

优刻得为智谱AI构建千卡推理集群,助力全球用户畅享大模型智能生活

时光倒回到 2021 年的那个夜晚。一位妈妈灵感枯竭,无法继续她的小说创作;一旁的爸爸正忙碌于代码的世界,他想要在工作之余开发一款小游戏,却困于代码调试;而他们的孩子,正眉头紧锁地趴在书桌上,为一道奥数题苦思冥想。2024 年的今天,AI 大模型的出现让这一切发生改变。在「智谱清言」的助力下,妈妈的小说创作焕发新生,她只需将自己的创意和构思输入给大模型,就可以生成自然生动的故事情节和对话;爸爸用大模型进行代码编程和调试,通过分析代码逻辑,大大减少了开发的繁琐流程,减轻了一大半的⼯作量;大模型也成为了小朋友学习上的得
2/28/2024 10:05:00 AM
新闻助手

自动驾驶领域,「决策」和「感知」终于握手言和

作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温,却呈现出愈发复杂而矛盾的现象。 一方面,资本力量的积极投入,行业巨头纷纷抢占先机。 例如,特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本,并已在美国和加拿大地区逐步面向非员工用户提供更新服务。
2/27/2024 10:59:00 AM
郭思

谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

Gemini 好像终于被玩坏了。去年年底,谷歌 Gemini 震撼了业界,它是谷歌「最大、最有能力和最通用」的 AI 系统,号称第一个原生多模态大模型,能力超越 GPT-4,也被认为是谷歌反击微软和 OpenAI 的强大工具。对此,在 2 月 8 日,谷歌还把自家对标 ChatGPT 的服务 Bard 更名为 Gemini,以着重体现新使命 —— 旨在提供对「最强模型系列」的访问。上周谷歌还火速更新了 Gemini Pro 1.5 版。结果,推出不到一个月,这个 Gemini 就翻车了。多离谱呢,作为一个多模态的生
2/25/2024 7:49:00 PM
机器之心

推出不到一个月,谷歌Gemini翻车了

机器之能报道编辑:Sia谷歌下架 Gemini 人物图像生成服务。三月前,谷歌 Gemini 轰轰烈烈亮相,被描述为谷歌“最大、最有能力和最通用”的 AI 系统,并补充说它具有复杂的推理和编码能力。2 月 8 日,谷歌聊天机器人 Bard 正式更名为 Gemini,以反映新聊天机器人的“使命”——提供对“最有能力的模型系列”的访问。结果,推出不到一个月,Gemini 就捅了个大篓子。用户使用人像生成服务时发现,让 Gemini 承认白人的存好像非常困难,AI 拒绝在图像中描绘白人,以至于生成不少违背基本事实(性别、
2/23/2024 6:20:00 PM
机器之能

谷歌Gemini1.5火速上线:MoE架构,100万上下文

今天,谷歌宣布推出 Gemini 1.5。Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合 (MoE) 架构使 Gemini 1.5 的训练和服务更加高效。谷歌现在推出的是用于早期测试的 Gemini 1.5 的第一个版本 ——Gemini 1.5 Pro。它是一种中型多模态模型,针对多种任务的扩展进行了优化,其性能水平与谷歌迄今为止最大的模型 1.0 Ultra 类似,并引入了长上下文理解方面的突破性实验特征。Gemini 1.5 Pro 配备了 128000
2/16/2024 5:39:00 PM
机器之心

性能提升、成本降低,这是分布式强化学习算法最新研究进展

深度强化学习(Deep Reinforcement Learning,DRL)是一种公认的解决连续决策问题的有效技术。为了应对 DRL 的数据低效(data inefficiency)问题,受到分布式机器学习技术的启发,分布式深度强化学习 (distributed deep reinforcement learning,DDRL) 已提出并成功应用于计算机视觉和自然语言处理领域。有观点认为,分布式强化学习是深度强化学习走向大规模应用、解决复杂决策空间和长期规划问题的必经之路。分布式强化学习是一个综合的研究子领域,需
2/15/2024 5:27:00 PM
机器之心

谷歌Gemini Ultra 大会员:每月19.99美元

谷歌大模型的新篇章翻开一页 —— 这还只是 Ultra 的 1.0 版。时代变了。北京时间 2 月 8 日晚,随着桑达尔・皮查伊(Sundar Pichai)的一声宣布,谷歌大模型体系全面进入了 Gemini 时代,并带来最新的 Gemini Ultra 模型。距离 Bard 推出还不到一年,谷歌的所有生成式 AI 服务这次实现了改头换面。原来的 Bard 网站已经改为 Gemini: 12 月 Gemini 系列的发布时,谷歌已经预告过能力最强的 Gemini Ultra 大模型。当时推出的 Gemini Pro
2/15/2024 3:49:00 PM
机器之心