文章列表
斯坦福大学研究:教育水平较低地区的 AI 写作工具使用率更高
自 2022 年底 ChatGPT 推出以来,关于人工智能语言模型将如何广泛影响世界的讨论一直存在。如今,随着一项由斯坦福大学牵头的新研究的发布,这一图景逐渐清晰。研究发现,AI 语言模型目前已在多个行业中协助处理高达四分之一的专业沟通任务,尤其是在美国教育水平较低的地区,其影响尤为显著。
3/4/2025 5:39:18 PM
远洋
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址: : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调(Reinforcement Fine-Tuning,RFT)范式成功从纯文本大语言模型拓展到了视觉语言大模型(LVLM)。 通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!
3/4/2025 5:27:05 PM
机器之心
AI 大战超级玛丽!Claude 3.7 封神:Gemini、GPT-4o 全军覆没,谁才是游戏界真王者?
谁是游戏界真王者?AI 竟向经典游戏《超级马力欧兄弟》发起挑战! 加州大学圣地亚哥分校 Hao 人工智能实验室传来惊人战报:在一场别开生面的 AI “马力欧” 大乱斗中,Anthropic 旗下的 Claude3.7模型 “一骑绝尘”,力压群雄,荣登 “最强 AI 马力欧” 宝座! 紧随其后的是同门师弟 Claude3.5,而谷歌 Gemini1.5Pro 和 OpenAI 的 GPT-4o 这两位 “AI 界大佬” 却意外 “翻车”,表现令人大跌眼镜!
3/4/2025 5:00:00 PM
AI在线
飞猪推出 AI 行程助手:在线旅游行业首个融合多模型智能产品
阿里巴巴旗下领先在线旅游平台飞猪宣布,将于3月5日正式推出在线旅游行业首个融合多个大模型的 AI 产品——“AI 行程助手”。 这一创新产品集成了 DeepSeek-R1和阿里云通义千问旗下主力模型的强大能力,旨在以秒级响应速度为用户提供高度个性化的旅行方案。 此消息一经发布,便在 X 上引发热烈讨论,被视为 AI 技术在旅游行业落地的新里程碑。
3/4/2025 4:34:00 PM
AI在线
OpenAI 称 GPT-4.5 AI 模型采用全新监督技术“减少幻觉”,公司有望 5 月底前推出 GPT-5
OpenAI 于 2 月 28 日推出 GPT-4.5 AI 模型“研究预览版”,号称交互更自然,知识库更广,更能理解用户意图,并且“情商”更高。
3/4/2025 4:26:32 PM
漾仔
自变量机器人成功融资,迈向具身智能新纪元
在最新的产业动态中,南京市创投集团宣布国产机器人初创企业自变量机器人(X Square Robot)成功完成 Pre-A 轮融资。 这一轮融资的领投方为光速光合与君联资本,北京机器人产业基金及神骐资本等机构也参与了跟投,融资金额将用于下一代统一具身智能通用大模型的训练与场景落地。 自变量机器人成立于2023年12月,目标是通过研发具身智能通用大模型,推动通用机器人技术的发展,最终实现通用机器人如人类一般,能够通过交互、感知和行动自主执行任务。
3/4/2025 4:16:00 PM
AI在线
GPT-4.5崛起仅六小时便失宠,xAI Grok-3 逆袭夺冠
OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。 然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。 根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。
3/4/2025 2:24:00 PM
AI在线
小红书AI搜索神器「点点」接入DeepSeek,我们拿它单挑百度
AI好好用报道编辑:杨文啃了10亿 篇小红书、还接入DeepSeek的AI搜索神器「点点」实力如何? 周末在小红书冲浪,刷到一个帖子:小红书旗下独立 AI 搜索 App「点点」上线「深度思考」功能。 而且,看样子也是接入了 DeepSeek R1。
3/4/2025 2:05:00 PM
AI好好用
智谱开源文生图模型CogView4,支持中英双语提示词输入
智谱AI最新开源文生图模型CogView4正式亮相,CogView4不仅在参数数量上达到了6亿,还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”。 CogView4以支持中英双语提示词输入为核心亮点,尤其擅长理解和遵循复杂的中文指令,成为中文内容创作者的福音。 作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域的一大空白。
3/4/2025 1:44:00 PM
AI在线
DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据
在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性? 这是一项新研究得出的结论。 这项研究来自 Copyleaks—— 一个专注于检测文本中的抄袭和 AI 生成内容的平台。
3/4/2025 1:25:00 PM
机器之心
周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视
在今年全国两会前夕,全国政协委员、360集团创始人周鸿祎就DeepSeek大模型及AI安全问题发表看法,强调正确认识AI安全,既不可夸大也不应忽视。 周鸿祎指出,当前AI安全议题需警惕被夸大的趋势。 他批评以OpenAI为代表的美国五大AI公司倾向于通过渲染AI不安全来为其垄断和闭源策略辩护,借此推动政府加强监管,阻挠后来者追赶。
3/4/2025 12:00:28 PM
AI在线
火山引擎宣布大模型应用开源:上线“大模型应用实验室”,释放 AI 创新潜力
火山引擎今日通过 X 平台宣布,其大模型应用正式开源,并推出全新“大模型应用实验室”平台。 这一举措标志着火山引擎在 AI 技术生态建设上的重大突破,旨在通过开放核心应用和技术资源,加速开发者社区的创新步伐。 此次开源的应用包括手机助手、Deep Research、DeepSeek 联网版、实时视频理解、互动双语视频生成器以及语音实时通话-青青等一系列前沿 AI 工具,引发了 X 用户的广泛热议。
3/4/2025 11:23:00 AM
AI在线
三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级
三星近日宣布,中国市场发售的Galaxy S25系列正式整合DeepSeek-R1大模型,进一步提升其AI功能。 据三星中国官方消息,用户无需额外下载App或注册账号,只需将三星生活助手升级至最新版本,或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体,即可体验包括深度思考、联网搜索、情绪价值、上下文记忆及视觉解析在内的多项AI功能。 通过接入DeepSeek-R1,Galaxy S25系列实现了多模态感知与跨应用执行能力的显著提升。
3/4/2025 11:20:00 AM
AI在线
AI “狼人杀” 大战!GPT-4.5 封神:社交推理 + 顶级欺骗,把 Claude 和 DeepSeek 都 “玩弄于股掌”!
万万没想到,AI 不仅能在棋盘上 “厮杀”,在 “狼人杀” 这种尔虞我诈的社交游戏中,也展现出了惊人的智力! 最近,一场代号为 “Elimination Game” 的 AI “狼人杀” 基准测试火爆出炉, 结果简直让人 “虎躯一震”: GPT-4.5竟然在这场 “社交博弈” 中 “封神”, 把 Claude3.7Sonnet 和 DeepSeek R1等一众 AI “大佬” 都远远甩在了身后! 这不禁让人惊呼: AI 的 “社交智能” 已经进化到如此恐怖的程度了吗?这场 “Elimination Game” 的规则听起来就 “心跳加速”: 最多8名玩家(可以是 AI 模型,也可以是真人玩家) 被拉入 “战场”, 每轮都要 “票决” 淘汰一人, 直到只剩下最后两名 “幸存者”。
3/4/2025 10:56:00 AM
AI在线
企业实施RAG过程中:常见误解与澄清,内含项目升级预告
春节之后的一个月的时间内,微信和小红书上数了下大概有 150 多个过来咨询 RAG 在企业落地的网友,一路聊下来按照对方的诉求大概分为三类,第一种是最多的就是年后返工公司领导让落地 RAG,但是一时没有头绪的过来咨询的;第二种是看过我公众号上的相关案例后,想外包给我来做具体实施的;第三种有点出乎意料的是,相关的媒体来交流行业观察的。 第一种类型也是最开始比较多的,最初我也是问啥答啥,但是大概聊了五六个之后发现情况有点不对,大部分其实是比较基础的问题,或者我认为问大模型能比问我更快扫盲的,再加上后来确实肉眼可见的人在变多,我索性和每个人说如果是咨询的话 200 块每小时(现在涨到了 500),这样就大部分人就索性不问了,虽说前后也是有十几个人很干脆的问完问题后直接发了红包,不过不得不说收费确实是个很好的互相筛选。 以上是碎碎念,言归正传,这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。
3/4/2025 10:53:59 AM
韦东东
Claude公司估值615亿美元再融35亿,那DeepSeek…
刚刚,Claude背后公司Anthropic官宣新一轮融资:35亿美元! 投后估值达到615亿。 在Clauede-3.7发布后,此轮新融资便浮出水面,并在今天正式公布。
3/4/2025 10:33:14 AM
谷歌 Gemini 助手升级:支持实时视频分析与屏幕共享
在今年的世界移动通信大会(MWC)上,谷歌宣布为其 Gemini 助手新增实时视频分析和屏幕共享功能。 Gemini Advanced 的 Google One AI Premium 订阅用户将于本月晚些时候率先体验这项新功能。 此次更新将赋予 Gemini Live 两大核心能力:一是通过外部摄像头实时分析视频内容,二是支持屏幕共享,让 AI 助手能够直接解读用户手机上的信息并提供反馈。
3/4/2025 9:34:00 AM
AI在线
一文读懂大模型 RAG:检索、增强与生成的技术详解
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型往往面临专业知识不足的问题。 相对于成本昂贵的“Post-Training”或“Supervised Fine-Tuning”(监督微调,SFT),基于RAG的技术方案成为了一种更优选择。 本文笔者将从RAG所解决的问题及模拟场景入手,详细总结相关技术细节,与大家分享~一、初识:RAG所解决的问题及模拟场景1.
3/4/2025 9:10:00 AM
小喵学AI