AIGC宇宙 AIGC宇宙

大模型

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。 顾名思义,它快速、简单,并能与Pydantic完美集成,实现无缝数据验证。
1/22/2025 10:33:44 AM
zone7

搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking

消息源 @sir04680280 于 1 月 19 日发布博文,报道称观看谷歌黑客马拉松直播时,发现谷歌升级版 Gemini AI 模型“Gemini 2.0 Flash Thinking Exp-0123”,暗示 1 月 23 日发布。
1/21/2025 10:43:31 AM
故渊

人类全程没碰一个字,谷歌 Gemini 不到 4 小时写完 10 万字商业战略书籍

初创公司 DeepWriter 宣布:世界第一部完全由 AI 写作的 10 万字商业竞争书籍诞生了!全程没有人类参与工作,不到 4 小时,即可完成约 10 万单词的商业书籍创作。
1/20/2025 11:39:17 PM
清源

豆包推出实时语音大模型:号称中文对话断崖式领先、情商智商均在线

据介绍,豆包实时语音大模型实现了语音理解和生成一体化,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
1/20/2025 4:29:51 PM
清源

小红书翻译紧急上线,见证历史:大模型翻译首次上线C端应用!AI竟自称是GPT-4?网友变身“测试狂魔”,疯狂套话,效果拉满了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)程序员键盘敲冒烟,小红书翻译功能这不是就来了吗! 之前大家各种吐槽美国人用的翻译机器不准确,导致大家交流起来“人机感很重”,一些美网友还需要额外用ChatGPT才能实现无缝交流。 这翻译功能一出来,语言障碍什么的都不存在了。
1/20/2025 1:52:45 PM
伊风

全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,该大模型 2025 年将开放微调、推理框架和配套的数据处理流程,用户可在超算平台直接使用“谛听”用于业务分析和科学研究。
1/19/2025 1:46:30 PM
归泷(实习)

首个国产版AlphaFold3发布!大分子预测精度超车,在线平台即开即用,推理成本更是白菜价

来了,国内首个对标AlphaFold3的产品——HelixFold3,来自百度智能云与百度螺旋桨团队。 它在常规生物分子结构预测任务中实现了AlphaFold3媲美水平:尤其RNA分子和共价修饰场景中,精准度上持平或者实现了大幅超越。 △图注,蓝色为HelixFold3,黄色为AlphaFold3还有抗原-抗体结构预测任务中,成功率提升至80% ,感觉可以直接拿来研究抗体结合机制的水平。
1/17/2025 1:00:00 PM
量子位

看听读全都会的六边形战士MiniCPM,来啦

MiniCPM-o 2.6开源啦,该模型视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别。 图片简介MiniCPM-o 2.6是一个端侧多模态大模型,具有8B参数量。 它基于SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B构建,通过端到端的方式训练和推理。
1/17/2025 11:38:10 AM
哎呀AIYA

大模型时代,人机交互体验将被怎样重塑?

在科技持续演进、创新浪潮迭起的当下,人类与计算机的关系日益紧密,成为推动社会发展的关键力量。 自从世界上第一台计算机ENIAC被发明以来,人机交互就成为计算机科学非常重要的一个分支学科。 人机交互(Human-Computer Interaction,HCI)指的是人类和计算机之间的信息交换和互动的过程,目标是使这种交互尽可能直观、高效、满足需求。
1/17/2025 11:37:46 AM
Yu

对2025年AI的四个大胆预测

随着2024年的结束,我们可以回顾并认识到,AI已经取得了令人瞩目且开创性的进展。 按照当前的发展速度,几乎无法预测2025年AI将带来怎样的惊喜,但有几个趋势为企业描绘了一幅来年可期以及如何充分准备的动人画卷。 推理成本骤降过去一年,前沿模型的成本稳步下降。
1/17/2025 11:14:42 AM
Ben Dickson

谷歌 CEO 皮查伊认为 Gemini 能力“市面最强”,已超越竞争对手

据《华尔街日报》今日报道,谷歌CEO桑达尔·皮查伊认为,自家的AI技术在市场上处于领先地位,但要想让消费者真正关注仍需更多努力。
1/16/2025 7:55:24 PM
清源

仅用8小时,用Vim编辑器手搓BadApple火了!

老二次元/科技宅倒背如流的Bad Apple动画,网友Nolen Royalty用Vim文本编辑器复现出来了! 而且仅耗时8小时、用了6500个正则表达式! 先来一起瞅瞅效果:可以看到,动画基本还原了人物的所有动作,整体视频也很流畅,画风很有经典像素风游戏的味道。
1/16/2025 4:35:42 PM
量子位

终于等到你!港大首发「轻量级RAG神器」MiniRAG,1.5B手机端可用

传统RAG架构主要依赖大型语言模型(LLMs)的强大能力,但这种设计难以适应小型语言模型(SLMs)的固有局限,特别是在复杂查询理解、多步推理、语义匹配和信息合成等关键环节。 为此,MiniRAG重新设计了信息检索和生成流程,以极简和高效为核心原则,通过创新的轻量级架构设计,成功实现了一个高效的知识增强系统,无需依赖大型语言模型,在保证性能表现的同时有效保护用户数据隐私。 主要设计思路基于对小型语言模型的三个关键发现:虽然在复杂语义理解上存在局限,但在模式匹配和局部文本处理方面表现优异通过引入显式结构信息,可有效弥补有限的语义理解能力将复杂RAG任务分解为简单明确的子任务,可在不依赖高级推理能力的情况下保持系统稳定性基于以上认知,MiniRAG提出了两个核心创新组件:异构图索引和轻量级基于图的知识检索,以实现高效精准的信息检索。
1/16/2025 2:38:10 PM
新智元

突发,美国开始拉黑国产大模型公司!智谱官方回应:手握全链路大模型核心技术,无实质影响!一天内25家中企被列入实体名单!

编辑 | 伊风月初,腾讯被美国国防部列进了“中国军工企业清单”(1260H 清单)已经够离谱了! 没想到刚过去10天,更离谱的事情出现了:大模型公司也登上了美国黑名单! 昨晚深夜,美国商务部工业和安全局(BIS)修订了实体清单,其中大模型六小虎之一的智谱公司赫然在列。
1/16/2025 1:24:32 PM
伊风

文档解析技术指南:从传统Pipeline到端到端大模型

众多文档,如技术手册、历史档案、学术论文和法律文件,往往以扫描件或图片形式存在。 这对检索增强生成(Retrieval-Augmented Generation, RAG)、内容提取以及文档解读等后续处理工作构成了极大的挑战。 文档解析技术应运而生,它能够识别并提取文档中的多种元素,如文字、公式、表格和图片,同时保持它们之间的结构联系。
1/16/2025 10:11:58 AM
追求卓越的

ChatGPT全年更新大总结!重看「大模型风向标」进化之路

2024年,大模型已经深入融入了我们的日常生活。 而作为领跑者,ChatGPT也一直是大模型届的指南针,无论是去年发布的大模型o1-pro,Sora Turbo,还是各种小功能,比如视频模式、打断说话等,甚至是每月200美元的高额定价,OpenAI的每一场发布会都能给广大AI爱好者带来一些新震撼、新思路。 下面共同回顾一下OpenAI在2024年发布的关键更新,一起见证大模型的进化之路!
1/16/2025 9:30:00 AM
新智元

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

从章鱼通过改变皮肤颜色来融入周围环境,到人类大脑在受伤后重新连接神经网络,无不体现着那句经典的名言——「物竞天择,适者生存」。 然而,对于LLM来说,想要加入哪怕只是一句话的新知识,都必须要再训练一次。 针对这一挑战,来自Sakana AI的研究团队刚刚提出了一种全新的方法——Transformer²。
1/16/2025 8:30:00 AM
新智元

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

在自然界,「适应」是一种非常普遍的现象。 例如,章鱼能够迅速改变自身的肤色和纹理,以融入周围环境,从而躲避天敌和捕捉猎物;人脑在受伤后能够重新连接自身神经回路,使个体能够恢复失去的功能并适应新的思维方式或行动方式。 生物体展现出的适应能力使得生命能够在不断变化的环境中蓬勃发展。
1/15/2025 3:11:39 PM
机器之心