文章列表

分类

标签

微调大型语言模型（LLM）的五个技巧

译者 | 李睿审校 | 重楼数据质量、模型架构以及偏见缓解方面的专家建议开发人员可以掌握LLM微调来提高人工智能开发的性能和效率。为什么微调至关重要大型语言模型（LLM）配备了处理广泛任务的通用能力，包括文本生成、翻译、提取摘要和回答问题。尽管LLM的性能表现非常强大，但它们在特定的任务导向型问题或特定领域（例如医学和法律等）上仍然效果不佳。

11/21/2024 8:22:45 AM

李睿

神级模型 In-Context LoRA 爆火！10种场景精准出图！

大家好，我是花生~. 阿里通义实验室在月初推出的一个新开源项目 In-Context(上下文) LoRA 最近越来越火了，因为大家发现它实在太好用了，无论是保持人物/场景一致性，还是进行服装、风格、Logo、字体样式、页面版式的学习迁移，效果都非常不错，一下就解决了很多大家之前头疼的问题。目前 In-Context LoRA 已经在摄影、电商设计、样机制作、头像生成等方面有了落地应用，极大满足了大家对精准控制出图的需求，那今天我们就一起来看看 In-Context LoRA （以下简称 IC LoRA）究竟有哪些神奇之处。

11/21/2024 1:39:32 AM

夏花生

大厂设计复盘！百度法行宝如何打造24小时免费AI律师？

百度「捏合总结」功能设计复盘前言随着 AI 技术的不断进步，用户对于信息获取的即时性、准确性及个性化程度均提出了更高的期望，而对于设计师的挑战则是如何利用设计思维和 AI 技术，帮助用户更高效地获取信息，同时打造出具有智能感知的新功能。阅读文章 . 前言.

11/21/2024 12:29:27 AM

百度MEUX 团队

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

官方表示，该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

11/20/2024 11:02:11 PM

沛霖（实习）

OpenAI 推出免费 AI 培训课程，教老师如何将 ChatGPT 用于教育

OpenAI 与非营利组织 Common Sense Media 共同宣布推出免费的教师培训课程，旨在帮助教师更好地理解人工智能和提示工程（prompt engineering，是指设计和优化提示词以引导大语言模型生成更准确、有用的输出的工程）。

11/20/2024 8:08:10 PM

远洋

昆仑万维推出“天工大模型 4.0”4o 版及实时语音助手 Skyo，号称可克服大模型幻觉

今天上午，昆仑万维宣布推出“天工大模型4.0”4o版（Skywork 4o）以及新产品“实时语音对话助手Skyo”。

11/20/2024 6:15:47 PM

清源

谷歌 Gemini 引入“记忆”功能：AI 记住用户偏好、习惯，提供更贴心服务

科技媒体 TechCrunch 昨日（11 月 19 日）发布博文，报道称谷歌开始向 Gemini Advanced 用户，推出“记忆”（memory）功能，可以记住用户的生活细节、工作习惯以及个人偏好。

11/20/2024 1:54:51 PM

故渊

年度世界互联网科技大奖公布，腾讯Angel机器学习平台获领先科技奖

11月19日，2024年世界互联网大会领先科技奖在乌镇发布，腾讯Angel机器学习平台凭借其卓越的技术积累、创新的关键技术和广泛的应用场景，荣获本年度领先科技奖。腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。世界互联网大会领先科技奖由世界互联网大会主办，旨在奖励全球年度最具领先性的互联网科技成果，倡导互联网技术国际交流合作。

11/20/2024 11:13:00 AM

新闻助手

ChatGPT付费功能免费用！Mistral把Canvas、Artifact全复制了

欧洲的OpenAI，把ChatGPT功能都复制了。 Mistral AI大模型平台Le Chat新增Canvas、联网搜索、上传PDF等ChatGPT同款功能，而且全都免费！三大主流大模型产品的功能，现在可以一站式访问。

11/20/2024 7:00:00 AM

2024年11月工具合集！6 款不容错过的免费AI神器

大家好，我是花生~. 今天我们继续 AI 效率神器的第 13 期，一起来看看吧~. 上期回顾：.

11/20/2024 2:08:26 AM

夏花生

德国音乐版权代理机构 GEMA、印度 ANI 通讯社起诉 OpenAI 侵犯版权

ANI 通讯社认为 OpenAI 聊天机器人捏造的“幻觉”采访内容对其声誉构成了真正的威胁，假新闻的传播也会导致公共混乱。

11/19/2024 5:45:31 PM

溯波（实习）

OpenAI 早有“造芯梦”：曾考虑收购晶圆级芯片企业 Cerebras

对于 OpenAI 而言，自研 AI 芯片可降低对英伟达等外部供应商的依赖，获得更强的对英伟达议价能力，在 AI GPU 紧缺时保障业务推进不受影响。

11/19/2024 4:32:22 PM

溯波（实习）

谷歌回应 Gemini 聊天机器人回复“人类去死吧”：已采取措施防止类似事件再次发生

人工智能聊天机器人再次引发争议。一名用户在使用谷歌的 AI 聊天机器人 Gemini 时，收到了极其可怕的回复：“人类请去死吧。”谷歌方面承认了这一事件，将其归咎于一次“无意义”的回应，并表示这违反了他们的安全指南。该公司已采取措施，以防止类似事件再次发生。

11/19/2024 3:23:43 PM

远洋

LLM为何频频翻车算术题？研究追踪单个神经元，「大脑短路」才是根源

由于缺少对运行逻辑的解释，大模型一向被人称为「黑箱」，但近来的不少研究已能够在单个神经元层面上解释大模型的运行机制。例如Claude在2023年发表的一项研究，将大模型中大约500个神经元分解成约4000个可解释特征。而10月28日的一项研究，以算术推理作为典型任务，借鉴类似的研究方法，确定了大模型中的一个模型子集，能解释模型大部分的基本算术逻辑行为。

11/19/2024 12:53:50 PM

新智元

研究发现ChatGPT在疾病诊断方面优于医生

随着AI技术的飞速发展，其在医疗保健领域的应用也日益广泛。近期，一项由波士顿贝斯以色列女执事医疗中心(BethIsrael Deaconess Medical Center)的研究团队发表在《美国医学会网络开放》(JAMA Network . Open)上的研究，引发了广泛关注。

11/19/2024 12:21:45 PM

Gina Kolata

AlphaFold3级性能、开源、可商用，MIT团队推出生物分子预测模型Boltz-1

图示：来自测试集的靶标上的 Boltz-1 的示例预测。（来源：论文）编辑 | 萝卜皮2024 年 11 月 18 日，麻省理工学院（MIT）的研究人员宣布推出 Boltz-1，这是一个开源模型，旨在准确模拟复杂的生物分子相互作用。 Boltz-1 是第一个完全商业化的开源模型，在预测生物分子复合物的 3D 结构方面达到 AlphaFold3 级精度。

11/19/2024 11:59:00 AM

ScienceAI

提升人工智能性能的三种关键的LLM压缩策略

译者 | 布加迪审校 | 重楼在当今快节奏的数字环境中，依赖人工智能的企业面临着新的挑战：运行人工智能模型的延迟、内存使用和计算能力成本。随着人工智能快速发展，幕后推动这些创新的模型变得越来越复杂、资源密集。虽然这些大模型在处理各种任务中取得了出色的性能，但它们通常伴随着很高的计算和内存需求。

11/19/2024 8:08:16 AM

布加迪

人人都能做！3 步教你用 AI 免费复刻 “让学生梦想成真” 的照片

大家好，我是花生~. 上周优设 AIGC 视频号发布了一条趣闻推送，讲的是国外有一个老师，在收集了学生们未来想从事的职业后，用 AI 生成了每个人长大后对应的照片，然后打印出来在课堂上送给了他们。每个收到照片的小朋友都非常惊喜和快乐，兴奋地向同学们展示自己未来 “梦想成真” 的样子。

11/19/2024 1:02:02 AM

夏花生

资讯热榜

中国企业大模型市场爆发:半年调用量暴增363%，阿里通义居首位美团首个开源大模型正式发布！LongCat-Flash-Chat能否撼动AI格局？ Anthropic 融资 130 亿美元，估值飙升至 1830 亿美元对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破中国AI三巨头入选《时代》周刊2025年度百强榜单苹果AI团队遭遇人才流失，核心研究员转投Meta、OpenAI和Anthropic 被低估的GPT-5！OpenAI给7亿人解锁最强AI，大众智能一夜撕裂旧秩序视觉中国重磅升级！AI生成内容标识系统全面上线

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 Anthropic 英伟达 AI新词论文代码训练算法 LLM Stable Diffusion 芯片蛋白质开发者腾讯 Claude 苹果 Agent 生成式 AI for Science 神经网络 3D 机器学习研究 xAI 生成人形机器人 AI视频计算百度 Sora GPU 华为工具 RAG AI设计大语言模型字节跳动搜索具身智能大型语言模型场景深度学习预测视频生成伟达视觉 AGI Transformer 架构神器推荐亚马逊 Copilot 特斯拉 DeepMind 应用