大模型

神经网络debug太难了，这里有六个实用技巧

神经网络debug太难了，这里有六个实用技巧

神经网络的 debug 过程着实不容易，这里是一些有所帮助的 tips。

6/11/2021 2:24:00 PM 机器之心

专访唐杰 | 我国首个超大智能模型「悟道」发布，迎接基于模型的AI云时代

专访唐杰 | 我国首个超大智能模型「悟道」发布，迎接基于模型的AI云时代

唐杰认为，超大规模预训练模型的出现，很可能改变信息产业格局，继基于数据的互联网时代、基于算力的云计算时代之后，接下来可能将进入基于模型的 AI 时代。智源研究院致力于成为这样一个时代的引领者，集聚各方资源力量，构建一个超大规模智能模型技术生态和开放平台，供北京乃至全国的研究人员、开发者和企业使用。

3/30/2021 2:26:00 PM 机器之心

百分点认知智能实验室：基于不完全标注样本集的信息抽取实践

百分点认知智能实验室：基于不完全标注样本集的信息抽取实践

编者按信息抽取是从文本数据中抽取特定信息的一种技术，命名实体识别（Named Entity Recognition, NER）是信息抽取的基础任务之一，其目标是抽取文本中具有基本语义的实体单元，在知识图谱构建、信息抽取、信息检索、机器翻译、智能问答等系统中都有广泛应用。基于监督学习的NER系统通常需要大规模的细粒度、高精度标注数据集，一旦数据标注质量下降，模型的表现也会急剧下降。利用不完全标注的数据进行NER系统的建立，越来越受到专家学者们的关注。第九届国际自然语言处理与中文计算会议（NLPCC 2020）针对此业

3/25/2021 2:12:00 PM 百分点科技

提供基于transformer的pipeline、准确率达SOTA，spaCy 3.0正式版发布

提供基于transformer的pipeline、准确率达SOTA，spaCy 3.0正式版发布

spaCy 3.0 正式版来了。

2/2/2021 2:28:00 PM 机器之心

AI模型被「骗」怎么破？《燃烧吧！天才程序员》冠军团队解决方案出炉

AI模型被「骗」怎么破？《燃烧吧！天才程序员》冠军团队解决方案出炉

前段时间，一档名为《燃烧吧！天才程序员》的竞赛类综艺让「程序员」这一群体成功破圈，也呈现了 AI 在解决实际问题的过程中面临的一些挑战，如数据集中存在对抗样本、图像中存在噪声等。在本文中，CLS 战队（大赛头名团队）的优秀选手、奥比中光算法工程师埼玉详细解读了他们在比赛中用到的解决方案。近日，由蚂蚁集团、清华大学等组织共同协办的首届「Inclusion|A-tech 科技精英赛」(以下简称 A-tech 大赛)圆满落幕。奥比中光科技集团股份有限公司 (以下简称「奥比中光」) 研究院 SDK 组负责人小蛮腰、算法工程

1/21/2021 2:43:00 PM 机器之心

如何防止我的模型过拟合？这篇文章给出了6大必备方法

如何防止我的模型过拟合？这篇文章给出了6大必备方法

正如巴菲特所言：「近似的正确好过精确的错误。」

1/20/2021 3:01:00 PM 机器之心

资讯热榜

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek 腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言腾讯云上线DeepSeek全系API接口并打通联网搜索东风日产N7首款接入DeepSeek大模型，实现智能化人机交互 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线 DeepSeek 更新 R1 推理 AI 模型：代码生成与复杂推理性能大幅提升推理能力比肩 o1

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体 Gemini 技术英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D 大语言模型字节跳动 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索视频生成 AI模型亚马逊特斯拉 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉