大模型
神经网络debug太难了,这里有六个实用技巧
神经网络的 debug 过程着实不容易,这里是一些有所帮助的 tips。
专访唐杰 | 我国首个超大智能模型「悟道」发布,迎接基于模型的AI云时代
唐杰认为,超大规模预训练模型的出现,很可能改变信息产业格局,继基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于模型的 AI 时代。智源研究院致力于成为这样一个时代的引领者,集聚各方资源力量,构建一个超大规模智能模型技术生态和开放平台,供北京乃至全国的研究人员、开发者和企业使用。
百分点认知智能实验室:基于不完全标注样本集的信息抽取实践
编者按信息抽取是从文本数据中抽取特定信息的一种技术,命名实体识别(Named Entity Recognition, NER)是信息抽取的基础任务之一,其目标是抽取文本中具有基本语义的实体单元,在知识图谱构建、信息抽取、信息检索、机器翻译、智能问答等系统中都有广泛应用。基于监督学习的NER系统通常需要大规模的细粒度、高精度标注数据集,一旦数据标注质量下降,模型的表现也会急剧下降。利用不完全标注的数据进行NER系统的建立,越来越受到专家学者们的关注。第九届国际自然语言处理与中文计算会议(NLPCC 2020)针对此业
提供基于transformer的pipeline、准确率达SOTA,spaCy 3.0正式版发布
spaCy 3.0 正式版来了。
AI模型被「骗」怎么破?《燃烧吧!天才程序员》冠军团队解决方案出炉
前段时间,一档名为《燃烧吧!天才程序员》的竞赛类综艺让「程序员」这一群体成功破圈,也呈现了 AI 在解决实际问题的过程中面临的一些挑战,如数据集中存在对抗样本、图像中存在噪声等。在本文中,CLS 战队(大赛头名团队)的优秀选手、奥比中光算法工程师埼玉详细解读了他们在比赛中用到的解决方案。近日,由蚂蚁集团、清华大学等组织共同协办的首届「Inclusion|A-tech 科技精英赛」(以下简称 A-tech 大赛)圆满落幕。奥比中光科技集团股份有限公司 (以下简称「奥比中光」) 研究院 SDK 组负责人小蛮腰、算法工程
如何防止我的模型过拟合?这篇文章给出了6大必备方法
正如巴菲特所言:「近似的正确好过精确的错误。」
资讯热榜
OpenAI低调更新GPT4o模型,多项能力反超DeepSeek
腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
腾讯云上线DeepSeek全系API接口并打通联网搜索
东风日产N7首款接入DeepSeek大模型,实现智能化人机交互
IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线
DeepSeek 更新 R1 推理 AI 模型:代码生成与复杂推理性能大幅提升 推理能力比肩 o1
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
Gemini
技术
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
大语言模型
字节跳动
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
视频生成
AI模型
亚马逊
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉