yuanlab.ai 团队正式对外开源 源 yuan3.0 flash 多模态基础大模型。本次发布涵盖完整模型权重(支持16bit与4bit量化版本)、详尽技术白皮书、全流程训练方案及全面评测数据,全面开放社区进行后续微调、二次训练与垂直领域定制化开发。
据官方说明,Yuan3.0 Flash 是一款参数量达40B的多模态基础大模型,基于稀疏混合专家(MoE)架构设计,单次前向推理仅动态激活约3.7B参数。该模型首次提出并落地强化学习优化范式 RAPO(Reflection-Aware Policy Optimization),并创新引入反思抑制奖励机制(RIRM),从训练源头约束模型减少冗余反思行为,在保障甚至提升逻辑推理准确率的同时,显著削减推理阶段的 token 生成量,从而大幅压缩计算资源消耗,在“低算力开销、高智能水平”的大模型演进方向上实现关键突破。
Yuan3.0 Flash 整体由三大部分构成:高性能视觉编码器、高效语言主干网络,以及鲁棒的多模态对齐模块。其中,语言主干采用局部过滤增强型注意力机制(LFA)与MoE结构协同设计,在提升注意力建模精度的基础上,有效缓解训练与推理过程中的显存压力与算力负担。
在多模态融合方面,模型通过视觉编码器将图像信息编码为统一语义token,与文本token共同输入语言主干,并借助多模态对齐模块完成跨模态特征的精准、稳定映射。此外,系统集成自适应图像分块策略,既可支撑超高分辨率图像理解任务,又可显著降低GPU显存占用与整体计算开销。
公告指出,在面向企业级落地的关键任务中——包括RAG增强对话(ChatRAG)、多模态文档检索(Docmatix)、多模态表格解析(MMTab)以及智能摘要生成(SummEval)——Yuan3.0 Flash 的综合性能已超越 GPT-5.1,展现出更强的产业适配性与实用价值。
在权威多模态推理与纯语言理解评测中,Yuan3.0 Flash(40B)的精度表现逼近 Qwen3-VL235B-A22B(235B)与 DeepSeek-R1-0528(671B)等超大规模模型,但其平均 token 消耗仅为上述模型的 1/4 至 1/2,为企业部署轻量高效的大模型解决方案提供了全新选择。
源 Yuan 3.0 系列基础模型将按能力与规模划分为
Flash、Pro 和 Ultra 三大版本,对应参数量分别为 40B、200B 与 1T,满足不同场景下的性能与成本需求。
源码获取地址:点击下载
# Reflection
# 高性能
# 既可
# 更强
# 点击下载
# 分别为
# 仅为
# 基础上
# 显存
# 三大
# 多模
# 编码
# Token
# 架构
# qwen
# deepseek
# ultra
# 大模型
# gpt-5
# gpt
# ai
相关文章:
马斯克疯狂鼓吹:投资者涌进人形机器人赛道,创业者警告技术成熟度被高估
小米3nm自研芯片就是例子!台积电:中国大陆客户可获全球先进制程支持
小米17 Ultra支持红毯运镜 卢伟冰:谁拍谁就是吴彦祖
北京严查电动自行车非法改装,端掉 18 个“黑窝点”
一代神卡落幕:Arch Linux正式停止支持GTX 10系列!
漫威隐藏搭档,找它分分钟做出顶级特效
宫崎英高称魂类游戏并非创新!只是设计理念满足玩家需求
练习时长2年半 AMD下代游戏卡要等2027:台积电N3P工艺
如何锻造御灵刀寒狱冰天 打造勿忘冰系毕业利器
游戏科学成立全资子公司 经营范围涵盖出版与游戏发行
石头科技赴港上市获中国证监会备案,募资用于国际化业务拓展
三位幻战女神操作详解:节奏切换与战术搭配
强制性国家标准《移动电源安全技术规范》论证会在京召开
魅族23手机假想图曝光 加入背屏 后置5000万像素三摄
光影为序,专业为纲丨飞利浦商用显示器&尼康共绘影像创作新图景
一加Turbo 6系列官宣1月8日发布 内置9000mAh大电池
字节跳动与南洋理工大学开源 StoryMem 框架
iQOO 15 Ultra来了:首发最强风扇 性能释放堪比2nm骁龙8E6
内存价格坐上火箭!DDR4一年暴涨1800%:2026年还要涨
《星际:异端先知》光头女主被网友改成性感|美女|
Pixel再出奇怪BUG 部分用户反映拍照后照片消失
布里奇特女船长战斗手册:小怪清空是关键
《密特罗德究极4》师承《塞尔达传说:旷野之息》!竟是部分灵感设计来源
《inZOI》发布紧急补丁回滚部分模块版本至10月份
小李爆发秒杀流 VS 西门群攻控场派:你的核心输出抉择
《赛博朋克2077》总监否认删减蓝月恋爱线 不过确实有想过
MongoDB 中的 MongoBleed 漏洞正被积极利用
美国法官叫停得州App Store年龄验证法案:缺乏必要性
2026年国补政策来了:一加手机最高优惠800元
携程声明:与柬埔寨国家旅游局合作未曾启动,绝不存在泄露用户隐私信息情况
20张发人深省的插画,深刻揭露了社会现实
字节 Trae 发布《2025 年度产品报告》
4TB数据传输难:物理搬运竟比网络更快
全系标配9000mAh电池!一加Turbo 6系列开启新一轮预热
iQOO 15 Ultra春节前登场:首发最强主动散热风扇,性能比肩2nm旗舰
报告:苹果 AI 战略有望明年终见成效
共建工业软件新生态,格创东智在喻家山论坛详解工业AI落地方法论
快科技2025年度评奖:主板篇
Intel 18A工艺被指已有四大客户:AMD和NVIDA排除在外 原因很简单
熙艾尔马埃尔战斗技能全解析 高效游戏角色通关秘诀
日本2025年下半年二手手机市场:iPhone占64.8%
内存严重缺货:厂商开始挑客户!四家PC大厂优先供应 其他靠边站
商务部:坚决反对美对华半导体产品加征 301 关税,已提出严正交涉
《异度装甲》知名编剧嵯峨空哉宣布封笔 重心转向家庭
穿越黑暗!《生化危机9:安魂曲》主题曲片段揭晓
疑似小米17 Plus部分配置曝光 搭载第五代骁龙8至尊版
造人形机器人的公司自己先泼冷水:行业存在过度炒作现象
798迎别样潮流展,蓝鸟潮物大赛携手VaVa引爆京城
蓝鲸云 LanJing-Nacos-ArcoVue 微服务框架 v1.1.0 发布
国产影像传感器新动向曝光:SCC90XS或成旗舰机主摄
相关栏目:
【
广告资讯37196 】
【
广告推广143353 】
【
广告优化89630 】