威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

Qwen3发布!超DeepSeek R1登顶开源榜,还带来了跟R1不同配方

2025-04-30 08:34:03
来源:

猫眼电影

作者:

伍生宝

手机查看

  猫眼电影记者 倪正 报道w3u7903ejky2ywls

作者 | summer邮箱 | huangxiaoyi@pingwest.com

在所有人都在猜测DeepSeek V4或者R2和Qwen3谁先到来时,Qwen3发布了。

4月29日凌晨,阿里巴巴开源了新一代通义千问Qwen3系列模型,涵盖8款不同尺寸。其中,旗舰模型Qwen3 235B采用混合专家(MoE)架构,总参数量235B(仅为DeepSeek-R1的1/3),激活参数仅需22B,预训练数据量达36万亿Tokens。

性能上,据官方介绍,Qwen3在多项测评中表现优异,超越DeepSeek-R1、OpenAI-o1等主流模型,成为当前性能领先的开源大语言模型。

具体来看,Qwen3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强:在奥数水平的AIME25测评中,Qwen3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,Qwen3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。

看惯了模型榜单表现上的反复超越,但这次的Qwen3还有些不同,比起单纯的模型边界突破,Qwen3更想突出的是以小博大的能力。而且它在和DeepSeek轮流推动开源模型进步的过程中,再次给开源社区提供了与R1不同的配方。

1

没完全用R1的方法,但完成了对R1的超越

和R1类似的是,Qwen3也走的是“用模型训模型”的思路。

在预训练阶段,Qwen3的性能优化很重要的一个来源是大量高质的合成数据。

数量上看,Qwen3的数据集相比Qwen2.5有了显著扩展。Qwen2.5是在 18 万亿个 token 上进行预训练的,而 Qwen3 使用的数据量几乎是其两倍,达到了约 36 万亿个 token,涵盖了 119 种语言和方言。其中一部分来自于PDF文档提取信息,另一部分就是Qwen2.5系列模型合成的数据。

技术报告中明确提到,“我们使用 Qwen2.5-VL 从这些文档中提取文本,并用 Qwen2.5 改进提取内容的质量。为了增加数学和代码数据的数量,我们利用 Qwen2.5-Math 和 Qwen2.5-Coder 这两个数学和代码领域的专家模型合成数据,合成了包括教科书、问答对以及代码片段等多种形式的数据。”

这也意味着,在预训练的过程中,Qwen3借助自身的生态优势,又构建了一个自我迭代提升的数据系统。

预训练奠定了Qwen3的基础能力,而在此基础上的后训练阶段则是Qwen3最为关键的技术创新,它通过多阶段训练方法实现了推理能力与直接回答能力的融合。

以上图为例,同一模型内实现了思考和非思考模式。在官方的应用界面来看,选择哪种模式的方法看起来还是让用户自己选择,不过在选择了深度思考模式后,用户多了一个设置思考预算的功能,让模型根据问题难度动态分配。

在后训练上,Qwen3用了和R1整体pipeline类似的的“回锅肉”式迭代:微调、RL、再微调,然后再更具体的RL。

它和DeepSeek一样用大模型蒸馏小模型,不过Qwen彻底是自己蒸馏自己了。

另一个特别值得注意的是,第二阶段RL,Qwen团队采用的是基于规则的奖励来增强模型的探索和钻研能力。

“第二阶段的重点是大规模强化学习,利用基于规则的奖励来增强模型的探索和钻研能力。”官方博客写到。这与当前被认为是DeepSeek R1等模型成功关键的GRPO(基于结果奖励的优化)形成鲜明对比。Qwen3没有完全依赖GRPO这样基于结果的奖励机制。

紧接着,在第三阶段的微调中,Qwen3采用了一份长思维链数据和常用的指令微调数据的组合数据上对模型进行微调,实现了将非思考模式整合到思考模型中,确保了推理和快速响应能力的无缝结合。

最后,在第四阶段,Qwen3在包括指令遵循、格式遵循和 Agent 能力等在内的 20 多个通用领域的任务上应用了强化学习。

Qwen3没有完全用R1的方法,但完成了对R1的超越。

1

模型全尺寸,但参数正在“变小”

和Qwen此前的生态路线一样,Qwen3一口气发布了8款不同的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能)。

这次的全尺寸,果然没有让期待已久的社区失望,欢呼声一片。

MLX 是专为 Apple Silicon设计的高效机器学习框架。在模型发布前,MLX的团队就完成了对Qwen 3的支持工作。其中0.6B和4B可以应用于手机,8B、30B、30B MOE可用于电脑......

尺寸全是一方面。更重要的是Qwen在不断以更多、更小的尺寸,达到过去更大尺寸同样的性能效果。在很多场景下,模型都具备了在端侧运行的能力和水平。

据官方博客显示,Qwen3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能;Qwen3的稠密模型性能继续突破,一半的参数量可实现同样的高性能,如32B版本的Qwen3模型可跨级超越Qwen2.5-72B性能。

Qwen3显然是个能让开源界好好把玩和拆解一段时间的最热门模型,接下来它更全面的技术报告发布后,估计会揭秘更多“独家配方”,继续推动开源模型的进步和创新。

点个 “爱心”,再走吧

 时事1:激情无码翘臀喷水呻吟

  04月30日,“悦享童年·公益阅读”世界读书日系列活动在北京举办,

  海底三个月的磨砺,石昊成功了,肉身成灵,在这一阶段蜕变到极尽,这是一种难以言喻的体悟,成灵者第一时间感知到,自己走到那一步了。

,女仆装纯欲。

  04月30日,河北公益诉讼检察案件六成为生态环境和资源保护案件,

  金色的毛球顿时发出一声惨叫,百般纠结,最终用一只小爪子捂住自己的眼睛,狠心咬破另一只小爪子上的肉垫。

,丝袜丝袜变态口工视频,鸣人和照美冥❌漫画,国产成年妇视频。

 时事2:嗯脱我内衣吸我奶小内裤图片

  04月30日,加强作风建设,切实为基层减负,

  1、按时上学下学,上午是7:30-7:50,下午是1:30-1:50到校。上学期很多同学早早就来到校门口、泉德路口等,这样非常危险。家住学校附近的瓷城花园上午7:30,下午1:30才从家里出发,家住在其他要计算好家到学校的时间,请同学们按时上学不能过早到校。请各班主任加强教育,务必使本班学生遵守。

,小鲜肉GayGay✅✅免费自慰,日本学生扒裙子打光屁股网站,国外美女换装视频高清下载。

  04月30日,杭州都市圈城市齐聚杭州联展 500多项文旅优惠发布,

  一群高手来自不同的部落,组成了一支相当强大的队伍,此时突破外围区域,一路斩杀猛兽,进入山脉较深处。

,黑土被❌🐻黄漫,全黄一级裸片,免费的黄漫❌18禁动漫网站。

 时事3:三角洲骇爪被❌❌爆乳漫画

  04月30日,真补贴,雍禾为你的脱发买单,植发最高立减2万元,

  可除却他外,其他人都没有一丝笑意,如果说蛟鹏是天才,那么这个还没断的娃是什么呢?

,真人实景女处被破www免费看,欧美∨iboss,小三哈里斯裸体。

  04月30日,第十一届平潭国际风筝冲浪节中国风筝板巡回赛落幕,

  ③ 20年,公司投资购置、新建了一批生产设备,已全部投入运行,增强了企业核心竞争力。

,美女怀孕裸体㊙️网站,福瑞涩涩同人18禁网站免费,少妇的丰满2奇优影院。

 时事4:白皑草校霸爸爸小说免费阅读

  04月30日,南方电网原纪检监察组组长龙飞被逮捕,

  当前,全市上下都在围绕即将召开的XX市第九次党代会、全面完成今年经济社会发展任务等,做好各项工作,营造良好的社会氛围。实现市委、市政府制定的工作目标关键在抓落实。领导干部要善于带头深入抓落实,转变作风抓落实,开拓创新抓落实。要坚持正确的方向,敢于正视矛盾,紧密联系群众,善于化解矛盾;要勤政廉政,沉下心来,殚精竭虑,埋头实干,勇创佳绩,以艰辛的付出换来工作的成就,以丰硕的成果换来群众的满意。特别是在换届工作中,乡镇党委班子成员要率先垂范,严格换届工作纪律,政治指导和参与各级换届工作,保证换届风清气正。要善于抓好班子团结,把领导班子建设成团结统一、坚强有力、充满活力的班子,做到政令畅通、令行禁止,班子成员要充分发挥参谋助手作用,用服从安排和指挥,按照职责分工,在乡镇党委书记的带领下,把各项任务落到实处。

,动漫❌扶他❌女同,俄罗斯⭕⭕⭕⭕XXXX,蒂法被❌AV免费观看。

  04月30日,以色列惊险营救致千人死伤:“好似世界末日来临”,

  老树皮脱落,早先出现突起的那个地方,此时绿霞炽盛,钻出几条新枝,皆翠绿欲滴,刹那间,又光雾氤氲,瑞彩万条。

,欧美Ⅴdeσsex69性欧美,美女扒开腿❌裸体网站免费视频,爽躁多水快深点三p文章。

责编:黄少萍

审核:章文雅

责编:和卓玲

相关推荐 换一换