威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

小扎回应Llama4对比DeepSeek:榜单有缺陷,等推理模型出来再比

2025-05-05 00:04:35
来源:

猫眼电影

作者:

陈吉

手机查看

  猫眼电影记者 贾麦勒·马阿鲁 报道w3u7903ejky2ywls

梦晨 发自 凹非寺量子位 | 公众号 QbitAI

Meta首届LlamaCon开发者大会开幕,扎克伯格在期间接受采访,回应大模型相关的一切。

包括Llama4在大模型竞技场表现不佳的问题:

开源基准测试存在缺陷,常偏向特定不常见用例,与产品实际使用场景脱节,不能真实反映模型的优劣。试图为这类东西进行过多优化会误入歧途。对于我们团队来说,搞一个冲到榜单顶部的Llama 4 Maverick版本相对容易,但是我们发布的版本根本没有对此进行调优,排名靠后是正常的。

以及与DeepSeek的比较:

我们的推理模型还没有出来,所以还没有和R1相应的模型去对比。

与此同时,在Meta合作伙伴亚马逊的网站代码中,被扒出要即将推出的Llama4推理模型为17B参数的llama4-reasoning-17b-instruct。

活动期间,有那么点Meta不语,只是一味地抛出Llama系列“亮点”的意思了(doge):

除即将推出超2万亿参数的Llama 4 Behemoth模型之外,代号“Little Llama”的80亿参数小模型可能会在未来几个月推出。推出官方Llama API平台推出一系列AI安全工具,包括检测和防止提示注入、越狱等风险。

扎克伯格谈“智能爆炸”

扎克伯格认为随着软件工程和AI研究的自动化推进,智能爆炸具备实现的可能性。从技术发展趋势来看,AI写代码能力不断提升,预计未来12-18个月,大部分相关代码将由AI完成。

这不仅意味着开发效率的大幅提高,还可能带来代码质量的提升,因为AI能够基于大量的数据和先进的算法,生成更优化、更高效的代码。

然而真正达到智能爆炸还面临着诸多现实层面的制约。在物理基础设施上,构建大规模计算集群复杂且耗时,从研发到稳定应用需要一定时间,同时还需要配套建设网络设施,确保数据的高速传输;建设专门的数据中心场地,要经过严格的审批流程;解决能源供应问题,无论是采用传统的燃气轮机发电还是绿色能源,都涉及到复杂的供应链体系,这些环节都需要耗费大量的时间和资源。

在人机协同方面,人们对AI系统的适应和反馈同样需要时间。AI系统并非一经推出就能被用户熟练使用,而是需要一个相互学习的过程。用户在使用过程中逐渐掌握与AI交互的方式,AI则通过分析用户的行为和反馈,不断优化自身的功能和性能。

在Meta广告团队的自动化排序实验中,尽管有大量的测试想法,但由于计算资源的限制,无法对所有假设进行充分测试;同时,为了保证测试结果的准确性和可靠性,需要大量的测试人力,这也在一定程度上限制了实验的推进速度。

扎克伯格认为,人们已经开始与AI建立起多种类型的关系,如将AI作为治疗师倾诉或朋友分享生活等,产品开发者应该尊重用户的选择。

虽然现阶段这类AI人际关系相关的产品在技术实现上还不够成熟,比如虚拟治疗师或朋友的形象往往只是简单的图片或粗糙的动画,缺乏真实的交互感,但随着技术的不断进步,为提升虚拟形象的真实感和交互性带来了新的可能。

换句话说,AI和元宇宙战略在未来还有联动效应。

在产品设计理念上,避免过度干扰用户是关键原则。Meta的Orion眼镜设计目标不仅仅是集成各种先进的技术功能,更重要的是要成为一副好用的日常眼镜。在不使用AI功能时,它要能像普通眼镜一样满足用户的基本需求,如佩戴舒适、外观美观;当用户需要使用 AI 功能时,又能便捷地提供服务,如语音交互、信息展示等。

这种设计理念同样适用于增强现实未来的产品设计,即让物理世界和数字世界自然融合,在为用户提供丰富数字内容的同时,避免数字元素过度充斥用户的视野,造成视觉和心理上的负担。

最后,扎克伯格回答了“如果软件生产力在两年内提高100倍”会怎么样。

他认为从历史看,过去全人类大部分精力都用于养活自己,也就是从事农业为主。最近100多年来满足基本身体需求在人类精力中的占比越来越小。

这种转变有两个影响:一个是越来越多的人在追求创意和文化。第二是人们花在工作上的时间更少,而花在娱乐和文化上的时间更多。

但随着时间的推移,如果每个人都拥有这些超人类工具来创造大量不同的东西,就会出现令人难以置信的多样性。其中一部分成果将用于解决难题:攻克疾病、推动科学进步、开发让我们生活更美好的新技术。

Llama首次推出官方API

此前Meta只管开源模型,部署托管各凭本事,现在终于推出官方API平台。

提供微调和评估Llama模型性能的工具。新型芯片供应商Cerebras和Groq合作,提供高推理速度的选项。承诺不会使用客户数据来训练自己的模型。

目前属于邀请测试阶段,需要排队。

不过手快的开发者在会场上就把Demo做出来了。

利用多模态能力,描述相机拍到的画面,整体上描述准确,不过其实这根香蕉是玩具,对AI来说还是难了。

Llama API:https://www.llama.com/products/llama-api/#llama-protections

Demo试玩:https://llama-api-launch.craigsdemos.workers.dev

参考链接:[1]https://www.dwarkesh.com/p/mark-zuckerberg-2[2]https://x.com/craigsdennis/status/1917365062165225544[3]https://x.com/btibor91/status/1917232574344384522

 时事1:女同学被❌c🐻

  05月05日,香港房屋局与智能建造研发中心合作 推动科研成果在公屋应用,

  消防、消防,有“消”也有“防”!在“防”的方面,可能我们相对要注重一些。比如大家会很注意杜绝火灾隐患;每到节假日,我们的有关同志,分管院领导和院办的同志,也会特别重视消防安全,都会认真开展消防大检查。

,草 榴 社区在线视频。

  05月05日,2024北京国际汽车展览会首辆进境展车通关,

  旁边,石林虎也吼道:“虎子,听到没有,你也赶紧驯服,别光顾着自己得瑟,再不让我骑上,回头我收拾你。”

,欧美手臂全部伸入肚子鼓包,美女露10尿孔无挡的撒尿,韩国精品A片应用。

 时事2:janpense人妻3

  05月05日,众星云集第十七届亚洲电影大奖颁奖典礼 张艺谋获“终身成就奖”,

  “什么,不行!”狈村的人大叫,对于他们来说,武器就是第二生命,生活在这大山中,没有这些兵器怎能活下去。

,高清乱码🔞❌♋免费观看学生,国产九色❤️sp调教91,小玉被扒开腿往里灌满精子。

  05月05日,“塞中务实合作不断拓展”,

  石渊两侧,诸多强者皆持兵器,眸蕴怒光,准备出手,不允许天生重瞳的神人早夭,要在此一战。

,爽躁多水快深点小说妇视,曼珠沙华裸身被❌羞羞照片,沈芯语AV一区二区。

 时事3:内衣办公室1~3樱花动漫

  05月05日,中亚青年来华14年:愿做中外友谊使者,

  “怎么回事?”几位族老都出现了,向他询问。

第十九章 争夺,女生❌狂揉❌喷水视频,别告诉妈妈黑料,撕开内衣秘挠奶头捆绑。

  05月05日,我国国家公园建设取得积极成效 生物多样性稳定增加,

  ⒈“一把手”的重视是搞好科技信息工作的关键

,Japanese scat poop 粪,永久免费看mv网站入口,班长让我吃他🐻我脱她衣服。

 时事4:媚黑母猪宣言

  05月05日,当年轻人的烦恼“穿越”到养老院,

  “山宝夺不成了,他们这是要去灭那个村落。”有人叹息。

,脱👙让摸🐻欧美,Hentai❌18禁动漫,女女🔞被一堆玩具玩哭动漫。

  05月05日,为推进中国式现代化注入强大动力——习近平总书记同出席2024年全国两会人大代表、政协委员共商国是纪实,

  “竟然不能让他昏厥过去,真是麻烦。”少妇冷淡的说道。

,俄罗斯胖老太做爰,国产精品㊙️老头,精品国产㊙️3D同人动漫。

责编:舍瓦

审核:董兰

责编:吴先娟

相关推荐 换一换