开云体育 刷Token走火入魔!Meta职工写外挂舞弊冲榜,1个月烧掉200万好意思元

新智元报说念
剪辑:元宇
【新智元导读】Meta里面搞了个AI用量排名榜「Claudeonomics」,8.5万职工拼挥霍、冲段位、抢「Token神话」称呼。有东说念主一个月烧掉200万好意思元,有东说念主写外挂冲榜,有东说念主挂着Agent睡眠也在跑——硅谷卷Token,仍是卷到走火入魔了。
一个东说念主,30天,烧掉3285亿token!
按Anthropic公开订价粗算,这些烧掉的算力资本接近200万好意思元。
4月初,The Information记者Jyoti Mann在X上初次曝光Meta里面「Claudeonomics」排名榜,30天全公司token总挥霍超60万亿。
伸开剩余93%这些猖獗的数字,来自Meta里面一个名叫「Claudeonomics」排名榜的比赛,8.5万东说念主参与的烧token大赛,只展示前250名。
从铜牌、银牌、金牌、铂金、翡翠,一起升到「不朽会话」(Session Immortal),再到最高荣誉「Token神话」(Token Legend)。
没错,烧token皆烧出段位来了。
这笔账到底有多大?The Information成心作念了一个计较器来拆解:
The Information报说念中附带的交互式token资本估算器,按Claude Opus 4.6占86%的模子配比、70%缓存掷中率估算,1万亿token表面资本约550万好意思元。
天然,这仅仅按公开价的估算,但数据量级自己仍是有余炸裂。
淌若放到通盘Meta来看,这个数字更恐怖:最近一个月token总挥霍约60.2万亿。
这是什么主张?
The Information作念了一个估算:好意思国国会藏书楼全部藏书折算约2.66万亿token,Meta的Llama 3实际数据是15万亿token,东说念主类历史上悉数出书竹素加起来估算约20万亿token。
Meta职工30天烧掉的token量,是东说念主类全部出书物的3倍!
这还仅仅启动。一周之后,这个数凭据报说念跳到了73.7万亿。
音讯传开后,业内知名时刻博主Gergely Orosz在X上振领提纲地驳倒:
Token用量仍是是Meta绩效评估的一部分。聪慧东说念主在刷他们觉得指导念念看的方针,就这样简短。
这仍是不是某个工程师在用AI写代码的故事了,而演变成一场超大鸿沟AI挥霍竞赛游戏:
遮掩数万东说念主,有排名、有称呼、有荣誉体系。
曝光后两天
排名榜就湮灭了
The Information的报说念发出后,Meta里面炸开了锅。
有职工在里面商议区写说念:
我淡漠民众算算这背后的动力挥霍。要不是果然在发生,我会以为是个见笑。
到了周三,排名榜从Meta内网湮灭了。
Meta发言东说念主对外的说法是:排名榜是由创建者自行撤下的,不是公司下令。
公司强调,职工评估看的是「本体托付影响」,不主张把个东说念主token数据作为评估绩效的主要神志。
但Meta发出的信号是矛盾的。
据The Information报说念,Meta里面一个名为Checkpoint的AI驱动绩效跟踪系统,如实将token使用量列为数据点之一。
排名榜天然撤了,但公司官方的AI Insights姿首盘仍然对悉数职工绽放,你随时不错检讨我方和团队的token挥霍。
Meta发言东说念主透露,AI Insights姿首盘的想法是匡助公司了解各组织怎么向AI原生的职责神志转型,它提供的瞻念察不仅仅token用量,还包括代码有计划方针和其他维度。
天然,乐动中国手机app官网Meta停掉了排名榜,嘴上说不以token论铁汉,但排名榜的逻辑仍然存在,这让不少职工感受到公司开释出的信号并不完全一致。
「代码行数」
披上token新衣
这个排名榜天然只存在了几天,但它仍是催生出了一套「刷分」操作。
据The Information征引匿名职工刻画,一些Meta工程师念念出了多样办法来膨大我方的AI使用方针。
比如,一些工程师会让AI Agent 生成多量轻细更变,这些更变对功能匡助有限,但每次仍会造成一次commit,从而举高其AI使用方针。
量上去了,排名天然顺眼。
还有东说念主缔造了转录机器东说念主,挂在会议里自动作念纪录。
有的东说念主以至成心饱读动共事来用我方缔造的转录器用,因为只消别东说念主通过你的器用跑token,挥霍量就算在你头上。
近似的事不单发生在Meta。
亚马逊电商部食客岁也出现过一个案例。
一位司理透露团队应该更多使用AI编程器用Cline。于是团队里有东说念主径直改了代码,让每次和Cline的对话看起来挥霍了10倍的token。
这个团队的AI使用排名连忙冲到了分部前线。
不外到本年年头,亚马逊退换了系统,这个「舞弊码」失效了。
这些故事看起来有些乖张,但熟练软件行业历史的东说念主一定不目生。
Box CEO Aaron Levie直言:这让他念念起了AI出现之前,行业里围绕「用代码行数预计智力员产出」的那些老争论。
代码行数曾经经被算作坐蓐力方针。
着力工程师们学会了把一瞥能写完的逻辑拆成十行:方针涨了,产出没变,以至更差了。
目下,开云sports通常的故事仅仅换了个计量单元:代码行数变成了token数。刷行数变成了刷commit、挂转录机器东说念主、改系统让数字翻10倍。
方针可量化,又和绩效沾边,就一定可能会「玩坏」。
据The Information报说念,有Meta职工暗里承认,那些token用量低的东说念主,有时辰会懆急我方看起来「不够AI native」。
同期这位职工也觉得,高token用量不应该成为一种身份美艳,因为它并不是坐蓐力的好方针。
不卷token的公司
怎么玩?
既然刷token排名的逻辑破绽这样显著,有莫得企业选拔另外一条路?
功令装备的公司Axon选拔了把AI激发绑定在业务托付上,而不是挥霍量上。
他们的作念法是团队淌若欺诈AI器用逾额完成年度道路图标的15%以上,就能拿到现款奖金。
Axon总裁Josh Isner涌现,本年公司各团队集体的道路图逾额幅度正在跟踪到30%摆布,主要归功于Claude Code和Cursor的使用。
瞻望本年在AI编程器用上的支拨将达到「数千万好意思元」级别。
Isner觉得,当你引入「尽量多用这个器用咱们就付钱」这种捕快的时辰,风险越来越大:
你怎么知说念你获取的是你念念要的着力,大致说,到底有莫得任何着力?
Aaron Levie并不饱读动tokenmaxxing,也不觉得它会在硅谷以外的大公司里平淡流行。
不外他也透露,我方合并这种冲动,因为刻下阶段需要先让工程师充分试用这些器用。
他选了另一种神志:既然AI能让团队更高效,那就把居品标的定得更高。职工能不可完成这些加码后的标的,径直影响薪酬。
但Levie也莫得一刀切地辩说token挥霍。他觉得应该容忍一定流程的token「浪费」,因为那意味着团队在尝试新东西:
硅谷目下正处于这样一个阶段,你得让工程师去试这些器用。
Levie答允为试错买单,但不肯意把「谁烧得最多」变成一种排名机制。
Axon和Box代表了一种不雅点:token仅仅弹药,你用了若干不热切,你使用它作念出了什么才热切。
当油表被当成速率表
Meta的排名榜被撤了,但背后催生它的那股力量依然宏大:
硅谷高管们集体把「多烧token」等同于「高坐蓐力」的叙事少许也莫得松开。
英伟达CEO黄仁勋
英伟达CEO黄仁勋就曾在All-In Podcast上说过一句被平淡援用的话:
淌若一个年薪50万好意思元的工程师,连至少25万好意思元的token皆没用掉,他会「高度警惕」。
他以至设念念了一个将来:Token会成为招聘时的标配福利,就像牙科保障和免费午餐一样。工程师口试时会问:「这份职责给我配若干token?」
Meta CTO Andrew Bosworth在本年2月的一次科技会议上提到,淌若一个顶级工程师花掉十分于我方年薪的token资本,却能把坐蓐力晋升到10倍,这笔钱就好比「白送的钱」,应该无间投,以至不必设上限。
前OpenAI和特斯拉AI科学家Andrej Karpathy则是再造新词:token挥霍量俨然成了AI时间个东说念主能力的新标尺:
你的token玄虚量是若干?你能拓荒若干token玄虚量(Token throughput)?
当行业大佬皆在说「多烧token即是高坐蓐力」,民众听到的信号惟有一个:不烧即是落伍,这种FOMO(Fear of Missing Out,错失懦弱)会连忙从「我要不要多用少许AI」变成「我敢不敢无须」。
莫得东说念主念念成为团队里阿谁token用量垫底的东说念主,而排名榜仅仅把这种懆急变成了一场公开竞赛。
但问题未必在这里。
Token挥霍量之是以被追捧,是因为它是目下最容易量化的AI使用方针。
你很难预计一个工程师「用AI之后托付质料晋升了若干」,但你不错精准地看到他烧了若干token,就它和「代码行数」一样。
但容易量化,不等于值得量化。
代码行数对应的是写代码的动作,并不代表软件质料;Token挥霍量预计的是API调用次数,不等于工程产出。
这就好比油表能告诉你烧了若干油,但它不代表速率和里程。
而AI Agent时间,只会让这个问题更敏锐。
NYT近期的报说念刻画了一种新适意:
工程师同期开十几个窗口,放出几十个Agent并行跑任务,有些Agent系统被野心成24/7不阻隔运行,在东说念主类睡眠的时辰还在捏续挥霍token。
一个全职Agent一周不错跑掉7亿个token。
当token挥霍不错脱离东说念主类骚动自动增长的时辰,拿挥霍量来预计东说念主的坐蓐力,就愈加造作了。
天然,Meta的Claudeonomics排名榜仍是下线,但它折射出一个东说念主类在时刻接受上的「经典悖论」:
当一个器用的使用量不错被精准计量、不错被公开排名、不错和绩效感知挂钩,它就势必从器用变成扮演。
代码行数是这样,commit次数是这样,专利肯求数、论文援用量、OKR完成率,透顶是这样。
每一个曾被算作坐蓐力代理方针的数字,最终皆催生出了一套刷分产业。
目下轮到了token。
下一个被异化的方针会是什么?
也许是Agent的并发数目,也许是AI生成代码的合并率,也许是某种咱们今天还念念象不到的新数字。
只消企业还分不清「饱读动用AI」和「捕快AI带来的真确产出」,近似的刷榜游戏就不会停。
参考辛勤:
https://www.theinformation.com/articles/tokenmaxxing-tide-may-turning?rc=epv9gi开云体育
发布于:北京市小九体育在线直播官网

备案号: