YC科技资讯网

Token通胀之下,谁能给中小企业的算力焦虑灭火? 最近跟几个做AI应用的朋友

Token通胀之下,谁能给中小企业的算力焦虑灭火?

最近跟几个做AI应用的朋友聊天,发现大家嘴上挂着一个词:Token焦虑。这不是开玩笑。国联民生证券的测算数据显示,中国日均Token消耗从2024年初的1000亿级,飙升至2026年2月的180万亿级。半年多时间,涨了上百倍。

这背后是什么?是AI智能体的大规模落地。以前聊天机器人一问一答,消耗有限。现在一个金融风控智能体完成单笔信贷审批,要经历用户画像检索、征信调用、风险评估、报告生成四五个环节,一次任务动辄消耗几十万Token。这哪是烧钱,简直是烧Token。
而Token烧得越多,算力成本就越像一座大山,压在创业者头上。之前有个行业分析师给我算过一笔账,2024年那会儿,大模型厂商打价格战,千Token最低降到0.0008元,几乎是赔本赚吆喝。但到了今年,阿里云、腾讯云集体涨价,部分服务涨幅超400%。以前是用得起但不想用,现在可能是想用但用不起。

最难受的是谁?是那些靠调用API做业务的中小创业公司。没有自研芯片,没有自己的算力池,所有成本都挂在云厂商的价目表上。身边不少相关人士都在吐槽,现在的算力市场,头部玩家吃肉,我们连汤都快喝不上了。

有意思的是,这个节骨眼上,曙光要在中关村论坛发超节点新品的消息传了出来。而且从流出的信息看,新品瞄准的方向,恰恰是普惠算力。

如果往前翻翻曙光的动作,其实能看出一些线索。去年乌镇的一套丝滑连招是给万亿参数大模型准备的,而这次新品的关键词,变成了面向全场景算力需求。

这其实也呼应了两会期间的一个政策信号,政府工作报告明确提出“支持公共云发展”,强调算力资源的普惠化配置。工作人员甚至在两会现场当场加代表微信,对接算力普惠的建议,这个细节也很能说明问题。

当算力成为像水电一样的基础设施,成本可控、门槛适中,才能真正激活千行百业的创新。否则,AI的故事讲得再大,也只是少数人的游戏。

我倒认为,这次曙光的新品,看点不在于参数有多高,而在于它能不能成为那个灭火器,帮中小企业和创业者,把算力成本的焦虑,浇下去。

中小企业 超节点新品 算力成本 GTC AI计算