简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

Token热潮下,能效比竞争成为新风口

2026-06-25 10:27

Token热潮下,能效比竞争成为新风口

南方 plus

2026-06-25 10:27

围绕大模型调用计价单位“Token”的价格体系与产业价值分配问题,正成为科技与资本市场关注的焦点。

如果说,大模型厂商是“挖金子的人”——烧钱训练、打价格战、抢用户,甚至亏钱也要做。但是,相当多并不训练大模型,只提供算力、网络等服务的厂商走到了台前。

6月24日,2026世界移动通信大会(MWC2026上海)在上海拉开帷幕。在此次展会上,以华为、中兴、浩鲸、亚信等厂商为代表,纷纷探索构建从Token生产到Token服务、再到Token流通的完整价值链,推动AI价值的规模化落地。

它们或许不用太关心最后挖到金子的是谁,只笃定卖铲子和卖水的生意稳赚不赔。

讨论焦点从大模型转型Token

当AI Agent与多模态大模型进入规模化落地阶段,Token(词元)已从底层技术计量单位,演变为企业AI资源的核心生产要素。

据国家数据局披露,2026年3月国内大模型日均Token调用量已突破140万亿,较2024年初增长超千倍,Token消耗呈指数级扩张。

从产业链拆解来看,Token是一条典型的价值放大链条。最上游是能源层;中游是算力层,;再往上是模型层;最终在应用层,AI Agent(智能体)的兴起,使Token需求呈指数级增长,一个复杂任务的Token消耗可达普通对话的数千甚至上万倍。

别小看Token。它表面上只是大模型调用里的计价单位,往深里看,它就是AI时代的新“货币”。

谁能把Token卖出去,谁就可能在下一轮全球竞争里先捞到第一桶金。说白了,过去是“卖产品”,现在更像是“卖算力、卖能力、卖效率”。

“以前大家讨论多是大模型,但今年展会更多转向了Token。因为大模型更多是企业在部署,或者说是针对企业的一个服务项目,而当大众都在讨论Token时,这就表明Token经济真正在走向普通消费者。”浩鲸科技数据智能产品线运营总监蒲武说。

他举例说,以豆包为例,日常办公如改作业、做表格和PPT等场景都会调用Token,虽目前部分服务免费,但后续将转向收费模式,其实这表明,大家调用Token已成为日常习惯。

从算力规模转向Token效率

随着AI智能体的广泛应用,产业竞争的焦点正从算力规模转向Token效率。

在此次展会,“卖铲子”的已经逐步涉足从Token生产到Token服务、再到Token流通的完整价值链。

例如,面对运营商Token规模化经营业务需求,华为升级星河AI高算效数据中心网络方案,围绕Token高效生产、稳定生产两大维度迭代优化。

比如说,在大模型多轮交互推理场景中,对带宽需求就会暴涨,传统算力网络架构普遍面临“算力空转、等待数据”的痛点。

该方案可以打通算、存、网协同壁垒,比如,其KVCache传输带宽直接提升8倍,补齐KV传输带宽短板。

大上行是Token经营时代运营商网络基础设施的重要能力之一。比如,戴上AI眼镜进行翻译或者逛展,就需要实时多模态交互,以及上行20Mbps体验需求。

这意味着,需要超宽带网络保障其大上行、高可靠、低时延需求,而华为U6GHz正是符合该网络的下一代黄金频谱,其端到端产业生态已就绪。

从全球协同来看,超过20个国家和地区已明确将U6GHz用于IMT(国际移动通信),覆盖全球近80%人口。2026年是U6GHz商用元年,中东有望部署全球首个基于U6GHz的5G-A商用网络,中国香港,中国澳门等多个运营商也将启动U6GHz商用部署。

中兴通讯也以智算超节点、极致性价比推理、极致能效AIDC等全维要素协同,持续降低单位Token生产成本。

从“堆算力”向“提效能”演进

在Token流通环节,大多数企业普遍面临Token使用分散、计量规则混乱、成本不可控、调用行为不可追溯,导致AI 投入逐渐演变为不可视、不可控的成本黑洞。

在浩鲸科技看来,企业真正需要解决的,不是“如何用模型”,而是如何将Token纳入类似水、电、算力的精细化运营体系,在保障创新的同时,实现成本与风险的可控。

浩鲸科技推出“鲸智大模型Token运营平台”,构建企业级Token全生命周期管理体系,实现AI 资源“可视、可管、可算、可追溯”。

比如,针对算力浪费、Token无效消耗过高问题,搭载智能推理加速引擎与多策略调度机制,整体模型吞吐量提升20%以上,减少单位Token算力消耗;通过长文本压缩、智能截断等专项优化,大幅减少冗余Token消耗,作业处理时长缩短36.9%,请求排队延迟降低41%。

同等预算下可支撑更多AI业务调用,或者,同等算力条件下可覆盖更广应用场景,这对用户来说,就是一种降本增效。浩鲸科技鲸智大模型Token运营平台已在广东、宁夏等地成功落地。

同样,如何算清“Token账单”是企业将AI融入生产运营的关键挑战。

亚信Token计费与运营解决方案,直击AI投入的“黑盒”痛点,为企业提供从算力到Token、从成本到ROI的闭环治理能力。

比如,某软件企业基于它将AI成本压降30%,Token对账周期从“周”缩短至“秒”;某通信运营商基于该方案,使多智能体协同调用的分账准确率升至100%,结算效率提升70%,真正让AI投入从“成本黑盒”走向“价值中心”。

1849年加州淘金热,成千上万的人涌向西部挖金子。最后谁赚了大钱?不是那些灰头土脸的矿工,而是卖铲子、卖牛仔裤的人。

在Token经济时代,同样的故事正在重演。

(来源:南方 plus)

相关文章

推荐阅读

围绕大模型调用计价单位“Token”的价格体系与产业价值分配问题,正成为科技与资本市场关注的焦点。

如果说,大模型厂商是“挖金子的人”——烧钱训练、打价格战、抢用户,甚至亏钱也要做。但是,相当多并不训练大模型,只提供算力、网络等服务的厂商走到了台前。

6月24日,2026世界移动通信大会(MWC2026上海)在上海拉开帷幕。在此次展会上,以华为、中兴、浩鲸、亚信等厂商为代表,纷纷探索构建从Token生产到Token服务、再到Token流通的完整价值链,推动AI价值的规模化落地。

它们或许不用太关心最后挖到金子的是谁,只笃定卖铲子和卖水的生意稳赚不赔。

讨论焦点从大模型转型Token

当AI Agent与多模态大模型进入规模化落地阶段,Token(词元)已从底层技术计量单位,演变为企业AI资源的核心生产要素。

据国家数据局披露,2026年3月国内大模型日均Token调用量已突破140万亿,较2024年初增长超千倍,Token消耗呈指数级扩张。

从产业链拆解来看,Token是一条典型的价值放大链条。最上游是能源层;中游是算力层,;再往上是模型层;最终在应用层,AI Agent(智能体)的兴起,使Token需求呈指数级增长,一个复杂任务的Token消耗可达普通对话的数千甚至上万倍。

别小看Token。它表面上只是大模型调用里的计价单位,往深里看,它就是AI时代的新“货币”。

谁能把Token卖出去,谁就可能在下一轮全球竞争里先捞到第一桶金。说白了,过去是“卖产品”,现在更像是“卖算力、卖能力、卖效率”。

“以前大家讨论多是大模型,但今年展会更多转向了Token。因为大模型更多是企业在部署,或者说是针对企业的一个服务项目,而当大众都在讨论Token时,这就表明Token经济真正在走向普通消费者。”浩鲸科技数据智能产品线运营总监蒲武说。

他举例说,以豆包为例,日常办公如改作业、做表格和PPT等场景都会调用Token,虽目前部分服务免费,但后续将转向收费模式,其实这表明,大家调用Token已成为日常习惯。

从算力规模转向Token效率

随着AI智能体的广泛应用,产业竞争的焦点正从算力规模转向Token效率。

在此次展会,“卖铲子”的已经逐步涉足从Token生产到Token服务、再到Token流通的完整价值链。

例如,面对运营商Token规模化经营业务需求,华为升级星河AI高算效数据中心网络方案,围绕Token高效生产、稳定生产两大维度迭代优化。

比如说,在大模型多轮交互推理场景中,对带宽需求就会暴涨,传统算力网络架构普遍面临“算力空转、等待数据”的痛点。

该方案可以打通算、存、网协同壁垒,比如,其KVCache传输带宽直接提升8倍,补齐KV传输带宽短板。

大上行是Token经营时代运营商网络基础设施的重要能力之一。比如,戴上AI眼镜进行翻译或者逛展,就需要实时多模态交互,以及上行20Mbps体验需求。

这意味着,需要超宽带网络保障其大上行、高可靠、低时延需求,而华为U6GHz正是符合该网络的下一代黄金频谱,其端到端产业生态已就绪。

从全球协同来看,超过20个国家和地区已明确将U6GHz用于IMT(国际移动通信),覆盖全球近80%人口。2026年是U6GHz商用元年,中东有望部署全球首个基于U6GHz的5G-A商用网络,中国香港,中国澳门等多个运营商也将启动U6GHz商用部署。

中兴通讯也以智算超节点、极致性价比推理、极致能效AIDC等全维要素协同,持续降低单位Token生产成本。

从“堆算力”向“提效能”演进

在Token流通环节,大多数企业普遍面临Token使用分散、计量规则混乱、成本不可控、调用行为不可追溯,导致AI 投入逐渐演变为不可视、不可控的成本黑洞。

在浩鲸科技看来,企业真正需要解决的,不是“如何用模型”,而是如何将Token纳入类似水、电、算力的精细化运营体系,在保障创新的同时,实现成本与风险的可控。

浩鲸科技推出“鲸智大模型Token运营平台”,构建企业级Token全生命周期管理体系,实现AI 资源“可视、可管、可算、可追溯”。

比如,针对算力浪费、Token无效消耗过高问题,搭载智能推理加速引擎与多策略调度机制,整体模型吞吐量提升20%以上,减少单位Token算力消耗;通过长文本压缩、智能截断等专项优化,大幅减少冗余Token消耗,作业处理时长缩短36.9%,请求排队延迟降低41%。

同等预算下可支撑更多AI业务调用,或者,同等算力条件下可覆盖更广应用场景,这对用户来说,就是一种降本增效。浩鲸科技鲸智大模型Token运营平台已在广东、宁夏等地成功落地。

同样,如何算清“Token账单”是企业将AI融入生产运营的关键挑战。

亚信Token计费与运营解决方案,直击AI投入的“黑盒”痛点,为企业提供从算力到Token、从成本到ROI的闭环治理能力。

比如,某软件企业基于它将AI成本压降30%,Token对账周期从“周”缩短至“秒”;某通信运营商基于该方案,使多智能体协同调用的分账准确率升至100%,结算效率提升70%,真正让AI投入从“成本黑盒”走向“价值中心”。

1849年加州淘金热,成千上万的人涌向西部挖金子。最后谁赚了大钱?不是那些灰头土脸的矿工,而是卖铲子、卖牛仔裤的人。

在Token经济时代,同样的故事正在重演。

(来源:南方 plus)

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。