比同行低99% 字节挑起大模型价格战

http://www.gkjw.com.cn 2024-05-22 11:37:30 发布于：北京市来源: 中国网科技作者: 杨月涵

　　在AI上“迟钝”了的字节，凭借价格“逃逸了一波平庸”。主力模型0.0008元/千tokens，较行业价格便宜99.3%的水平，让外界直呼字节跳动开启了大模型的“价格战”。对行业来说，门槛的下降意味着生态繁荣进程的再度提速，而对字节跳动来说，这场“迟到”的发布会，或许也意味着庞大的字节正在理顺自己做AI的逻辑。

　　“价格力”

　　AI也开始讲“价格力”了。5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布，目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等9款模型。

　　豆包大模型原名“云雀”，是国内首批通过算法备案的大模型之一。但比起首次集体亮相的豆包大模型家族，价格才是这场发布会最大的意外和惊喜。

　　“豆包通用模型Pro 32k模型，正式定价是0.8厘/千tokens，比行业价格降低99.3%。”发布会上，火山引擎总裁谭待公布这一数字的话音一落，现场就响起了一阵惊呼和掌声。以至于让谭待重复，“对，没有听错，是降低99.3%”。

　　相比起来，市面上同规格模型的定价一般为0.12元/千tokens，是豆包模型价格的150倍。火山引擎公布的价格计算显示，一元钱能买到豆包主力模型的125万tokens，大约是200万个汉字，相当于三本《三国演义》。

　　什么支撑了豆包大模型的定价，这可能是定价消息一出，最先跳出来的问题。在发布会后的群采中，谭待解释称，团队在技术上有非常多优化手段，包括通过模型结构的优化调整，把成本做低、效果做好，通过分布式推理、混合调度大幅度降低部署成本等。

　　调用量给了豆包低价的底气，而低价则是为了撬动更大的市场。据悉，经过一年的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿tokens文本，生成3000万张图片。谭待认为，降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

　　“豆包的低价使得更多企业和个人能够负担得起大模型的使用费用，从而降低了大模型技术的使用门槛，这将有助于大模型在更多行业和场景中的落地应用。”北京市社会科学院副研究员王鹏对北京商报记者进一步分析称，低价策略有助于吸引更多的潜在客户，扩大市场份额。随着用户基数的增加，大模型的商业化前景也将更加广阔。

　　输不起的竞赛

　　在时间节点上，AI的“价格力”故事也有巧合。两天前，OpenAI用GPT-4o炸场，在API使用方面，相比GPT-4-turbo，GPT-4o价格降低一半，速度提升两倍。

　　同一天，智谱大模型开放平台上线了新的价格体系。其中入门级产品GLM-3 Turbo模型调用价格下调80%，从5元/百万tokens降至1元/百万tokens。

　　“从全球范围看，大模型的推理成本，特别是非顶尖大模型推理成本的下降，比之前预估的进度要快得多。”在接受北京商报记者采访时，互联网投资人庄明浩如此说道。

　　而从国内情况来看，低价可能也是一个必然之举。庄明浩称，相比起国外屈指可数的几家大模型企业，国内大模型的竞争环境更为复杂，头部企业、明星创业公司林立。但与之相对的是，应用层的爆发却慢于预期。因此在技术能力已经进入相对瓶颈的阶段时，尽可能地拓展应用生态，也是商业惯例。

　　而在头部大模型企业中，大洋彼岸的战况同样激烈。北京时间5月15日凌晨，谷歌正式反击OpenAI，不仅带来了轻量化的模型Gemini 1.5 Flash、AI通用智能体Project Astra等重量级发布，还推出了OpenAI“跳票”了的AI搜索，捍卫了自己在搜索市场上的地位。

　　对于如今字节跳动是否会引发降价连锁反应的问题，王鹏认为，当一家企业采取低价策略时，其他竞争对手为了保持或扩大市场份额，往往也会采取相应的降价措施。因此，豆包的低价策略很可能触发大模型行业的价格战。

　　有人甚至戏称，可能要不了多久，企业调用大模型将不再需要成本，甚至企业调用大模型，相应的大模型企业应该提供补贴。这种玩笑反映了两个层面的焦虑，一个在于应用生态，另一个在于市场竞争。

　　谭待也提到，对企业来说，在AI转型上充满太多不确定性，必须要让试错成本尽量低。

　　“大模型发展至今，基础技术到达瓶颈，人们迫切想要知道大模型能够做什么，是否真的能实现飞轮效应，这些都需要时间，也需要钱。在这场没人输得起的竞赛中，是否会走向一种极端的价格战，谁也说不清。”庄明浩说道。

　　而对于烧钱的大模型来说，低价是否会压缩盈利空间，也成为核心议题之一。对此，王鹏认为，降价无疑会在短期内对企业的盈利空间造成一定压力。然而，这种压力可以通过扩大市场份额和提高使用率来缓解。

　　从长期看，王鹏认为，随着用户数量的增加和使用频率的提高，企业可以实现规模经济，降低单位成本，从而在一定程度上抵消降价带来的影响。此外，企业还可以通过提供增值服务、定制化服务等方式来增加收入来源，以应对降价带来的盈利压力。

　　“我们不是以亏损为代价做这件事的，亏损是接受不了的。”群采中，谭待也提到，定价的基础是对技术的信心。

　　迟到的发布会

　　2024年初的年度全员会上，字节跳动CEO梁汝波给字节跳动2024年定下的关键词是“始终创业，逃逸平庸的重力”。那场演讲中，梁汝波多次提及“危机感”，比如组织平庸化的危机感、迟钝的危机感。

　　AI也是危机感的来源之一。梁汝波说，公司层面的半年度技术回顾，直到2023年才开始讨论GPT，而业内做得比较好的大模型创业公司都是在2018—2021年创立的。

　　这样的评价其实与外界对字节跳动AI线条过于低调甚至“慢了”的印象不谋而合——此前包括豆包、扣子等产品发布的消息，大多是以“网传”的形式而被外界接收，火山引擎原动力大会可能是字节第一场真正意义上聚焦AI的发布会。

　　而慢了的字节跳动，也需要找回自己的节奏，无论是产品的发布，还是“舞台”上的聚光。

　　“从传播角度看，字节跳动过去的AI动作其实非常低调，虽然豆包和扣子的数据不错，但可能只有最关心这个行业的人才会知道，声量上远不如智谱、MiniMax等企业。从这个意义上看，字节跳动需要这样一场发布会，让事情回到应有的状态里。”庄明浩说。

　　事实上，在长达一个小时的群采期间，豆包准备的时长与现在才发布的时间点也被多次提及。谭待给出的回应是，“我们的风格就是不准备好不要说出来”。

　　在庄明浩看来，字节跳动的“慢”和“低调”，可能都要归结于组织架构的庞大，“大模型一路发展下来，对这些体量超级大、业务超级复杂的公司而言，梳理好自身的AI战略本来就是一件非常困难的事”。

　　庄明浩举例称，字节跳动有各种各样的产品，也很擅长开发，造成如今的情况，更大可能是内部没有理清楚，到底是以火山引擎还是字节跳动的名义、是以豆包还是扣子的名义，是以to B还是to C的名义讲，这些可能都在字节跳动内部经历了一番博弈，划分清楚之后，才有了这样一场发布会。

　　巧合的是，群采期间，当被问及字节跳动在AI和大模型业务上的整体战略思考时，现场也有解释提到，谭待主要负责火山引擎的部分，“可以聊聊火山引擎的战略，字节跳动的战略可以回头再聊”。

(责任编辑：毕安吉)

免责声明

凡本网注明“来源：XXX(非高科技网)”的内容，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

如有侵权等问题，请及时联系本网，本网将在第一时间删除：gkjnet@qq.com

责任编辑:小雷

分享到

延伸阅读：

推荐阅读：

焦点推荐

本站焦点

故宫博物院与高德地图正式签约携手共绘数字文博新蓝恒温防晒，2022室内玩水就到千朝浪屿水世界青春肆意飞扬沃野wow yeah联名安徽卫视《男生女生向保险业如何突破三大数字化挑战？Dynatrace创新技术提供乐研科技加入中国网络安全产业联盟 618选购选购中央空调，这几个点一定要提前掌握 10+款福田奥铃冷藏底盘现身随州，冷链行业福音来了奇安信2024半年报：营收17.83亿元现金流大幅增长40.97% 能链与青岛崂山区签约合作，推动新能源产业高质量发展赋能地理空间探测，Velodyne Lidar荣获GeoBuiz峰会测绘

热门频道

手机
|
动态
|
资讯

三星独占！高通骁龙8 Gen4高频版首曝：CPU频率史无前超百万人预约！iPhone 16 Pro系列要被疯抢：顶配售价一加 Ace 3 Pop-up 快闪活动来袭，二十城掀起抢购热 vivo S18系列即将发布：AI大模型、影棚级人像，一览旗全球首发搭载天工散热系统，一加 Ace 2 Pro 将于 8 一加 618开启旗舰普及风暴全程价保最高直降400 三星Galaxy S23系列国行发布首发定制版第二代骁苹果手机账号被盗半小时被盗刷近3万元一加11延续哈苏影像合作未来性能引领者明日正式一加 11 开启手游全新时代超帧超画引擎引领游戏

图文推荐