2025年12月18日,火山引擎Force原动力大会·冬季场于上海顺利召开。当日下午的“Data +AI”专题论坛环节,火山引擎数智平台正式发布《AI时代企业数据基建升级路线图》白皮书。这份路线图针对生成式AI规模化发展浪潮下的企业,就如何系统性升级数据基础设施、充分挖掘数据资产价值,给出了清晰的演进方向与实践指引。
随着大模型与生成式AI在各行业的应用不断深化,企业数据基础设施正迎来从主要服务商业智能(BI)到全面支撑人工智能(AI)的关键代际转型。数据的价值不再局限于满足传统经营分析需求,更成为推动AI模型持续迭代升级、助力智能体(Agent)等高级应用落地的核心动力。在这一趋势下,数据基建的先进程度,直接决定了企业能否有效掌握AI技术、充分释放模型的潜在价值。
白皮书中指出,在AI时代构建数据基建的关键,在于打造以Token作为价值流转载体的智能基础架构,并且首次从体系化角度提出企业升级数据基建需遵循的五大“北极星”原则,分别是模型本位、安全内生、极致效能、闭环进化以及生态兼容。依据这些原则,白皮书为企业在AI时代的数据基建规划了循序渐进的升级路线,着重强调应从三个维度推进系统性建设。
在升级的起步阶段,企业的核心任务是打破传统单一算力的供给限制,初步达成计算范式的整合,为不断增长的AI负载提供稳固支撑。这一阶段的根本目标是打造一个灵活、可扩展的算力供给池,使其既能充分满足AI模型训练与推理对高性能计算的要求,又能高效完成海量数据的处理任务,为后续的智能化升级筑牢算力基础。
随着大语言模型与视觉语言模型的能力愈发成熟,数据计算的核心逻辑正从传统的“逻辑规则”驱动转向“模型语义”驱动。在这一阶段,数据基建需要构建原生的多模态数据处理能力,突破数据仅用于人类阅读或传统报表的限制,转而生成能被模型高效利用的高质量数据资产。“模型即引擎”逐步成为新一代数据处理的通用架构方向。
面对非结构化数据呈现出的指数级增长趋势,企业数据基础设施建设的重心,已从早期的“算力堆叠”转向深度的“平台化治理”与“架构融合”。其演进方向在于打破传统结构化数据平台与新兴非结构化AI平台之间的“二元割裂”现状,企业正着力构建统一融合的技术架构,以实现结构化与非结构化数据的深度整合。
在AI时代,企业数据基础设施的升级已不再局限于单一计算能力的线性增长,而是涉及算力供给、计算引擎、平台架构和数据治理等多个维度的全方位、系统性工程。为了提升实践参考的价值,白皮书还收录了传媒、智能驾驶、大模型研发等不同行业的先进实践案例,直观呈现了数据基建升级为业务发展所创造的实际效益。
目前,企业能够借助字节跳动数据平台的官方渠道获取《AI时代企业数据基建升级路线图》白皮书的完整内容,从而深入认识并规划自身在AI时代的系统性数据能力构建工作。