排版格式成了AI生成过不去的坎？

作者|王铁梅

编辑|古廿

五年前，WPS发布了一篇自述文章，标题是《现在大家正在用的WPS，我们用32年更新了9999个版本》。

换算下来，相当于每月更新26次。用这种产品节奏，WPS在微软阴影下走出了一条更符合国情的办公软件生存路径。

最典型的莫过于办公软件本身免费，但是弹窗广告变现。尽管被诟病，但是中国互联网商业模式的玩法，依然给了这家企业和微软差异化竞争的空间，且在微软的Windows操作系统大本营拿下60%的覆盖度。

直到AI的出现。

2023年末，ChatGPT掀起大模型浪潮一年后。金山办公CEO章庆元对外宣布，WPS个人版将全面关闭商业广告，全力投入AI方向。对此他表示：为什么我们广告停了以后还敢投入？我觉得用户会愿意为AI付钱。

在这之前，章庆元在接受采访时谈到希望商业模式更优雅，将会逐步关闭广告。彼时他认为可以取消广告的理由主要有三个：老百姓有钱了；移动支付兴起；会员付费意识觉醒。两者相比较，AI给金山办公带来的产品付费转型更具说服力。

从产品角度而言，全面转向AI后，截至到今年WPS在C端产品迭代到了灵犀3.0；在B端也全面升级WPS 365，定位为一站式AI协同办公平台。

但是在变现能力的设计上，WPS并未押上All in AI的激进玩法。

据「市象」了解，目前WPS整体的AI用户数在四五千万左右。三种C端会员中，目前超级会员用户最多，其次是大会员，AI会员最少。主要是增值权益的设计上，AI会员功能有限，而大会员包含AI会员能力的同时，还有传统功能，订阅价格只贵了100元左右。

从定价策略上看，AI会员更像是一个定价“陪跑”，用来凸显大会员的价值优势。

换言之，真正单独为AI买单的用户并不多。WPS并没有把AI当作核心付费产品，而是作为会员体系中的增值能力，用来提高整体订阅率与续费意愿。因此在付费标准上，金山办公全球都采用包月定价模式，而非Agent办公软件常用的token模式付费。

在业内人士看来，目前WPS的AI主要应用在文本编辑修改这种对token消耗量有限的调用上，比Agent办公软件的一句话生成的token消耗量更低，采用普通用户更熟悉的包月付费更合适。

在AI功能方面，目前WPS文生视频功能不多，可能后续会有少量视频存储、简单剪辑功能。比如PPT转视频的功能后续可能会上线。

拥有6.47亿月活的金山办公正试图让AI真正融入用户现有的工作流程，而非创造全新的使用习惯。这也让WPS的AI路线与不少ai办公软件形成差异，后者往往试图用AI重构使用路径。

在金山办公总裁助理看来，“用户要的不是炫酷，而是有用。”这套逻辑下，WPS不是要重建用户的工作方式，而是让AI成为用户熟悉流程中的新手段。

相比从头重写工作流的AI办公新秀，WPS这种老编辑式的AI进化，也让WPS在这轮AI办公重构中显得特别。

01 千问们盯上Office三件套

不到30天时间里，阿里旗下两款To C AI应用接连出手：

先是11月底，深度融合千问AI助手的夸克浏览器迎来升级。发布六大千问AI套件。

虽然对准Chrome，但是基于屏幕共享功能，夸克可以和WPS等多种办公软件联动，帮助用户写Word文档、做Excel表。甚至夸克浏览器自己也可以做表格、生成PPT，或者提取一个word文档。

接着12月初，阿里的另一个AI产品千问继续升级。继上线一周下载量迅速突破1000万次后，这一次将功能瞄准office三件套。

12月4日，推出面向办公与协作场景的全新能力。此次更新将文档生成、智能排版、在线编辑、多格式转换等整合为一站式操作。同时，全新PPT生成能力上线，千问可基于图片、文档、语音等多种输入内容精准提炼、智能匹配模板。

上述能力同时向所有用户免费开放。

相比夸克，千问这次的升级直指office三件套。千问产品经理书瑶对外透露“千问的办事能力在进一步增强。我们希望千问不仅能激发用户产生想法，更能为用户交付完整文档。”将Office能力融入到对话中，让AI助手从生成内容进化到完成任务。

能干活才是原生AI应用解决粘性的关键。“某些应用打开率偏低，回到本质上来说，它跟需求本身的频率、频繁程度和它的朴素程度，以及刚性需求的重要程度是强相关的。”书瑶表示。

在他看来：“千问上线办公能力，核心就是希望解决真实、朴素但每天必要的高频需求。从结果上来看能保证打开率，因为这是用户自然需求的反映。”

值得注意的是，从阿里巴巴管理层到产品层面，都在尝试确立在AI时代的新标准。阿里巴巴集团联合创始人、董事长蔡崇信最新一次在香港大学的演讲中，尝试提出阿里巴巴在AI时代的竞赛规则。

“美国人定义的AI竞赛规则是错的。美国人怎么算谁赢？看谁的大语言模型更强。今天是OpenAI领先，明天是Anthropic，后天可能是别人。”蔡崇信说，这个计分方式本身就有问题。“真正的赢家不是谁有最好的模型，而是谁用得最好。”

不止是阿里，在追求办事能力的AI竞争定义下，办公三件套也成为大模型企业、初创AI企业的首选。

在阿里之前，昆仑万维发布天工超级智能体，打出“AI版Office”的旗号，其内置的专家智能体可以一键生成专业的文档、PPT和表格。

大模型企业瞄准office全家桶之外，更多的初创企业，选择更聚焦的AI办公细分场景。

以最为激烈的PPT领域为例，海外跑出了年收入过亿美元的Gamma验证了AI办公的商业闭环，国内的AiPPT产品也用20个月拿到2000万用户。其中超过60%的流量来自Kimi、智谱等大模型入口。

这些数据揭示了一个趋势：办公软件看似是红海，但AI正在让office三件套都有可能成为独立战场。

文档撰写、表格处理、PPT展示，这些原本传统办公软件体系内的功能，如今在AI能力的解耦下，被外包给垂类应用。每一个场景，都有可能诞生新的估值30亿美金级的独角兽。

AI办公初创企业，通过绑定AI代际红利，完成对传统办公工具的侧翼包抄。当AI办公工具开始从传统办公软件中分流时，以微软和WPS为代表的传统办公软件巨头必须回答，什么才是办公软件的护城河。

02 不同于微软的AI路径

微软是AI时代最早起飞的玩家。

投资OpenAI，让它在大模型底层占据了稀缺资源位；Copilot之后，尽管没有成为AI办公的样板工程。但从业务结构看，微软的增长主引擎已不是Office，而是Azure和Copilot背后的AI基础设施。

Office更多承担的是入口和生态角色。相比之下，金山办公的基本盘要纯粹得多。在一次媒体采访中，金山办公副总裁田然被问到WPS是否会成为AI时代的“超级入口”。

他的回答很清醒：“我不觉得WPS是超级入口，如果真成了，那这个世界该多可悲啊。未来有眼镜、耳机、音箱等多种入口，但Office是每个智能体都该具备的能力。”

不争“超级入口”的WPS，想成为所有AI助理的“必备模块”，构建标准能力，成为每个AI智能体生成文档时必须调用的那一层。

这也是WPS与微软的差异：微软用Copilot重构Office体验，但最终目标是绑定Azure的企业云端。WPS用灵犀重构办公交互，但核心是守住格式、接口、兼容性这套文档基建。

7月份的WAIC现场，WPS灵犀3.0发布会后的一场群访中，谈及AI市场中的优势，WPS相关负责人透露：多家专注于PPT生成的AI初创企业，也在主动寻求和金山办公合作，想要解决生成内容和真实Office环境深度兼容的问题。

因为目前市场上所谓的一键生成PPT，本质上都是生成一个看起来像的PPT，实质是HTML格式或者图片格式。想要保证在用户熟悉的编辑环境中无缝二次编辑，跨设备演示，异常艰难。

在金山办公PPT产品负责人陆炜俊看来，虽然市场上很多AIPPT生成工具，但是效果完全取决于大模型，没办法做二次的变更了。让AI能够精准理解用户的实时需求，并根据用户的指令快速调整内容，是2025年AI办公行业亟待解决的核心痛点。

因此，WPS判断AI办公真正的壁垒，恰恰在于做完之后能不能修改、调整、编辑。灵犀产品的核心思路不是一句话生成，而是类似AI时代的编辑模式“边生成、边修改”。

例如在WPS的AIPPT中，用户可以通过自然语言实时调整内容结构“帮我把第二页扩展三条要点”“把这一页版式换成深色系”“加一张财报图表”，灵犀可以立即理解并执行，且整个修改过程发生在熟悉的PPT编辑环境中。

这不是prompt-to-image的AI，而是prompt-to-slide的持续对话的老编辑模式。

灵犀能够做到“边聊边改”，依赖的是WPS对Office格式的深度积累。

金山办公在过去30年里积累了对Office文档的“增删改查能力”，不仅能精准读取格式信息，还能将其转译为大模型能理解的“中间层文件”。这是PPT能被AI读懂、改写、再生成的根本前提。

与之对照的是，大多数AI初创工具，在做格式转写时只能提取文本，再交给模型生成视觉稿，缺乏格式积累。在正式办公场景中，PPT与Word文档的格式要求极高，很多AI工具生成的内容即便内容不错，也无法落地到标准场合使用。

03 AI办公软件的终局是什么？

过去三年，AI办公经历了三个阶段：

2023年的插件增强阶段：微软Copilot最早尝试嵌入AI能力于Office，但仅限于“语义增强”，办公逻辑未被重构。

2024年的轻量生成阶段：Manus、Genspark等AI平台支持一句话生成内容，但协作能力薄弱，编辑器体验不佳，难以进入工作流。

2025年的原生交付阶段：以千问、夸克为代表的AI助手，开始直接从语音/文档/图片输入生成结构化办公成果，实现任务闭环。

在第三个阶段，大模型企业也开始冲击AI办公的格式标准。比如千问除了让新增功能容易上手、内容更加专业，也在使用细节上进行了改进。

相比目前市面上大多数AI产品仍停留在只能生成文字阶段，文字生成后，用户往往需要将AI生成文字复制到其他Office软件中才能进行排版修改，体验受影响。千问目前可以做到生成即排版。

另外，千问的智能编辑器也支持更多精细化操作。用户可以对特定段落，要求千问进行润色、扩写或风格调整。

此前面对大模型的冲击，WPS选择的AI路线是一条务实的防御路径：不自研大模型，将AI内化，全力强化自身专业办公的地位。

在大模型能力层面，布局“多模型适配”机制，根据不同任务调用不同大模型，以平衡效果与成本。目前，金山办公接入了DeepSeek、MiniMax、智谱AI、文心一言、通义、商汤等多个主流大模型。

章庆元强调不会自研基础大模型，只做模型的应用。“我们自认不是模型厂商，而是应用厂商，但会自研一些小模型，用于垂直的应用场景。”这套早在2023年百模大战之时，金山办公就定下的策略，目前看来是正确的。

今年DeepSeek一出现，基础模型的调用成本下降。作为应用方的WPS，可以灵活选择最优模型。WPS的AI底层能力是开放的，但场景入口、内容交付、格式处理则牢牢掌握在自己手中。

千问与WPS的技术路径，看似方向不同，实则都在争夺最终交付权。

不同的是，以千问为代表的大模型厂商，从AI助手出发，试图走完“基础模型→内容生成-交付结果”的全流程。WPS则从文件标准与格式处理的末端出发，把AI深度绑定在文档入口、编辑流程和排版格式中，不做模型，但守住标准。

这使得WPS成为平台与模型厂商之间的中立连接器，在大模型快速平权的背景下，反而拥有更大的协同空间。

陆炜俊曾用一个比喻描述行业现状：“整个办公行业像在挖两条尚未贯通的隧道，一端是炫目的AI交互能力，一端是对办公规则的深刻理解，只有两端真正打通，才能解决根本问题。”

如今看来，WPS选择的方向，是占据那条“办公规则理解”的主隧道。而那条通往AI原生交互的隧道，则正由千问等大模型企业高速掘进。这种角色变化，也正在催化办公生态的一轮微妙重构。

五年前，当在线协作平台开始崛起，飞书、钉钉等新兴玩家在文档层并未自建底座，而是普遍选择与金山办公合作，接入其成熟的编辑与格式能力；如今，类似的合作结构是否会在AI办公场景中重演，也决定了WPS的编辑护城河深不深。