排版格式成了AI生成过不去的坎?
作者|王铁梅
编辑|古廿
五年前,WPS发布了一篇自述文章,标题是《现在大家正在用的WPS,我们用32年更新了9999个版本》。
换算下来,相当于每月更新26次。用这种产品节奏,WPS在微软阴影下走出了一条更符合国情的办公软件生存路径。
最典型的莫过于办公软件本身免费,但是弹窗广告变现。尽管被诟病,但是中国互联网商业模式的玩法,依然给了这家企业和微软差异化竞争的空间,且在微软的Windows操作系统大本营拿下60%的覆盖度。
直到AI的出现。
2023年末,ChatGPT掀起大模型浪潮一年后。金山办公CEO章庆元对外宣布,WPS个人版将全面关闭商业广告,全力投入AI方向。对此他表示:为什么我们广告停了以后还敢投入?我觉得用户会愿意为AI付钱。
在这之前,章庆元在接受采访时谈到希望商业模式更优雅,将会逐步关闭广告。彼时他认为可以取消广告的理由主要有三个:老百姓有钱了;移动支付兴起;会员付费意识觉醒。两者相比较,AI给金山办公带来的产品付费转型更具说服力。
从产品角度而言,全面转向AI后,截至到今年WPS在C端产品迭代到了灵犀3.0;在B端也全面升级WPS 365,定位为一站式AI协同办公平台。
但是在变现能力的设计上,WPS并未押上All in AI的激进玩法。
据「市象」了解,目前WPS整体的AI用户数在四五千万左右。三种C端会员中,目前超级会员用户最多,其次是大会员,AI会员最少。主要是增值权益的设计上,AI会员功能有限,而大会员包含AI会员能力的同时,还有传统功能,订阅价格只贵了100元左右。
从定价策略上看,AI会员更像是一个定价“陪跑”,用来凸显大会员的价值优势。
换言之,真正单独为AI买单的用户并不多。WPS并没有把AI当作核心付费产品,而是作为会员体系中的增值能力,用来提高整体订阅率与续费意愿。因此在付费标准上,金山办公全球都采用包月定价模式,而非Agent办公软件常用的token模式付费。
在业内人士看来,目前WPS的AI主要应用在文本编辑修改这种对token消耗量有限的调用上,比Agent办公软件的一句话生成的token消耗量更低,采用普通用户更熟悉的包月付费更合适。
在AI功能方面,目前WPS文生视频功能不多,可能后续会有少量视频存储、简单剪辑功能。比如PPT转视频的功能后续可能会上线。
拥有6.47亿月活的金山办公正试图让AI真正融入用户现有的工作流程,而非创造全新的使用习惯。这也让WPS的AI路线与不少ai办公软件形成差异,后者往往试图用AI重构使用路径。
在金山办公总裁助理看来,“用户要的不是炫酷,而是有用。”这套逻辑下,WPS不是要重建用户的工作方式,而是让AI成为用户熟悉流程中的新手段。
相比从头重写工作流的AI办公新秀,WPS这种老编辑式的AI进化,也让WPS在这轮AI办公重构中显得特别。
01 千问们盯上Office三件套
不到30天时间里,阿里旗下两款To C AI应用接连出手:
先是11月底,深度融合千问AI助手的夸克浏览器迎来升级。发布六大千问AI套件。
虽然对准Chrome,但是基于屏幕共享功能,夸克可以和WPS等多种办公软件联动,帮助用户写Word文档、做Excel表。甚至夸克浏览器自己也可以做表格、生成PPT,或者提取一个word文档。
接着12月初,阿里的另一个AI产品千问继续升级。继上线一周下载量迅速突破1000万次后,这一次将功能瞄准office三件套。
12月4日,推出面向办公与协作场景的全新能力。此次更新将文档生成、智能排版、在线编辑、多格式转换等整合为一站式操作。同时,全新PPT生成能力上线,千问可基于图片、文档、语音等多种输入内容精准提炼、智能匹配模板。
上述能力同时向所有用户免费开放。

相比夸克,千问这次的升级直指office三件套。千问产品经理书瑶对外透露“千问的办事能力在进一步增强。我们希望千问不仅能激发用户产生想法,更能为用户交付完整文档。”将Office能力融入到对话中,让AI助手从生成内容进化到完成任务。
能干活才是原生AI应用解决粘性的关键。“某些应用打开率偏低,回到本质上来说,它跟需求本身的频率、频繁程度和它的朴素程度,以及刚性需求的重要程度是强相关的。”书瑶表示。
在他看来:“千问上线办公能力,核心就是希望解决真实、朴素但每天必要的高频需求。从结果上来看能保证打开率,因为这是用户自然需求的反映。”
值得注意的是,从阿里巴巴管理层到产品层面,都在尝试确立在AI时代的新标准。阿里巴巴集团联合创始人、董事长蔡崇信最新一次在香港大学的演讲中,尝试提出阿里巴巴在AI时代的竞赛规则。
“美国人定义的AI竞赛规则是错的。美国人怎么算谁赢?看谁的大语言模型更强。今天是OpenAI领先,明天是Anthropic,后天可能是别人。”蔡崇信说,这个计分方式本身就有问题。“真正的赢家不是谁有最好的模型,而是谁用得最好。”

不止是阿里,在追求办事能力的AI竞争定义下,办公三件套也成为大模型企业、初创AI企业的首选。
在阿里之前,昆仑万维发布天工超级智能体,打出“AI版Office”的旗号,其内置的专家智能体可以一键生成专业的文档、PPT和表格。
大模型企业瞄准office全家桶之外,更多的初创企业,选择更聚焦的AI办公细分场景。
以最为激烈的PPT领域为例,海外跑出了年收入过亿美元的Gamma验证了AI办公的商业闭环,国内的AiPPT产品也用20个月拿到2000万用户。其中超过60%的流量来自Kimi、智谱等大模型入口。
这些数据揭示了一个趋势:办公软件看似是红海,但AI正在让office三件套都有可能成为独立战场。
文档撰写、表格处理、PPT展示,这些原本传统办公软件体系内的功能,如今在AI能力的解耦下,被外包给垂类应用。每一个场景,都有可能诞生新的估值30亿美金级的独角兽。
AI办公初创企业,通过绑定AI代际红利,完成对传统办公工具的侧翼包抄。当AI办公工具开始从传统办公软件中分流时,以微软和WPS为代表的传统办公软件巨头必须回答,什么才是办公软件的护城河。
02 不同于微软的AI路径
微软是AI时代最早起飞的玩家。
投资OpenAI,让它在大模型底层占据了稀缺资源位;Copilot之后,尽管没有成为AI办公的样板工程。但从业务结构看,微软的增长主引擎已不是Office,而是Azure和Copilot背后的AI基础设施。
Office更多承担的是入口和生态角色。相比之下,金山办公的基本盘要纯粹得多。在一次媒体采访中,金山办公副总裁田然被问到WPS是否会成为AI时代的“超级入口”。
他的回答很清醒:“我不觉得WPS是超级入口,如果真成了,那这个世界该多可悲啊。未来有眼镜、耳机、音箱等多种入口,但Office是每个智能体都该具备的能力。”
不争“超级入口”的WPS,想成为所有AI助理的“必备模块”,构建标准能力,成为每个AI智能体生成文档时必须调用的那一层。
这也是WPS与微软的差异:微软用Copilot重构Office体验,但最终目标是绑定Azure的企业云端。WPS用灵犀重构办公交互,但核心是守住格式、接口、兼容性这套文档基建。
7月份的WAIC现场,WPS灵犀3.0发布会后的一场群访中,谈及AI市场中的优势,WPS相关负责人透露:多家专注于PPT生成的AI初创企业,也在主动寻求和金山办公合作,想要解决生成内容和真实Office环境深度兼容的问题。

因为目前市场上所谓的一键生成PPT,本质上都是生成一个看起来像的PPT,实质是HTML格式或者图片格式。想要保证在用户熟悉的编辑环境中无缝二次编辑,跨设备演示,异常艰难。
在金山办公PPT产品负责人陆炜俊看来,虽然市场上很多AIPPT生成工具,但是效果完全取决于大模型,没办法做二次的变更了。让AI能够精准理解用户的实时需求,并根据用户的指令快速调整内容,是2025年AI办公行业亟待解决的核心痛点。
因此,WPS判断AI办公真正的壁垒,恰恰在于做完之后能不能修改、调整、编辑。灵犀产品的核心思路不是一句话生成,而是类似AI时代的编辑模式“边生成、边修改”。
例如在WPS的AIPPT中,用户可以通过自然语言实时调整内容结构“帮我把第二页扩展三条要点”“把这一页版式换成深色系”“加一张财报图表”,灵犀可以立即理解并执行,且整个修改过程发生在熟悉的PPT编辑环境中。
这不是prompt-to-image的AI,而是prompt-to-slide的持续对话的老编辑模式。
灵犀能够做到“边聊边改”,依赖的是WPS对Office格式的深度积累。
金山办公在过去30年里积累了对Office文档的“增删改查能力”,不仅能精准读取格式信息,还能将其转译为大模型能理解的“中间层文件”。这是PPT能被AI读懂、改写、再生成的根本前提。
与之对照的是,大多数AI初创工具,在做格式转写时只能提取文本,再交给模型生成视觉稿,缺乏格式积累。在正式办公场景中,PPT与Word文档的格式要求极高,很多AI工具生成的内容即便内容不错,也无法落地到标准场合使用。
03 AI办公软件的终局是什么?
过去三年,AI办公经历了三个阶段:
2023年的插件增强阶段:微软Copilot最早尝试嵌入AI能力于Office,但仅限于“语义增强”,办公逻辑未被重构。
2024年的轻量生成阶段:Manus、Genspark等AI平台支持一句话生成内容,但协作能力薄弱,编辑器体验不佳,难以进入工作流。
2025年的原生交付阶段:以千问、夸克为代表的AI助手,开始直接从语音/文档/图片输入生成结构化办公成果,实现任务闭环。
在第三个阶段,大模型企业也开始冲击AI办公的格式标准。比如千问除了让新增功能容易上手、内容更加专业,也在使用细节上进行了改进。
相比目前市面上大多数AI产品仍停留在只能生成文字阶段,文字生成后,用户往往需要将AI生成文字复制到其他Office软件中才能进行排版修改,体验受影响。千问目前可以做到生成即排版。
另外,千问的智能编辑器也支持更多精细化操作。用户可以对特定段落,要求千问进行润色、扩写或风格调整。
此前面对大模型的冲击,WPS选择的AI路线是一条务实的防御路径:不自研大模型,将AI内化,全力强化自身专业办公的地位。
在大模型能力层面,布局“多模型适配”机制,根据不同任务调用不同大模型,以平衡效果与成本。目前,金山办公接入了DeepSeek、MiniMax、智谱AI、文心一言、通义、商汤等多个主流大模型。
章庆元强调不会自研基础大模型,只做模型的应用。“我们自认不是模型厂商,而是应用厂商,但会自研一些小模型,用于垂直的应用场景。”这套早在2023年百模大战之时,金山办公就定下的策略,目前看来是正确的。
今年DeepSeek一出现,基础模型的调用成本下降。作为应用方的WPS,可以灵活选择最优模型。WPS的AI底层能力是开放的,但场景入口、内容交付、格式处理则牢牢掌握在自己手中。
千问与WPS的技术路径,看似方向不同,实则都在争夺最终交付权。
不同的是,以千问为代表的大模型厂商,从AI助手出发,试图走完“基础模型→内容生成-交付结果”的全流程。WPS则从文件标准与格式处理的末端出发,把AI深度绑定在文档入口、编辑流程和排版格式中,不做模型,但守住标准。
这使得WPS成为平台与模型厂商之间的中立连接器,在大模型快速平权的背景下,反而拥有更大的协同空间。
陆炜俊曾用一个比喻描述行业现状:“整个办公行业像在挖两条尚未贯通的隧道,一端是炫目的AI交互能力,一端是对办公规则的深刻理解,只有两端真正打通,才能解决根本问题。”
如今看来,WPS选择的方向,是占据那条“办公规则理解”的主隧道。而那条通往AI原生交互的隧道,则正由千问等大模型企业高速掘进。这种角色变化,也正在催化办公生态的一轮微妙重构。
五年前,当在线协作平台开始崛起,飞书、钉钉等新兴玩家在文档层并未自建底座,而是普遍选择与金山办公合作,接入其成熟的编辑与格式能力;如今,类似的合作结构是否会在AI办公场景中重演,也决定了WPS的编辑护城河深不深。


我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)