事情的开始很简单。
有天我突然意识到:在做过的所有设计里,让自己看着最舒服的,其实是同一种感觉。温柔的、克制的、文字优先的、留白比填满更有力量的。
这不是某个设计系统教给我的,我也没学习过设计,是我自己内心审美的趋同。
先把这种感觉说清楚 #
我花了些时间和 AI 做多轮交互——不是让它帮我做设计,而是让它帮我剖析:我做过的这些东西,规律在哪里?边界在哪里?反复问,反复重来。最后沉淀出来的,是几个我自己真正认可的判断:
- 文字即界面 — 内容本身就是最好的设计,排版做好了,装饰是多余的
- 留白即设计 — 空白不是空缺,是呼吸感的来源
- 克制即力量 — 点睛之色不超过两处,少即是多
后来我把这套规范叫做文心,又基于文心设计了落地页、博客主题等——用同一套语言说话,放在一起不违和。
文心落地之后 #
但我又想让它动起来,能自己干活。这就引出了万形。
万形是我基于 OpenCode 搭的一套软 Harness——不是开发一个成品应用,而是把文心的设计规范写成足够精确的配置和约束,结合 Agent 开发与 SOP 工作流的定义,让 AI 在这个框架下自主生成设计。
我自己定义的软 Harness,就是不写一行代码,纯靠提示词、Agent 设计和 SOP 工作流,让 AI 按你想要的方式干活。当软 Harness 的产品成熟度足够高之后,再在代码层面引入硬约束——条件判断、流程控制、护栏逻辑——让 AI 碰到边界就硬停,也完全可以。这时候易用性会更好,整套系统也更可靠。
万种形态,同出一源。
目前万形覆盖 9 种输出形态:Web 页面、移动应用、品牌标识、印刷排版、演示文稿、文档站、海报封面、架构图表、研究报告。
在实际生产中,我用 DeepSeek 作为模型基座,尝试让万形跑了两轮。
第一轮:一次性生成九种形态的 Demo。OpenCode 跑了大约两个小时,成熟度大概 40%。粗糙,但有形,方向对。
第二轮:进行多层审计,包括基于 MCP 的视觉审计,联合审计。OpenCode 又跑了一个多小时,成熟度提到了 60%。
第三轮:加上我自己的直接反馈,成熟度 70% 以上。这速度是原来一个人的 10 倍都不为过。
最终成品可以在 https://zopiya.github.io/wanxing/ 浏览体验。有一说一,如果换用更好的模型基座,效率更快,成品更好。目前我认为 Gemini 效果比较好,但 DeepSeek 量大管饱。
万形仓库地址: https://github.com/zopiya/wanxing ,有兴趣的可以体验一下。
真正有意思的地方 #
到这里还没完。
我让栀子(OpenClow 的化身)学习了整套万形之后,把它接入了我的日常工作流。现在的日常是这样的:我拿出手机,在微信里找到栀子,告诉它我想做什么。栀子理解意图之后,调起 OpenCode 去跑万形的 Harness,全流程走通,产物直接部署到 Cloudflare。
整个过程极其流畅,几乎感觉不到我在用工具。更像是在和一个理解你审美的人说:帮我做个这个,然后它就去做了。
虽然 Harness 也许是目前最顺手的叫法,至少沟通起来门槛低。但这个名字可能过于技术,限制了它本来的想象空间。
不过有一件事倒是越来越确定:大家往往高估一个新事物在两三年内能改变什么。ChatGPT 出来的时候,DeepSeek 出来的时候,所有人都在学、都在讨论,同时也都在高估它短期内能带来的冲击。两三年过去,好像没那么颠覆。但如果低估它长远能改变什么,这个代价更大。
不知道这条路最终通向哪里。但我知道和栀子聊清楚,然后去睡觉——醒来之后东西就在那里,等你打磨成品——这件事放在三年前是不可能发生的。