垃圾内容不是配个精美图片就变成优质内容了
先考虑自己的动机,是真的在创造价值还是在往互联网上丢垃圾
用专门的文生图模型有💰成本问题,而我还处于赚 token 养🦞的阶段
本着能自给自足的原则,所以无法考虑那些高高在上的优质模型
所以我一直在探索完全零成本的生图方式
比如我之前推荐的微信输入法排版成图
可以在任何输入框内触发,把你输入的文字直接变成文字海报,直接下载->保存->上传
对于简单的场景来说已经够用了,能在封面传递主要信息就行。
这种方式主要问题在于还是要人去操作且模板不太固定,毕竟输入法没想到你要往这个方向上用
再个就是直接用公众号助手里的文字海报
有一些固定模板,能换颜色。缺点同样是需要人去操作且不能指定哪些文字高亮。
但是现在用openclaw,电脑屏幕从来不开(除了去抢救它)
所以,我直接问 Jinx:
我其实完全没想它会怎么做,也不知道能否实现
总之,我有需求,然后我问了
于是我在发现它能做这件事时,开始追问它实现细节。因为这是我的一个高频操作,每一篇文章、贴图都要用到配图功能。
结果它答复我的完全不在我的思路内,因为我不止一次解决过公众号排版问题、封面图如何在后台动态生成问题,脑子里存在依赖路径了,考虑的全是客户端还是服务端,服务端不能依赖DOM之类的。
此刻我才意识到,它真的拥有整个 Mac Mini !
这就相当于,领导给我提了个需求,让我去动态生成封面图,每天他要发文章时我都要给他配一张。于是我开始思考技术栈、环境、实现思路,然后编码、测试,给出demo。
而其实我应该直接打开Photoshop把字儿给他P一下就完了!😯
一个重复动作,是必须要做成SKILL的,我追问它的出发点也是如此,首先我知道我要做成SKILL,但我要知道更多细节才能把这个SKILL完善。
很快就实现了,但是边界问题它可能考虑的还不够,于是继续追问:
然后继续让它支持自定义字体,安装字体的方式就是直接把ttf文件在聊天里发给它,它自己就能保存和引入了。
然后有了一些效果之后,开始继续调试样式,调icon在图中的点缀。因为不可能全是字,没icon,那就有点丑。调的方式就是,发要求,再让它发图片给你看结果。
此时我既有点飘了,思路也有点不对,开始让它自己画图了
看到它这个图,直接给我气笑了。
我也理解了我离那些高高在上的优秀模型有着多么远的距离。
发现自己思路错了,还是太过于依赖原来的路径,开始转换思路。
在发现其实什么图都能用之后,我也发现了这个SKILL的潜质:
它不止能固定模板出图,还能把某个图片作为背景图/边框/点缀,这个图片完全可以是另一个SKILL使用一些便宜模型出的图,也可以是自己的常用的LOGO/吉祥物。
所以一张图,80%的固定内容是自己调好的排版和字号,支持动态替换文字。20%的部分可以交给大模型自由发挥,可以是花里胡哨的边框,也可以是某些有特色的背景或者指定区域显示图片。
那么这张图几乎是不用自己调试的,可以直接拿去用。
思路清晰之后,AI几乎是秒完成任务,最终优化到了这个效果:
功能看起来可以了,你不要以为就结束了
在任何一个SKILL完成后,你应该做的是/new: 开一个新的session,看它还能不能完成
因为有时候,不是这个SKILL完成度高,是刚才敲定的细节还在上下文里。
它没写进SKILL的话,开新的 session就完全没了刚才的上下文,有问题的话就会暴露出来了
最后直到完全没问题就可以了!全程仅靠聊天和自己的脑子!
最后,如果你还想知道自己的SKILL有什么安全问题,可以上传到 clawhub。
clawhub 就是 SKILL 的 Github
clawhub 会自动检测你的SKILL有没有任何隐患,你只需要把检测出的隐患复制出来再发给openclaw 让它自己去修复就好了。
先去询问自己的openclaw,SKILL是由哪些部分组成的,是如何被openclaw发现和调用的。
发现SKILL:重复需求或者被解决的问题都可以是SKILL
设计SKILL:靠编程解决问题的SKILL需要你的编程能力,靠文字描述解决问题的SKILL需要你的理解能力。
但没能力也能用,只是有能力会让它更好用。能力需要在平时学习和交流中积累。
我觉得编码类的SKILL,考验的设计能力本质上还是传统编码的设计或者说架构思维,所以古法编程没用了吗?我不这么认为,写过的代码都是有用的,它只是今天体现在了你的设计能力上。
优化SKILL:要注意边界问题,一个SKILL.md 如果自己读着都有问题,那LLM理解有偏差也很正常。
比如:这个SKILL依赖的环境是什么,使用者没有这个环境该怎么办?
这个SKILL支持用户给出的参数边界是什么?本来只在20字以内有效果,用户是百分百不看说明直接用的(这个只能怪LLM太傻),会直接给出200个字,再回来问作者你这效果怎么是这样的。
编排SKILL:SKILL之间可以相互配合,靠LLM的理解能力做到联动。比如我这个SKILL可以等待其他SKILL出图后再自己拿来用(但是我没实现,因为我不喜欢)
如果你看到了这里,就会发现,这个SKILL完全是我 "一时兴起",就创造出来了
如此低的创作成本也意味着在通用性上不会很好,所以你在用了我的或者别人的SKILL觉得不好用是非常正常的
也意味着安全性几乎毫无保证,只能靠 clawhub 的检测,而你从 Github 上直接下载的SKILL就很难说了,防人之心不可无啊
并且最重要的,别人的需求会一直变,不会考虑你的情况,发现自己的需求变了,随手就会把SKILL更新。
所以你需要创建自己的SKILL,从别人的基础上魔改也是非常好的。
这篇文章更多的是为了展示的我思路,而非向你推荐这个SKILL
SKILL的设计和编排还有诸多细节值得讨论
后续我也会分享更多在写作和编码上的SKILL案例
欢迎关注和私信进群交流 ~