GraphMind:用“搭积木”的思路做的概念绘图神器

张开发
2026/4/15 2:00:41 15 分钟阅读

分享文章

GraphMind:用“搭积木”的思路做的概念绘图神器
分享一个特别有意思的脑洞最新打磨出的 SKILL——文本AI绘图引擎graph_mind。说起这个idea得把时间拨回2018年的夏天。当时我在中科院自动化所跟着余老师实习我们构造过一个“位置信息生成图片”的算法。时过境迁现在的 AI 绘图比如 Midjourney、DALL-E早就一飞冲天了全是直接把纯文字转为逼真的像素图片。但是我们真的每次都需要 AI 去“无中生有”算像素吗试想一下你只是想把一篇晦涩文献里的知识点或者备课时的一个复杂概念画成一张清晰的结构图。这时候让大模型去凭空生图不仅风格难控而且大材小用。于是我想到了一个“偷懒”但也极其聪明的解法回归计算机图形学和排版引擎的本质——组合Composition。 纯文本 AI 是怎么画图的整个思路就像搭积木积木块 你的图片素材库咱们在本地建个文件夹放一堆常用的 PNG 透明底图片比如素材_人1.png、素材_人2.png、素材_单位.png、素材_猫.png、素材_车.png……大脑 LLM大语言模型它负责理解你要讲解的概念并在脑海里画一张“排版图纸”。胶水 HTML/CSS用来把积木按图纸粘好。 具体怎么用这个 SKILL 的用法超级简单粗暴输入丢给 AI 一个待讲解的概念比如“TCP三次握手”、“量子坍缩”并告诉它你的 PNG 素材库在哪。输出AI 不直接画图而是生成一个HTML 静态网页文件在这个网页里AI 已经帮你把素材库里的猫猫、小人、车子调用了出来根据概念逻辑排好了版比如树状图、流程图、对比图还贴心地加上了文字标注。你只需要用浏览器打开这个 HTML咔嚓一截图一张完美的知识概念图就搞定了而且由于是 HTML你觉得哪里不合适直接用鼠标拖拽微调、双击改字完全是“活”的 为什么这个思路绝佳极低的 Tokens 消耗AI 只需要输出坐标和文本不需要生成庞大的图像数据。符合“空间换时间”的守恒定律我们用本地的存储空间素材库换取了 AI 极高的生成效率和极低的算力成本。高可控性出的图不再是盲盒你的素材长啥样出来的图就啥画风。下载地址:https://github.com/Luomin1993/graph_mind

更多文章