如何在AI生成的图片上显示指定的文字？

目前很流行让ai形成文字图片，我也尝试过。

目前常用的稳定？扩散？然后呢。DALLE-2？我没有做过文字生成方面的培训，即使提出类似的要求，也很容易生成乱码或者扭曲的文字。但是使用图像编辑软件(比如Adobe？Photoshop，GIMP等。)，给生成的图片添加文字。打开AI生成的图片，在编辑模式下选择合适的工具(如文字工具)，设置字体、大小、颜色等参数，然后将指定的文字添加到图片中。这个问题可以有效避免，新手党也省去了急冲。

但也有很多人提出了类似的诉求，比如在品牌、衣服上印上特定的文字，或者做特定的纹身、水印等等，确实有现实意义。据说？谷歌？什么事？AI？会更好，还有呢？英伟达？开放？伊迪芙-我？已经有更多可用的结果。

我觉得总的思路是使用文本生成模型，把要显示的文本输入到模型中，然后生成相应的图像。有一些开源的文本生成模型(比如AttnGAN，StackGAN等。)可用于此任务。

比如网友晒的例子中，常见的普通文字可以直接用？穿着？答？t恤？阅读？“一些？话”？试着生成，但即使这样，也很难设置字体/字号/样式等。定向地。如果是的话？Logo还是纹身，用类似的东西比较好？PS？正片和底片叠加的方式可以是一体的

你在线吗？稳定？扩散？自动生成是最好的。如果集成不了，可以等大佬们直接做类似的插件功能。这种方法需要相关的算法和训练数据，机器学习技术可以帮助实现图文关联。

。其实现在游戏里也有很多类似的捏人方式。印象比较深的是银子的“忠”，其实就是一个画面的叠加，绑定人物造型。至于提到的用途？controlNet？是的，我最初以为我可能控制不了那么细致(也可能是我研究的还不够透彻……)。

目前？controlNet？模型描述提供的预处理模型和功能中最有前途的是什么？mlsd？但是那个东西主要是用来检测建筑物边缘的…我还是要试试。总之我的想法是，对于大老板或者模型建造者来说应该不难。我尝试加文字训练，但是中文可能不太好。

以后呢？问题？人多了可能会有更简单的模型或者插件来实现，所以现在找一些奇怪的技能有点要求太高了。