如何在AI生成的图片上显示指定的文字?
目前常用的稳定?扩散?然后呢。DALLE-2?我没有做过文字生成方面的培训,即使提出类似的要求,也很容易生成乱码或者扭曲的文字。但是使用图像编辑软件(比如Adobe?Photoshop,GIMP等。),给生成的图片添加文字。打开AI生成的图片,在编辑模式下选择合适的工具(如文字工具),设置字体、大小、颜色等参数,然后将指定的文字添加到图片中。这个问题可以有效避免,新手党也省去了急冲。
但也有很多人提出了类似的诉求,比如在品牌、衣服上印上特定的文字,或者做特定的纹身、水印等等,确实有现实意义。据说?谷歌?什么事?AI?会更好,还有呢?英伟达?开放?伊迪芙-我?已经有更多可用的结果。
我觉得总的思路是使用文本生成模型,把要显示的文本输入到模型中,然后生成相应的图像。有一些开源的文本生成模型(比如AttnGAN,StackGAN等。)可用于此任务。
比如网友晒的例子中,常见的普通文字可以直接用?穿着?答?t恤?阅读?“一些?话”?试着生成,但即使这样,也很难设置字体/字号/样式等。定向地。如果是的话?Logo还是纹身,用类似的东西比较好?PS?正片和底片叠加的方式可以是一体的
你在线吗?稳定?扩散?自动生成是最好的。如果集成不了,可以等大佬们直接做类似的插件功能。这种方法需要相关的算法和训练数据,机器学习技术可以帮助实现图文关联。
。其实现在游戏里也有很多类似的捏人方式。印象比较深的是银子的“忠”,其实就是一个画面的叠加,绑定人物造型。至于提到的用途?controlNet?是的,我最初以为我可能控制不了那么细致(也可能是我研究的还不够透彻……)。
目前?controlNet?模型描述提供的预处理模型和功能中最有前途的是什么?mlsd?但是那个东西主要是用来检测建筑物边缘的…我还是要试试。总之我的想法是,对于大老板或者模型建造者来说应该不难。我尝试加文字训练,但是中文可能不太好。
以后呢?问题?人多了可能会有更简单的模型或者插件来实现,所以现在找一些奇怪的技能有点要求太高了。