模仿是人类的天性。
用到做图当中也是。不会设计好的作品,就先模仿好的作品,不会写优质提示词,那就先模仿优质的提示词。
即梦3.0生图模型开放之后,我发现很多粉丝即使有一套好的提示词,仍然会遇到一个问题:不知道该让它生成什么,或者说不知道该如何表达给它让它生成想要的画面。
这该怎么办?
还是开头那句话——模仿是人类的天性。
现在只不过交给ai让它来模仿而已。
所以今天分享如何借助ai的视觉理解能力,帮助我们模仿生成图片,并且多张图片创意进行融合,实现新的创新,以及最后再把飞书多维表格结合进来,实现批量生产,妥妥的懒人法子!
所用工具:kimi智能助手或者gemini2.5pro,解决不了网络的朋友就用国内的kimi,今天的分享也会同样对比测试效果。
多图融合的提示词放在结尾。
01 直接识图生成新提示词
先试试上传一张图片,这种更多的就是一比一模仿这张图片,但是又不涉及到抄袭的问题,因为是重新生成的。
把多图融合的提示词全部丢给ai,然后上传你想让它模仿的图片,如下图:

我先上传了第一张原图:

得到提示词之后,复制到即梦ai官网,用即梦3.0生成效果。
然后可以分别看看gemini和kimi生成的效果:

毫不逊色于原图的。
再来一张原图:

再看即梦3.0中生成的对比效果:

再来一张字体设计的原图:

然后是即梦生成的效果:

这字体也很像啊。不得不说视觉识别也是很给力的,像这种不是正常的中文文字都识别出来了。
02 多图识别创意融合
多张图片丢进去融合可玩性就更大了,今天的测试我并没有指定让ai在每张图片当中参考什么内容,如果你有需要让ai特别参考某张图片的构图,配色还是氛围等的要求,可以单独对它提要求。
以下的测试都是ai随机融合图片生成的提示词。
比如第一组我上传了这么三张时尚感的图片:

可以看下gemini和kimi生成的效果:

测试到这里我发现没提任何要求的话,kimi生成的提示词偏向“组合”,就是三张图甭管有啥都凑一起,也就是上面右图的效果,你会觉得有点拥挤,把啥都识别放进去了。
gemini这里的优势就很明显了,是真正的“融合”,生成的新图独具一格。
再来测试一组,图片风格差异更大,可以说是跨界融合,三张原图如下:

生成的效果如下,就更有意思了,各张图的影子都能看到一些,gemini生成的还是效果更好一些。

最后再测试一组,三张原图如下:

生成的对比效果如下,我还把其中一张图直接用即梦ai生成了视频,效果也不错,文字也保留没有变形。


和ai对话的提示词如下,可以直接复制使用:
你是一个专门分析视觉艺术并为图像合成模型生成精确提示词的AI。请仔细检查上传的图片,重点关注以下方面:
艺术风格与媒介(例如:油画、水彩、3D渲染、照片)
艺术影响/流派(例如:印象派、赛博朋克、新艺术运动)
构图技巧(例如:三分法、引导线、荷兰角)
光照与氛围(例如:电影感光照、黄金时刻、忧郁的雾气)
色彩方案与理论(例如:类似色、高对比度、柔和色调)
主题内容与细节
文字元素:分析任何可见的文字,包括其内容、字体风格、在图像中的位置,并注意其语言。
将你的分析结果合成为高效、简洁的AI图像生成提示词。
对于单张图片: 捕捉其独特的视觉特征。如果原图包含文字,请考虑将其含义或风格改编成相关中文文字,并在新提示词中体现。
对于多张图片: 创造性地融合不同图片的显著特征。优先考虑有冲击力的组合。
关键要求: 你生成的提示词**必须**明确指示图像生成模型在最终图像中要**包含恰当的、自然融入场景或设计的【中文文字】**。如果输入图片中有文字,可将其含义/风格作为中文文字的灵感来源。如果输入图片中没有文字,则根据整体主题创意地添加合适的中文文字(例如:可以是一个标志、一个标题、一个图层叠加文字等)。在生成的提示词中,使用引号清晰地标示出具体的中文文字内容,例如:...墙上醒目地展示着中文文字“示例文字”...。
输出格式:
对于每一个生成的提示词,请同时提供英文版本和其准确的中文翻译,并严格按照以下格式清晰标注:
English Prompt: [这里是生成的英文提示词,包含添加具体中文文字的指令]
中文提示词: [这里是生成的中文翻译,包含添加具体中文文字的指令]
请严格按照此格式生成输出,在提示词内容前后不要添加任何额外的解释性文字。
结尾唠叨两句:创新也可以说是模仿叠加之后的另一种结果,把我们自己做图的目标结果确认清楚,然后找到参考图,提取关键信息,再融合生成,你就得到新作品了~
上一次分享的结合飞书多维表格批量生产提示词的文章可以看之前的分享。
以上所有用到的图片均来自网络,如有侵权,请联系删除~
更多融合效果展示:
