豆包Vs即梦:多主体一致性图片,一次性生成成,超简单,谁更强?
文章标签:
织梦摄影百度网盘
我们做图片、做视频,很多时候都要求主和主体的一致性。最近,即梦推出了图片4.0,豆包推出了模型4.0,现在用同样的图片,同样的提示语,对比一下,哪个理解生成能力更强呢?
直入正题,先上3张参考图片。如下图所示:
在豆包,多主体一致性,怎么玩呢?
打开豆包,点击+号键。
顺次序,添加元帅,嫦娥,玉兔的图片。在输入框输入提示语:
图1为:元帅,图2为:嫦娥,图3为:玉兔,生成三张图片
1.元帅与嫦娥在夜月桂花树下见面。
2.嫦娥元帅玉兔在广寒宫打麻将。
3.玉兔在啃着红萝卜,元帅看盯着它看,嫦娥偷笑。
豆包生成的效果如下:
这次豆包生成效果还是可以的,如果觉得不满意,可以重新生成。
现在用即梦AI,看看怎么玩?
我们将输入参考图,输入同样的提示语。
打开即梦,点击想象, 点击图片生成,选图片4.0。
在号处,顺次序,添加元帅,嫦娥,玉兔的图片。在输入框输入提示语:
图1为:元帅,图2为:嫦娥,图3为:玉兔,生成三张图片
1.元帅与嫦娥在夜月桂花树下见面。
2.嫦娥元帅玉兔在广寒宫打麻将。
3.玉兔在啃着红萝卜,元帅看盯着它看,嫦娥偷笑。
生成的效果如下:
很多大模型也存在是主体失真的情况
模型对参考元素的理解与融合能力有限导致的。比如元帅的盔甲纹饰等,细节越精细,越容易失真。
目前,对于这种情况 ,我个人认为,还是无解。除了重新生成抽卡,别无他法,或自我妥协降低要求。
豆包与即梦谁更强 ?大家怎么看?
好吧。此文只做抛砖引玉,当然 我们可以对提示语更加详细的描述,可以添加更多的参考图,提示语中更多的角色指定,生成更多的相对应图片。
此文就写到这,相信大家一定会举一反三,做得更好, 希望下文再见!