最近在研究 AI 图片生成,发现了个挺有意思的模型,顺手分享一下。 https://uni-1.me/
用过 Midjourney 和 Flux 的应该都知道,这类模型的通病是"听话"程度参差不齐——提示词写得很细,出来的图还是跑偏,空间关系错,多角色场景更是一塌糊涂。
最近试了个叫 Uni-1 的模型,底层逻辑和别的不太一样——它在生成之前会先做推理,把提示词拆解、分析空间约束、规划构图,然后再出图。实际体验下来,复杂场景的还原度确实比 Midjourney 强一截,多人物合照基本一次过。
另外支持上传最多 8 张参考图做身份锚定,风格迁移也比较稳,不会出那种"参考了但完全不像"的情况。支持 76+ 种风格,日系漫画、电影感、产品摄影都能跑。
生成前先推理——比单纯堆模型参数更有意思,感兴趣的可以看看。
1
liu731 PRO 感谢分享。测试了一下,严重怀疑是 FLUX-2 的底子魔改的。不过逻辑性确实强点~
|
2
alexwang0707 OP 非常感谢作者的分享,看完收获很多。
这里也分享一个最近一直在用的工具,Aggiii AI 。起初只是拿来生图,用着用着发现功能比我想象的丰富很多——Nano Banana Pro 现在免费开放,出图质量很稳,光影和细节都不像一般免费工具的水平。视频生成也在里面,不用跳到别的平台,背景替换、水印去除、图片扩展一套流程在一个地方搞定。 对于需要持续产出内容的人来说,这个组合确实省了不少时间和成本。感兴趣的可以看看 https://aggiii.com/ |