Black Forest Labs推出了Flux,一种开源的文本到图像生成模型,拥有120亿个参数,能够生成与Midjourney等模型相媲美的高质量视觉效果。Flux有三种变体,分别为开放源代码的Flux Dev、快速版本的Flux Schnell和闭源的Flux Pro。基准测试显示,Flux的图像合成质量超过了Midjourney v6.0和Dall-E 3等多种主流模型,使其成为开源图像生成器的有力竞争者。
关键点
- Flux是迄今为止最大的开源文本到图像生成模型,拥有120亿个参数。
- Flux提供三种版本:Flux Dev(开源)、Flux Schnell(快速版)和Flux Pro(闭源API版本)。
- 用户可以在Hugging Face上下载Flux模型,并在ComfyUI中使用新的本地工作流程。
- Flux在图像合成的基准测试中表现突出,超越了多种主流竞争模型。
- 尽管Flux提供了高质量的输出,但较大的模型大小限制了较低显卡用户的使用。
- Black Forest Labs与Fal AI合作,支持云端生成,用户可通过Replicate平台免费测试Flux。
- Flux Pro和Schnell提供的图像生成成本相对低于Midjourney和Ideogram等竞争对手。