要点:PixArt-α是一款基于Transformer的文本到图像生成模型,具有竞争力的图像生成质量,且训练成本明显低于现有大规模文本到图像模型。PixArt-α采用了三项核心设计:训练策略分解,高效的T2I Transformer,以及使用..
华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型,该模型采用了 DiT 架构,可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha,PixArt-\Sigma 在图像保真度上有了明显的提升,并改善了与文本提示的一..