华为发布图像生成模型PixArt-\Sigma 可直出4K图像

2024-03-08 13:39

默认

摘要：华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型，该模型采用了 DiT 架构，可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha，PixArt-\Sigma 在图像保真度上有了明显的提升，并改善了与文本提示的一..

华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型，该模型采用了 DiT 架构，可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha，PixArt-\Sigma 在图像保真度上有了明显的提升，并改善了与文本提示的一致性。

项目地址:https://top.aibase.com/tool/pixart

PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练，它通过整合更高质量的数据，从较弱的基线逐步演变为较强的模型，这个过程被称为弱到强训练。

PixArt-\Sigma 的进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-\Sigma 结合了更高质量的图像数据，配对更精确和详细的图像标题，同时在 DiT 框架内提出了一个新的注意力模块，可以压缩键（Key）和值(Value)，显著提高效率，促进超高分辨率图像的生成。

由于这些改进，PixArt-\Sigma 以较小的模型规模（6亿参数）实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。此外，PixArt-\Sigma 能够生成4K 图像，为创建高分辨率海报和壁纸提供了支持，有效地增强了电影和游戏等行业中高质量视觉内容的制作。

更新于：8个月前

华为发布图像生成模型PixArt-\Sigma 可直出4K图像

最近发表

淘宝退货运费险在哪里查看？怎么理赔？

平价按摩仪风靡TikTok美区

如何在拼多多平台上有效获得首页流量，拼多多流量入口有哪些

小红书卖货平台佣金多少？卖货交多少保证金？

京东家电以旧换新详细过程是什么？以旧换新靠谱吗？

淘宝售后服务撤销后还能申请吗？期限多久？

双11大促Shopee跨境单量激增9倍

抖店开店运营方法有哪些？抖音运营工作内容

多多买菜怎么联系人工客服，如何申请平台介入退款

小米SU7 Ultra极速测试成绩出炉：达359.71km/h

相关文章