图像生成

雷达速递

FiT：一种全新的Transformer架构图像生成模型分辨率和高宽比不受限制

2024-02-21 13:05

灵活视觉变换器（FiT）是一种全新的Transformer架构图像生成模型，专门设计用于创造没有分辨率和宽高比限制的图像。相较于传统将图像视为固定分辨率网格的方法，FiT将图像视为一系列可变大小的图像块（Token）。这种..

阅读：40
时间：8个月前
分类：图像生成
点赞：0

下载次数破39万，CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

2024-11-07 12:09

VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能，还能..

阅读：10
时间：8天前
分类：视觉问答
点赞：0

0 今日
54121 总数
3040969 浏览

控制面板

您好,欢迎到访网站!

浏览排行

微信二维码