要点:1. 近两年内,文本到图像(T2I)模型发展迅猛,产生了高质量、多样性和创造性的图像生成,但大多数模型难以与自然语言有效沟通,需要复杂的提示调整。2. 研究人员受到DALLE3的启发,提出了交互式文本到图像(iT..