多图像场景也能用DPO方法来对齐了!由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。通过将单图像数据扩展至多图像数据,并设计序列、网格拼贴和..