让AI像人类一样借助多模态线索定位感兴趣的物体,有新招了!来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下的指代分割),让AI..
2012年,计算机科学家吴恩达和Jeff Dean进行了一场试验。他们用1.6万个CPU、1000万张猫咪图片以及当时全球最大的深度学习网络,训练了3天,生成了世界上第一张AI猫脸图像。这是人们基于深度学习模型自动生成图片的开..