基于transformer的场景图生成
时间: 2023-06-06 22:06:55 浏览: 139
很高兴回答您的问题。场景图生成是指根据输入的文本描述生成对应的视觉场景图像。基于transformer的场景图生成已经有了一些成果,例如Text-to-Image Transformer (TIT)、Generative Scene Graph Network (SGN)等。这些模型利用transformer编码文本信息,并将其与视觉信息相结合,生成对应的场景图。这是一个非常有趣和有用的研究方向,引起了广泛的关注。
阅读全文