面向图文游记写作的多模态学习研究

需积分: 9 0 下载量 102 浏览量 更新于2024-09-06 收藏 368KB PDF 举报
"论文研究-面向图文游记写作的多模态学习" 本文研究了面向图文游记写作的多模态学习,旨在解决图文游记写作的任务。本文提出了长记忆视觉故事模型,利用卷积神经网络(CNN)提取图像特征,接着利用文本特征提取模型(doc2vec)提取句子特征,并利用双向长短期记忆网络(BLSTM)学习图像特征到句子特征的模态转换关系。 本文模型在中文数据集CHANYOUJI与英文数据集SIND上均取得了优于传统模型的效果,并通过实例说明了长记忆视觉故事模型在时序记忆方面的优势。本文的研究结果对在线旅游网站图文游记业务的发展具有重要的意义。 人工智能是本文研究的核心技术之一,利用深度学习技术实现了多模态学习的突破。本文的研究结果对人工智能领域的发展也具有重要的影响。 深度学习是本文研究的基础技术之一,利用深度学习技术实现了图像特征的提取和文本特征的提取。深度学习技术的应用使得多模态学习的效果得到了大幅度的提高。 多模态学习是本文研究的核心技术之一,旨在解决图文游记写作的任务。多模态学习的应用使得图文游记写作的效果得到了大幅度的提高。 视觉故事是本文研究的核心技术之一,旨在解决图文游记写作的任务。视觉故事模型的应用使得图文游记写作的效果得到了大幅度的提高。 双向长短期记忆网络(BLSTM)是本文研究的核心技术之一,旨在学习图像特征到句子特征的模态转换关系。BLSTM的应用使得长记忆视觉故事模型在时序记忆方面的优势得到了体现。 卷积神经网络(CNN)是本文研究的核心技术之一,旨在提取图像特征。CNN的应用使得图像特征的提取效果得到了大幅度的提高。 文本特征提取模型(doc2vec)是本文研究的核心技术之一,旨在提取句子特征。doc2vec的应用使得句子特征的提取效果得到了大幅度的提高。 本文的研究结果对在线旅游网站图文游记业务的发展具有重要的意义,对人工智能领域的发展也具有重要的影响。