参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用

107 浏览量更新于2023-12-01 收藏 1.04MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

+v：mala2277获取更多论文基于表格或文本的Vaishali1Evangelos Kanoulas2Maarten de Rijke21阿姆斯特丹大学发现实验室2阿姆斯特丹大学诉pal，e.kanoulas，m.uva.nl摘要信息搜索问答系统的一个长期目标是在多模态上下文上进行推理，并为用户查询生成自然答案。如今，通过在特定模态（如非结构化文本或结构化表格）的QA数据上微调模型，理论密集型预训练语言模型适用于下游任务，如QA。为了避免训练这种内存消耗的模型，同时为每个模态使用统一的架构，参数高效的适配器在Transformer层之间添加和训练小的特定于任务的瓶颈层。在这项工作中，我们研究了参数高效的抽象QA编码器-解码器模型在结构化的表格数据和非结构化的文本数据，只使用1.5%的额外参数，为每一个模态。我们还对编码器和解码器模块中的适配器层进行了消融，以研究效率-性能权衡，并证明将额外的可训练参数减少到0.7%我们的模型在表格 QA 数据集（如Tablesum和FeTaQA）上的表现优于当前最先进的模型，并在文本 QA数据集（如NarrativeQA）上实现了可比较的性能，使用的可训练参数明显少于微调。1介绍不同背景下的信息搜索系统需要模型能力来推理非结构化和结构化数据，如自由形式的文本、表格和图像（Agrawal et al. ，2016; Vaku-lenkoet al. ，2019; Hudson and Manning，2019;Zhang et al. ，2020; Zhu等人，2021; Deldjoo etal. ，2021年）。如果部署为面向任务的会话代理，则这样的系统可能具有生成自然语言响应的附加要求（Wen et al. ，2015; CarnegieandOh ， 2000;Rambowetal.， 2001;Ratnaparkhi，2002）。开放域问答（QA）的最新工作主要通过微调来解决这些挑战自然答案LM头部文本适配器Nx编码器工作台适配器文本适配器解码器表适配器提问表问题文件图1：使用特定模态（表/文本）适配器进行抽象问题分类的基于不同模态（如表格和文本）的大规模预训练语言模型（Yin et al. ，2020; Herzig et al. ，2020 ， 2021; Katsis 等人， 2021; Nanet al. ，2021年）。然而，在特定输入类型上训练的每个模型与其他模态不兼容，并且需要模态特定的微调。例如，在表格式QA（Herzig et al. ，2020），通过训练附加位置嵌入（行和列标识符）来识别表格单元格属于哪一行和哪一列来学习表格这使得这种模态特定的模型与基于自由形式文本的模型不兼容多模态模型（Zhu etal. ，2021）可以通过连接文本上下文和扁平化的表来对表和文本两者进行推理，从而导致更长的输入序列并限制可以被编码的上下文的长度。为了应对这些挑战，我们研究了针对表格和文本的抽象QA的参数有效迁移学习。我们的动机是使用适配器层，在冻结的预训练Transformer层之间注入小瓶颈层，因为它们实现了与精细转换层相当的性能arXiv：2204.03357v1 [cs.CL] 2022年4+v：mala2277获取更多论文调整各种任务，如多语言翻译（Pfeiffer etal. ， 2020; Philip 等人， 2020; Guo et al. ，2020）、分类（Houlsby et al. ，2019a），文本到文本生成（Lin et al. ，2020）、对话状态跟踪中的域适应和响应生成（Hung et al. ，2021年）。适配器层的消融研究（Rucklé等人，，2020年）上的掩蔽语言模型，如BERT- base和RoBERTa在GLUE基准测试表明，删除开始适配器层导致性能下降最小。在单独的编码器和解码器模块上扩展适配器层烧蚀是重要的，因为层的顺序修剪的常规方法我们的工作探讨了在抽象QA的背景下，两个模块的适配器层的相互作用。Lin等人（2020）探索适配器瓶颈尺寸对各种语言生成任务的影响，这些任务超过了自回归模型，如GPT-2（Radford et al. ，2019）。他们不研究表格数据，也不消融适配器层，这对于理解顺序Transformer模块架构（如编码器-解码器）中单个适配器的影响至关重要。我们的分析是对（Lin et al. ，2020），因为我们消融适配器层以研究参数-性能权衡，而它们仅关注适配器瓶颈尺寸。此外，我们概括了文本到文本的设置，并探索从结构化或非结构化输入（如表格和文本）生成语言。这在下游数据的任务和结构我们提出了一个系统，名为 Partists ，Eefficient ， AbstractiveQ uestionA nswering（PeaQA），如图1所示，它使用共享的预训练语言模型和特定于模态的适配器层学习对非结构化和结构化输入进行推理。我们自动将层次表转换为常规表，以获得统一的表示，而不会破坏表单元格之间的关联。此外，我们扩展的研究消融适配器层的编码器和解码器模块。我们的主要贡献归纳如下：(1) 我们在多模态上下文上执行参数高效的抽象问题回答，每个模态仅使用额外的1.5%的可训练参数。我们的适配器调优模型通过以下方面优于现有的工作：在表格QA数据集上有很大的余量，在文本QA数据集上实现了相当的性能(2) 我们研究表格QA作为一种新的模态，它引入了大量的输入域转移到预先训练的语言模型。我们提出了一个两步的层次表到序列的转换，它产生了一个统一的表示，由一个单一的，共享的预训练的语言模型和模态特定的适配器层使用据我们所知，这是第一个以参数有效的方式探索表格QA问题回答的工作。(3) 我们烧蚀了编码器和解码器模块中的适配器层，以研究它们的影响，并表明可以消除编码器和解码器的起始层，而不会显着降低性能。我们还证明了最后的编码器适配器层是不可或缺的，并具有更大的贡献比解码器层在同一级别。2相关工作表格式问答。表格式QA系统旨在回答结构化表格中的问题，这些表格可以是规则的或分层的。分层表可以具有跨越多个行和列的标题单元格和主体单元格（Chenget al. ，2021年）。在大多数表格式QA系统中（Herziget al. ，2020; Zhu等人，2021; Katsis et al. ，2021），表的结构通过引入表特定的位置信息（诸如行id和列id）在大型语言模型的嵌入层中编码。，2021; Cheng et al. ，2021）提出了通过推理和聚合来自表格的不连续事实来生成自然答案的额外挑战。文本问答。文本上的问题回答测量系统理解用户问题和上下文段落中的自由形式文本并预测答案的能力。预测的答案本质上可以是提取的，其中系统识别上下文段落中的短文本跨度以回答用户查询（Lee et al. ，2016; Seo等人，2016; Rajpurkar等人。，2016; Pearce et al. ，2021），或者它可以是抽象的，其中需要生成自由形式的答案（Yin et al. ，2016; Mitra，2017; Bauer 等人， 2018; Reddy et al. ，2019）。迁移学习。迁移学习技术，如微调预训练模型，+v：mala2277获取更多论文流任务需要为每个新任务学习一组新参数为了避免这种记忆密集型迁移学习方法，已经提出了适配器作为适应新领域的参数有效方法（ Houlsby et al. ， 2019 b; Pfeiffer et al. ，2020）。适配器已经被扩展到各种生成任务中的语言生成，诸如翻译、摘要、多轮对话和面向任务的自然语言生成（Lin et al. ，2020）。我们的工作结合了上述所有方面，从表格和文本中生成抽象的答案，只有0。7%3模型我们专注于编码器-解码器模型的抽象问题回答的任务。我们使用BART（Lewis et al. ，2019）编码器-解码器架构，其包括双向编码器和自回归解码器。输入序列由问题、上下文标题和上下文序列组成，上下文序列之前有指示每个子序列开始的提示形式上，输入序列表示为question>qq1. . . qm t1t2.. . tp<上下文> c0c1。. . Cn，其中Qi是第i个问题令牌，Tj是第j个标题令牌，以及Ck是第k个上下文令牌。上下文可以是文本段落或展开的表格。预训练的BART模型的参数在训练期间被冻结添加到模型中的特定于模态的适配器层在表格上下文或文本上下文上进行训练，以生成自然的答案。4语篇提问为了研究多模态抽象问答系统，我们首先将自由形式的文本作为系统的上下文我们在Narra-t iv eQA数据集上针对文本上下文训练适配器层（ K o cKomiskovskiyetal. ， 2018 ）。 NarrativeQA是基于故事的复杂抽象问题回答该数据集在训练集中包含32，747个样本，在验证集中包含3，461个样本，在测试集中包含10，557个对于我们的任务，我们选择了输入上下文段落作为每个样本的人工注释摘要，这是故事的维基百科页面摘要模型的输入是每篇文章的问题、标题和摘要，目标是抽象的答案。5表格式提问我们研究了表格QA作为一种新的模式，它引入了大量的输入域转移到预先训练的语言模型。表格在其表示中强制执行结构为了通过使用统一的预训练语言模型来实现参数效率的目标，我们只训练表特定的然而，这需要表格和文本的统一输入表示另外一个挑战是在不同的表类型（常规的、分层的）之间保持一致性。对于我们的任务，我们探索2个表格QA数据集，即 Tablesum （ Zhang et al. ， 2020 ）和FeTaQA（Nan et al. ，2021年）。Tablesum由200个独特的维基百科表格组成，其中问题和摘要人工注释答案; 40%的样本是关于分层表的问题，但是它们发布的数据中的表在分层单元中缺少信息，并且它们的工作不处理分层结构。我们通过从相应的维基百科页面中提取wikitables来解决这个问题，并发布一个干净版本的数据集。1FeTaQA（Nan et al. ，2021）是一个更大的抽象表格QA数据集，由超过10，330个常规表格的问题和自由形式的答案的数据集由7，326个训练样本验证集中为1，001，测试集。FeTaQA由人工注释的答案组成，其中包含涉及实体和关系的解释。5.1表格表示对于我们的工作，我们选择在两个步骤中统一表示所有表：（1）将层次表转换为常规表;(2) 将常规表线性化为可以用语言模型编码的扁平序列。线性化分层表格标题。分层表格标题通过以下过程线性化为单行标题跨多列的标题单元格被复制并拆分为多个单元格。接下来，将此标题所跨越的单元格值对所有标题行重复此过程会将分层标题转换为顺序1清理后的数据和代码可以在github.com/kolk/Pea-QA上找到+v：mala2277获取更多论文e（f）1a（d）<d：>−一BCDeFG我123J45HK6L78910a（d）a（e）Bc（f）g（i）g（j）11231145h（k）1146h78910(a) 表示为常规表的多跨度表。a（d）Be（f）g1213B2<d：>g（h）a（d）1B3(b) 将常规表线性化为一系列键：值对。图2：表格表示。一个.我们在图2a中描述了这个过程，它产生了线性报头a（d），a（d），b，e（f）。线性化表体。多跨度表体单元格的解析方式与表头不同每个表体单元格都与一个或多个标题单元格一起复制，跨多行的单元格将与所有跨行的单元格一起复制。这一过程导致了一个经常性的数据集。在Tablesum数据集上，我们遵循原始工作中描述的5重交叉验证来评估我们的模型。在FeTaQA和Narra- tiveQA上，我们利用测试分割来评估我们的模型。我们在每个数据集上训练模型 15 个时期，并在 Rouge-2 ，Rouge-L和sacreBLEU指标上进行评估。6.2适配器调谐我们执行适配器调整作为一个参数有效的替代方案，以适应BART-大模型的抽象问题回答任务在不同的模态。我们首先冻结预训练的BART 大模型的所有层，该模型是在原始BART 论文中提到的文本重建上训练的（Lewis et al. ，2019）。我们从Houlsby适配器配置中添加瓶颈适配器层（Houlsby et al. ，2019 a），这些训练适应下游抽象问题回答任务，也适应特定于表.我们以行为主的形式扁平化常规表，按顺序连接行。每一行都是一个（键，值）对序列，其中键是列标题，值是该列的单元格值，如图2b所示。6实验装置我们试图通过实验回答以下研究问题：（RQ1）在多模态输入的情况下，适配器调整(RQ2)编码器和解码器上的所有适配器层是否对任务/模态的性能贡献相同？6.1微调我们的实验都是在大变量的BART模型上进行的。我们在3个数据集上微调BART-大型模型，因为最先进的微调模型针对不同的数据集利用不同的架构，使得与适配器调优的比较我们将3个数据集上的微调BART模型作为基线。我们从{8e−4，6e−4，3e−4，1e−4，5e−5，4e5，3e−5，2e−5，1e−5}中扫描学习率，并为每个数据集选择最佳执行学习率。我们在Tablesum上选择4e−5进行微调，在Fe-TaQA数据集上选择8e−4，在NarrativeQA上选择2e−5我们使用批量大小4和梯度累积8来模拟有效批量大小32。表格QA数据集的最大靶序列长度设置为200，文本QA数据集的最大靶序列长度设置为100把上下文。每个适配器层具有64的瓶颈嵌入尺寸。如第6.1节所述，我们扫描学习率并为每个数据集选择性能最佳的学习率。我们选择6e−4作为表格式QA数据集Tablesum和FeTaQA，并选择1e−1来训练文本QA数据集NarrativeQA。我们使用相同的批次大小和最大靶序列长度作为微调以进行有效的比较。超参数的总结见表1。数据集参数ATuneFTune所有调度器线性线性批量3232种子66最大历元1515表和学习率6e-44e-5输入长度200200学习率6e-48e-4FeTaQA输入长度100100NarrativeQA学习率1e-42e-5输入长度5050表1：用于训练的超参数。ATune表示适配器调整，FTune表示微调，All表示所有3个数据集。6.3消融研究：适配器修剪适配器层修剪已经在GLUE基准上进行了探索（Rucklé et al. ，2020年），其中+v：mala2277获取更多论文数据集模型训练Rouge-1 Rouge-2 Rouge-L BLEUGPT2微调0. 2720. 0730. 2005. 35（Nishida et al. ，2019年）表2：结果：在Tablesum、FeTaQA和NarrativeQA数据集上获得的评分演示了从BERT-base和RoBERTa模型的开头我们扩展适配器层烧蚀的编码器-解码器架构，并假设这种现象应观察到的编码器和解码器模块。然而，编码器和解码器中的适配器层如何彼此交互并对性能做出贡献是不平凡的。既往研究（Rucklé et al. ，2020）在适配器消除上修剪掩码语言模型中的连续适配器层。该方法不直接扩展到编码器-解码器的顺序模块，其中模块内适配器不仅有助于它们各自的编码和解码目标，而且有助于模块间交互和性能。为了测量不同模块中适配器层的影响，我们在编码器和解码器中执行适配器消融。首先，我们从编码器和解码器模块中统一删除适配器层，从两个模块的开始层开始，最后删除所有层。这导致12个实验，对应于消除12个编码器和12个解码器适配器层。为了研究不同层次的模块间适配器之间的相互作用，我们从编码器和解码器的最后6个层次进行了36个不同配置的适配器消除实验。我们在第7.3节中分析了每种配置的性能。7结果我们比较了我们的基线微调模型的结果与最先进的微调模型，在第7.1节中。我们解决（RQ1）“在多模态输入的情况下，适配器调整与微调相比如何执行？”节中7.2和（RQ 2）“编码器和解码器上的所有适配器层是否对任务/模态的性能都有同等贡献？”在7.3。7.1微调模型我们研究了我们的基线微调模型的结果实验结果示于表2中。我们观察到，对于Tablesum数据集，我们的微调模型在Rouge-1上的表现优于最先进的 T5 模型 3 。 8% ，胭脂 -2 乘 4 。Rouge-L评分降低4%。这可以归因于在数据集的干净版本上微调我们的模型我们的微调模型在Fe-TaQA数据集上执行最先进的T5-大，即0。2%的胭脂-1，0。Rouge-2高出01%，0.Rouge-L高出04%。我们对NarrativeQA的微调结果低于使用复杂推理架构训练的最先进模型。这项工作的重点主要是比较微调和适配器调优，因此我们离开明确的推理作为未来工作的一部分。7.2适配器调谐型号我们通过比较适配器调整模型与我们的基线微调模型的性能来解决（ RQ 1 ）。对于Tablesum，如表2所示，微调（基线）的性能略优于适配器调优，Rouge-1和0高7%。Rouge-L 评分高 4% ，而 Rouge-2 评分相同。对于FeTaQA，adapter-tune显示了更大的TablesumT50。3620。1430。27610.43（Zhang et al. ，2020年）我们的（Pea-QA）微调（基线）0.4000.1860.316第六章30适配器调谐0。3930.1860。312第六章75T5-小型0。5500。3300。47021岁60FeTaQAT5基础微调0。6100。3900。51028岁14（Nan et al. ，2021年）T5-大号0。6300。4140。53030. 54我们的（Pea-QA）微调（基线）0。6320。4150。53430. 81+v：mala2277获取更多论文问：Akhila Kishore的前两部电影是什么时候目标：akhila kishore在卡纳达语电影padhe padhe（2013）中首次亮相，并出现在kathaithiraikathai vasanam iyakkam（2014）中。表：Adaper-tune：akhila kishore在卡纳达语电影padhe padhe（2013）和kathai thiraikathai vasanamiyakkam（2014）中首次亮相。微调：kathai thiraikathai vasanam iyakkam（2014）和inimey ippadithaan（2015）是卡纳达语电影。问：谁是Aastik的主演？目标：aastik是一部1956年的印地语电影，由shahu modak，paro devi和meenakshi主演。表：adaper调：aastik是1956年宝莱坞电影主演沙湖莫达克。由s导演的《微调》。p. 卡拉问：雅库布导演的三部电影是什么，什么时候上映的目标：雅库布执导了三部电影：1937年的《萨加尔卡舍尔》，1939年的《乌斯基塔曼纳》，以及1949年的《爱叶》。表：改编曲：雅库布执导了三部电影：1937年的《萨加尔之狮》、1939年的《她最后的欲望》和1949年的《爱也》。由雅库布执导的《微调：表3：适配器调整优于微调的示例性能增益为1。Rouge-1、Rouge-L和Rouge-2的9%。1%的胭脂-2相比，微调。在表格式QA中，微调相对于适配器调整的微不足道的收益可以归因于灾难性的遗忘（French，1999;Kirkpatricket al. ，2017; Chen et al. ，2020），这是由下游表格数据格式的分布与预训练的原始文本数据格式的差异引起的为了进一步探索这种现象，我们分析了表3中FeTaQA数据集的示例，其中适配器调整优于微调。我们观察到，在第一个例子中，微调模型无法从列语义中消除表面形式的问题中命名实体Akhila Kishore的预期语义是Actor。虽然表面形式类似于列值Akhila，但预期的语义是列标题“角色”。微调模型错误地预测表格上下文的第二行和第三行作为信息的正确基础，我们观察到，微调模型还预测来自错误列Direc- tor的信息，而不是第二个例子中的Castadapter-tune正确识别列，但在预测中部分生成所需的信息.第三个例子描述了微调模型的非事实和非流畅预测我们在表4中演示了一个Tablesum的分层表的示例。该问题要求在表格单元格上进行聚合，并具有与之关联的各种类似摘要的目标。分层表格提到了EdShepherd3次，但实际出现次数为10次，从年膜作用语言2013帕迪帕迪Kanchana卡纳达2014Kathai Thiraikathai Vasanam IyakkamDaksha泰米尔2015伊巴迪塔安阿希拉泰米尔.........标题主任铸造.........阿斯蒂克S. P. 卡拉Shahu Modak，Paro Devi，Meenakshi，B.M. 普拉文？保罗？维亚斯阿拉姆·阿拉纳努拜·瓦基勒Daljeet Chitra Tiwari Niranjan Sharma Minu Mumtaz.年膜主任.........1937萨加尔狮子（Sagar Lion）Yakub.........1939Uski Tamanna（Her LastDesire）Yakub.........1949艾叶Yakub.........+v：mala2277获取更多论文问：埃德谢夫登有多少次被列为表演者？目标：• 埃德·谢林在记录2014年瑞典热门歌曲的表格中两次被列为表演者。其他英语音乐的顶级表演者包括布鲁斯·斯普林斯汀、山姆·史密斯和酷玩乐队，这意味着英语音乐在瑞典取得了巨大的成功。• 根据该表，在2014年，埃德·谢林只被列为表演者一次。这是他在2014年1月和2月发行的一首名为“我看到火”的歌曲表：Adaper-tune：我找到了2014年的一张桌子它显示了一周中的一周、歌曲名称、艺术家、歌曲名称、专辑名称和表演者。有11次，埃德谢林被列为表演者在一年。这首歌的名字是“木材”，这张专辑是真的。微调：我找到了一张2014年埃德·谢利的表格。他在2014年他第一次上榜是在2014年1月3日，歌曲“Timber”和最后一首2014年4月4日，《我看见火》。适配器调谐表4：来自Tablesum数据集的示例这两种模型都能生成很长的答案，已移除编码器解码器适配器已移除#可训练参数来自上下文表的信息然而，由于模型没有显式地处理细胞聚集，我们在两个适配器调整的模型和微调的模型。模特们发现Tablesum示例具有挑战性，即使生成的语言是流畅和可读的。对于文本QA，在NarrativeQA数据集上，适配器调优的性能与微调相当，其中适配器调优的模型达到0。降低8%胭脂-1，1. Rouge-2和1高8%。低5%的Rouge-L分数比微调。微调406，291，456（100%）我们的结论是，适配器调谐性能更好而不是针对域外表格数据进行微调，表5：编码器和解码器中的可训练参数。编码器适配器层从0x-y第3周至第9周、第31周和第42周至第43。我们的表格转换过程处理这个问题，以生成一个包含10个单元格的常规表格，其中包含- ingEdShepherd作为值。模型可以简单地聚合提及。如表4所示，在域名文本上的性能相当。7.3适配器层我们通过烧蚀编码器和解码器模块中的适配器层来研究（RQ 2）我们统一地从编码器和解码器中消除连续的适配器层，从两个模块中的第一层开始，最后删除所有层。这导致12个实验对应于12个en-––6，343，680（1.（56%）0–212–144，757，760（1.17%）0–412–163，700，480（0。91%）0–612–182，643，200（0。（65%）周日期歌曲标题表演者专辑标题表演者12014年1月3日“木材”Pitbull feat. ......这是什么？真Avicii22014年1月1032014年1月17日《我看见火》Ed Sheeran厚望布鲁斯42014年1月24日52014年1月31真Avicii62014年2月7日克里斯特·舍格伦桑格·西纳特拉克里斯特·舍格伦72014年2月1482014年2月21日真Avicii92014年2月28............31二〇一四年七月三十一日XEd Sheeran+v：mala2277获取更多论文至−−(a) FeTaQA Rouge-L评分（b）表格Rouge-L评分（c）叙述性QA Rouge-L评分(d)FeTaQAsacreBLEU评分（e）Tablesum sacreBLEU评分（f）NarrativeQA sacreBLEU评分图3：适配器层消融评分。X轴表示删除的编码器适配器层的范围，Y轴表示删除的解码器适配器层的范围x-y意味着从x到y的所有适配器层。那里显示了36种模型消融配置消融从0到6个编码器适配器层移除开始以及由左下单元（（0-6），（12-18））表示的12到18解码器适配器层移除增加了沿X轴的编码器适配器层和沿Y轴的解码器适配器层的删除图4：适配器层消融Rouge2 F评分。X轴描绘了逐渐删除的编码器适配器层（0每个（x-y）表示具有编码器层p的图5：适配器层消融Rouge-L评分。X轴描绘了删除的编码器适配器层（0-11）和解码器适配器层（12-23 逐渐地。每个（x-y）表示具有编码器层p的（俄、西）Q被删除并且解码器层R到S被删除。编码器和12个解码器适配器层。我们将编码器适配器层编号为0-11，将解码器适配器层编号为 12-23 。我们使用 Rouge-2 ， Rouge-L2 和sacreBLEU3评分来衡量模型的性能。F分数2https://pypi.org/project/rouge-score/3https://github.com/mjpost/sacreBLEU（俄、西）到Q被删除并且解码器层R到S被删除。对于每个数据集（NarrativeQA，Tablesum，FeTaQA），分别如图4，5和6所示。我们观察到，随着更多的适配器层被消除，所有数据集的性能都会下降。然而，性能下降是最小的，直到最后一个适配器层也被删除.拐点在数据集之间变化，但限于编码器和解码器的最后2层对于纳拉-+v：mala2277获取更多论文−（俄、西）图6：适配器层消融sacreBLEU F评分。X轴描绘了逐渐删除的编码器适配器层（0-11）和解码器适配器层（12-23）。每个（x-y）表示删除了编码器层p到q和解码器层r到s的F分数。tiveQA数据集，这一点是当所有层，直到倒数第二个适配器层从编码器和解码器被删除。对于FeTaQA和Tablesum数据集，只有当最后的编码器和解码器层被删除时，性能才会急剧下降为了分析编解码器的第i层适配器对性能的贡献. .、（0. . ，（12 这导致了36个配置-其中构型（p-q移除从第p层到第q层的所有编码器适配器和从第r层到第s层的所有解码器适配器。结果如图3所示。我们观察到，性能保持可比，因为我们逐步消除适配器层从编码器和解码器，直到最后一层。当我们移除朝向图3a、3b和3c中的RougeL分数以及图3d、3e和3f中的BLEU分数的右上角描绘的最后编码器和解码器适配器层时，性能急剧下降。这意味着最后的适配器层学习大部分域信息。我们还观察到最后的编码器和解码器层对性能的贡献不同删除最后一个编码器层（列0-11）导致所有解码器层的分数大幅下降。这表明最后一个编码器层是必不可少的。仅保留最后一个解码器适配器（行12我们还观察到，仅保留适配器的最后50%，来自编码器和解码器两者的层将参数效率增加0。7%的参数，如表5中所总结，而不会显著损害性能。8结论我们是第一个研究参数有效的迁移学习表和文本的抽象问题的回答使用适配器。我们证明了参数有效的适配器调整优于微调域外的表格数据，并取得了可比的结果域内的文本数据。我们提出了一种从层次表到规则表的转换，并进一步转换为与预训练模型兼容的序列形式。我们将现有的适配器层消融研究扩展到编码器-解码器设置，并证明来自编码器末端的适配器层与同一级别的解码器适配器层相比，可指示编码模态特定我们的研究结果是有用的探索QA模型的可扩展性在内存受限的情况下，具有可比的性能，同时跨模式使用轻量级适配器扩展我们的工作的局限性之一是，我们的模型没有显式地推理和聚合表单元格。这可能会导致在具有挑战性的Tablesum数据集上出现流畅但实际上不正确的答案。解决这一限制问题将留待今后工作。9确认我们要感谢爱思唯尔在整个项目中的支持和资助。这项工作也得到了NWO创新研究激励计划Vidi（016.Vidi.189.039），NWO智能文化- 大数据/数字人文（314-99-301），H2020-EU.3.4。 - 社会挑战-智能、绿色、综合交通（814961）。所有内容都代表作者的意见，不一定得到各自雇主和/或赞助商的认可或认可+v：mala2277获取更多论文引用艾西瓦亚·阿格拉瓦尔，陆佳森，斯坦尼斯瓦夫·安托尔，马·米切尔，C.劳伦斯·齐特尼克，德鲁夫·巴特拉，和德维·帕里克。2016. VQA：视觉问题回答。arXiv预印本arXiv：1505.00468。Lisa Bauer，Yicheng Wang，and Mohit Bansal. 2018.生成式多跳问题回答任务的常识在EMNLP。作者：Alice H.哦2000.口语对话系统的随机语言生成在ANLP/NAACL 2000年会议记录中。《对话系统》，第27-32页。陈三元、侯玉泰、崔一鸣、车万象、刘婷、余翔战。2020年。回忆和学习：微调深度预训练的语言模型，减少遗忘。在2020年自然语言处理经验方法会议（EMNLP）中，第7870计算语言学协会.Zhujun Cheng，Haoyu Dong，Zhiruo Wang，RanJia，Jiaqi Guo，Yan Gao，Shi Han，Jian-GuangLou，and Dongmei Zhang. 2021. Hitab：用于问答和自然语言生成的分层表数据集。arXiv预印本arXiv：2108.06712。作者声明：John R.崔帕斯，还有哈米德·扎曼尼.2021年多模态会话信息搜索。在SIGIRACM。Robert M.法语1999. 连接主义网络中的灾难性遗忘。Trends in Cognitive Sciences，3（4）：128Junliang Guo ， Zhirui Zhang ， Linli Xu ， Hao-RanWei，Boxing Chen，and Enhong Chen. 2020. 用适配器。神经信息处理系统进展，第33卷，第10843-10854页。Curran Associates，Inc.JonathanHerzig ， ThomasMüller ， SyrineKrichene，and Julian Eisenschlos.2021. 开放领域的问题通过密集检索表。计算语言学协会北美分会2021年会议论文集：人类语言技术。Jonathan Herzig，Pawel Krzysztof Nowak，ThomasMüller ， FrancescoPiccinno ， andJulianEisenschlos. 2020. TaPas：通过预训练进行弱监督表解析。在计算语言学协会第58届年会的会议记录中，第4320-4333页，在线。计算语言学协会。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentinDeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly.2019年a。NLP的参数有效迁移学习。第36届国际机器学习会议论文集，机器学习研究论文集第97卷，第2790-2799页。PMLR。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentindeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly. 2019年b. NLP的参数有效迁移学习。 arXiv 预印本 arXiv ：1902.00751。德鲁·A Hudson和Christopher D.曼宁2019. GQA：一个用于真实世界视觉推理和组合问题回答的新数据集。arXiv预印本arXiv：1902.09506。洪家谦，安妮·劳舍尔，西蒙娜·保罗·庞泽托，戈兰·格拉瓦托。2021. DS-TOD：面向任务对话的高效领域专门化。 arXiv 预印本 arXiv ：2110.08395。Yannis Katsis，Saneem Chemmengath，VishwajeetKumar， Samarth Bharadwaj ， Mustafa Canim ，Michael Glass，Alfio Gliozzo，Feifei Pan，Jay-deep Sen ， KarthikSankaranarayanan ， andSoumen Chakrabarti. 2021. AIT-QA：航空业复杂表格的问答数据集。 arXiv 预印本 arXiv ：2106.12944。JamesKirkpatrick ， RazvanPascanu ， NeilRabinowitz，JoelVeness，GuillaumeDesjardins，Andrei A. Rusu，Kieran Milan，JohnQuan ， Tiago Ramalho ， Agnieszka Grabska-Barwinska，Demis Hassabis，Claudia Clopath，Dharshan Kumaran，and Raia Hadsell. 2017.克服神经网络中的灾难性遗忘arXiv预印本arXiv：1612.00796。托马斯 ·K·o·c· 阿尼斯克， JonathanSchw arz ，PhilBlunsom， ChrisDyer ， KarlMoritzHermann，GáborMelis，andEdwardGrefenstette.2018. NarrativeQA阅读理解挑战。Transactions of the Association for ComputationalLinguistics，6：317-328.Shimi Salant，Tom Kwiatkowski，Ankur Parikh，Dipanjan Das，and Jonathan Berant. 2016.学习提取性问题回答的循环广度表征。arXiv预印本arXiv：1611.01436。Mike Lewis，Yinhan Liu，Naman戈亚尔，Mar-jan Ghazvininejad ， Abdelrahman Mohamed ，OmerLevy ， VesStoyanov ， andLukeZettlemoyer. 2019. Bart：用于自然语言生成、翻译和理解的去噪序列到序列预训练。林兆江，Andrea Madotto和Pascale Fung。2020. 通过参数有效的迁移学习探索通用生成语言模型。在计算语言学协会的调查结果：EMNLP 2020，第441-459页，在线。计算语言学协会.+v：mala2277获取更多论文Rajarshee Mitra 201</div> <div class="more_warp" data-v-03e86d15><div class="bottom_hover" data-v-03e86d15><p class="downText" data-v-03e86d15> 下载后可阅读完整内容，剩余1页未读，<a data-v-03e86d15>立即下载<i class="el-icon-arrow-down" style="margin-left: 4px" data-v-03e86d15></i></a></p></div></div></div></div> </div></div></div></div> <div class="space" data-v-1ad8b000></div></div>  <div id="recommend" type="recommend" class="nav-item nav-item-recommend"><div class="el-card is-never-shadow"><div class="el-card__body"><div class="recommend-list" data-v-6b3d4552><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://img-home.csdnimg.cn/images/20210720083512.png" alt="pdf" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="0" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fdownload.csdn.net%2Fdownload%2Fwenyusuran%2F84997249&spm=1003.2020.3001.6616.1" href="https://download.csdn.net/download/wenyusuran/84997249" title="1-3+中文大规模多模态预训练模型M6.pdf" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>1-3+中文大规模多模态预训练模型M6.pdf</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="0" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fdownload.csdn.net%2Fdownload%2Fwenyusuran%2F84997249&spm=1003.2020.3001.6616.1" href="https://download.csdn.net/download/wenyusuran/84997249" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>3. 位置编码：M6模型使用位置编码来捕获图像和文本中的位置信息。 M6模型预训练方法： M6模型使用多任务预训练方法，包括图像-文本生成、图像描述、文本分类等多种任务。预训练方法主要有以下几点： 1. 多任务...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://img-home.csdnimg.cn/images/20210720083736.png" alt="zip" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="1" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fdownload.csdn.net%2Fdownload%2Fweixin_66442839%2F89279693&spm=1003.2020.3001.6616.2" href="https://download.csdn.net/download/weixin_66442839/89279693" title="多模态大模型应用-本地化部署VQGAN+CLIP-不使用colab-附流程教程-优质大模型应用实战.zip" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态大模型应用-本地化部署VQGAN+CLIP-不使用colab-附流程教程-优质大模型应用实战.zip</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="1" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fdownload.csdn.net%2Fdownload%2Fweixin_66442839%2F89279693&spm=1003.2020.3001.6616.2" href="https://download.csdn.net/download/weixin_66442839/89279693" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>在当前的IT领域，多模态大模型的应用已经成为人工智能研究和开发的重要方向。VQGAN（Vector Quantized Generative Adversarial Networks）和CLIP（Contrastive Language-Image Pretraining）是两种在图像处理和自然...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="2" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F4830538317b64f1d9c3dd573d1f79b3a&spm=1003.2020.3001.6616.3" href="https://wenku.csdn.net/answer/4830538317b64f1d9c3dd573d1f79b3a" title="给我推荐20个比流行的多模态模型" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>给我推荐20个比流行的多模态模型</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="2" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F4830538317b64f1d9c3dd573d1f79b3a&spm=1003.2020.3001.6616.3" href="https://wenku.csdn.net/answer/4830538317b64f1d9c3dd573d1f79b3a" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>12. Multi-modal Variational Autoencoder：结合变分自编码器的多模态生成模型。 13. Bi-STMM：结合文本和图像信息的时空多模态建模模型。 14. Multi-model Deep Neural Networks：结合多个深度神经网络模型的多模态...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="3" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7efa3116043648d4b66c278a7f9f9542&spm=1003.2020.3001.6616.4" href="https://wenku.csdn.net/answer/7efa3116043648d4b66c278a7f9f9542" title="多模态信息表示的国内外研究现状" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态信息表示的国内外研究现状</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="3" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7efa3116043648d4b66c278a7f9f9542&spm=1003.2020.3001.6616.4" href="https://wenku.csdn.net/answer/7efa3116043648d4b66c278a7f9f9542" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>(2) 基于深度学习的方法：国内研究者也在多模态信息表示方面进行了大量的基于深度学习的研究，主要是使用编码器-解码器的方法。 (3) 基于知识图谱的方法：国内研究者还尝试将多模态信息表示与知识图谱相结合，从而...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="4" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F5b8324acd1b84084982d11d318942d5a&spm=1003.2020.3001.6616.5" href="https://wenku.csdn.net/answer/5b8324acd1b84084982d11d318942d5a" title="给我推荐20个多模态模型" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>给我推荐20个多模态模型</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="4" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F5b8324acd1b84084982d11d318942d5a&spm=1003.2020.3001.6616.5" href="https://wenku.csdn.net/answer/5b8324acd1b84084982d11d318942d5a" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>12. MARN：多模态对话系统模型，用于视觉问答和对话任务。 13. SCAN：一种用于图像和文本对齐的模型，可进行跨模态检索和检测。 14. HME-VR：一种用于多模态情感识别的模型，结合了语言和视觉特征。 15. VSE++：...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="5" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2Fcf1aae7c860e43f8b9d53e73613d3a5c&spm=1003.2020.3001.6616.6" href="https://wenku.csdn.net/answer/cf1aae7c860e43f8b9d53e73613d3a5c" title="在多模态领域，在模态缺失的情况下，将卷积网络与transformer串联使用作为自动编码器的编码器，有什么优势,请详细说明" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>在多模态领域，在模态缺失的情况下，将卷积网络与transformer串联使用作为自动编码器的编码器，有什么优势,请详细说明</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="5" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2Fcf1aae7c860e43f8b9d53e73613d3a5c&spm=1003.2020.3001.6616.6" href="https://wenku.csdn.net/answer/cf1aae7c860e43f8b9d53e73613d3a5c" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>综上所述，将卷积网络与transformer串联使用作为自动编码器的编码器，在多模态领域中可以充分利用卷积网络和transformer的优势，解决模态缺失的问题，提高模型的表达能力和泛化能力，更好地处理多模态输入数据。</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="6" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F4f93370cae9749739f93d29ba6c99591&spm=1003.2020.3001.6616.7" href="https://wenku.csdn.net/answer/4f93370cae9749739f93d29ba6c99591" title="VAE编码器和解码器如何创新进行时间序列异常检测" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>VAE编码器和解码器如何创新进行时间序列异常检测</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="6" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F4f93370cae9749739f93d29ba6c99591&spm=1003.2020.3001.6616.7" href="https://wenku.csdn.net/answer/4f93370cae9749739f93d29ba6c99591" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>3. 引入多模态信息：在编码器中引入多模态信息，即同时考虑多个时间序列数据的信息，可以帮助模型更好地理解数据之间的关系，从而提高异常检测的准确性。 4. 结合深度学习和传统方法：结合深度学习和传统的时间序列...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="7" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F4e9782235e61455ba8dabc603e6f546d&spm=1003.2020.3001.6616.8" href="https://wenku.csdn.net/answer/4e9782235e61455ba8dabc603e6f546d" title="大模型、小模型、多模态的关系" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>大模型、小模型、多模态的关系</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="7" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F4e9782235e61455ba8dabc603e6f546d&spm=1003.2020.3001.6616.8" href="https://wenku.csdn.net/answer/4e9782235e61455ba8dabc603e6f546d" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>此外，多模态还可以利用不同模态之间的关联性进行跨模态信息的传递和融合，从而进一步提升模型的性能。最后，大模型、小模型和多模态之间可以相互结合，从而实现更加灵活和高效的模型设计。例如，可以使用小模型对...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="8" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7x71ybxsop&spm=1003.2020.3001.6616.9" href="https://wenku.csdn.net/answer/7x71ybxsop" title="深度学习是大模型还是多模态" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>深度学习是大模型还是多模态</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="8" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7x71ybxsop&spm=1003.2020.3001.6616.9" href="https://wenku.csdn.net/answer/7x71ybxsop" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>深度学习系统可能同时具备大模型（通过深层架构和参数规模）和多模态（处理不同类型输入）的特点。它在很多领域，如计算机视觉、自然语言处理和语音识别中都有广泛应用，并且随着研究的发展，往往会融合更多的模态和...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="9" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F3wtfk5bejo&spm=1003.2020.3001.6616.10" href="https://wenku.csdn.net/answer/3wtfk5bejo" title="军事多模态认知大模型训练算法及模型研制" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>军事多模态认知大模型训练算法及模型研制</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="9" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F3wtfk5bejo&spm=1003.2020.3001.6616.10" href="https://wenku.csdn.net/answer/3wtfk5bejo" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>军事多模态认知大模型是一种结合了多种信息表达形式（如文本、图像、音频等）的高级人工智能系统，其训练算法旨在模拟人类军事决策过程中的多维度分析和理解能力。这种模型的研制通常涉及以下步骤和技术： 1. **...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="10" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F2cgiqfyaiw&spm=1003.2020.3001.6616.11" href="https://wenku.csdn.net/answer/2cgiqfyaiw" title="多模态大模型构建与应用技术路线图" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态大模型构建与应用技术路线图</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="10" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F2cgiqfyaiw&spm=1003.2020.3001.6616.11" href="https://wenku.csdn.net/answer/2cgiqfyaiw" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>6. 应用开发：基于训练好的模型开发实际应用，比如图像与文本的联合搜索、跨模态的信息检索、多模态对话系统等。 7. 模型迭代与更新：根据应用反馈和数据的变化不断迭代更新模型，以提高其鲁棒性和适应性。</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="11" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F6hqtzoikpi&spm=1003.2020.3001.6616.12" href="https://wenku.csdn.net/answer/6hqtzoikpi" title="多模态transformer" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态transformer</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="11" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F6hqtzoikpi&spm=1003.2020.3001.6616.12" href="https://wenku.csdn.net/answer/6hqtzoikpi" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>在多模态Transformer中，注意力机制被广泛应用于不同模态之间的信息交互。通过计算注意力权重，模型可以自动学习模态间的相关性，从而更好地整合不同模态的信息。多模态Transformer已经在许多应用领域取得了成功，...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="12" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2Fgp14e13o6g&spm=1003.2020.3001.6616.13" href="https://wenku.csdn.net/answer/gp14e13o6g" title="大模型和多模态模型的关系" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>大模型和多模态模型的关系</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="12" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2Fgp14e13o6g&spm=1003.2020.3001.6616.13" href="https://wenku.csdn.net/answer/gp14e13o6g" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>大模型和多模态模型在人工智能领域有着紧密的关系，但它们关注的方向稍有不同： 1. **大模型**通常指的是规模庞大的预训练神经网络模型，例如GPT系列、BERT等，它们拥有数万亿到几百亿个参数，经过大规模的数据训练...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="13" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F5d38badac57d4491a1f59ba3e3ad2fe0&spm=1003.2020.3001.6616.14" href="https://wenku.csdn.net/answer/5d38badac57d4491a1f59ba3e3ad2fe0" title="在多模态领域，由卷积网络和transformer组成的编码器，对于特征处理有什么优势？请详细说明" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>在多模态领域，由卷积网络和transformer组成的编码器，对于特征处理有什么优势？请详细说明</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="13" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F5d38badac57d4491a1f59ba3e3ad2fe0&spm=1003.2020.3001.6616.14" href="https://wenku.csdn.net/answer/5d38badac57d4491a1f59ba3e3ad2fe0" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>综上所述，由卷积网络和Transformer组成的编码器在多模态领域中具有明显的优势。卷积网络能够处理图像等数据的局部特征，参数共享和规模不变性等特点使得模型具有较强的泛化能力；而Transformer则通过自注意力机制...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="14" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F5f7mb9p22h&spm=1003.2020.3001.6616.15" href="https://wenku.csdn.net/answer/5f7mb9p22h" title="用clip模型进行多模态情感分析" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>用clip模型进行多模态情感分析</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="14" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F5f7mb9p22h&spm=1003.2020.3001.6616.15" href="https://wenku.csdn.net/answer/5f7mb9p22h" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>使用CLIP模型进行多模态情感分析的方法如下： 1. 收集多模态数据，包括图像、文本等；...在多模态情感分析中，我们可以使用CLIP模型将图像和文本编码为向量，然后将这些向量输入到情感分类器中进行分类。</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="15" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7tp2zw7sd7&spm=1003.2020.3001.6616.16" href="https://wenku.csdn.net/answer/7tp2zw7sd7" title="多模态大模型是如何克服跨模态间差异性的？在多模态任务中，如何评估模型性能以及优化模型效果？大型多模态模型在处理实时数据流时面临哪些挑战？" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态大模型是如何克服跨模态间差异性的？在多模态任务中，如何评估模型性能以及优化模型效果？大型多模态模型在处理实时数据流时面临哪些挑战？</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="15" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7tp2zw7sd7&spm=1003.2020.3001.6616.16" href="https://wenku.csdn.net/answer/7tp2zw7sd7" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>在多模态任务中，模型面临的最大挑战之一就是如何有效地将来自不同模态的数据（如文本、图像、音频等）转换为统一表示形式，以便进行有效的联合处理。这通常是通过以下几种策略实现的： 1. **嵌入空间统一**：首先...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="16" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F6wynddqgdp&spm=1003.2020.3001.6616.17" href="https://wenku.csdn.net/answer/6wynddqgdp" title="多模态大模型中，多模态主要指的是" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态大模型中，多模态主要指的是</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="16" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F6wynddqgdp&spm=1003.2020.3001.6616.17" href="https://wenku.csdn.net/answer/6wynddqgdp" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>在传统的单模态模型中，只能处理一种类型的数据，而多模态大模型可以同时处理多种类型的数据，从而更全面地理解和分析信息。多模态主要指的是模型能够同时处理多种类型的数据，并且能够将这些不同类型的数据进行...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="17" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F6d64f443717b4048b0b92b2d8e96adce&spm=1003.2020.3001.6616.18" href="https://wenku.csdn.net/answer/6d64f443717b4048b0b92b2d8e96adce" title="cross-transformer模型" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>cross-transformer模型</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="17" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F6d64f443717b4048b0b92b2d8e96adce&spm=1003.2020.3001.6616.18" href="https://wenku.csdn.net/answer/6d64f443717b4048b0b92b2d8e96adce" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>Cross-transformer模型的核心思想是在Transformer的编码器和解码器之间建立跨模态的交互模块，使得模型能够将不同模态的信息进行交互和融合。具体而言，它通过引入跨模态的注意力机制，将不同模态的信息交互起来，...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="18" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7rscoy8pam&spm=1003.2020.3001.6616.19" href="https://wenku.csdn.net/answer/7rscoy8pam" title="国内开源多模态大模型概述" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>国内开源多模态大模型概述</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="18" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F7rscoy8pam&spm=1003.2020.3001.6616.19" href="https://wenku.csdn.net/answer/7rscoy8pam" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>国内开源的多模态大模型通常是指结合了文本、图像、语音等多种模态的预训练模型，这类模型通过大量数据预训练，学习到跨模态的表示和关联能力，能够理解和生成多种类型的信息。比如，它们可以理解一张图片的描述，...</span></a></div></div></div><div class="flex mb-16 item" data-v-6b3d4552><div class="mr-16" data-v-6b3d4552><img width="48" height="48px" src="https://csdnimg.cn/download_wenku/file_type_ask_c1.png" class="bor-r" data-v-6b3d4552></div> <div class="flex-1" data-v-6b3d4552><div class="fs-md flex" data-v-6b3d4552><a index="19" target="_blank" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F1o38pgrzwo&spm=1003.2020.3001.6616.20" href="https://wenku.csdn.net/answer/1o38pgrzwo" title="多模态dbms学习多模态表示" class="flex-1" data-v-6b3d4552><h4 class="flex-1 line" data-v-6b3d4552>多模态dbms学习多模态表示</h4> </a></div> <div class="mt-4 pr-16" data-v-6b3d4552><a target="_blank" index="19" data-report-query="utm_medium=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&depth_1-utm_source=distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315%5Ev3%5Econtrol_v2&dest=https%3A%2F%2Fwenku.csdn.net%2Fanswer%2F1o38pgrzwo&spm=1003.2020.3001.6616.20" href="https://wenku.csdn.net/answer/1o38pgrzwo" class="line" style="color:#777888;" data-v-6b3d4552><span data-v-6b3d4552>在学习多模态表示的过程中，DBMS可以借鉴不同领域的相关研究成果和技术，如图像处理、音频分析和视频编码等。通过这些技术的应用，DBMS可以对多模态数据进行特征提取，提取出有用的信息和特征，以便更好地表示和处理...</span></a></div></div></div></div></div></div></div> <div class="space"></div> </div> </div> <div class="layout-right" data-v-1caecc57><div data-v-76a4b887 data-v-1caecc57><div class="file-owner-card" data-v-18de6965 data-v-76a4b887><div class="card-content" data-v-18de6965><div class="content-top" data-v-18de6965><div class="logo" style="cursor:pointer;" data-v-18de6965><img src="https://profile-avatar.csdnimg.cn/default.jpg!1" class="img-logo" data-v-18de6965> </div> <div class="detail" data-v-18de6965><div class="username" style="cursor:pointer;" data-v-18de6965>cpongm</div> <ul class="d-ib mt-4" data-v-18de6965><li class="fans-count d-ib mr-8" data-v-18de6965> 粉丝: 5 </li> <li class="d-ib" data-v-18de6965><span class="fans-count" data-v-18de6965>资源:</span> <a rel="nofollow" href="https://download.csdn.net/user/cpongm" target="_blank" class="highlight-font d-ib" data-v-18de6965>2万+</a></li></ul></div> <div class="ml-8" data-v-18de6965><button type="button" class="el-button el-button--default el-button--small" data-v-18de6965><span> 私信 </span></button></div></div></div></div>  <div class="upload-sidebar mt-10" data-v-d2529d5a data-v-76a4b887><div class="upload-button" data-v-d2529d5a><div class="btn" data-v-d2529d5a><i class="el-icon-plus" data-v-d2529d5a></i> 上传资源快速赚钱 </div></div> <div class="user-info" data-v-d2529d5a><ul data-v-d2529d5a><li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source.ac4c7e83.png" data-v-d2529d5a> <span data-v-d2529d5a>我的内容管理</span> <span class="tip" data-v-d2529d5a> 展开 <i class="el-icon-arrow-right" data-v-d2529d5a></i></span></li> <div class="ml-16" style="display:none;" data-v-d2529d5a data-v-d2529d5a><li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source.ac4c7e83.png" data-v-d2529d5a> <span data-v-d2529d5a> 我的资源</span> <span class="tip" data-v-d2529d5a> 快来上传第一个资源 <i class="el-icon-arrow-right" data-v-d2529d5a></i></span></li> <li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source-wallet.b4362fe7.png" data-v-d2529d5a> <span data-v-d2529d5a> 我的收益 </span> <div class="tip" data-v-d2529d5a><span data-v-d2529d5a>登录查看自己的收益</span> <i class="el-icon-arrow-right" data-v-d2529d5a></i></div></li> <li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source-points.06ca666d.png" data-v-d2529d5a> <span data-v-d2529d5a>我的积分</span> <span class="tip" data-v-d2529d5a> 登录查看自己的积分 <i class="el-icon-arrow-right" data-v-d2529d5a></i></span></li> <li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source-c.87c53263.png" data-v-d2529d5a> <span data-v-d2529d5a>我的C币</span> <span class="tip" data-v-d2529d5a> 登录后查看C币余额 </span> <i class="el-icon-arrow-right" data-v-d2529d5a></i></li> <li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source-collect.0655e61c.png" data-v-d2529d5a> <span data-v-d2529d5a> 我的收藏</span> <div class="tip" data-v-d2529d5a><i class="el-icon-arrow-right" data-v-d2529d5a></i></div></li> <li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source-download.f1f40a4f.png" data-v-d2529d5a> <span data-v-d2529d5a>我的下载 </span> <div class="tip" data-v-d2529d5a><i class="el-icon-arrow-right" data-v-d2529d5a></i></div></li> <li data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/source-help.7427e86d.png" data-v-d2529d5a> <span data-v-d2529d5a> 下载帮助 </span> <div class="tip" data-v-d2529d5a><i class="el-icon-arrow-right" data-v-d2529d5a></i></div></li></div></ul></div> <div class="user-tip" data-v-d2529d5a><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png" data-v-d2529d5a> <div class="el-carousel el-carousel--vertical" data-v-d2529d5a><div class="el-carousel__container"></div></div></div></div>  <div class="sticky-content" data-v-76a4b887><div class="latest-file-card mt-10" data-v-f7fbb29e data-v-76a4b887><h3 class="title" data-v-f7fbb29e>最新资源</h3> <ul data-v-f7fbb29e><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/b81tpbv0ce" target="_blank" class="title-new" data-v-f7fbb29e> OptiX传输试题与SDH基础知识 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/24tfp4tkjk" target="_blank" class="title-new" data-v-f7fbb29e> C++Builder函数详解与应用 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/8bov69qy5q" target="_blank" class="title-new" data-v-f7fbb29e> Linux shell (bash) 文件与字符串比较运算符详解 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/3kw9qaj4ug" target="_blank" class="title-new" data-v-f7fbb29e> Adam Gawne-Cain解读英文版WKT格式与常见投影标准 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/884fm7b98q" target="_blank" class="title-new" data-v-f7fbb29e> dos命令详解：基础操作与网络测试必备 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/2ujj5ahfjf" target="_blank" class="title-new" data-v-f7fbb29e> Windows 蓝屏代码解析与处理指南 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/4kch640iv3" target="_blank" class="title-new" data-v-f7fbb29e> PSoC CY8C24533在电动自行车控制器设计中的应用 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/53hftndee3" target="_blank" class="title-new" data-v-f7fbb29e> PHP整合FCKeditor网页编辑器教程 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/42j1ns9u8p" target="_blank" class="title-new" data-v-f7fbb29e> Java Swing计算器源码示例：初学者入门教程 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/4k1z13n8he" target="_blank" class="title-new" data-v-f7fbb29e> Eclipse平台上的可视化开发：使用VEP与SWT </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/7x5w0g1mrw" target="_blank" class="title-new" data-v-f7fbb29e> 软件工程CASE工具实践指南 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/7tsc3ca5h8" target="_blank" class="title-new" data-v-f7fbb29e> AIX LVM详解：网络存储架构与管理 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/88bwx13gu6" target="_blank" class="title-new" data-v-f7fbb29e> 递归算法解析：文件系统、XML与树图 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/2v02ojcwnr" target="_blank" class="title-new" data-v-f7fbb29e> 使用Struts2与MySQL构建Web登录验证教程 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/50mngznj37" target="_blank" class="title-new" data-v-f7fbb29e> PHP5 CLI模式：用PHP编写Shell脚本教程 </a></li><li data-v-f7fbb29e><a href="https://wenku.csdn.net/doc/1i34x4nmtw" target="_blank" class="title-new" data-v-f7fbb29e> MyBatis与Spring完美整合：1.0.0-RC3详解 </a></li></ul></div> <div class="feedback mt-10" data-v-d951529e data-v-76a4b887><div class="left-content" data-v-d951529e><span data-v-d951529e>资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！</span> <a rel="nofollow" href="https://gitcode.net/csdn/download/-/issues" target="_blank" class="btn mt-8" data-v-d951529e> 点击此处反馈 <img src="https://img-home.csdnimg.cn/images/20220527035711.png" data-v-d951529e></a></div> <img src="https://img-home.csdnimg.cn/images/20220527035111.png" class="right-img ml-16" data-v-d951529e></div></div></div></div></div>          <div class="el-dialog__wrapper" style="display:none;" data-v-1caecc57><div role="dialog" aria-modal="true" aria-label="dialog" class="el-dialog lottery" style="margin-top:15vh;width:500px;"><div class="el-dialog__header"><span class="el-dialog__title"></span></div></div></div> <div class="el-dialog__wrapper coupon-dialog" style="display:none;" data-v-7e9c3e49 data-v-1caecc57><div role="dialog" aria-modal="true" aria-label="dialog" class="el-dialog" style="margin-top:15vh;width:422px;"><div class="el-dialog__header"><span class="el-dialog__title"></span><button type="button" aria-label="Close" class="el-dialog__headerbtn"><i class="el-dialog__close el-icon el-icon-close"></i></button></div></div></div> <div class="el-dialog__wrapper" style="display:none;" data-v-63e113a1 data-v-1caecc57><div role="dialog" aria-modal="true" aria-label="安全验证" class="el-dialog" style="margin-top:15vh;width:300px;"><div class="el-dialog__header"><span class="el-dialog__title">安全验证</span><button type="button" aria-label="Close" class="el-dialog__headerbtn"><i class="el-dialog__close el-icon el-icon-close"></i></button></div></div></div> <div class="el-dialog__wrapper copy-check" style="display:none;" data-v-0a933a23 data-v-1caecc57><div role="dialog" aria-modal="true" aria-label="文档复制为VIP权益，开通VIP直接复制" class="el-dialog el-dialog--center" style="margin-top:15vh;width:470px;"><div class="el-dialog__header"><span class="el-dialog__title">文档复制为VIP权益，开通VIP直接复制</span><button type="button" aria-label="Close" class="el-dialog__headerbtn"><i class="el-dialog__close el-icon el-icon-close"></i></button></div><div class="el-dialog__footer"><span class="dialog-footer" data-v-0a933a23><button type="button" class="el-button jump-button el-button--primary" data-v-0a933a23><span>开通VIP，畅享复制特权不限次数</span></button></span></div></div></div> <div class="el-dialog__wrapper" style="display:none;" data-v-1672b810 data-v-1caecc57><div role="dialog" aria-modal="true" aria-label="dialog" class="el-dialog" style="margin-top:15vh;width:400px;"><div class="el-dialog__header"><div class="title" data-v-1672b810><div class="flex-1 flex top-content" data-v-1672b810><img src="https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png" class="dialog-icon" data-v-1672b810> <span data-v-1672b810>信息提交成功</span></div> <div class="el-dialog__close el-icon el-icon-close" data-v-1672b810></div></div></div><div class="el-dialog__footer"><button type="button" class="el-button button el-button--default" data-v-1672b810><span>暂时放弃优惠</span></button> <button type="button" class="el-button btn-light button el-button--primary" data-v-1672b810><span>立即享受8折</span></button></div></div></div>    </div></div> <div class="global-modal" data-v-11673da2></div></div></div><script> window.__INITIAL_STATE__= {"csrf":"W7izzj2p-9K0olhTizUbi3nbB0-P7QTjJ4mU","origin":"http:\u002F\u002Fwenku.csdn.net","isMobile":false,"cookie":"uuid_tt_dd=10_596724060-1726347388752-930994;","ip":"3.142.135.86","pageData":{"sourceBaseInfo":{"sourceId":88589315,"sourcesIsessence":6,"loginUsername":"","rating":0,"isWhiteListAuthor":false,"isAllowDownload":true,"blindBox":{"url":"https:\u002F\u002Fmall.csdn.net\u002Fvip?utm_source=vip_cth_xzxqy_xfc","imgUrl":"https:\u002F\u002Fimg-home.csdnimg.cn\u002Fimages\u002F20240624095725.gif"},"userIsVip":false,"previewData":{"previewList":[{"index":1,"content":"+v：mala2277获取更多论文基于表格或文本的Vaishali1Evangelos Kanoulas2Maarten de Rijke21阿姆斯特丹大学发现实验室2阿姆斯特丹大学诉pal，e.kanoulas，m.uva.nl摘要信息搜索问答系统的一个长期目标是在多模态上下文上进行推理，并为用户查询生成自然答案。如今，通过在特定模态（如非结构化文本或结构化表格）的QA数据上微调模型，理论密集型预训练语言模型适用于下游任务，如QA。为了避免训练这种内存消耗的模型，同时为每个模态使用统一的架构，参数高效的适配器在Transformer层之间添加和训练小的特定于任务的瓶颈层。在这项工作中，我们研究了参数高效的抽象QA编码器-解码器模型在结构化的表格数据和非结构化的文本数据，只使用1.5%的额外参数，为每一个模态。我们还对编码器和解码器模块中的适配器层进行了消融，以研究效率-性能权衡，并证明将额外的可训练参数减少到0.7%我们的模型在表格 QA 数据集（如Tablesum和FeTaQA）上的表现优于当前最先进的模型，并在文本 QA数据集（如NarrativeQA）上实现了可比较的性能，使用的可训练参数明显少于微调。1介绍不同背景下的信息搜索系统需要模型能力来推理非结构化和结构化数据，如自由形式的文本、表格和图像（Agrawal et al. ，2016; Vaku-lenkoet al. ，2019; Hudson and Manning，2019;Zhang et al. ，2020; Zhu等人，2021; Deldjoo etal. ，2021年）。如果部署为面向任务的会话代理，则这样的系统可能具有生成自然语言响应的附加要求（Wen et al. ，2015; CarnegieandOh ， 2000;Rambowetal.， 2001;Ratnaparkhi，2002）。开放域问答（QA）的最新工作主要通过微调来解决这些挑战自然答案LM头部文本适配器Nx编码器工作台适配器文本适配器解码器表适配器提问表问题文件图1：使用特定模态（表\u002F文本）适配器进行抽象问题分类的基于不同模态（如表格和文本）的大规模预训练语言模型（Yin et al. ，2020; Herzig et al. ，2020 ， 2021; Katsis 等人， 2021; Nanet al. ，2021年）。然而，在特定输入类型上训练的每个模型与其他模态不兼容，并且需要模态特定的微调。例如，在表格式QA（Herzig et al. ，2020），通过训练附加位置嵌入（行和列标识符）来识别表格单元格属于哪一行和哪一列来学习表格这使得这种模态特定的模型与基于自由形式文本的模型不兼容多模态模型（Zhu etal. ，2021）可以通过连接文本上下文和扁平化的表来对表和文本两者进行推理，从而导致更长的输入序列并限制可以被编码的上下文的长度。为了应对这些挑战，我们研究了针对表格和文本的抽象QA的参数有效迁移学习。我们的动机是使用适配器层，在冻结的预训练Transformer层之间注入小瓶颈层，因为它们实现了与精细转换层相当的性能arXiv：2204.03357v1 [cs.CL] 2022年4+v：mala2277获取更多论文调整各种任务，如多语言翻译（Pfeiffer etal. ， 2020; Philip 等人， 2020; Guo et al. ，2020）、分类（Houlsby et al. ，2019a），文本到文本生成（Lin et al. ，2020）、对话状态跟踪中的域适应和响应生成（Hung et al. ，2021年）。适配器层的消融研究（Rucklé等人，，2020年）上的掩蔽语言模型，如BERT- base和RoBERTa在GLUE基准测试表明，删除开始适配器层导致性能下降最小。在单独的编码器和解码器模块上扩展适配器层烧蚀是重要的，因为层的顺序修剪的常规方法我们的工作探讨了在抽象QA的背景下，两个模块的适配器层的相互作用。Lin等人（2020）探索适配器瓶颈尺寸对各种语言生成任务的影响，这些任务超过了自回归模型，如GPT-2（Radford et al. ，2019）。他们不研究表格数据，也不消融适配器层，这对于理解顺序Transformer模块架构（如编码器-解码器）中单个适配器的影响至关重要。我们的分析是对（Lin et al. ，2020），因为我们消融适配器层以研究参数-性能权衡，而它们仅关注适配器瓶颈尺寸。此外，我们概括了文本到文本的设置，并探索从结构化或非结构化输入（如表格和文本）生成语言。这在下游数据的任务和结构我们提出了一个系统，名为 Partists ，Eefficient ， AbstractiveQ uestionA nswering（PeaQA），如图1所示，它使用共享的预训练语言模型和特定于模态的适配器层学习对非结构化和结构化输入进行推理。我们自动将层次表转换为常规表，以获得统一的表示，而不会破坏表单元格之间的关联。此外，我们扩展的研究消融适配器层的编码器和解码器模块。我们的主要贡献归纳如下：(1) 我们在多模态上下文上执行参数高效的抽象问题回答，每个模态仅使用额外的1.5%的可训练参数。我们的适配器调优模型通过以下方面优于现有的工作：在表格QA数据集上有很大的余量，在文本QA数据集上实现了相当的性能(2) 我们研究表格QA作为一种新的模态，它引入了大量的输入域转移到预先训练的语言模型。我们提出了一个两步的层次表到序列的转换，它产生了一个统一的表示，由一个单一的，共享的预训练的语言模型和模态特定的适配器层使用据我们所知，这是第一个以参数有效的方式探索表格QA问题回答的工作。(3) 我们烧蚀了编码器和解码器模块中的适配器层，以研究它们的影响，并表明可以消除编码器和解码器的起始层，而不会显着降低性能。我们还证明了最后的编码器适配器层是不可或缺的，并具有更大的贡献比解码器层在同一级别。2相关工作表格式问答。表格式QA系统旨在回答结构化表格中的问题，这些表格可以是规则的或分层的。分层表可以具有跨越多个行和列的标题单元格和主体单元格（Chenget al. ，2021年）。在大多数表格式QA系统中（Herziget al. ，2020; Zhu等人，2021; Katsis et al. ，2021），表的结构通过引入表特定的位置信息（诸如行id和列id）在大型语言模型的嵌入层中编码。，2021; Cheng et al. ，2021）提出了通过推理和聚合来自表格的不连续事实来生成自然答案的额外挑战。文本问答。文本上的问题回答测量系统理解用户问题和上下文段落中的自由形式文本并预测答案的能力。预测的答案本质上可以是提取的，其中系统识别上下文段落中的短文本跨度以回答用户查询（Lee et al. ，2016; Seo等人，2016; Rajpurkar等人。，2016; Pearce et al. ，2021），或者它可以是抽象的，其中需要生成自由形式的答案（Yin et al. ，2016; Mitra，2017; Bauer 等人， 2018; Reddy et al. ，2019）。迁移学习。迁移学习技术，如微调预训练模型，+v：mala2277获取更多论文流任务需要为每个新任务学习一组新参数为了避免这种记忆密集型迁移学习方法，已经提出了适配器作为适应新领域的参数有效方法（ Houlsby et al. ， 2019 b; Pfeiffer et al. ，2020）。适配器已经被扩展到各种生成任务中的语言生成，诸如翻译、摘要、多轮对话和面向任务的自然语言生成（Lin et al. ，2020）。我们的工作结合了上述所有方面，从表格和文本中生成抽象的答案，只有0。7%3模型我们专注于编码器-解码器模型的抽象问题回答的任务。我们使用BART（Lewis et al. ，2019）编码器-解码器架构，其包括双向编码器和自回归解码器。输入序列由问题、上下文标题和上下文序列组成，上下文序列之前有指示每个子序列开始的提示形式上，输入序列表示为question\u003Eqq1. . . qm\u003Ctitle\u003E t1t2.. . tp\u003C上下文\u003E c0c1。. . Cn，其中Qi是第i个问题令牌，Tj是第j个标题令牌，以及Ck是第k个上下文令牌。上下文可以是文本段落或展开的表格。预训练的BART模型的参数在训练期间被冻结添加到模型中的特定于模态的适配器层在表格上下文或文本上下文上进行训练，以生成自然的答案。4语篇提问为了研究多模态抽象问答系统，我们首先将自由形式的文本作为系统的上下文我们在Narra-t iv eQA数据集上针对文本上下文训练适配器层（ K o cKomiskovskiyetal. ， 2018 ）。 NarrativeQA是基于故事的复杂抽象问题回答该数据集在训练集中包含32，747个样本，在验证集中包含3，461个样本，在测试集中包含10，557个对于我们的任务，我们选择了输入上下文段落作为每个样本的人工注释摘要，这是故事的维基百科页面摘要模型的输入是每篇文章的问题、标题和摘要，目标是抽象的答案。5表格式提问我们研究了表格QA作为一种新的模式，它引入了大量的输入域转移到预先训练的语言模型。表格在其表示中强制执行结构为了通过使用统一的预训练语言模型来实现参数效率的目标，我们只训练表特定的然而，这需要表格和文本的统一输入表示另外一个挑战是在不同的表类型（常规的、分层的）之间保持一致性。对于我们的任务，我们探索2个表格QA数据集，即 Tablesum （ Zhang et al. ， 2020 ）和FeTaQA（Nan et al. ，2021年）。Tablesum由200个独特的维基百科表格组成，其中问题和摘要人工注释答案; 40%的样本是关于分层表的问题，但是它们发布的数据中的表在分层单元中缺少信息，并且它们的工作不处理分层结构。我们通过从相应的维基百科页面中提取wikitables来解决这个问题，并发布一个干净版本的数据集。1FeTaQA（Nan et al. ，2021）是一个更大的抽象表格QA数据集，由超过10，330个常规表格的问题和自由形式的答案的数据集由7，326个训练样本验证集中为1，001，测试集。FeTaQA由人工注释的答案组成，其中包含涉及实体和关系的解释。5.1表格表示对于我们的工作，我们选择在两个步骤中统一表示所有表：（1）将层次表转换为常规表;(2) 将常规表线性化为可以用语言模型编码的扁平序列。线性化分层表格标题。分层表格标题通过以下过程线性化为单行标题跨多列的标题单元格被复制并拆分为多个单元格。接下来，将此标题所跨越的单元格值对所有标题行重复此过程会将分层标题转换为顺序1清理后的数据和代码可以在github.com\u002Fkolk\u002FPea-QA上找到+v：mala2277获取更多论文e（f）1a（d）\u003Cd：\u003E−一BCDeFG我123J45HK6L78910a（d）a（e）Bc（f）g（i）g（j）11231145h（k）1146h78910(a) 表示为常规表的多跨度表。a（d）Be（f）g1213B2\u003Cd：\u003Eg（h）a（d）1B3(b) 将常规表线性化为一系列键：值对。图2：表格表示。一个.我们在图2a中描述了这个过程，它产生了线性报头a（d），a（d），b，e（f）。线性化表体。多跨度表体单元格的解析方式与表头不同每个表体单元格都与一个或多个标题单元格一起复制，跨多行的单元格将与所有跨行的单元格一起复制。这一过程导致了一个经常性的数据集。在Tablesum数据集上，我们遵循原始工作中描述的5重交叉验证来评估我们的模型。在FeTaQA和Narra- tiveQA上，我们利用测试分割来评估我们的模型。我们在每个数据集上训练模型 15 个时期，并在 Rouge-2 ，Rouge-L和sacreBLEU指标上进行评估。6.2适配器调谐我们执行适配器调整作为一个参数有效的替代方案，以适应BART-大模型的抽象问题回答任务在不同的模态。我们首先冻结预训练的BART 大模型的所有层，该模型是在原始BART 论文中提到的文本重建上训练的（Lewis et al. ，2019）。我们从Houlsby适配器配置中添加瓶颈适配器层（Houlsby et al. ，2019 a），这些训练适应下游抽象问题回答任务，也适应特定于表.我们以行为主的形式扁平化常规表，按顺序连接行。每一行都是一个（键，值）对序列，其中键是列标题，值是该列的单元格值，如图2b所示。6实验装置我们试图通过实验回答以下研究问题：（RQ1）在多模态输入的情况下，适配器调整(RQ2)编码器和解码器上的所有适配器层是否对任务\u002F模态的性能贡献相同？6.1微调我们的实验都是在大变量的BART模型上进行的。我们在3个数据集上微调BART-大型模型，因为最先进的微调模型针对不同的数据集利用不同的架构，使得与适配器调优的比较我们将3个数据集上的微调BART模型作为基线。我们从{8e−4，6e−4，3e−4，1e−4，5e−5，4e5，3e−5，2e−5，1e−5}中扫描学习率，并为每个数据集选择最佳执行学习率。我们在Tablesum上选择4e−5进行微调，在Fe-TaQA数据集上选择8e−4，在NarrativeQA上选择2e−5我们使用批量大小4和梯度累积8来模拟有效批量大小32。表格QA数据集的最大靶序列长度设置为200，文本QA数据集的最大靶序列长度设置为100把上下文。每个适配器层具有64的瓶颈嵌入尺寸。如第6.1节所述，我们扫描学习率并为每个数据集选择性能最佳的学习率。我们选择6e−4作为表格式QA数据集Tablesum和FeTaQA，并选择1e−1来训练文本QA数据集NarrativeQA。我们使用相同的批次大小和最大靶序列长度作为微调以进行有效的比较。超参数的总结见表1。数据集参数ATuneFTune所有调度器线性线性批量3232种子66最大历元1515表和学习率6e-44e-5输入长度200200学习率6e-48e-4FeTaQA输入长度100100NarrativeQA学习率1e-42e-5输入长度5050表1：用于训练的超参数。ATune表示适配器调整，FTune表示微调，All表示所有3个数据集。6.3消融研究：适配器修剪适配器层修剪已经在GLUE基准上进行了探索（Rucklé et al. ，2020年），其中+v：mala2277获取更多论文数据集模型训练Rouge-1 Rouge-2 Rouge-L BLEUGPT2微调0. 2720. 0730. 2005. 35（Nishida et al. ，2019年）表2：结果：在Tablesum、FeTaQA和NarrativeQA数据集上获得的评分演示了从BERT-base和RoBERTa模型的开头我们扩展适配器层烧蚀的编码器-解码器架构，并假设这种现象应观察到的编码器和解码器模块。然而，编码器和解码器中的适配器层如何彼此交互并对性能做出贡献是不平凡的。既往研究（Rucklé et al. ，2020）在适配器消除上修剪掩码语言模型中的连续适配器层。该方法不直接扩展到编码器-解码器的顺序模块，其中模块内适配器不仅有助于它们各自的编码和解码目标，而且有助于模块间交互和性能。为了测量不同模块中适配器层的影响，我们在编码器和解码器中执行适配器消融。首先，我们从编码器和解码器模块中统一删除适配器层，从两个模块的开始层开始，最后删除所有层。这导致12个实验，对应于消除12个编码器和12个解码器适配器层。为了研究不同层次的模块间适配器之间的相互作用，我们从编码器和解码器的最后6个层次进行了36个不同配置的适配器消除实验。我们在第7.3节中分析了每种配置的性能。7结果我们比较了我们的基线微调模型的结果与最先进的微调模型，在第7.1节中。我们解决（RQ1）“在多模态输入的情况下，适配器调整与微调相比如何执行？”节中7.2和（RQ 2）“编码器和解码器上的所有适配器层是否对任务\u002F模态的性能都有同等贡献？”在7.3。7.1微调模型我们研究了我们的基线微调模型的结果实验结果示于表2中。我们观察到，对于Tablesum数据集，我们的微调模型在Rouge-1上的表现优于最先进的 T5 模型 3 。 8% ，胭脂 -2 乘 4 。Rouge-L评分降低4%。这可以归因于在数据集的干净版本上微调我们的模型我们的微调模型在Fe-TaQA数据集上执行最先进的T5-大，即0。2%的胭脂-1，0。Rouge-2高出01%，0.Rouge-L高出04%。我们对NarrativeQA的微调结果低于使用复杂推理架构训练的最先进模型。这项工作的重点主要是比较微调和适配器调优，因此我们离开明确的推理作为未来工作的一部分。7.2适配器调谐型号我们通过比较适配器调整模型与我们的基线微调模型的性能来解决（ RQ 1 ）。对于Tablesum，如表2所示，微调（基线）的性能略优于适配器调优，Rouge-1和0高7%。Rouge-L 评分高 4% ，而 Rouge-2 评分相同。对于FeTaQA，adapter-tune显示了更大的TablesumT50。3620。1430。27610.43（Zhang et al. ，2020年）我们的（Pea-QA）微调（基线）0.4000.1860.316第六章30适配器调谐0。3930.1860。312第六章75T5-小型0。5500。3300。47021岁60FeTaQAT5基础微调0。6100。3900。51028岁14（Nan et al. ，2021年）T5-大号0。6300。4140。53030. 54我们的（Pea-QA）微调（基线）0。6320。4150。53430. 81+v：mala2277获取更多论文问：Akhila Kishore的前两部电影是什么时候目标：akhila kishore在卡纳达语电影padhe padhe（2013）中首次亮相，并出现在kathaithiraikathai vasanam iyakkam（2014）中。表：Adaper-tune：akhila kishore在卡纳达语电影padhe padhe（2013）和kathai thiraikathai vasanamiyakkam（2014）中首次亮相。微调：kathai thiraikathai vasanam iyakkam（2014）和inimey ippadithaan（2015）是卡纳达语电影。问：谁是Aastik的主演？目标：aastik是一部1956年的印地语电影，由shahu modak，paro devi和meenakshi主演。表：adaper调：aastik是1956年宝莱坞电影主演沙湖莫达克。由s导演的《微调》。p. 卡拉问：雅库布导演的三部电影是什么，什么时候上映的目标：雅库布执导了三部电影：1937年的《萨加尔卡舍尔》，1939年的《乌斯基塔曼纳》，以及1949年的《爱叶》。表：改编曲：雅库布执导了三部电影：1937年的《萨加尔之狮》、1939年的《她最后的欲望》和1949年的《爱也》。由雅库布执导的《微调：表3：适配器调整优于微调的示例性能增益为1。Rouge-1、Rouge-L和Rouge-2的9%。1%的胭脂-2相比，微调。在表格式QA中，微调相对于适配器调整的微不足道的收益可以归因于灾难性的遗忘（French，1999;Kirkpatricket al. ，2017; Chen et al. ，2020），这是由下游表格数据格式的分布与预训练的原始文本数据格式的差异引起的为了进一步探索这种现象，我们分析了表3中FeTaQA数据集的示例，其中适配器调整优于微调。我们观察到，在第一个例子中，微调模型无法从列语义中消除表面形式的问题中命名实体Akhila Kishore的预期语义是Actor。虽然表面形式类似于列值Akhila，但预期的语义是列标题“角色”。微调模型错误地预测表格上下文的第二行和第三行作为信息的正确基础，我们观察到，微调模型还预测来自错误列Direc- tor的信息，而不是第二个例子中的Castadapter-tune正确识别列，但在预测中部分生成所需的信息.第三个例子描述了微调模型的非事实和非流畅预测我们在表4中演示了一个Tablesum的分层表的示例。该问题要求在表格单元格上进行聚合，并具有与之关联的各种类似摘要的目标。分层表格提到了EdShepherd3次，但实际出现次数为10次，从年膜作用语言2013帕迪帕迪Kanchana卡纳达2014Kathai Thiraikathai Vasanam IyakkamDaksha泰米尔2015伊巴迪塔安阿希拉泰米尔.........标题主任铸造.........阿斯蒂克S. P. 卡拉Shahu Modak，Paro Devi，Meenakshi，B.M. 普拉文？保罗？维亚斯阿拉姆·阿拉纳努拜·瓦基勒Daljeet Chitra Tiwari Niranjan Sharma Minu Mumtaz.年膜主任.........1937萨加尔狮子（Sagar Lion）Yakub.........1939Uski Tamanna（Her LastDesire）Yakub.........1949艾叶Yakub.........+v：mala2277获取更多论文问：埃德谢夫登有多少次被列为表演者？目标：• 埃德·谢林在记录2014年瑞典热门歌曲的表格中两次被列为表演者。其他英语音乐的顶级表演者包括布鲁斯·斯普林斯汀、山姆·史密斯和酷玩乐队，这意味着英语音乐在瑞典取得了巨大的成功。• 根据该表，在2014年，埃德·谢林只被列为表演者一次。这是他在2014年1月和2月发行的一首名为“我看到火”的歌曲表：Adaper-tune：我找到了2014年的一张桌子它显示了一周中的一周、歌曲名称、艺术家、歌曲名称、专辑名称和表演者。有11次，埃德谢林被列为表演者在一年。这首歌的名字是“木材”，这张专辑是真的。微调：我找到了一张2014年埃德·谢利的表格。他在2014年他第一次上榜是在2014年1月3日，歌曲“Timber”和最后一首2014年4月4日，《我看见火》。适配器调谐表4：来自Tablesum数据集的示例这两种模型都能生成很长的答案，已移除编码器解码器适配器已移除#可训练参数来自上下文表的信息然而，由于模型没有显式地处理细胞聚集，我们在两个适配器调整的模型和微调的模型。模特们发现Tablesum示例具有挑战性，即使生成的语言是流畅和可读的。对于文本QA，在NarrativeQA数据集上，适配器调优的性能与微调相当，其中适配器调优的模型达到0。降低8%胭脂-1，1. Rouge-2和1高8%。低5%的Rouge-L分数比微调。微调406，291，456（100%）我们的结论是，适配器调谐性能更好而不是针对域外表格数据进行微调，表5：编码器和解码器中的可训练参数。编码器适配器层从0x-y第3周至第9周、第31周和第42周至第43。我们的表格转换过程处理这个问题，以生成一个包含10个单元格的常规表格，其中包含- ingEdShepherd作为值。模型可以简单地聚合提及。如表4所示，在域名文本上的性能相当。7.3适配器层我们通过烧蚀编码器和解码器模块中的适配器层来研究（RQ 2）我们统一地从编码器和解码器中消除连续的适配器层，从两个模块中的第一层开始，最后删除所有层。这导致12个实验对应于12个en-––6，343，680（1.（56%）0–212–144，757，760（1.17%）0–412–163，700，480（0。91%）0–612–182，643，200（0。（65%）周日期歌曲标题表演者专辑标题表演者12014年1月3日“木材”Pitbull feat. ......这是什么？真Avicii22014年1月1032014年1月17日《我看见火》Ed Sheeran厚望布鲁斯42014年1月24日52014年1月31真Avicii62014年2月7日克里斯特·舍格伦桑格·西纳特拉克里斯特·舍格伦72014年2月1482014年2月21日真Avicii92014年2月28............31二〇一四年七月三十一日XEd Sheeran+v：mala2277获取更多论文至−−(a) FeTaQA Rouge-L评分（b）表格Rouge-L评分（c）叙述性QA Rouge-L评分(d)FeTaQAsacreBLEU评分（e）Tablesum sacreBLEU评分（f）NarrativeQA sacreBLEU评分图3：适配器层消融评分。X轴表示删除的编码器适配器层的范围，Y轴表示删除的解码器适配器层的范围x-y意味着从x到y的所有适配器层。那里显示了36种模型消融配置消融从0到6个编码器适配器层移除开始以及由左下单元（（0-6），（12-18））表示的12到18解码器适配器层移除增加了沿X轴的编码器适配器层和沿Y轴的解码器适配器层的删除图4：适配器层消融Rouge2 F评分。X轴描绘了逐渐删除的编码器适配器层（0每个（x-y）表示具有编码器层p的图5：适配器层消融Rouge-L评分。X轴描绘了删除的编码器适配器层（0-11）和解码器适配器层（12-23 逐渐地。每个（x-y）表示具有编码器层p的（俄、西）Q被删除并且解码器层R到S被删除。编码器和12个解码器适配器层。我们将编码器适配器层编号为0-11，将解码器适配器层编号为 12-23 。我们使用 Rouge-2 ， Rouge-L2 和sacreBLEU3评分来衡量模型的性能。F分数2https:\u002F\u002Fpypi.org\u002Fproject\u002Frouge-score\u002F3https:\u002F\u002Fgithub.com\u002Fmjpost\u002FsacreBLEU（俄、西）到Q被删除并且解码器层R到S被删除。对于每个数据集（NarrativeQA，Tablesum，FeTaQA），分别如图4，5和6所示。我们观察到，随着更多的适配器层被消除，所有数据集的性能都会下降。然而，性能下降是最小的，直到最后一个适配器层也被删除.拐点在数据集之间变化，但限于编码器和解码器的最后2层对于纳拉-+v：mala2277获取更多论文−（俄、西）图6：适配器层消融sacreBLEU F评分。X轴描绘了逐渐删除的编码器适配器层（0-11）和解码器适配器层（12-23）。每个（x-y）表示删除了编码器层p到q和解码器层r到s的F分数。tiveQA数据集，这一点是当所有层，直到倒数第二个适配器层从编码器和解码器被删除。对于FeTaQA和Tablesum数据集，只有当最后的编码器和解码器层被删除时，性能才会急剧下降为了分析编解码器的第i层适配器对性能的贡献. .、（0. . ，（12 这导致了36个配置-其中构型（p-q移除从第p层到第q层的所有编码器适配器和从第r层到第s层的所有解码器适配器。结果如图3所示。我们观察到，性能保持可比，因为我们逐步消除适配器层从编码器和解码器，直到最后一层。当我们移除朝向图3a、3b和3c中的RougeL分数以及图3d、3e和3f中的BLEU分数的右上角描绘的最后编码器和解码器适配器层时，性能急剧下降。这意味着最后的适配器层学习大部分域信息。我们还观察到最后的编码器和解码器层对性能的贡献不同删除最后一个编码器层（列0-11）导致所有解码器层的分数大幅下降。这表明最后一个编码器层是必不可少的。仅保留最后一个解码器适配器（行12我们还观察到，仅保留适配器的最后50%，来自编码器和解码器两者的层将参数效率增加0。7%的参数，如表5中所总结，而不会显著损害性能。8结论我们是第一个研究参数有效的迁移学习表和文本的抽象问题的回答使用适配器。我们证明了参数有效的适配器调整优于微调域外的表格数据，并取得了可比的结果域内的文本数据。我们提出了一种从层次表到规则表的转换，并进一步转换为与预训练模型兼容的序列形式。我们将现有的适配器层消融研究扩展到编码器-解码器设置，并证明来自编码器末端的适配器层与同一级别的解码器适配器层相比，可指示编码模态特定我们的研究结果是有用的探索QA模型的可扩展性在内存受限的情况下，具有可比的性能，同时跨模式使用轻量级适配器扩展我们的工作的局限性之一是，我们的模型没有显式地推理和聚合表单元格。这可能会导致在具有挑战性的Tablesum数据集上出现流畅但实际上不正确的答案。解决这一限制问题将留待今后工作。9确认我们要感谢爱思唯尔在整个项目中的支持和资助。这项工作也得到了NWO创新研究激励计划Vidi（016.Vidi.189.039），NWO智能文化- 大数据\u002F数字人文（314-99-301），H2020-EU.3.4。 - 社会挑战-智能、绿色、综合交通（814961）。所有内容都代表作者的意见，不一定得到各自雇主和\u002F或赞助商的认可或认可+v：mala2277获取更多论文引用艾西瓦亚·阿格拉瓦尔，陆佳森，斯坦尼斯瓦夫·安托尔，马·米切尔，C.劳伦斯·齐特尼克，德鲁夫·巴特拉，和德维·帕里克。2016. VQA：视觉问题回答。arXiv预印本arXiv：1505.00468。Lisa Bauer，Yicheng Wang，and Mohit Bansal. 2018.生成式多跳问题回答任务的常识在EMNLP。作者：Alice H.哦2000.口语对话系统的随机语言生成在ANLP\u002FNAACL 2000年会议记录中。《对话系统》，第27-32页。陈三元、侯玉泰、崔一鸣、车万象、刘婷、余翔战。2020年。回忆和学习：微调深度预训练的语言模型，减少遗忘。在2020年自然语言处理经验方法会议（EMNLP）中，第7870计算语言学协会.Zhujun Cheng，Haoyu Dong，Zhiruo Wang，RanJia，Jiaqi Guo，Yan Gao，Shi Han，Jian-GuangLou，and Dongmei Zhang. 2021. Hitab：用于问答和自然语言生成的分层表数据集。arXiv预印本arXiv：2108.06712。作者声明：John R.崔帕斯，还有哈米德·扎曼尼.2021年多模态会话信息搜索。在SIGIRACM。Robert M.法语1999. 连接主义网络中的灾难性遗忘。Trends in Cognitive Sciences，3（4）：128Junliang Guo ， Zhirui Zhang ， Linli Xu ， Hao-RanWei，Boxing Chen，and Enhong Chen. 2020. 用适配器。神经信息处理系统进展，第33卷，第10843-10854页。Curran Associates，Inc.JonathanHerzig ， ThomasMüller ， SyrineKrichene，and Julian Eisenschlos.2021. 开放领域的问题通过密集检索表。计算语言学协会北美分会2021年会议论文集：人类语言技术。Jonathan Herzig，Pawel Krzysztof Nowak，ThomasMüller ， FrancescoPiccinno ， andJulianEisenschlos. 2020. TaPas：通过预训练进行弱监督表解析。在计算语言学协会第58届年会的会议记录中，第4320-4333页，在线。计算语言学协会。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentinDeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly.2019年a。NLP的参数有效迁移学习。第36届国际机器学习会议论文集，机器学习研究论文集第97卷，第2790-2799页。PMLR。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentindeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly. 2019年b. NLP的参数有效迁移学习。 arXiv 预印本 arXiv ：1902.00751。德鲁·A Hudson和Christopher D.曼宁2019. GQA：一个用于真实世界视觉推理和组合问题回答的新数据集。arXiv预印本arXiv：1902.09506。洪家谦，安妮·劳舍尔，西蒙娜·保罗·庞泽托，戈兰·格拉瓦托。2021. DS-TOD：面向任务对话的高效领域专门化。 arXiv 预印本 arXiv ：2110.08395。Yannis Katsis，Saneem Chemmengath，VishwajeetKumar， Samarth Bharadwaj ， Mustafa Canim ，Michael Glass，Alfio Gliozzo，Feifei Pan，Jay-deep Sen ， KarthikSankaranarayanan ， andSoumen Chakrabarti. 2021. AIT-QA：航空业复杂表格的问答数据集。 arXiv 预印本 arXiv ：2106.12944。JamesKirkpatrick ， RazvanPascanu ， NeilRabinowitz，JoelVeness，GuillaumeDesjardins，Andrei A. Rusu，Kieran Milan，JohnQuan ， Tiago Ramalho ， Agnieszka Grabska-Barwinska，Demis Hassabis，Claudia Clopath，Dharshan Kumaran，and Raia Hadsell. 2017.克服神经网络中的灾难性遗忘arXiv预印本arXiv：1612.00796。托马斯 ·K·o·c· 阿尼斯克， JonathanSchw arz ，PhilBlunsom， ChrisDyer ， KarlMoritzHermann，GáborMelis，andEdwardGrefenstette.2018. NarrativeQA阅读理解挑战。Transactions of the Association for ComputationalLinguistics，6：317-328.Shimi Salant，Tom Kwiatkowski，Ankur Parikh，Dipanjan Das，and Jonathan Berant. 2016.学习提取性问题回答的循环广度表征。arXiv预印本arXiv：1611.01436。Mike Lewis，Yinhan Liu，Naman戈亚尔，Mar-jan Ghazvininejad ， Abdelrahman Mohamed ，OmerLevy ， VesStoyanov ， andLukeZettlemoyer. 2019. Bart：用于自然语言生成、翻译和理解的去噪序列到序列预训练。林兆江，Andrea Madotto和Pascale Fung。2020. 通过参数有效的迁移学习探索通用生成语言模型。在计算语言学协会的调查结果：EMNLP 2020，第441-459页，在线。计算语言学协会.+v：mala2277获取更多论文Rajarshee Mitra 201"}],"previewType":2,"briefIntroduction":"+v：mala2277获取更多论文基于表格或文本的Vaishali1Evangelos Kanoulas2Maarten de Rijke21阿姆斯特丹大学发现实验室2阿姆斯特丹大学诉pal，e.kanoulas，m.uva.nl摘要信息搜索问答系统的一个长期目标是在多模态上下文上进行推理，并为用户查询生成自然答案。如今，通过在特定模态（如非结构化文本或结构化表格）的QA数据上微调模型，理论密集型预训练语言模型适用于下游任务，如QA。为了避免训练这种内存消耗的模型，同时为每个模态使用统一的架构，参数高效的适配器在Transformer层之间添加和训练小的特定于任务的瓶颈层。在这项工作中，我们研究了参数高效的抽象QA编码器-解码器模型在结构化的表格数据和非结构化的文本数据，只使用1.5%的额外参数，为每一个模态。我们还对编码器和解码器模块中的适配器层进行了消融，以研究效率-性能权衡，并证明将额外的可训练参数减少到0.7%我们的模型在表格 QA 数据集（如Tablesum和FeTaQA）上的表现优于当前最先进的模型，并在文本 QA数据集（如NarrativeQA）上实现了可比较的性能，使用的可训练参数明显少于微调。1介绍不同背景下的信息搜索系统需要模型能力来推理非结构化和结构化数据，如自由形式的文本、表格和图像（Agrawal et al. ，2016; Vaku-lenkoet al. ，2019; Hudson and Manning，2019;Zhang et al. ，2020; Zhu等人，2021; Deldjoo etal. ，2021年）。如果部署为面向任务的会话代理，则这样的系统可能具有生成自然语言响应的附加要求（Wen et al. ，2015; CarnegieandOh ， 2000;Rambowetal.， 2001;Ratnaparkhi，2002）。开放域问答（QA）的最新工作主要通过微调来解决这些挑战自然答案LM头部文本适配器Nx编码器工作台适配器文本适配器解码器表适配器提问表问题文件图1：使用特定模态（表\u002F文本）适配器进行抽象问题分类的基于不同模态（如表格和文本）的大规模预训练语言模型（Yin et al. ，2020; Herzig et al. ，2020 ， 2021; Katsis 等人， 2021; Nanet al. ，2021年）。然而，在特定输入类型上训练的每个模型与其他模态不兼容，并且需要模态特定的微调。例如，在表格式QA（Herzig et al. ，2020），通过训练附加位置嵌入（行和列标识符）来识别表格单元格属于哪一行和哪一列来学习表格这使得这种模态特定的模型与基于自由形式文本的模型不兼容多模态模型（Zhu etal. ，2021）可以通过连接文本上下文和扁平化的表来对表和文本两者进行推理，从而导致更长的输入序列并限制可以被编码的上下文的长度。为了应对这些挑战，我们研究了针对表格和文本的抽象QA的参数有效迁移学习。我们的动机是使用适配器层，在冻结的预训练Transformer层之间注入小瓶颈层，因为它们实现了与精细转换层相当的性能arXiv：2204.03357v1 [cs.CL] 2022年4+v：mala2277获取更多论文调整各种任务，如多语言翻译（Pfeiffer etal. ， 2020; Philip 等人， 2020; Guo et al. ，2020）、分类（Houlsby et al. ，2019a），文本到文本生成（Lin et al. ，2020）、对话状态跟踪中的域适应和响应生成（Hung et al. ，2021年）。适配器层的消融研究（Rucklé等人，，2020年）上的掩蔽语言模型，如BERT- base和RoBERTa在GLUE基准测试表明，删除开始适配器层导致性能下降最小。在单独的编码器和解码器模块上扩展适配器层烧蚀是重要的，因为层的顺序修剪的常规方法我们的工作探讨了在抽象QA的背景下，两个模块的适配器层的相互作用。Lin等人（2020）探索适配器瓶颈尺寸对各种语言生成任务的影响，这些任务超过了自回归模型，如GPT-2（Radford et al. ，2019）。他们不研究表格数据，也不消融适配器层，这对于理解顺序Transformer模块架构（如编码器-解码器）中单个适配器的影响至关重要。我们的分析是对（Lin et al. ，2020），因为我们消融适配器层以研究参数-性能权衡，而它们仅关注适配器瓶颈尺寸。此外，我们概括了文本到文本的设置，并探索从结构化或非结构化输入（如表格和文本）生成语言。这在下游数据的任务和结构我们提出了一个系统，名为 Partists ，Eefficient ， AbstractiveQ uestionA nswering（PeaQA），如图1所示，它使用共享的预训练语言模型和特定于模态的适配器层学习对非结构化和结构化输入进行推理。我们自动将层次表转换为常规表，以获得统一的表示，而不会破坏表单元格之间的关联。此外，我们扩展的研究消融适配器层的编码器和解码器模块。我们的主要贡献归纳如下：(1) 我们在多模态上下文上执行参数高效的抽象问题回答，每个模态仅使用额外的1.5%的可训练参数。我们的适配器调优模型通过以下方面优于现有的工作：在表格QA数据集上有很大的余量，在文本QA数据集上实现了相当的性能(2) 我们研究表格QA作为一种新的模态，它引入了大量的输入域转移到预先训练的语言模型。我们提出了一个两步的层次表到序列的转换，它产生了一个统一的表示，由一个单一的，共享的预训练的语言模型和模态特定的适配器层使用据我们所知，这是第一个以参数有效的方式探索表格QA问题回答的工作。(3) 我们烧蚀了编码器和解码器模块中的适配器层，以研究它们的影响，并表明可以消除编码器和解码器的起始层，而不会显着降低性能。我们还证明了最后的编码器适配器层是不可或缺的，并具有更大的贡献比解码器层在同一级别。2相关工作表格式问答。表格式QA系统旨在回答结构化表格中的问题，这些表格可以是规则的或分层的。分层表可以具有跨越多个行和列的标题单元格和主体单元格（Chenget al. ，2021年）。在大多数表格式QA系统中（Herziget al. ，2020; Zhu等人，2021; Katsis et al. ，2021），表的结构通过引入表特定的位置信息（诸如行id和列id）在大型语言模型的嵌入层中编码。，2021; Cheng et al. ，2021）提出了通过推理和聚合来自表格的不连续事实来生成自然答案的额外挑战。文本问答。文本上的问题回答测量系统理解用户问题和上下文段落中的自由形式文本并预测答案的能力。预测的答案本质上可以是提取的，其中系统识别上下文段落中的短文本跨度以回答用户查询（Lee et al. ，2016; Seo等人，2016; Rajpurkar等人。，2016; Pearce et al. ，2021），或者它可以是抽象的，其中需要生成自由形式的答案（Yin et al. ，2016; Mitra，2017; Bauer 等人， 2018; Reddy et al. ，2019）。迁移学习。迁移学习技术，如微调预训练模型，+v：mala2277获取更多论文流任务需要为每个新任务学习一组新参数为了避免这种记忆密集型迁移学习方法，已经提出了适配器作为适应新领域的参数有效方法（ Houlsby et al. ， 2019 b; Pfeiffer et al. ，2020）。适配器已经被扩展到各种生成任务中的语言生成，诸如翻译、摘要、多轮对话和面向任务的自然语言生成（Lin et al. ，2020）。我们的工作结合了上述所有方面，从表格和文本中生成抽象的答案，只有0。7%3模型我们专注于编码器-解码器模型的抽象问题回答的任务。我们使用BART（Lewis et al. ，2019）编码器-解码器架构，其包括双向编码器和自回归解码器。输入序列由问题、上下文标题和上下文序列组成，上下文序列之前有指示每个子序列开始的提示形式上，输入序列表示为question\u003Eqq1. . . qm\u003Ctitle\u003E t1t2.. . tp\u003C上下文\u003E c0c1。. . Cn，其中Qi是第i个问题令牌，Tj是第j个标题令牌，以及Ck是第k个上下文令牌。上下文可以是文本段落或展开的表格。预训练的BART模型的参数在训练期间被冻结添加到模型中的特定于模态的适配器层在表格上下文或文本上下文上进行训练，以生成自然的答案。4语篇提问为了研究多模态抽象问答系统，我们首先将自由形式的文本作为系统的上下文我们在Narra-t iv eQA数据集上针对文本上下文训练适配器层（ K o cKomiskovskiyetal. ， 2018 ）。 NarrativeQA是基于故事的复杂抽象问题回答该数据集在训练集中包含32，747个样本，在验证集中包含3，461个样本，在测试集中包含10，557个对于我们的任务，我们选择了输入上下文段落作为每个样本的人工注释摘要，这是故事的维基百科页面摘要模型的输入是每篇文章的问题、标题和摘要，目标是抽象的答案。5表格式提问我们研究了表格QA作为一种新的模式，它引入了大量的输入域转移到预先训练的语言模型。表格在其表示中强制执行结构为了通过使用统一的预训练语言模型来实现参数效率的目标，我们只训练表特定的然而，这需要表格和文本的统一输入表示另外一个挑战是在不同的表类型（常规的、分层的）之间保持一致性。对于我们的任务，我们探索2个表格QA数据集，即 Tablesum （ Zhang et al. ， 2020 ）和FeTaQA（Nan et al. ，2021年）。Tablesum由200个独特的维基百科表格组成，其中问题和摘要人工注释答案; 40%的样本是关于分层表的问题，但是它们发布的数据中的表在分层单元中缺少信息，并且它们的工作不处理分层结构。我们通过从相应的维基百科页面中提取wikitables来解决这个问题，并发布一个干净版本的数据集。1FeTaQA（Nan et al. ，2021）是一个更大的抽象表格QA数据集，由超过10，330个常规表格的问题和自由形式的答案的数据集由7，326个训练样本验证集中为1，001，测试集。FeTaQA由人工注释的答案组成，其中包含涉及实体和关系的解释。5.1表格表示对于我们的工作，我们选择在两个步骤中统一表示所有表：（1）将层次表转换为常规表;(2) 将常规表线性化为可以用语言模型编码的扁平序列。线性化分层表格标题。分层表格标题通过以下过程线性化为单行标题跨多列的标题单元格被复制并拆分为多个单元格。接下来，将此标题所跨越的单元格值对所有标题行重复此过程会将分层标题转换为顺序1清理后的数据和代码可以在github.com\u002Fkolk\u002FPea-QA上找到+v：mala2277获取更多论文e（f）1a（d）\u003Cd：\u003E−一BCDeFG我123J45HK6L78910a（d）a（e）Bc（f）g（i）g（j）11231145h（k）1146h78910(a) 表示为常规表的多跨度表。a（d）Be（f）g1213B2\u003Cd：\u003Eg（h）a（d）1B3(b) 将常规表线性化为一系列键：值对。图2：表格表示。一个.我们在图2a中描述了这个过程，它产生了线性报头a（d），a（d），b，e（f）。线性化表体。多跨度表体单元格的解析方式与表头不同每个表体单元格都与一个或多个标题单元格一起复制，跨多行的单元格将与所有跨行的单元格一起复制。这一过程导致了一个经常性的数据集。在Tablesum数据集上，我们遵循原始工作中描述的5重交叉验证来评估我们的模型。在FeTaQA和Narra- tiveQA上，我们利用测试分割来评估我们的模型。我们在每个数据集上训练模型 15 个时期，并在 Rouge-2 ，Rouge-L和sacreBLEU指标上进行评估。6.2适配器调谐我们执行适配器调整作为一个参数有效的替代方案，以适应BART-大模型的抽象问题回答任务在不同的模态。我们首先冻结预训练的BART 大模型的所有层，该模型是在原始BART 论文中提到的文本重建上训练的（Lewis et al. ，2019）。我们从Houlsby适配器配置中添加瓶颈适配器层（Houlsby et al. ，2019 a），这些训练适应下游抽象问题回答任务，也适应特定于表.我们以行为主的形式扁平化常规表，按顺序连接行。每一行都是一个（键，值）对序列，其中键是列标题，值是该列的单元格值，如图2b所示。6实验装置我们试图通过实验回答以下研究问题：（RQ1）在多模态输入的情况下，适配器调整(RQ2)编码器和解码器上的所有适配器层是否对任务\u002F模态的性能贡献相同？6.1微调我们的实验都是在大变量的BART模型上进行的。我们在3个数据集上微调BART-大型模型，因为最先进的微调模型针对不同的数据集利用不同的架构，使得与适配器调优的比较我们将3个数据集上的微调BART模型作为基线。我们从{8e−4，6e−4，3e−4，1e−4，5e−5，4e5，3e−5，2e−5，1e−5}中扫描学习率，并为每个数据集选择最佳执行学习率。我们在Tablesum上选择4e−5进行微调，在Fe-TaQA数据集上选择8e−4，在NarrativeQA上选择2e−5我们使用批量大小4和梯度累积8来模拟有效批量大小32。表格QA数据集的最大靶序列长度设置为200，文本QA数据集的最大靶序列长度设置为100把上下文。每个适配器层具有64的瓶颈嵌入尺寸。如第6.1节所述，我们扫描学习率并为每个数据集选择性能最佳的学习率。我们选择6e−4作为表格式QA数据集Tablesum和FeTaQA，并选择1e−1来训练文本QA数据集NarrativeQA。我们使用相同的批次大小和最大靶序列长度作为微调以进行有效的比较。超参数的总结见表1。数据集参数ATuneFTune所有调度器线性线性批量3232种子66最大历元1515表和学习率6e-44e-5输入长度200200学习率6e-48e-4FeTaQA输入长度100100NarrativeQA学习率1e-42e-5输入长度5050表1：用于训练的超参数。ATune表示适配器调整，FTune表示微调，All表示所有3个数据集。6.3消融研究：适配器修剪适配器层修剪已经在GLUE基准上进行了探索（Rucklé et al. ，2020年），其中+v：mala2277获取更多论文数据集模型训练Rouge-1 Rouge-2 Rouge-L BLEUGPT2微调0. 2720. 0730. 2005. 35（Nishida et al. ，2019年）表2：结果：在Tablesum、FeTaQA和NarrativeQA数据集上获得的评分演示了从BERT-base和RoBERTa模型的开头我们扩展适配器层烧蚀的编码器-解码器架构，并假设这种现象应观察到的编码器和解码器模块。然而，编码器和解码器中的适配器层如何彼此交互并对性能做出贡献是不平凡的。既往研究（Rucklé et al. ，2020）在适配器消除上修剪掩码语言模型中的连续适配器层。该方法不直接扩展到编码器-解码器的顺序模块，其中模块内适配器不仅有助于它们各自的编码和解码目标，而且有助于模块间交互和性能。为了测量不同模块中适配器层的影响，我们在编码器和解码器中执行适配器消融。首先，我们从编码器和解码器模块中统一删除适配器层，从两个模块的开始层开始，最后删除所有层。这导致12个实验，对应于消除12个编码器和12个解码器适配器层。为了研究不同层次的模块间适配器之间的相互作用，我们从编码器和解码器的最后6个层次进行了36个不同配置的适配器消除实验。我们在第7.3节中分析了每种配置的性能。7结果我们比较了我们的基线微调模型的结果与最先进的微调模型，在第7.1节中。我们解决（RQ1）“在多模态输入的情况下，适配器调整与微调相比如何执行？”节中7.2和（RQ 2）“编码器和解码器上的所有适配器层是否对任务\u002F模态的性能都有同等贡献？”在7.3。7.1微调模型我们研究了我们的基线微调模型的结果实验结果示于表2中。我们观察到，对于Tablesum数据集，我们的微调模型在Rouge-1上的表现优于最先进的 T5 模型 3 。 8% ，胭脂 -2 乘 4 。Rouge-L评分降低4%。这可以归因于在数据集的干净版本上微调我们的模型我们的微调模型在Fe-TaQA数据集上执行最先进的T5-大，即0。2%的胭脂-1，0。Rouge-2高出01%，0.Rouge-L高出04%。我们对NarrativeQA的微调结果低于使用复杂推理架构训练的最先进模型。这项工作的重点主要是比较微调和适配器调优，因此我们离开明确的推理作为未来工作的一部分。7.2适配器调谐型号我们通过比较适配器调整模型与我们的基线微调模型的性能来解决（ RQ 1 ）。对于Tablesum，如表2所示，微调（基线）的性能略优于适配器调优，Rouge-1和0高7%。Rouge-L 评分高 4% ，而 Rouge-2 评分相同。对于FeTaQA，adapter-tune显示了更大的TablesumT50。3620。1430。27610.43（Zhang et al. ，2020年）我们的（Pea-QA）微调（基线）0.4000.1860.316第六章30适配器调谐0。3930.1860。312第六章75T5-小型0。5500。3300。47021岁60FeTaQAT5基础微调0。6100。3900。51028岁14（Nan et al. ，2021年）T5-大号0。6300。4140。53030. 54我们的（Pea-QA）微调（基线）0。6320。4150。53430. 81+v：mala2277获取更多论文问：Akhila Kishore的前两部电影是什么时候目标：akhila kishore在卡纳达语电影padhe padhe（2013）中首次亮相，并出现在kathaithiraikathai vasanam iyakkam（2014）中。表：Adaper-tune：akhila kishore在卡纳达语电影padhe padhe（2013）和kathai thiraikathai vasanamiyakkam（2014）中首次亮相。微调：kathai thiraikathai vasanam iyakkam（2014）和inimey ippadithaan（2015）是卡纳达语电影。问：谁是Aastik的主演？目标：aastik是一部1956年的印地语电影，由shahu modak，paro devi和meenakshi主演。表：adaper调：aastik是1956年宝莱坞电影主演沙湖莫达克。由s导演的《微调》。p. 卡拉问：雅库布导演的三部电影是什么，什么时候上映的目标：雅库布执导了三部电影：1937年的《萨加尔卡舍尔》，1939年的《乌斯基塔曼纳》，以及1949年的《爱叶》。表：改编曲：雅库布执导了三部电影：1937年的《萨加尔之狮》、1939年的《她最后的欲望》和1949年的《爱也》。由雅库布执导的《微调：表3：适配器调整优于微调的示例性能增益为1。Rouge-1、Rouge-L和Rouge-2的9%。1%的胭脂-2相比，微调。在表格式QA中，微调相对于适配器调整的微不足道的收益可以归因于灾难性的遗忘（French，1999;Kirkpatricket al. ，2017; Chen et al. ，2020），这是由下游表格数据格式的分布与预训练的原始文本数据格式的差异引起的为了进一步探索这种现象，我们分析了表3中FeTaQA数据集的示例，其中适配器调整优于微调。我们观察到，在第一个例子中，微调模型无法从列语义中消除表面形式的问题中命名实体Akhila Kishore的预期语义是Actor。虽然表面形式类似于列值Akhila，但预期的语义是列标题“角色”。微调模型错误地预测表格上下文的第二行和第三行作为信息的正确基础，我们观察到，微调模型还预测来自错误列Direc- tor的信息，而不是第二个例子中的Castadapter-tune正确识别列，但在预测中部分生成所需的信息.第三个例子描述了微调模型的非事实和非流畅预测我们在表4中演示了一个Tablesum的分层表的示例。该问题要求在表格单元格上进行聚合，并具有与之关联的各种类似摘要的目标。分层表格提到了EdShepherd3次，但实际出现次数为10次，从年膜作用语言2013帕迪帕迪Kanchana卡纳达2014Kathai Thiraikathai Vasanam IyakkamDaksha泰米尔2015伊巴迪塔安阿希拉泰米尔.........标题主任铸造.........阿斯蒂克S. P. 卡拉Shahu Modak，Paro Devi，Meenakshi，B.M. 普拉文？保罗？维亚斯阿拉姆·阿拉纳努拜·瓦基勒Daljeet Chitra Tiwari Niranjan Sharma Minu Mumtaz.年膜主任.........1937萨加尔狮子（Sagar Lion）Yakub.........1939Uski Tamanna（Her LastDesire）Yakub.........1949艾叶Yakub.........+v：mala2277获取更多论文问：埃德谢夫登有多少次被列为表演者？目标：• 埃德·谢林在记录2014年瑞典热门歌曲的表格中两次被列为表演者。其他英语音乐的顶级表演者包括布鲁斯·斯普林斯汀、山姆·史密斯和酷玩乐队，这意味着英语音乐在瑞典取得了巨大的成功。• 根据该表，在2014年，埃德·谢林只被列为表演者一次。这是他在2014年1月和2月发行的一首名为“我看到火”的歌曲表：Adaper-tune：我找到了2014年的一张桌子它显示了一周中的一周、歌曲名称、艺术家、歌曲名称、专辑名称和表演者。有11次，埃德谢林被列为表演者在一年。这首歌的名字是“木材”，这张专辑是真的。微调：我找到了一张2014年埃德·谢利的表格。他在2014年他第一次上榜是在2014年1月3日，歌曲“Timber”和最后一首2014年4月4日，《我看见火》。适配器调谐表4：来自Tablesum数据集的示例这两种模型都能生成很长的答案，已移除编码器解码器适配器已移除#可训练参数来自上下文表的信息然而，由于模型没有显式地处理细胞聚集，我们在两个适配器调整的模型和微调的模型。模特们发现Tablesum示例具有挑战性，即使生成的语言是流畅和可读的。对于文本QA，在NarrativeQA数据集上，适配器调优的性能与微调相当，其中适配器调优的模型达到0。降低8%胭脂-1，1. Rouge-2和1高8%。低5%的Rouge-L分数比微调。微调406，291，456（100%）我们的结论是，适配器调谐性能更好而不是针对域外表格数据进行微调，表5：编码器和解码器中的可训练参数。编码器适配器层从0x-y第3周至第9周、第31周和第42周至第43。我们的表格转换过程处理这个问题，以生成一个包含10个单元格的常规表格，其中包含- ingEdShepherd作为值。模型可以简单地聚合提及。如表4所示，在域名文本上的性能相当。7.3适配器层我们通过烧蚀编码器和解码器模块中的适配器层来研究（RQ 2）我们统一地从编码器和解码器中消除连续的适配器层，从两个模块中的第一层开始，最后删除所有层。这导致12个实验对应于12个en-––6，343，680（1.（56%）0–212–144，757，760（1.17%）0–412–163，700，480（0。91%）0–612–182，643，200（0。（65%）周日期歌曲标题表演者专辑标题表演者12014年1月3日“木材”Pitbull feat. ......这是什么？真Avicii22014年1月1032014年1月17日《我看见火》Ed Sheeran厚望布鲁斯42014年1月24日52014年1月31真Avicii62014年2月7日克里斯特·舍格伦桑格·西纳特拉克里斯特·舍格伦72014年2月1482014年2月21日真Avicii92014年2月28............31二〇一四年七月三十一日XEd Sheeran+v：mala2277获取更多论文至−−(a) FeTaQA Rouge-L评分（b）表格Rouge-L评分（c）叙述性QA Rouge-L评分(d)FeTaQAsacreBLEU评分（e）Tablesum sacreBLEU评分（f）NarrativeQA sacreBLEU评分图3：适配器层消融评分。X轴表示删除的编码器适配器层的范围，Y轴表示删除的解码器适配器层的范围x-y意味着从x到y的所有适配器层。那里显示了36种模型消融配置消融从0到6个编码器适配器层移除开始以及由左下单元（（0-6），（12-18））表示的12到18解码器适配器层移除增加了沿X轴的编码器适配器层和沿Y轴的解码器适配器层的删除图4：适配器层消融Rouge2 F评分。X轴描绘了逐渐删除的编码器适配器层（0每个（x-y）表示具有编码器层p的图5：适配器层消融Rouge-L评分。X轴描绘了删除的编码器适配器层（0-11）和解码器适配器层（12-23 逐渐地。每个（x-y）表示具有编码器层p的（俄、西）Q被删除并且解码器层R到S被删除。编码器和12个解码器适配器层。我们将编码器适配器层编号为0-11，将解码器适配器层编号为 12-23 。我们使用 Rouge-2 ， Rouge-L2 和sacreBLEU3评分来衡量模型的性能。F分数2https:\u002F\u002Fpypi.org\u002Fproject\u002Frouge-score\u002F3https:\u002F\u002Fgithub.com\u002Fmjpost\u002FsacreBLEU（俄、西）到Q被删除并且解码器层R到S被删除。对于每个数据集（NarrativeQA，Tablesum，FeTaQA），分别如图4，5和6所示。我们观察到，随着更多的适配器层被消除，所有数据集的性能都会下降。然而，性能下降是最小的，直到最后一个适配器层也被删除.拐点在数据集之间变化，但限于编码器和解码器的最后2层对于纳拉-+v：mala2277获取更多论文−（俄、西）图6：适配器层消融sacreBLEU F评分。X轴描绘了逐渐删除的编码器适配器层（0-11）和解码器适配器层（12-23）。每个（x-y）表示删除了编码器层p到q和解码器层r到s的F分数。tiveQA数据集，这一点是当所有层，直到倒数第二个适配器层从编码器和解码器被删除。对于FeTaQA和Tablesum数据集，只有当最后的编码器和解码器层被删除时，性能才会急剧下降为了分析编解码器的第i层适配器对性能的贡献. .、（0. . ，（12 这导致了36个配置-其中构型（p-q移除从第p层到第q层的所有编码器适配器和从第r层到第s层的所有解码器适配器。结果如图3所示。我们观察到，性能保持可比，因为我们逐步消除适配器层从编码器和解码器，直到最后一层。当我们移除朝向图3a、3b和3c中的RougeL分数以及图3d、3e和3f中的BLEU分数的右上角描绘的最后编码器和解码器适配器层时，性能急剧下降。这意味着最后的适配器层学习大部分域信息。我们还观察到最后的编码器和解码器层对性能的贡献不同删除最后一个编码器层（列0-11）导致所有解码器层的分数大幅下降。这表明最后一个编码器层是必不可少的。仅保留最后一个解码器适配器（行12我们还观察到，仅保留适配器的最后50%，来自编码器和解码器两者的层将参数效率增加0。7%的参数，如表5中所总结，而不会显著损害性能。8结论我们是第一个研究参数有效的迁移学习表和文本的抽象问题的回答使用适配器。我们证明了参数有效的适配器调整优于微调域外的表格数据，并取得了可比的结果域内的文本数据。我们提出了一种从层次表到规则表的转换，并进一步转换为与预训练模型兼容的序列形式。我们将现有的适配器层消融研究扩展到编码器-解码器设置，并证明来自编码器末端的适配器层与同一级别的解码器适配器层相比，可指示编码模态特定我们的研究结果是有用的探索QA模型的可扩展性在内存受限的情况下，具有可比的性能，同时跨模式使用轻量级适配器扩展我们的工作的局限性之一是，我们的模型没有显式地推理和聚合表单元格。这可能会导致在具有挑战性的Tablesum数据集上出现流畅但实际上不正确的答案。解决这一限制问题将留待今后工作。9确认我们要感谢爱思唯尔在整个项目中的支持和资助。这项工作也得到了NWO创新研究激励计划Vidi（016.Vidi.189.039），NWO智能文化- 大数据\u002F数字人文（314-99-301），H2020-EU.3.4。 - 社会挑战-智能、绿色、综合交通（814961）。所有内容都代表作者的意见，不一定得到各自雇主和\u002F或赞助商的认可或认可+v：mala2277获取更多论文引用艾西瓦亚·阿格拉瓦尔，陆佳森，斯坦尼斯瓦夫·安托尔，马·米切尔，C.劳伦斯·齐特尼克，德鲁夫·巴特拉，和德维·帕里克。2016. VQA：视觉问题回答。arXiv预印本arXiv：1505.00468。Lisa Bauer，Yicheng Wang，and Mohit Bansal. 2018.生成式多跳问题回答任务的常识在EMNLP。作者：Alice H.哦2000.口语对话系统的随机语言生成在ANLP\u002FNAACL 2000年会议记录中。《对话系统》，第27-32页。陈三元、侯玉泰、崔一鸣、车万象、刘婷、余翔战。2020年。回忆和学习：微调深度预训练的语言模型，减少遗忘。在2020年自然语言处理经验方法会议（EMNLP）中，第7870计算语言学协会.Zhujun Cheng，Haoyu Dong，Zhiruo Wang，RanJia，Jiaqi Guo，Yan Gao，Shi Han，Jian-GuangLou，and Dongmei Zhang. 2021. Hitab：用于问答和自然语言生成的分层表数据集。arXiv预印本arXiv：2108.06712。作者声明：John R.崔帕斯，还有哈米德·扎曼尼.2021年多模态会话信息搜索。在SIGIRACM。Robert M.法语1999. 连接主义网络中的灾难性遗忘。Trends in Cognitive Sciences，3（4）：128Junliang Guo ， Zhirui Zhang ， Linli Xu ， Hao-RanWei，Boxing Chen，and Enhong Chen. 2020. 用适配器。神经信息处理系统进展，第33卷，第10843-10854页。Curran Associates，Inc.JonathanHerzig ， ThomasMüller ， SyrineKrichene，and Julian Eisenschlos.2021. 开放领域的问题通过密集检索表。计算语言学协会北美分会2021年会议论文集：人类语言技术。Jonathan Herzig，Pawel Krzysztof Nowak，ThomasMüller ， FrancescoPiccinno ， andJulianEisenschlos. 2020. TaPas：通过预训练进行弱监督表解析。在计算语言学协会第58届年会的会议记录中，第4320-4333页，在线。计算语言学协会。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentinDeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly.2019年a。NLP的参数有效迁移学习。第36届国际机器学习会议论文集，机器学习研究论文集第97卷，第2790-2799页。PMLR。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentindeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly. 2019年b. NLP的参数有效迁移学习。 arXiv 预印本 arXiv ：1902.00751。德鲁·A Hudson和Christopher D.曼宁2019. GQA：一个用于真实世界视觉推理和组合问题回答的新数据集。arXiv预印本arXiv：1902.09506。洪家谦，安妮·劳舍尔，西蒙娜·保罗·庞泽托，戈兰·格拉瓦托。2021. DS-TOD：面向任务对话的高效领域专门化。 arXiv 预印本 arXiv ：2110.08395。Yannis Katsis，Saneem Chemmengath，VishwajeetKumar， Samarth Bharadwaj ， Mustafa Canim ，Michael Glass，Alfio Gliozzo，Feifei Pan，Jay-deep Sen ， KarthikSankaranarayanan ， andSoumen Chakrabarti. 2021. AIT-QA：航空业复杂表格的问答数据集。 arXiv 预印本 arXiv ：2106.12944。JamesKirkpatrick ， RazvanPascanu ， NeilRabinowitz，JoelVeness，GuillaumeDesjardins，Andrei A. Rusu，Kieran Milan，JohnQuan ， Tiago Ramalho ， Agnieszka Grabska-Barwinska，Demis Hassabis，Claudia Clopath，Dharshan Kumaran，and Raia Hadsell. 2017.克服神经网络中的灾难性遗忘arXiv预印本arXiv：1612.00796。托马斯 ·K·o·c· 阿尼斯克， JonathanSchw arz ，PhilBlunsom， ChrisDyer ， KarlMoritzHermann，GáborMelis，andEdwardGrefenstette.2018. NarrativeQA阅读理解挑战。Transactions of the Association for ComputationalLinguistics，6：317-328.Shimi Salant，Tom Kwiatkowski，Ankur Parikh，Dipanjan Das，and Jonathan Berant. 2016.学习提取性问题回答的循环广度表征。arXiv预印本arXiv：1611.01436。Mike Lewis，Yinhan Liu，Naman戈亚尔，Mar-jan Ghazvininejad ， Abdelrahman Mohamed ，OmerLevy ， VesStoyanov ， andLukeZettlemoyer. 2019. Bart：用于自然语言生成、翻译和理解的去噪序列到序列预训练。林兆江，Andrea Madotto和Pascale Fung。2020. 通过参数有效的迁移学习探索通用生成语言模型。在计算语言学协会的调查结果：EMNLP 2020，第441-459页，在线。计算语言学协会.+v：mala2277获取更多论文Rajarshee Mitra 201","totalNum":1,"upLimitPageNum":0},"downloadNum":0,"previewInfo":{"coverImg":["https:\u002F\u002Fdl-preview.csdnimg.cn\u002F88589315\u002F0001-a3df28fcccb7ae33a15eb7077da062ae_thumbnail.jpeg"],"isPreview":true,"isFromSo":false,"totalPage":14,"defaultCoverImg":"https:\u002F\u002Fcsdnimg.cn\u002Frelease\u002Fdownload\u002Fstatic_files\u002Fpc\u002Fimages\u002Fthumbnail\u002FPDF.png","unloginPreviewNum":0,"soPage":0,"firstPage":1,"sourceType":1,"isPpt":0,"previewImg":[]},"upDate":1701446777000,"isPaySource":false,"tagArr":[{"tagUrl":"https:\u002F\u002Fdownload.csdn.net\u002Ftagalbum\u002F16119","tagName":"性能优化","key":"66ff8b355d764709993c84f8cac24338"}],"isVipExclusive":true,"button4BuyVip":{"broadcastBackgroundColor":"#f84428","url":"https:\u002F\u002Fmall.csdn.net\u002Fvip?spm=1003.2020.3001.4167&utm_source=vip_pc_xz_tabjb","name":"开通VIP（低至0.43\u002F天）","broadcastCharactersColor":"#ffffff","broadcastText":"送3个月"},"sourceLowestPrice":0.43,"userIsStudent":false,"button4Download":{"downloadVipIcon":false,"name":"立即下载"},"pubDate":1701403577000,"userVipCouponNum":0,"favoriteNum":0,"fileSize":1092711,"firstSourceId":88589315,"isFavorite":false,"flag":26,"sourcesStatus":2,"description":"《参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用》\n\n在信息技术领域，信息搜索系统正逐步向着多模态推理发展，以满足处理非结构化文本和结构化表格等多样化数据的需求。传统的问答系统(Question Answering, QA)通常依赖于特定模态的微调模型，这不仅需要大量的训练资源，而且限制了模型的通用性。为了解决这一问题，研究者们提出了参数高效的抽象QA模型，通过在Transformer层间添加小而专的瓶颈层，即适配器层，实现对不同模态数据的有效处理。\n\n该模型的核心在于适配器层的运用，它们能够在预训练的Transformer模型基础上进行微调，而无需大量额外的训练参数。这种设计允许模型在结构化表格数据和非结构化文本数据上同时表现出色，只需1.5%的额外参数。通过对编码器和解码器模块的适配器层进行消融研究，研究者们探索了效率与性能之间的平衡。进一步压缩可训练参数至0.7%，模型在表格QA数据集如TableSum和FeTaQA上超越了当前最先进的模型，并在文本QA数据集如NarrativeQA上实现了与微调模型相当的性能，但所用的参数显著减少。\n\n近年来，开放域问答系统的进步主要归功于大规模预训练的语言模型，如自然答案生成的LM头部、文本适配器和解码器中的适配器等。然而，这些模型往往需要针对特定模态进行微调，导致它们在处理不同类型的输入时兼容性较差。比如，对于表格格式的QA任务，模型需要学习表格单元格的行列位置，这使得此类模型难以应用于文本数据。多模态模型虽然尝试结合文本和表格进行推理，但由于输入序列的加长，可能导致上下文编码的限制。\n\n为了克服这些挑战，研究人员引入了适配器层的概念，这些层被插入到预训练的Transformer层之间，它们可以针对不同的任务进行微调，如多语言翻译、分类和文本生成等。尽管之前的研究已经验证了适配器层在语言模型如BERT和RoBERTa中的有效性，但对于编码器-解码器架构中单个适配器层的作用及其相互影响，尚未有深入的分析。本文的工作填补了这一空白，通过消融实验研究了编码器和解码器模块中适配器层的影响，揭示了参数与性能之间的微妙关系。\n\n这项工作为构建高效、灵活的多模态信息搜索系统提供了新的视角。通过适配器层的创新应用，模型能够在处理表格和文本数据时保持高性能，同时降低了训练成本，这对于未来的信息检索和问答系统设计具有重要的指导意义。","title":"参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用","showCBeansBool":true,"abTest10140":1,"isShowCopyRightIcon":false,"viewCountInteger":107,"tagStr":"[\"性能优化\"]","sourcePrice":0,"downloadToday":false,"viewCount":"107","userBalance":0,"minVipBalance":8600,"bundledVipInfo":{"hitId":0,"isBundledVip":false},"cBeans":90,"vipDiscount":0.9,"isCertification":false,"fileSizeFormat":"1.04MB","firstIsessence":"WENKU_PDF_SOURCES","fileTypeUrl":"https:\u002F\u002Fcsdnimg.cn\u002Frelease\u002Fdownload\u002Fstatic_files\u002Fpc\u002Fimages\u002Fminetype\u002FPDF.png","tarArrString":"[{\"key\":\"66ff8b355d764709993c84f8cac24338\",\"tagName\":\"性能优化\",\"tagUrl\":\"https:\u002F\u002Fdownload.csdn.net\u002Ftagalbum\u002F16119\"}]","userPayExpire":true,"userIsEmployee":false,"couponsValue":0,"sourceScore":5,"sourceAuthor":"cpongm","tagNavList":[],"userIsRisk":true,"activitiesTips":"限时抽奖","fileType":"PDF","optimalCouponsExpirationDate":"","vipActivityConfig":{"vip11EndTime":1605283200,"renewalDiscount":8,"vip11beginTime":1604678400,"vip11word":"领券续费立减¥100"}},"sourceAuthorInfo":{"authorVip":false,"ownColumnNum":0,"userStatus":1,"authorAvatarUrl":"https:\u002F\u002Fprofile-avatar.csdnimg.cn\u002Fdefault.jpg!1","ownFansNum":5,"ownCourseNum":0,"downloadNum":"1291","isFollow":false,"authorUserName":"cpongm","ownSourcesNum":"2万+","authorNickName":"cpongm"},"breadcrumbList":[{"categoryName":"首页","url":"https:\u002F\u002Fwenku.csdn.net\u002F","key":"048fe2a4ae754297b1195654efb3057e"},{"categoryName":"参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用","url":"https:\u002F\u002Fwenku.csdn.net\u002Fpdf\u002F71ss855c0t","key":"43d5a39c502c4d16ae85c69030470f87"}],"sourceDetailCouponConfig":{"couponSwitch":true,"couponDesc":"30元优惠券"},"recommendationsList":{"ext":{"highlight":["多模态","编码器","解码器","qa","高效","信息","参数","模型","抽象","搜索","系统","应用","中"],"contain_baidu":false},"items":[{"ext":{"item":{"filetype":"pdf","index":1,"pic":"https:\u002F\u002Fimg-home.csdnimg.cn\u002Fimages\u002F20210720083512.png","title":"1-3+中文大规模多模态预训练模型M6.pdf","type":"download","url":"https:\u002F\u002Fdownload.csdn.net\u002Fdownload\u002Fwenyusuran\u002F84997249","createdAt":"2022-03-18 09:21:22","sourcesize":"4699349","subTitle":"-","id":"84997249","tag":"","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"wenyusuran","desc":"3. 位置编码：M6模型使用位置编码来捕获图像和文本中的位置信息。 M6模型预训练方法： M6模型使用多任务预训练方法，包括图像-文本生成、图像描述、文本分类等多种任务。预训练方法主要有以下几点： 1. 多任务..."}},"productId":"84997249","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":1,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":1,"dest":"https:\u002F\u002Fdownload.csdn.net\u002Fdownload\u002Fwenyusuran\u002F84997249","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-1-84997249-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fdownload.csdn.net\u002Fdownload\u002Fwenyusuran\u002F84997249","spm":"1003.2020.3001.6616.1"},"eventClick":true,"eventView":true},"index":1,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"download"},{"ext":{"item":{"filetype":"zip","index":2,"pic":"https:\u002F\u002Fimg-home.csdnimg.cn\u002Fimages\u002F20210720083736.png","title":"多模态大模型应用-本地化部署VQGAN+CLIP-不使用colab-附流程教程-优质大模型应用实战.zip","type":"download","url":"https:\u002F\u002Fdownload.csdn.net\u002Fdownload\u002Fweixin_66442839\u002F89279693","createdAt":"2024-05-08 10:26:34","sourcesize":"32045070","subTitle":"-","id":"89279693","tag":"多模态大模型应用 VQGAN CLIP 本地化部署优质大模型应用","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"weixin_66442839","desc":"在当前的IT领域，多模态大模型的应用已经成为人工智能研究和开发的重要方向。VQGAN（Vector Quantized Generative Adversarial Networks）和CLIP（Contrastive Language-Image Pretraining）是两种在图像处理和自然..."}},"productId":"89279693","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":2,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":2,"dest":"https:\u002F\u002Fdownload.csdn.net\u002Fdownload\u002Fweixin_66442839\u002F89279693","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-download-2~default~OPENSEARCH~Rate-2-89279693-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fdownload.csdn.net\u002Fdownload\u002Fweixin_66442839\u002F89279693","spm":"1003.2020.3001.6616.2"},"eventClick":true,"eventView":true},"index":2,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"download"},{"ext":{"item":{"index":3,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"给我推荐20个比流行的多模态模型","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4830538317b64f1d9c3dd573d1f79b3a","createdAt":"2023-08-31 16:41:56","subTitle":"-","id":"4830538317b64f1d9c3dd573d1f79b3a","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"weixin_41194129","desc":"12. Multi-modal Variational Autoencoder：结合变分自编码器的多模态生成模型。 13. Bi-STMM：结合文本和图像信息的时空多模态建模模型。 14. Multi-model Deep Neural Networks：结合多个深度神经网络模型的多模态..."}},"productId":"4830538317b64f1d9c3dd573d1f79b3a","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":3,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":3,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4830538317b64f1d9c3dd573d1f79b3a","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-3-4830538317b64f1d9c3dd573d1f79b3a-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4830538317b64f1d9c3dd573d1f79b3a","spm":"1003.2020.3001.6616.3"},"eventClick":true,"eventView":true},"index":3,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":4,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"多模态信息表示的国内外研究现状","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7efa3116043648d4b66c278a7f9f9542","createdAt":"2023-05-22 02:54:31","subTitle":"-","id":"7efa3116043648d4b66c278a7f9f9542","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"xmmmm1214","desc":"(2) 基于深度学习的方法：国内研究者也在多模态信息表示方面进行了大量的基于深度学习的研究，主要是使用编码器-解码器的方法。 (3) 基于知识图谱的方法：国内研究者还尝试将多模态信息表示与知识图谱相结合，从而..."}},"productId":"7efa3116043648d4b66c278a7f9f9542","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":4,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":4,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7efa3116043648d4b66c278a7f9f9542","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-4-7efa3116043648d4b66c278a7f9f9542-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7efa3116043648d4b66c278a7f9f9542","spm":"1003.2020.3001.6616.4"},"eventClick":true,"eventView":true},"index":4,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":5,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"给我推荐20个多模态模型","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5b8324acd1b84084982d11d318942d5a","createdAt":"2023-08-09 12:17:53","subTitle":"-","id":"5b8324acd1b84084982d11d318942d5a","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"weixin_41194129","desc":"12. MARN：多模态对话系统模型，用于视觉问答和对话任务。 13. SCAN：一种用于图像和文本对齐的模型，可进行跨模态检索和检测。 14. HME-VR：一种用于多模态情感识别的模型，结合了语言和视觉特征。 15. VSE++：..."}},"productId":"5b8324acd1b84084982d11d318942d5a","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":5,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":5,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5b8324acd1b84084982d11d318942d5a","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-5-5b8324acd1b84084982d11d318942d5a-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5b8324acd1b84084982d11d318942d5a","spm":"1003.2020.3001.6616.5"},"eventClick":true,"eventView":true},"index":5,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":6,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"在多模态领域，在模态缺失的情况下，将卷积网络与transformer串联使用作为自动编码器的编码器，有什么优势,请详细说明","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002Fcf1aae7c860e43f8b9d53e73613d3a5c","createdAt":"2023-08-17 20:22:56","subTitle":"-","id":"cf1aae7c860e43f8b9d53e73613d3a5c","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"weixin_44708258","desc":"综上所述，将卷积网络与transformer串联使用作为自动编码器的编码器，在多模态领域中可以充分利用卷积网络和transformer的优势，解决模态缺失的问题，提高模型的表达能力和泛化能力，更好地处理多模态输入数据。"}},"productId":"cf1aae7c860e43f8b9d53e73613d3a5c","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":6,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":6,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002Fcf1aae7c860e43f8b9d53e73613d3a5c","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-6-cf1aae7c860e43f8b9d53e73613d3a5c-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002Fcf1aae7c860e43f8b9d53e73613d3a5c","spm":"1003.2020.3001.6616.6"},"eventClick":true,"eventView":true},"index":6,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":7,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"VAE编码器和解码器如何创新进行时间序列异常检测","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4f93370cae9749739f93d29ba6c99591","createdAt":"2023-04-05 02:53:42","subTitle":"-","id":"4f93370cae9749739f93d29ba6c99591","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"chunzhen_2020","desc":"3. 引入多模态信息：在编码器中引入多模态信息，即同时考虑多个时间序列数据的信息，可以帮助模型更好地理解数据之间的关系，从而提高异常检测的准确性。 4. 结合深度学习和传统方法：结合深度学习和传统的时间序列..."}},"productId":"4f93370cae9749739f93d29ba6c99591","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":7,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":7,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4f93370cae9749739f93d29ba6c99591","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-7-4f93370cae9749739f93d29ba6c99591-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4f93370cae9749739f93d29ba6c99591","spm":"1003.2020.3001.6616.7"},"eventClick":true,"eventView":true},"index":7,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":8,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"大模型、小模型、多模态的关系","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4e9782235e61455ba8dabc603e6f546d","createdAt":"2023-03-28 02:07:58","subTitle":"-","id":"4e9782235e61455ba8dabc603e6f546d","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"edison_yang1","desc":"此外，多模态还可以利用不同模态之间的关联性进行跨模态信息的传递和融合，从而进一步提升模型的性能。最后，大模型、小模型和多模态之间可以相互结合，从而实现更加灵活和高效的模型设计。例如，可以使用小模型对..."}},"productId":"4e9782235e61455ba8dabc603e6f546d","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":8,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":8,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4e9782235e61455ba8dabc603e6f546d","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-8-4e9782235e61455ba8dabc603e6f546d-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F4e9782235e61455ba8dabc603e6f546d","spm":"1003.2020.3001.6616.8"},"eventClick":true,"eventView":true},"index":8,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":9,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"深度学习是大模型还是多模态","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7x71ybxsop","createdAt":"2024-06-29 01:08:16","subTitle":"-","id":"7x71ybxsop","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"m0_51696651","desc":"深度学习系统可能同时具备大模型（通过深层架构和参数规模）和多模态（处理不同类型输入）的特点。它在很多领域，如计算机视觉、自然语言处理和语音识别中都有广泛应用，并且随着研究的发展，往往会融合更多的模态和..."}},"productId":"7x71ybxsop","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":9,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":9,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7x71ybxsop","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-9-7x71ybxsop-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7x71ybxsop","spm":"1003.2020.3001.6616.9"},"eventClick":true,"eventView":true},"index":9,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":10,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"军事多模态认知大模型训练算法及模型研制","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F3wtfk5bejo","createdAt":"2024-07-02 01:07:49","subTitle":"-","id":"3wtfk5bejo","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"weixin_46426641","desc":"军事多模态认知大模型是一种结合了多种信息表达形式（如文本、图像、音频等）的高级人工智能系统，其训练算法旨在模拟人类军事决策过程中的多维度分析和理解能力。这种模型的研制通常涉及以下步骤和技术： 1. **..."}},"productId":"3wtfk5bejo","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":10,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":10,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F3wtfk5bejo","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-10-3wtfk5bejo-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F3wtfk5bejo","spm":"1003.2020.3001.6616.10"},"eventClick":true,"eventView":true},"index":10,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":11,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"多模态大模型构建与应用技术路线图","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F2cgiqfyaiw","createdAt":"2024-09-07 01:06:03","subTitle":"-","id":"2cgiqfyaiw","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"luseruo","desc":"6. 应用开发：基于训练好的模型开发实际应用，比如图像与文本的联合搜索、跨模态的信息检索、多模态对话系统等。 7. 模型迭代与更新：根据应用反馈和数据的变化不断迭代更新模型，以提高其鲁棒性和适应性。"}},"productId":"2cgiqfyaiw","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":11,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":11,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F2cgiqfyaiw","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-11-2cgiqfyaiw-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F2cgiqfyaiw","spm":"1003.2020.3001.6616.11"},"eventClick":true,"eventView":true},"index":11,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":12,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"多模态transformer","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6hqtzoikpi","createdAt":"2023-09-08 05:03:32","subTitle":"-","id":"6hqtzoikpi","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"qq_57863900","desc":"在多模态Transformer中，注意力机制被广泛应用于不同模态之间的信息交互。通过计算注意力权重，模型可以自动学习模态间的相关性，从而更好地整合不同模态的信息。多模态Transformer已经在许多应用领域取得了成功，..."}},"productId":"6hqtzoikpi","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":12,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":12,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6hqtzoikpi","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-12-6hqtzoikpi-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6hqtzoikpi","spm":"1003.2020.3001.6616.12"},"eventClick":true,"eventView":true},"index":12,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":13,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"大模型和多模态模型的关系","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002Fgp14e13o6g","createdAt":"2024-08-22 01:00:51","subTitle":"-","id":"gp14e13o6g","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"qq_38930731","desc":"大模型和多模态模型在人工智能领域有着紧密的关系，但它们关注的方向稍有不同： 1. **大模型**通常指的是规模庞大的预训练神经网络模型，例如GPT系列、BERT等，它们拥有数万亿到几百亿个参数，经过大规模的数据训练..."}},"productId":"gp14e13o6g","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":13,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":13,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002Fgp14e13o6g","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-13-gp14e13o6g-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002Fgp14e13o6g","spm":"1003.2020.3001.6616.13"},"eventClick":true,"eventView":true},"index":13,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":14,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"在多模态领域，由卷积网络和transformer组成的编码器，对于特征处理有什么优势？请详细说明","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5d38badac57d4491a1f59ba3e3ad2fe0","createdAt":"2023-09-10 21:38:03","subTitle":"-","id":"5d38badac57d4491a1f59ba3e3ad2fe0","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"weixin_44708258","desc":"综上所述，由卷积网络和Transformer组成的编码器在多模态领域中具有明显的优势。卷积网络能够处理图像等数据的局部特征，参数共享和规模不变性等特点使得模型具有较强的泛化能力；而Transformer则通过自注意力机制..."}},"productId":"5d38badac57d4491a1f59ba3e3ad2fe0","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":14,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":14,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5d38badac57d4491a1f59ba3e3ad2fe0","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-14-5d38badac57d4491a1f59ba3e3ad2fe0-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5d38badac57d4491a1f59ba3e3ad2fe0","spm":"1003.2020.3001.6616.14"},"eventClick":true,"eventView":true},"index":14,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":15,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"用clip模型进行多模态情感分析","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5f7mb9p22h","createdAt":"2023-10-13 01:20:57","subTitle":"-","id":"5f7mb9p22h","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"l2210976373","desc":"使用CLIP模型进行多模态情感分析的方法如下： 1. 收集多模态数据，包括图像、文本等；...在多模态情感分析中，我们可以使用CLIP模型将图像和文本编码为向量，然后将这些向量输入到情感分类器中进行分类。"}},"productId":"5f7mb9p22h","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":15,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":15,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5f7mb9p22h","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-15-5f7mb9p22h-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F5f7mb9p22h","spm":"1003.2020.3001.6616.15"},"eventClick":true,"eventView":true},"index":15,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":16,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"多模态大模型是如何克服跨模态间差异性的？\n在多模态任务中，如何评估模型性能以及优化模型效果？\n大型多模态模型在处理实时数据流时面临哪些挑战？","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7tp2zw7sd7","createdAt":"2024-07-24 01:02:39","subTitle":"-","id":"7tp2zw7sd7","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"2401_82676702","desc":"在多模态任务中，模型面临的最大挑战之一就是如何有效地将来自不同模态的数据（如文本、图像、音频等）转换为统一表示形式，以便进行有效的联合处理。这通常是通过以下几种策略实现的： 1. **嵌入空间统一**：首先..."}},"productId":"7tp2zw7sd7","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":16,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":16,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7tp2zw7sd7","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-16-7tp2zw7sd7-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7tp2zw7sd7","spm":"1003.2020.3001.6616.16"},"eventClick":true,"eventView":true},"index":16,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":17,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"多模态大模型中，多模态主要指的是","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6wynddqgdp","createdAt":"2024-03-08 01:05:00","subTitle":"-","id":"6wynddqgdp","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"m0_37607457","desc":"在传统的单模态模型中，只能处理一种类型的数据，而多模态大模型可以同时处理多种类型的数据，从而更全面地理解和分析信息。多模态主要指的是模型能够同时处理多种类型的数据，并且能够将这些不同类型的数据进行..."}},"productId":"6wynddqgdp","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":17,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":17,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6wynddqgdp","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-17-6wynddqgdp-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6wynddqgdp","spm":"1003.2020.3001.6616.17"},"eventClick":true,"eventView":true},"index":17,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":18,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"cross-transformer模型","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6d64f443717b4048b0b92b2d8e96adce","createdAt":"2023-04-01 02:38:10","subTitle":"-","id":"6d64f443717b4048b0b92b2d8e96adce","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"sdlllxy","desc":"Cross-transformer模型的核心思想是在Transformer的编码器和解码器之间建立跨模态的交互模块，使得模型能够将不同模态的信息进行交互和融合。具体而言，它通过引入跨模态的注意力机制，将不同模态的信息交互起来，..."}},"productId":"6d64f443717b4048b0b92b2d8e96adce","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":18,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":18,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6d64f443717b4048b0b92b2d8e96adce","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-18-6d64f443717b4048b0b92b2d8e96adce-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F6d64f443717b4048b0b92b2d8e96adce","spm":"1003.2020.3001.6616.18"},"eventClick":true,"eventView":true},"index":18,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":19,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"国内开源多模态大模型概述","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7rscoy8pam","createdAt":"2024-07-14 01:08:00","subTitle":"-","id":"7rscoy8pam","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"m0_74431594","desc":"国内开源的多模态大模型通常是指结合了文本、图像、语音等多种模态的预训练模型，这类模型通过大量数据预训练，学习到跨模态的表示和关联能力，能够理解和生成多种类型的信息。比如，它们可以理解一张图片的描述，..."}},"productId":"7rscoy8pam","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":19,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":19,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7rscoy8pam","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-19-7rscoy8pam-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F7rscoy8pam","spm":"1003.2020.3001.6616.19"},"eventClick":true,"eventView":true},"index":19,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"},{"ext":{"item":{"index":20,"pic":"https:\u002F\u002Fcsdnimg.cn\u002Fdownload_wenku\u002Ffile_type_ask_c1.png","title":"多模态dbms学习多模态表示","type":"chatgpt","url":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F1o38pgrzwo","createdAt":"2023-07-23 06:19:07","subTitle":"-","id":"1o38pgrzwo","strategy":"2~default~OPENSEARCH~Rate","views":0,"username":"cpongoc","desc":"在学习多模态表示的过程中，DBMS可以借鉴不同领域的相关研究成果和技术，如图像处理、音频分析和视频编码等。通过这些技术的应用，DBMS可以对多模态数据进行特征提取，提取出有用的信息和特征，以便更好地表示和处理..."}},"productId":"1o38pgrzwo","reportData":{"data":{"mod":"","ab_strategy":"vector_download","index":20,"extra":"{\"utm_medium\":\"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315^v3^control_v2\",\"dist_request_id\":\"1726347388800_46251\"}","dist_request_id":"1726347388800_46251","strategy":"2~default~OPENSEARCH~Rate","_sort_index":20,"dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F1o38pgrzwo","spm":"1003.2020.3001.6616"},"urlParams":{"utm_medium":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315^v3^control_v2","depth_1-utm_source":"distribute.pc_relevant_chatgpt_v2.none-task-chatgpt-2~default~OPENSEARCH~Rate-20-1o38pgrzwo-download-71ss855c0t.315^v3^control_v2","dest":"https:\u002F\u002Fwenku.csdn.net\u002Fanswer\u002F1o38pgrzwo","spm":"1003.2020.3001.6616.20"},"eventClick":true,"eventView":true},"index":20,"recommendType":"ali","strategyId":"2~default~OPENSEARCH~Rate","style":"text_1","productType":"chatgpt"}]},"topAdsList":[{"beginTimestamp":1725897600000,"jumpUrl":"https:\u002F\u002Fmall.csdn.net\u002Fvip?utm_source=vip_pc_wkdt","isShow":true,"imgUrl":"https:\u002F\u002Fimg-home.csdnimg.cn\u002Fimages\u002F20240906033110.png","configId":"370767850727538688","endTimestamp":1727712000000}],"latestSliderSources":[{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002Fb81tpbv0ce","sdescription":" \"移动公司的传输试题，主要涵盖了OptiX传输设备的相关知识，包括填空题和选择题，涉及SDH同步数字体系、传输速率、STM-1、激光波长、自愈保护方式、设备支路板特性、光功率、通道保护环、网络管理和通信基础设施的重要性、路由类型、业务流向、故障检测以及SDH信号的处理步骤等知识点。\"\n\n这篇试题涉及到多个关键的传输技术概念，首先解释几个重要的知识点：\n\n1. SDH（同步数字体系）是一种标准的数字传输体制，它将不同速率的PDH（准同步数字体系）信号复用成一系列标准速率的信号，如155M、622M、2.5G和10G。\n\n2. STM-1（同步传输模块第一级）是SDH的基本传输单元，速率为155Mbps，能容纳多个2M、34M和140M业务。\n\n3. 自愈保护机制是SDH的重要特性，包括通道保护、复用段保护和子网连接保护，用于在网络故障时自动恢复通信，确保服务的连续性。\n\n4. OptiX设备的支路板支持不同阻抗（75Ω和120Ω）和环回功能，环回测试有助于诊断和定位问题。\n\n5. 光功率的度量单位dBm，0dBm表示光功率为1毫瓦。\n\n6. 单向通道保护环在光纤中断时能够快速切换，保持业务不中断。例如，A-C业务在A-B光纤中断时仍能保持。\n\n7. 传输网是通信基础设施的核心，对于信息的传送至关重要。\n\n8. 映射、定位和复用是将PDH信号融入SDH帧结构的关键步骤，其中映射是将低速信号放入高速信号的容器，定位则是确保信号在正确的时间位置发送，复用则是在更高层次的信号中组合多个低速信号。\n\n9. 单向通道保护环带链的拓扑结构中，环上交叉点站需要配置额外的光板来支持不同方向的业务。\n\n10. 时钟的工作模式中，通常锁相模式（GPS同步）具有最高的精度，能提供稳定的系统定时。\n\n这些知识点不仅适用于移动公司的传输网络维护，也是理解现代通信网络基础架构的关键。掌握这些概念和技术，对于网络工程师来说至关重要，能够有效提升网络的稳定性和可靠性。","stitle":"OptiX传输试题与SDH基础知识"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F24tfp4tkjk","sdescription":"\"C++Builder函数一览\"\n\nC++Builder是一个集成开发环境（IDE），它提供了丰富的函数库供开发者使用。在C++Builder中，函数是实现特定功能的基本单元，这些函数覆盖了从基本操作到复杂的系统交互等多个方面。下面将详细讨论部分在描述中提及的函数及其作用。\n\n首先，我们关注的是与Action相关的函数，这些函数主要涉及到用户界面（UI）的交互。`CreateAction`函数用于创建一个新的Action对象，Action在C++Builder中常用于管理菜单、工具栏和快捷键等用户界面元素。`EnumRegisteredAction`用于枚举已经注册的Action，这对于管理和遍历应用程序中的所有Action非常有用。`RegisterAction`和`UnRegisterAction`分别用于注册和反注册Action，注册可以使Action在设计时在Action列表编辑器中可见，而反注册则会将其从系统中移除。\n\n接下来是来自`Classes.hpp`文件的函数，这部分函数涉及到对象和集合的处理。`Bounds`函数返回一个矩形结构，根据提供的上、下、左、右边界值。`CollectionsEqual`函数用于比较两个`TCollection`对象是否相等，这在检查集合内容一致性时很有帮助。`FindClass`函数通过输入的字符串查找并返回继承自`TPersistent`的类，`TPersistent`是C++Builder中表示可持久化对象的基类。`FindGlobalComponent`变量则用于获取最高阶的容器类，这在组件层次结构的遍历中常用。`GetClass`函数返回一个已注册的、继承自`TPersistent`的类。`LineStart`函数用于找出文本中下一行的起始位置，这在处理文本文件时很有用。`ObjectBinaryToText`、`ObjectResourceToText`、`ObjectTextToBinary`和`ObjectTextToResource`是一组转换函数，它们分别用于在二进制流、文本文件和资源之间转换对象。`Point`和`Rect`函数则用于创建和操作几何形状，如点和矩形。`ReadComponentRes`、`ReadComponentResEx`和`ReadComponentResFile`用于从资源中读取和解析组件及其属性。`RegisterClass`、`UnregisterClass`以及它们的相关变体`RegisterClassAlias`、`RegisterClasses`、`RegisterComponents`、`RegisterIntegerConsts`、`RegisterNoIcon`和`RegisterNonActiveX`主要用于类和控件的注册与反注册，这直接影响到设计时的可见性和运行时的行为。\n\n这些函数只是C++Builder庞大函数库的一部分，它们展示了C++Builder如何提供强大且灵活的工具来支持开发者构建高效的应用程序。理解并熟练使用这些函数对于提升C++Builder项目开发的效率至关重要。通过合理利用这些函数，开发者可以创建出功能丰富、用户体验良好的桌面应用程序。","stitle":"C++Builder函数详解与应用"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F8bov69qy5q","sdescription":" \"这篇文章主要介绍了在Shell (Bash) 中使用的比较运算符，包括文件和字符串的比较。这些运算符帮助我们检查文件是否存在、是否为目录、是否可执行，以及字符串是否为空、相等或不等。此外，还涵盖了数值的比较。\"\n\n在Shell (Bash) 脚本编程中，比较运算符是非常关键的部分，它们允许我们基于条件执行不同的操作。以下是一些主要的文件和字符串比较运算符：\n\n1. 文件比较运算符：\n - `-e filename`：如果文件`filename`存在，则返回真。例如，`[ -e \u002Fvar\u002Flog\u002Fsyslog ]`。\n - `-d filename`：如果`filename`是目录，则返回真。例如，`[ -d \u002Ftmp\u002Fmydir ]`。\n - `-f filename`：如果`filename`是普通文件，则返回真。例如，`[ -f \u002Fusr\u002Fbin\u002Fgrep ]`。\n - `-L filename`：如果`filename`是符号链接，则返回真。例如，`[ -L \u002Fusr\u002Fbin\u002Fgrep ]`。\n - `-r filename`：如果`filename`可读，返回真。例如，`[ -r \u002Fvar\u002Flog\u002Fsyslog ]`。\n - `-w filename`：如果`filename`可写，返回真。例如，`[ -w \u002Fvar\u002Fmytmp.txt ]`。\n - `-x filename`：如果`filename`可执行，返回真。例如，`[ -x \u002Fusr\u002Fbin\u002Fgrep ]`。\n\n2. 文件时间戳比较：\n - `filename1 -nt filename2`：如果`filename1`比`filename2`更新，则返回真。例如，`[ \u002Ftmp\u002Finstall\u002Fetc\u002Fservices -nt \u002Fetc\u002Fservices ]`。\n - `filename1 -ot filename2`：如果`filename1`比`filename2`更旧，则返回真。例如，`[ \u002Fboot\u002FbzImage -ot arch\u002Fi386\u002Fboot\u002FbzImage ]`。\n\n3. 字符串比较运算符：\n - `-z string`：如果字符串`string`为空，返回真。例如，`[ -z \"$myvar\" ]`。\n - `-n string`：如果字符串`string`非空，返回真。例如，`[ -n \"$myvar\" ]`。\n - `string1 = string2`：如果字符串`string1`和`string2`相等，返回真。例如，`[ \"$myvar\" = \"onetwothree\" ]`。\n - `string1 != string2`：如果字符串`string1`和`string2`不相等，返回真。例如，`[ \"$myvar\" != \"onetwothree\" ]`。\n\n4. 数值比较运算符：\n - `num1 -eq num2`：如果数字`num1`等于`num2`，返回真。例如，`[ 3 -eq $mynum ]`。\n - `num1 -ne num2`：如果数字`num1`不等于`num2`，返回真。例如，`[ 3 -ne $mynum ]`。\n - `num1 -lt num2`：如果数字`num1`小于`num2`，返回真。例如，`[ 3 -lt $mynum ]`。\n - `num1 -le num2`：如果数字`num1`小于或等于`num2`，返回真。例如，`[ 3 -le $mynum ]`。\n - `num1 -gt num2`：如果数字`num1`大于`num2`，返回真。例如，`[ 3 -gt $mynum ]`。\n - `num1 -ge num2`：如果数字`num1`大于或等于`num2`，返回真。例如，`[ 3 -ge $mynum ]`。\n\n通过这些比较运算符，我们可以编写出灵活的脚本，根据文件状态、字符串内容或数值大小执行相应的操作。在实际使用中，通常会结合`if`语句来判断条件，以控制脚本流程。例如，如果一个文件不存在，可以创建它；如果一个变量的值满足特定条件，可以执行特定的命令。这些都是Shell脚本中的基本逻辑控制。","stitle":"Linux shell (bash) 文件与字符串比较运算符详解"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F3kw9qaj4ug","sdescription":"WKT (Well-Known Text) 是一种在地理信息系统 (GIS) 中广泛使用的文本格式，用于编码和表示空间参考系统。它最初由 OpenGIS Project 设计，用于 Simple Features 标准，该标准定义了如何在统一的文本形式下描述几何对象和坐标系统。WKT 格式具有严格的语法，允许用户定义各种投影和坐标体系。\n\nAdam Gawne-Cain 在 1999 年 7 月 12 日撰写了关于 WKT 格式澄清的文档，主要关注的是缺乏一个通用的文本值列表，以便不同的 GIS 系统在使用 OpenGIS 接口时能够明确识别彼此的空间参考系统。这会导致不同系统之间的互操作性受到限制，因为没有标准的文本描述，它们可能无法有效地交换和理解对方的数据。\n\n该文档提议为常用投影提供文本值，并详细列出了每个投影所预期的参数。Simple Features 的空间参考系统模型基于 European Petroleum Survey Group (EPSG) 的模型，EPSG 维护了一个包含常见空间参考系统的数据库。这些 EPSG 编码为不同的坐标系统提供了唯一标识符，使得在 WKT 格式中准确地指代和转换坐标成为可能。\n\nWKT 格式的使用涉及到以下几个关键部分：\n\n1. **格式定义**：WKT 采用一种精确的语法，包括几何类型（如点、线、面）、坐标系描述（如投影参数和椭球体）、以及坐标的表示方法。\n\n2. **投影支持**：文档强调了对多种投影的支持，包括常见的横轴墨卡托投影、UTM 系统等，这些都是地图制图和地理分析中的基础元素。\n\n3. **EPSG代码**：WKT 格式中的空间参考系统通过 EPSG 前缀和四位数字代码来识别，比如 \"EPSG:4326\" 表示 WGS84 坐标系统，这是地理定位和 Web 地图上的标准。\n\n4. **互通性问题**：为了解决不同 GIS 系统间的数据交流难题，引入了通用的文本值，使得即使没有预先定义的映射，系统也能理解并处理来自其他系统的 WKT 数据。\n\n5. **参数列表**：文档详细列出了每种投影所需的参数，以便开发人员能够正确解析和应用在他们的应用程序中。\n\nWKT 格式是 GIS 开发者和数据交换中的一个重要工具，它确保了空间数据的标准化和一致性，尤其是在跨国和跨平台项目中。通过理解 WKT 格式及其与 EPSG 的关联，开发者能够创建兼容且可互操作的应用程序，促进地理信息的共享和分析。","stitle":"Adam Gawne-Cain解读英文版WKT格式与常见投影标准"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F884fm7b98q","sdescription":"本文档详细介绍了DOS命令大全，特别是基础命令部分，涵盖了常用的文件和目录管理、屏幕操作、文件复制与移动、文件删除、文件夹操作、磁盘格式化以及网络测试等实用功能。\n\n1. **基础命令**\n - **dir** (目录浏览): 常用命令用于查看当前目录的文件和文件夹。可使用参数如 `\u002Fs` 显示所有子目录，`\u002Fa` 显示包括隐藏文件，`\u002Fw` 以紧凑模式显示，`\u002Fp` 分页显示，或通过 `dir\u002Fw | more` 结合 `more` 命令实现类似效果。\n - **cd** (改变目录): 进入指定目录，`cd\\` 回到根目录，`cd..` 上级目录。\n - **md** (创建目录) 和 **rd** (删除目录): 分别用于新建和删除文件夹。\n - **cls** 清除屏幕。\n - **copy** 和 **move** (文件操作): 分别用于复制和移动文件。\n - **del** 和 **deltree** (文件和文件夹删除): `del` 删除单个或多个文件，`deltree` 强力删除目录及其内容。\n - **format** 和 **formatx** (磁盘格式化): 对磁盘分区进行格式化，通常使用`fat`格式，Windows 2000以后可能支持`ntfs`。\n - **type** (文件内容查看): 显示文本文件内容。\n - **edit** (文本编辑器): 实际上是个文本编辑小程序。\n - **ren** (重命名文件): 改变文件名称。\n\n2. **网络相关命令**\n - **ping** (网络测试): 发送ICMP数据包验证网络连通性，`ping -t` 可持续发送。\n - **net**: 提供丰富的网络管理功能，使用`net\u002F?` 获取帮助。\n\n这些命令在早期的计算机操作系统，如MS-DOS环境下，是用户进行日常操作和系统维护的重要工具。了解并掌握这些命令，对于理解基础的计算机系统原理和解决简单的系统问题具有重要意义。随着现代操作系统的发展，虽然图形界面操作更为普及，但掌握这些基本命令仍然有助于提升计算机素养。","stitle":"dos命令详解：基础操作与网络测试必备"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F2ujj5ahfjf","sdescription":"\"蓝屏代码大全\"\n\n这篇资源是一个全面解析计算机蓝屏问题的指南，特别是针对Windows XP系统。蓝屏，也称为系统崩溃或蓝屏死亡（BSoD），是操作系统遇到严重错误时的一种表现，通常伴随着一个特定的停机码（Stop Code）。\n\n1、蓝屏含义\n - 故障检查信息：停机码是识别错误类型的标识，例如\"STOP0x0000001E\"，后面的四个数字集是随机参数，对普通用户来说难以理解，但对于驱动开发者或操作系统设计者有参考价值。错误名如\"KMODE_EXCEPTION_NOT_HANDLED\"提供了关于错误的简要描述。\n - 推荐操作：蓝屏信息第二部分通常给出一般性建议，如重启电脑，或者在某些情况下，建议访问制造商网站寻找BIOS更新。\n - 调试端口信息：这部分可能包含内存转储到硬盘的情况，以及是否通过网络发送调试信息，这对高级用户或技术支持人员诊断问题很有帮助。\n\n2、蓝屏的处理方法\n - 重启：这是最简单的解决方法，有时候重启后问题即可自动解决。\n - 新硬件：检查新安装的硬件是否安装牢固，并尝试在不同插槽中插入，同时确保使用最新驱动程序。硬件兼容性问题也可能导致蓝屏，可以查阅微软的硬件兼容列表。\n - 软件冲突：检查最近安装的软件是否与现有系统或驱动冲突，有时卸载这些软件能解决问题。\n - 内存问题：运行内存检测工具，如Windows内置的Memory Diagnostics，以检查是否存在内存故障。\n - 驱动程序更新：确保所有驱动程序都是最新版本，特别是显卡和声卡驱动，因为它们经常引起问题。\n - 系统还原：如果问题在近期出现，可以尝试恢复到出问题前的系统还原点。\n - 安全模式启动：在安全模式下启动电脑，有助于识别和解决问题，因为在这种模式下，只加载最基本的驱动和服务。\n - 病毒扫描：蓝屏也可能是病毒或恶意软件的结果，运行反病毒软件进行全面扫描。\n\n这篇文档涵盖了蓝屏代码的解析以及一系列通用的解决步骤，旨在帮助用户和IT支持人员诊断并修复电脑蓝屏问题。尽管Windows 2K\u002FXP时代的蓝屏信息可能与现代操作系统有所差异，但其基本原理和解决策略依然适用于现代Windows版本，因为蓝屏的核心原因——硬件不兼容、驱动问题、软件冲突等——仍然是普遍存在的问题。","stitle":"Windows 蓝屏代码解析与处理指南"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F4kch640iv3","sdescription":"\"基于PSoC CY8C24533 的电动自行车控制器设计，探讨了PSoC技术，特别是CY8C24533芯片的特性，并详细阐述了利用该芯片设计电动自行车控制器的过程。\"\n\n在电动自行车控制器的设计中，PSoC (Programmable System-on-Chip) 技术扮演了核心角色。PSoC是一种由Cypress半导体公司推出的创新性集成电路，它结合了8位微处理器内核、数字和模拟混合信号阵列，提供了一种高度可配置的平台。这种系统级芯片的独特之处在于，通过配置寄存器，可以灵活地实现数字、模拟和逻辑功能的协调工作，使得设计者能够根据具体需求定制硬件功能。\n\nCY8C24533是Cypress半导体专为电机控制设计的PSoC系列芯片。它具备丰富的数字和模拟资源，包括定时器、PWM（脉宽调制）、UART（通用异步收发传输器）、SPI（串行外围接口）、CRC（循环冗余校验）和PRS（可编程逻辑资源）等数字模块，以及放大器、比较器、滤波器等模拟模块。此外，它还集成了AD转换器，这在电机控制中尤为重要，因为电机的实时监测和控制需要精准的模拟信号处理。\n\n对于电动自行车控制器，CY8C24533的优势在于其内置的电机控制功能。它可以有效地管理无刷直流电机（BLDC Motor），这是电动自行车常见的动力单元。通过利用PSoCDesigner开发环境，设计者可以选择和配置预定义的用户模块，如PWM单元用于电机速度控制，以及比较器和滤波器用于电机状态的检测和稳定。PSoCDesigner不仅简化了硬件配置，还提供了API函数库，使得软件开发更为便捷。\n\n在控制器设计过程中，通常需要考虑以下几个关键点：\n\n1. **电机控制算法**：使用CY8C24533的PWM单元实现电机的调速，可能采用梯形或方波换向算法。\n2. **传感器接口**：可能需要连接霍尔效应传感器或其他位置传感器，以确定电机的转子位置。\n3. **电源管理**：确保电池电压监控和高效能源使用。\n4. **安全保护**：过载、短路保护机制，防止电机或电池受损。\n5. **通信接口**：例如UART或SPI，用于与显示单元或远程控制器通信，显示电池状态、速度等信息。\n6. **故障诊断**：通过内置的模拟和数字模块检测系统异常，并采取相应措施。\n\n通过充分利用CY8C24533的灵活性和集成度，电动自行车控制器能够实现高效、可靠且成本效益高的电机控制。同时，由于PSoC架构的可扩展性，未来还可以通过软件升级来增加新功能或优化性能，以适应电动自行车技术的不断发展。","stitle":"PSoC CY8C24533在电动自行车控制器设计中的应用"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F53hftndee3","sdescription":" \"PHP中使用FCKeditor编辑器的配置和应用\"\n\n在PHP开发中，FCKeditor是一款广泛使用的开源富文本编辑器，它基于JavaScript编写，提供了强大的文本编辑功能，支持多浏览器环境，并且兼容多种编程语言。由于其易用性和开源特性，FCKeditor在互联网上有着丰富的技术文档和社区支持，被众多知名网站如百度和阿里巴巴所采用。\n\n首先，要开始使用FCKeditor，你需要从官方网站下载最新的版本。访问FCKeditor官网（http:\u002F\u002Fwww.fckeditor.net）并点击“Download”链接，你可以选择适合你系统的压缩包格式，通常是.zip或.tar.gz。下载完成后，解压缩文件到你的网站根目录下的适当位置。\n\n安装过程相当简单，假设你将FCKeditor文件解压到与PHP调用脚本相同的目录。FCKeditor目录结构中包含了编辑器的核心文件，如check.php用于处理表单提交的数据，而add_article.php和add_article_js.html则是PHP和JavaScript调用FCKeditor的示例文件。\n\n在PHP环境中调用FCKeditor，首要步骤是引入FCKeditor的类文件。这通常通过`include()`函数完成，例如：\n```php\ninclude(\"fckeditor\u002Ffckeditor.php\");\n```\n然后，你需要创建一个FCKeditor实例，指定编辑器的基本路径以及创建编辑器对象。以下是一段创建编辑器实例的示例代码：\n```php\n$oFCKeditor = new FCKeditor('FCKeditor1'); \u002F\u002F 创建实例，'FCKeditor1'是编辑器的名称\n$oFCKeditor-\u003EBasePath = '.\u002Ffckeditor\u002F'; \u002F\u002F 设置FCKeditor的基础路径\n$oFCKeditor-\u003EWidth = '100%'; \u002F\u002F 设置编辑器宽度\n$oFCKeditor-\u003EHeight = '300'; \u002F\u002F 设置编辑器高度\n$oFCKeditor-\u003EValue = ''; \u002F\u002F 初始化编辑器内容\n$oFCKeditor-\u003ECreate(); \u002F\u002F 创建并显示编辑器\n```\n在HTML表单中，你可以将这个PHP代码嵌入，以便用户可以在表单中使用FCKeditor编辑内容。\n\n配置FCKeditor可以根据需求进行定制，例如更改工具栏设置、设置默认字体、颜色等。这些可以通过修改FCKeditor的配置文件或者在创建实例时传递参数实现。FCKeditor的Wiki（http:\u002F\u002Fwiki.fckeditor.net）提供了详细的配置指南和API文档。\n\n在实际应用中，你可以通过POST方法将FCKeditor编辑的内容提交到服务器端的PHP脚本，处理这些数据，例如保存到数据库或者生成HTML文件。FCKeditor会将富文本内容转化为HTML格式，方便进一步处理。\n\nFCKeditor为PHP开发者提供了一个便捷的富文本编辑解决方案，它的强大功能和灵活性使其成为网页编辑器的首选之一。通过简单的集成和配置，开发者可以轻松地在PHP项目中实现富文本编辑功能。","stitle":"PHP整合FCKeditor网页编辑器教程"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F42j1ns9u8p","sdescription":"Java Swing计算器程序是Java GUI编程中一个经典的示例，尤其适合初学者学习窗口、组件、事件处理以及用户界面设计。本代码片段展示了如何使用Swing库创建一个基本的四则运算计算器，包括数字按钮、运算符按钮、功能按钮（如清除和等于）以及数学运算按钮。\n\n首先，我们有四个主要的类定义：\n\n1. `NumBtn` (数字按钮)：继承自`JButton`，负责显示数字（0-9）。每个按钮实例存储一个整数值，并在构造函数中设置按钮的初始文本（数字）和边距。`getNum()`方法用于获取按钮代表的数字。\n\n2. `OperBtn` (运算符按钮)：同样继承自`JButton`，用于显示加、减、乘、除等运算符。`getOper()`方法返回按钮上的运算符。\n\n3. `FunBtn` (功能按钮)：包括清除（可能对应于C键）和等号（可能对应于=键）等功能，用于执行特定操作。`getFun()`方法获取按钮表示的功能。\n\n4. `MathBtn` (数学按钮)：可能包含诸如平方、开方等数学运算的按钮，`getMath()`方法返回按钮上的数学运算指令。\n\n`CalculatorextendsJFrame`类是主框架类，继承自`JFrame`，这是Swing中的顶级容器，负责管理整个窗口。它实现了`ActionListener`接口，这意味着它能够响应按钮的点击事件。\n\n在`CalculatorextendsJFrame`中，有一个`insets`变量用于设置组件之间的间距，确保布局整洁。程序会包含一个面板（如`JPanel`），用来组织这些按钮，并将它们添加到面板上。事件监听器会在按钮被点击时触发相应的计算逻辑，这可能涉及到事件传递、事件处理器方法以及处理用户的输入。\n\n对于初学者来说，这个代码提供了创建简单计算器应用程序的基础结构，通过实际编写代码，他们可以学习如何创建和管理Swing组件，理解事件驱动编程以及用户交互的设计。此外，还可以在此基础上扩展功能，例如处理优先级队列或栈来实现更复杂的运算规则。\n\n总结来说，这段代码演示了如何用Java Swing构建一个直观且功能基础的计算器应用，这对于想要进入GUI编程的初学者来说是一个很好的起点。通过深入研究和实践，他们可以逐渐掌握更多高级UI技术和组件的使用技巧。","stitle":"Java Swing计算器源码示例：初学者入门教程"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F4k1z13n8he","sdescription":"\"Eclipse下使用SWT涉及到Eclipse开源项目中的Visual Editor Project (VEP)，这是一个用于Java组件开发的可视化工具，使得开发者无需依赖其他IDE就能在Eclipse平台上完成GUI界面和业务逻辑的开发。本文将详细介绍如何在Eclipse中安装和使用VEP，以及其依赖的EMF和GEF插件。\"\n\n在Java GUI开发领域，Eclipse通过集成Visual Editor Project (VEP)扩展了其功能，使得开发者可以充分利用Eclipse的强大能力来构建应用程序界面。VEP基于Eclipse Modeling Framework (EMF)和Graphical Editing Framework (GEF)，这两个框架为创建和编辑模型提供了基础，而VEP则提供了图形化的用户界面编辑工具。\n\n**Eclipse Modeling Framework (EMF)** 是Eclipse的一个核心组件，它提供了一种方式来定义和实现数据模型。EMF允许开发者创建元数据模型，并且能自动生成对应的Java代码，这些代码可以用来创建、保存和加载数据。在VEP中，EMF负责处理数据结构和对象之间的关系，为GUI组件提供模型支持。\n\n**Graphical Editing Framework (GEF)** 是Eclipse中的另一个关键组件，专注于图形化编辑和绘图。GEF提供了一个框架，使得开发者可以轻松地创建出交互式的、图形化的用户界面。在VEP中，GEF用于实现对UI组件的拖放式设计和布局管理。\n\n**Visual Editor Project (VEP)** 结合了EMF和GEF的功能，为Eclipse提供了一个强大的GUI设计器。开发者可以利用VEP直观地设计、测试和修改Java Swing或SWT（Standard Widget Toolkit）组件，SWT是Eclipse首选的GUI库，因为它提供了原生的外观和性能。\n\n**安装步骤：**\n1. 首先确保已经安装了JDK，这是运行Eclipse的基础。\n2. 下载并解压Eclipse，Eclipse是一个便携式应用程序，不需要传统意义上的安装过程。\n3. 获取与Eclipse版本兼容的EMF、GEF和VEP插件。\n4. 在Eclipse安装目录下创建相应子目录存放插件，并将下载的插件解压到对应目录。\n5. 在`links`目录下创建文本文件并指定插件路径，采用相对或绝对路径。\n\n安装完成后，启动Eclipse，这些插件会自动加载。现在，开发者可以在Eclipse中使用VEP来设计GUI界面，包括添加、布局和配置SWT组件，而无需离开Eclipse环境，从而提高开发效率。\n\nEclipse结合VEP、EMF和GEF，为Java开发者提供了一个完整的开发环境，不仅可以进行后端业务逻辑的编写，还能进行前端界面的可视化设计，大大提升了开发体验。","stitle":"Eclipse平台上的可视化开发：使用VEP与SWT"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F7x5w0g1mrw","sdescription":"软件工程Case工具实验报告\n\n软件工程Case工具是软件工程领域中的一种重要工具，它可以帮助软件开发人员更好地理解软件工程的基本概念和原理，熟悉软件工程环境和工具，了解软件工程技术网站和主流的软件工程工具等。本实验报告将对软件工程Case工具进行详细的介绍和分析。\n\n一、软件工程Case工具的定义和分类\n\n软件工程Case工具是指在软件工程领域中使用的一种工具，旨在帮助软件开发人员更好地理解软件工程的基本概念和原理，提高软件开发的效率和质量。根据功能和用途，软件工程Case工具可以分为文档编写工具、分析与设计工具、版本控制工具、配置管理工具、测试工具、维护工具和调试工具等。\n\n二、软件工程Case工具的功能和特点\n\n1. 文档编写工具：Microsoft Word、Microsoft Visio等工具可以帮助软件开发人员编写高质量的文档，提供直观的操作界面、模板和帮助功能等。\n2. 分析与设计工具：PowerDesigner等工具可以帮助软件开发人员进行软件设计和分析，提供强大的功能和模块化的设计方法。\n3. 版本控制工具：VisualSoureSafe等工具可以帮助软件开发人员对软件版本进行控制和管理，提供基本的认证安全和版本控制机制。\n4. 配置管理工具：ClearCase等工具可以帮助软件开发人员对软件配置进行管理和控制，提供强大的功能和多版本开发等。\n5. 测试工具：WinRunner、LoadRunner等工具可以帮助软件开发人员对软件进行测试和验证，提高测试效率和质量。\n6. 维护工具：Concurrent Version System等工具可以帮助软件开发人员对软件进行维护和更新，提供主要用于在多人开发环境下的源码维护。\n7. 调试工具：交互式调试工具可以帮助软件开发人员对软件进行调试和测试，提高软件的可靠性和稳定性。\n\n三、软件工程Case工具的应用和优点\n\n软件工程Case工具广泛应用于软件开发过程的各个阶段，包括需求分析、设计、实现、测试和维护等。使用软件工程Case工具可以提高软件开发的效率和质量，减少软件开发的时间和成本，提高软件的可靠性和稳定性。\n\n四、结论\n\n软件工程Case工具是软件工程领域中的一种重要工具，能够帮助软件开发人员更好地理解软件工程的基本概念和原理，提高软件开发的效率和质量。通过使用软件工程Case工具，软件开发人员可以更好地完成软件开发任务，提高软件的可靠性和稳定性。","stitle":"软件工程CASE工具实践指南"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F7tsc3ca5h8","sdescription":"网络存储基础概述\n\n网络存储技术是现代IT基础设施的核心组成部分，它涉及如何有效地管理和利用存储资源，以支持大规模、高性能的数据存储和访问。本文将深入探讨网络存储的基本概念、存储结构、LVM（Logical Volume Manager）配置、磁盘Quorum机制以及逻辑存储管理的限制。\n\n1. **基本概念**\n - **物理卷（PV）**：是操作系统可以直接访问的基本存储单元，包括固定和可移动硬盘。它们是创建卷组的基石。\n - **卷组（VG）**：在AIX中，是存储管理的基本单位，由一个或多个物理卷组成，可以容纳逻辑卷。\n - **物理分区（PP）**：将物理卷划分为等大小的逻辑部分，便于组织和管理。\n - **逻辑分区（LP）**：映射物理分区到逻辑层面，用于更灵活的逻辑卷划分。\n - **逻辑卷（LV）**：由多个逻辑分区组成，逻辑上连续但物理上不连续，是用户可见的存储空间，通常与文件系统关联。\n\n2. **存储结构**\n - **逻辑卷**：虽然不可直接访问，但通过文件系统提供给用户，是系统内部的抽象层。\n - **文件系统**：用户接口，负责管理和组织LV上的数据，允许创建目录和文件，是用户可见的存储单元。\n - **物理卷、卷组、物理分区和逻辑卷**：这些概念是操作系统内部的管理结构，而文件系统、目录和文件则与用户交互。\n\n3. **LVM配置数据**\n - **卷组描述区（VGDA）**：记录了卷组与物理卷之间的关系，以及逻辑卷的元数据。\n - **卷组状态区（VGSA）**：监控物理卷状态，确保数据一致性。\n - **逻辑卷控制块（LVCB）**：存储逻辑卷的详细信息，如大小、位置等。\n - **LVM管理**：通过更新VGDA来添加、移除或调整硬盘，数据同步在ODM库中。\n\n4. **磁盘Quorum**：\n - 确保数据冗余和高可用性，关键在于至少有51%的VGDA和VGSA副本能正常访问，磁盘Quorum机制对此进行管理。\n - 单硬盘卷组需两份备份，双硬盘卷组一份备份，多硬盘卷组各一份。\n\n5. **逻辑存储管理限制**：\n - **VG数量**：每个系统最多支持255个卷组。\n - **PV数量**：普通卷组每个最多32个，大型卷组则为128个，但具体限制可能因系统配置不同而有所差异。\n - **PP数量**：取决于物理卷大小和管理需求，需要根据实际情况合理规划。\n\n理解这些基础知识对于有效设计和管理网络存储系统至关重要，能够帮助优化资源利用、提高数据安全性，并确保在各种情况下系统的稳定运行。在实际应用中，还需要考虑性能、成本和扩展性等因素，以满足不断变化的业务需求。","stitle":"AIX LVM详解：网络存储架构与管理"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F88bwx13gu6","sdescription":" \"这篇文档主要介绍了三种常见的递归算法在IT领域的应用，包括文件系统递归、XML递归和树图递归，并提供了C#语言实现的详细代码示例。这些递归方法常在面试中被考察，对于初入职场的求职者来说是很好的学习资料。\"\n\n在编程中，递归是一种强大的解决问题的方法，它通过函数或方法自身调用来解决复杂的问题。以下是三种递归的详细说明：\n\n1. 文件系统递归：\n文件系统递归通常用于遍历文件夹结构，例如在Windows应用程序中显示目录树。在C#中，可以使用`System.IO`命名空间中的`DirectoryInfo`和`Directory.GetFiles()`等方法来实现。当用户选择一个文件夹后，递归函数会遍历该文件夹及其所有子文件夹，将每个文件和子文件夹添加到`TreeView`控件中。代码示例中，`btnSearch_Click`事件处理程序会启动这一过程，首先清空`TreeView`的节点，然后使用`FolderBrowserDialog`让用户选择一个根目录，接着递归地添加文件和子目录。\n\n2. XML递归：\nXML递归涉及到解析XML文档的层级结构。XML是一种用于存储和交换数据的标记语言，其节点（元素）可以包含其他元素。在C#中，可以使用`System.Xml`命名空间的`XmlDocument`或`XDocument`类来解析XML。递归函数通常用于遍历XML树，处理每个元素和它的子元素。代码示例未提供XML递归的具体实现，但通常会涉及遍历`XmlNode`对象的子节点并进行相应操作。\n\n3. 树图递归（TreeView递归）：\n树图递归通常与用户界面（UI）组件如`TreeView`关联，用于展示具有多层关系的数据。`TreeView`控件可以显示层次结构的数据，如数据库记录、文件系统等。在C#中，可以通过递归地添加节点来构建这种层次结构。例如，每个父节点代表一个类别，子节点代表该类别下的条目。代码示例中，递归函数会根据数据结构创建`TreeNode`对象并将其添加到`TreeView`的适当位置。\n\n递归的关键在于正确设定基本情况（base case），即递归停止的条件，以及如何从一个情况过渡到下一个情况（递归步骤）。在以上三种场景中，基本情况通常是到达文件系统的叶子节点、解析完XML文档的最后一个元素，或者在`TreeView`中添加完所有数据项。递归步骤则涉及处理当前节点并调用自身处理子节点。\n\n理解并熟练掌握递归是成为优秀程序员的重要技能，因为它能够简化复杂问题的解决，并在处理分层数据和结构时非常有效。在面试中，递归问题常常被用来评估候选人的逻辑思维和问题解决能力。因此，对于初入职场的求职者来说，熟悉并能灵活运用这三种递归算法是非常有益的。","stitle":"递归算法解析：文件系统、XML与树图"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F2v02ojcwnr","sdescription":"本文档主要介绍了如何在Web开发环境中结合JSON、MySQL和Struts2框架进行用户登录验证的过程。首先，我们从一个基础的Web工程配置开始，使用MyEclipse集成开发环境（IDE），安装并引入Struts2相关包。这一步对于那些不熟悉Struts2的人来说可能需要操作，通常在插件管理器中搜索并添加Struts2插件。\n\n接下来，作者提供了web.xml文件的部分代码，这是Java EE应用服务器中的核心配置文件，用于定义过滤器（filter）和映射规则。在这个例子中，`struts2`过滤器被用来处理所有URL请求，确保Struts2框架的正常工作。StrutsPrepareAndExecuteFilter是Struts2提供的一个关键组件，它负责预处理请求并执行相应的Action。\n\nStruts.xml文件，虽然没有完全展示，但它是Struts2应用的另一个关键配置文件，用于声明Action（控制器）及其属性和行为。在这里，开发者会定义如何解析用户提交的表单数据，如登录请求，以及如何与数据库交互进行验证。\n\n在这个场景中，登录验证涉及到了MySQL数据库，可能包括从数据库查询用户信息（如用户名和密码），通过连接池或JDBC进行SQL查询。当用户输入用户名和密码后，Struts2框架会将这些信息封装成JSON格式，以便于前端与后端的交互。前端可以发送POST请求到指定的Action，携带JSON数据。Action接收到请求后，会解码JSON数据，查询数据库来验证用户信息是否匹配。\n\n如果验证通过，Action会返回一个成功响应，通常包含一个token或者其他安全标志，前端可以根据此信息进行后续操作，如跳转到主页或者显示登录成功的消息。反之，如果验证失败，Action将返回错误信息，前端则展示相应的错误提示。\n\n本文档提供了一个基本的流程，展示了如何使用Struts2框架，结合JSON和MySQL数据库，实现Web应用中的用户登录验证功能。开发者需要理解HTTP请求处理、XML配置文件的作用以及如何编写Action类来与数据库交互，这些都是Web开发中至关重要的技能。","stitle":"使用Struts2与MySQL构建Web登录验证教程"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F50mngznj37","sdescription":"\"用PHP写SHELL教程 - PHP与SHELL结合的高级应用\"\n\n在IT行业中，PHP是一种广泛使用的服务器端脚本语言，尤其擅长于Web开发。然而，PHP的功能并不仅限于此，它同样能够用于编写Shell脚本，提供了一种在命令行环境下工作的能力。这个教程将带你深入理解如何利用PHP5的CLI（命令行接口）模式来编写Shell脚本，展示PHP在非Web场景下的强大功能。\n\n20.1 简介\nPHP通常与Web服务器如Apache或Microsoft IIS一起工作，解析并执行嵌入在HTML中的PHP代码，然后将结果返回给用户的浏览器。然而，PHP也可以作为CLI SAPI（服务器应用程序编程接口）运行，这使得它能够在没有浏览器参与的情况下独立执行任务，特别是在系统管理、自动化脚本或者任务调度等领域。\n\n20.2 PHP CLI Shell脚本\nCLI模式的PHP与CGI（通用网关接口）模式有一定的相似性，但两者并不完全相同。CGI主要用于处理Web服务器的HTTP请求，而CLI则更专注于命令行操作，没有HTTP头信息，也不处理GET或POST数据。\n\n20.2.1 CLI与CGI的区别\nCLI模式的PHP不涉及HTTP协议，因此不处理HTTP头信息，也没有对表单数据的支持。它的设计更加轻量级，更适合于命令行环境中的任务执行。\n\n20.2.2 CLI的配置参数\nCLI模式有一些特定的配置参数，适应其在命令行环境下的工作：\n\n1. CLI默认静默启动，不打印HTTP头部信息，这对于命令行应用是必要的，因为它不需要浏览器相关的输出。\n2. 执行时，CLI不会自动改变工作目录到脚本所在目录，但可以通过-C和-no-chdir参数来模拟CGI的行为。\n3. 错误将以纯文本形式输出，而不是HTML格式，方便在终端中查看。\n4. 某些配置项在CLI下有特殊设定，例如：\n - `html_errors` 默认为关闭，这意味着错误信息将以纯文本形式显示。\n - `implicit_flush` 默认开启，这将强制PHP立即输出内容，而不是等待缓冲区填满。\n - `max_execution_time` 设置为0，表示CLI脚本没有执行时间限制，允许长时间运行的任务。\n - `register_argc_argv` 默认开启，允许通过argc和argv变量接收命令行参数。\n\n`implicit_flush`参数开启意味着PHP脚本中的输出会立即发送到终端，而`register_argc_argv`则允许脚本直接访问命令行参数，这对于处理命令行输入非常有用。\n\n通过这些特性，PHP CLI脚本可以用于各种用途，如文件处理、数据处理、系统监控、定时任务等。结合PHP的丰富函数库，开发者可以创建强大的命令行工具，实现自动化任务和系统集成。\n\n总结来说，\"用PHP写SHELL教程\"是关于如何利用PHP的CLI模式来编写Shell脚本，揭示了PHP在非Web环境中的潜力。学习这一技术，开发者可以将PHP的灵活性和功能带入到日常的系统管理和自动化工作中，提高效率，简化复杂的任务处理。","stitle":"PHP5 CLI模式：用PHP编写Shell脚本教程"},{"surl":"https:\u002F\u002Fwenku.csdn.net\u002Fdoc\u002F1i34x4nmtw","sdescription":"《Mybatis福音书》是一份针对MyBatis与Spring框架集成的详细指南，特别关注于Spring 3.0与MyBatis 3.0版本的兼容性。在Spring 3.0未正式支持MyBatis 3.0的情况下，MyBatis社区意识到有必要自行推动这两者之间的整合，以减轻用户在配置上下文环境时的繁琐工作，并提供更简洁、透明的事务管理。\n\n该文档首先介绍了整合的动机，Spring 3.0由于MyBatis 3.0的官方发布滞后而未能及时纳入支持，促使社区成员决定开发MyBatisSpring1.0.0-RC3来作为两者之间的临时解决方案。作者强调，在开始阅读前，读者应具备Spring和MyBatis的基本知识，包括术语理解及安装和配置流程，因为手册不会重复这些基础知识。\n\n章节内容涵盖了多个核心主题：\n1. **入门**：着重于安装和快速创建过程，帮助读者快速上手。\n2. **SqlSessionFactoryBean**：讲解如何创建和配置SqlSessionFactory，这是MyBatis的核心组件。\n3. **事务管理**：介绍了两种配置方式，标准配置和容器管理事务，确保事务的正确处理。\n4. **使用SqlSession**：区分了SqlSessionSupport和SqlSessionTemplate两种使用方法，提供灵活的访问数据库接口。\n5. **MapperFactoryBean**：讲解如何创建MapperFactoryBean，以及如何注入映射器和自动配置。\n6. **MyBatis API的使用**：深入探讨如何利用MyBatis API进行数据操作。\n7. **示例代码**：通过实际代码展示如何在Spring应用中无缝集成MyBatis。\n\n在整个文档中，作者对参与项目的贡献者表达了深深的感谢，并表示了版权声明，强调了文档的个人使用和分享规则。这份“福音书”旨在简化开发者的工作流程，提升开发效率，是MyBatis和Spring框架协同工作的实用指南。","stitle":"MyBatis与Spring完美整合：1.0.0-RC3详解"}],"commonConfig":{"armsConfig":{"config4Pc":"{pid:\"dyiaei5ihw@7fb361a16fa3212\",appType:\"web\",imgUrl:\"https:\u002F\u002Farms-retcode.aliyuncs.com\u002Fr.png?\",sendResource:true,behavior:true,sample:10,enableLinkTrace:true,enableApiCors: true,linkType:\"tracing\"}","config4Mobile":"{pid:\"dyiaei5ihw@9772815e201305f\",appType:\"web\",imgUrl:\"https:\u002F\u002Farms-retcode.aliyuncs.com\u002Fr.png?\",sendResource:true,behavior:true,sample:10,enableLinkTrace:true,enableApiCors: true,linkType:\"tracing\"}","sample":"10","config":"{\n \"pid\": \"dyiaei5ihw@7fb361a16fa3212\",\n \"appType\": \"web\",\n \"imgUrl\": \"https:\u002F\u002Farms-retcode.aliyuncs.com\u002Fr.png?\",\n \"sendResource\": true,\n \"enableLinkTrace\": true,\n \"behavior\": true\n}"},"feOrderVersion":{"wapVersion":{"orderPaymentVersion":"3.0.1"},"pcVersion":{"orderCartVersion":"3.0.0","orderTipVersion":"5.0.1","orderPaymentVersion":"3.1.1-download-e"}},"spmWenKuDetailsPageConfig":{"buyVipBottom":"1003.2020.3001.6505","authorIM":"1003.2020.3001.5737","limitedTimeCouponGoToUse":"1003.2020.3001.6660","employeeIdentityVerification":"1003.2020.3001.4169","downloadNowBottom":"1003.2020.3001.6504","rightSideMyScore":"1003.2020.3001.6248","hotRankList":"1003.2020.3001.7010","yearCardFullReduction":"1003.2020.3001.6521","latestResources":"1003.2020.3001.4174","superYearCard":"1003.2020.3001.6522","previewDownload":"1003.2020.3001.4257","authorResource":"1003.2020.3001.5449","bulletFramePurchaseMember":"1003.2020.3001.5553","authorFans":"1003.2020.3001.5450","bulletFrameVipDownload":"1003.2020.3001.5552","openVipToEnjoyDownload":"1003.2020.3001.5718","boutiqueAlbum":"1003.2020.3001.6627","detailsPage":"1055.2568","popularResources":"1003.2020.3001.6659","studentIdentityVerification":"1003.2020.3001.4170","guideVip":"1003.2020.3001.7461","certification":"1003.2020.3001.4168","twoInOneDownload":"1003.2020.3001.6509","resourceTag":"1003.2020.3001.6243","rightSideMyResource":"1003.2020.3001.6246","authorCourse":"1003.2020.3001.6244","collect":"1003.2020.3001.6639","breadcrumbs":"1003.2020.3001.5735","rightHotResourcesRecommendation":"1003.2020.3001.6790","rightSideCourseRecommendation":"1003.2020.3001.6523","satisfactionSurvey":"1003.2020.3001.5712","rightSideDownloaded":"1003.2020.3001.6250","authorFollow":"1003.2020.3001.5736","studentCertification":"1003.2020.3001.6613","operatingPosition":"1003.2020.3001.6671","bottomRecommendation":"1003.2020.3001.6616","rightSideMyEarnings":"1003.2020.3001.6247","uploadResource":"1003.2020.3001.4171","rightSideMyFavorites":"1003.2020.3001.6249","previewDownloadBtn2LotteryClosed":"1003.2020.3001.6474","hotRankMore":"1003.2020.3001.7011","buyVip":"1003.2020.3001.4167","advertisement":"1003.2020.3001.6556","confirmDownload":"1003.2020.3001.5554","leftSideUpload":"1003.2020.3001.4172","downloadNow":"1003.2020.3001.4165","previewDownloadBtn2Lottery":"1003.2020.3001.6458","nonStudentCertification":"1003.2020.3001.6614","directMessageToTheChatPage":"1003.2020.3001.5737","twoInOneDownloadBottom":"1003.2020.3001.6510","authorColumn":"1003.2020.3001.6245","downloadBtn2Vip":"1003.2020.3001.5553","report":"1003.2020.3001.6640","comment":"1003.2020.3001.6638"},"seoTdkMeta":{"csdnBaiduSearch":"文本基于表格,查询推理,性能优化,可训练参数,QA模型","tdkAbTest":"experiment2","metaDesc":"资源浏览查阅66次。《参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用》\n\n在信息技术领域，信息搜索系统正逐步向着多模态推理发展，以满足处理非结构化文本和结构化表格等多样化数据的需求。","showTdkTime":false,"metaTitle":"参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用 - CSDN文库","metaKeyword":"文本基于表格,查询推理,性能优化,可训练参数,QA模型"},"staticEndpointConfig":{"navSecondCss":"https:\u002F\u002Fg.csdnimg.cn\u002Fnav-second\u002F1.0.3\u002Fcss\u002Fnav-second.css","mpMyDownload":"https:\u002F\u002Fmp.csdn.net\u002Fmp_download\u002Fmanage\u002Fdownload\u002FDownloadDetailed","leveUserMedalImagePath":"\u002Fstatic_files\u002Fpc\u002Fimages\u002Flevel\u002Flevel_","studentUrl":"https:\u002F\u002Fi.csdn.net\u002F#\u002Fuser-center\u002Fprofile?floor=edu","collectionJs":"https:\u002F\u002Fg.csdnimg.cn\u002Fcollection-box\u002F2.0.6\u002Fcollection-box.js","userLoginJsVersion":"3.0.0","mpMyScoreUrl":"https:\u002F\u002Fmp.csdn.net\u002Fconsole\u002FdataWatch\u002FdownList","downloadHelperBlog":"https:\u002F\u002Fblog.csdn.net\u002Fblogdevteam\u002Fcategory_9584548.html","sourcesUploadUrl":"https:\u002F\u002Fmp.csdn.net\u002Fconsole\u002FuploadResources","meHost":"https:\u002F\u002Fblog.csdn.net\u002F","authUrl":"https:\u002F\u002Fi.csdn.net\u002F#\u002Fuc\u002Fprofile","csdnBuyVipPath":"https:\u002F\u002Fmall.csdn.net\u002Fvip","qrcodeJquery":"\u002F\u002Fg.csdnimg.cn\u002Flib\u002Fqrcode\u002F1.0.0\u002Fqrcode.min.js","navSecondJs":"https:\u002F\u002Fg.csdnimg.cn\u002Fnav-second\u002F1.0.4\u002Fnav-second.js","sideToolbarJs":"https:\u002F\u002Fg.csdnimg.cn\u002Fside-toolbar\u002F3.0\u002Fside-toolbar.js?t=1594881824401","mpMySourceUrl":"https:\u002F\u002Fmp.csdn.net\u002Fconsole\u002FupDetailed","blogHost":"https:\u002F\u002Fblog.csdn.net\u002F","imHost":"https:\u002F\u002Fim.csdn.net\u002Fchat\u002F","MyHost":"https:\u002F\u002Fmy.csdn.net\u002F","downloadCdnPath":"\u002Fstatic_files","certImage":"\u002Fstatic\u002Fpc\u002Fimages\u002Fcert_.png","certEmployeImage":"\u002Fstatic\u002Fpc\u002Fimages\u002Fcert_employe.png","downloadPathSource":"https:\u002F\u002Fmp.csdn.net\u002Fconsole\u002FuploadResources","medalJs":"https:\u002F\u002Fg.csdnimg.cn\u002Fuser-medal\u002F1.0.5\u002Fuser-medal.js","userVoiceVerificationJs":"https:\u002F\u002Fg.csdnimg.cn\u002Fuser-voice\u002F1.0.4\u002Fuser-voice-verification.js","reportJsVersion":"1.5.7","loginBoxJs":"https:\u002F\u002Fg.csdnimg.cn\u002Flogin-box\u002F1.1.4\u002Flogin-box.js","vipImg":"https:\u002F\u002Fcsdnimg.cn\u002Fidentity\u002Fvip.png","employeeAuthUrl":"https:\u002F\u002Fi.csdn.net\u002F#\u002Fuser-center\u002Fprofile?floor=job","certStudentImage":"\u002Fstatic\u002Fpc\u002Fimages\u002Fcert_student.png","iMyFavUrl":"https:\u002F\u002Fi.csdn.net\u002F#\u002Fuc\u002Fcollection-list","bindUrl":"https:\u002F\u002Fi.csdn.net\u002F#\u002Faccount\u002Fbind","certRealnameUrl":"\u002Fstatic\u002Fpc\u002Fimages\u002Fcert_realname.png"}},"curUserInfo":{"myEarning":0,"cBeans":0,"mySourcesNum":"0","cCoin":0,"showCBeansBool":true,"effectRiskAccount":false,"myIntegralNum":0},"spider":true,"templateName":"index-translate-pdf","ID":"71ss855c0t","sourceInfo":{"sourceId":88589315,"sourcesIsessence":6,"loginUsername":"","rating":0,"isWhiteListAuthor":false,"isAllowDownload":true,"blindBox":{"url":"https:\u002F\u002Fmall.csdn.net\u002Fvip?utm_source=vip_cth_xzxqy_xfc","imgUrl":"https:\u002F\u002Fimg-home.csdnimg.cn\u002Fimages\u002F20240624095725.gif"},"userIsVip":false,"previewData":{"previewList":[{"index":1,"content":"+v：mala2277获取更多论文基于表格或文本的Vaishali1Evangelos Kanoulas2Maarten de Rijke21阿姆斯特丹大学发现实验室2阿姆斯特丹大学诉pal，e.kanoulas，m.uva.nl摘要信息搜索问答系统的一个长期目标是在多模态上下文上进行推理，并为用户查询生成自然答案。如今，通过在特定模态（如非结构化文本或结构化表格）的QA数据上微调模型，理论密集型预训练语言模型适用于下游任务，如QA。为了避免训练这种内存消耗的模型，同时为每个模态使用统一的架构，参数高效的适配器在Transformer层之间添加和训练小的特定于任务的瓶颈层。在这项工作中，我们研究了参数高效的抽象QA编码器-解码器模型在结构化的表格数据和非结构化的文本数据，只使用1.5%的额外参数，为每一个模态。我们还对编码器和解码器模块中的适配器层进行了消融，以研究效率-性能权衡，并证明将额外的可训练参数减少到0.7%我们的模型在表格 QA 数据集（如Tablesum和FeTaQA）上的表现优于当前最先进的模型，并在文本 QA数据集（如NarrativeQA）上实现了可比较的性能，使用的可训练参数明显少于微调。1介绍不同背景下的信息搜索系统需要模型能力来推理非结构化和结构化数据，如自由形式的文本、表格和图像（Agrawal et al. ，2016; Vaku-lenkoet al. ，2019; Hudson and Manning，2019;Zhang et al. ，2020; Zhu等人，2021; Deldjoo etal. ，2021年）。如果部署为面向任务的会话代理，则这样的系统可能具有生成自然语言响应的附加要求（Wen et al. ，2015; CarnegieandOh ， 2000;Rambowetal.， 2001;Ratnaparkhi，2002）。开放域问答（QA）的最新工作主要通过微调来解决这些挑战自然答案LM头部文本适配器Nx编码器工作台适配器文本适配器解码器表适配器提问表问题文件图1：使用特定模态（表\u002F文本）适配器进行抽象问题分类的基于不同模态（如表格和文本）的大规模预训练语言模型（Yin et al. ，2020; Herzig et al. ，2020 ， 2021; Katsis 等人， 2021; Nanet al. ，2021年）。然而，在特定输入类型上训练的每个模型与其他模态不兼容，并且需要模态特定的微调。例如，在表格式QA（Herzig et al. ，2020），通过训练附加位置嵌入（行和列标识符）来识别表格单元格属于哪一行和哪一列来学习表格这使得这种模态特定的模型与基于自由形式文本的模型不兼容多模态模型（Zhu etal. ，2021）可以通过连接文本上下文和扁平化的表来对表和文本两者进行推理，从而导致更长的输入序列并限制可以被编码的上下文的长度。为了应对这些挑战，我们研究了针对表格和文本的抽象QA的参数有效迁移学习。我们的动机是使用适配器层，在冻结的预训练Transformer层之间注入小瓶颈层，因为它们实现了与精细转换层相当的性能arXiv：2204.03357v1 [cs.CL] 2022年4+v：mala2277获取更多论文调整各种任务，如多语言翻译（Pfeiffer etal. ， 2020; Philip 等人， 2020; Guo et al. ，2020）、分类（Houlsby et al. ，2019a），文本到文本生成（Lin et al. ，2020）、对话状态跟踪中的域适应和响应生成（Hung et al. ，2021年）。适配器层的消融研究（Rucklé等人，，2020年）上的掩蔽语言模型，如BERT- base和RoBERTa在GLUE基准测试表明，删除开始适配器层导致性能下降最小。在单独的编码器和解码器模块上扩展适配器层烧蚀是重要的，因为层的顺序修剪的常规方法我们的工作探讨了在抽象QA的背景下，两个模块的适配器层的相互作用。Lin等人（2020）探索适配器瓶颈尺寸对各种语言生成任务的影响，这些任务超过了自回归模型，如GPT-2（Radford et al. ，2019）。他们不研究表格数据，也不消融适配器层，这对于理解顺序Transformer模块架构（如编码器-解码器）中单个适配器的影响至关重要。我们的分析是对（Lin et al. ，2020），因为我们消融适配器层以研究参数-性能权衡，而它们仅关注适配器瓶颈尺寸。此外，我们概括了文本到文本的设置，并探索从结构化或非结构化输入（如表格和文本）生成语言。这在下游数据的任务和结构我们提出了一个系统，名为 Partists ，Eefficient ， AbstractiveQ uestionA nswering（PeaQA），如图1所示，它使用共享的预训练语言模型和特定于模态的适配器层学习对非结构化和结构化输入进行推理。我们自动将层次表转换为常规表，以获得统一的表示，而不会破坏表单元格之间的关联。此外，我们扩展的研究消融适配器层的编码器和解码器模块。我们的主要贡献归纳如下：(1) 我们在多模态上下文上执行参数高效的抽象问题回答，每个模态仅使用额外的1.5%的可训练参数。我们的适配器调优模型通过以下方面优于现有的工作：在表格QA数据集上有很大的余量，在文本QA数据集上实现了相当的性能(2) 我们研究表格QA作为一种新的模态，它引入了大量的输入域转移到预先训练的语言模型。我们提出了一个两步的层次表到序列的转换，它产生了一个统一的表示，由一个单一的，共享的预训练的语言模型和模态特定的适配器层使用据我们所知，这是第一个以参数有效的方式探索表格QA问题回答的工作。(3) 我们烧蚀了编码器和解码器模块中的适配器层，以研究它们的影响，并表明可以消除编码器和解码器的起始层，而不会显着降低性能。我们还证明了最后的编码器适配器层是不可或缺的，并具有更大的贡献比解码器层在同一级别。2相关工作表格式问答。表格式QA系统旨在回答结构化表格中的问题，这些表格可以是规则的或分层的。分层表可以具有跨越多个行和列的标题单元格和主体单元格（Chenget al. ，2021年）。在大多数表格式QA系统中（Herziget al. ，2020; Zhu等人，2021; Katsis et al. ，2021），表的结构通过引入表特定的位置信息（诸如行id和列id）在大型语言模型的嵌入层中编码。，2021; Cheng et al. ，2021）提出了通过推理和聚合来自表格的不连续事实来生成自然答案的额外挑战。文本问答。文本上的问题回答测量系统理解用户问题和上下文段落中的自由形式文本并预测答案的能力。预测的答案本质上可以是提取的，其中系统识别上下文段落中的短文本跨度以回答用户查询（Lee et al. ，2016; Seo等人，2016; Rajpurkar等人。，2016; Pearce et al. ，2021），或者它可以是抽象的，其中需要生成自由形式的答案（Yin et al. ，2016; Mitra，2017; Bauer 等人， 2018; Reddy et al. ，2019）。迁移学习。迁移学习技术，如微调预训练模型，+v：mala2277获取更多论文流任务需要为每个新任务学习一组新参数为了避免这种记忆密集型迁移学习方法，已经提出了适配器作为适应新领域的参数有效方法（ Houlsby et al. ， 2019 b; Pfeiffer et al. ，2020）。适配器已经被扩展到各种生成任务中的语言生成，诸如翻译、摘要、多轮对话和面向任务的自然语言生成（Lin et al. ，2020）。我们的工作结合了上述所有方面，从表格和文本中生成抽象的答案，只有0。7%3模型我们专注于编码器-解码器模型的抽象问题回答的任务。我们使用BART（Lewis et al. ，2019）编码器-解码器架构，其包括双向编码器和自回归解码器。输入序列由问题、上下文标题和上下文序列组成，上下文序列之前有指示每个子序列开始的提示形式上，输入序列表示为question\u003Eqq1. . . qm\u003Ctitle\u003E t1t2.. . tp\u003C上下文\u003E c0c1。. . Cn，其中Qi是第i个问题令牌，Tj是第j个标题令牌，以及Ck是第k个上下文令牌。上下文可以是文本段落或展开的表格。预训练的BART模型的参数在训练期间被冻结添加到模型中的特定于模态的适配器层在表格上下文或文本上下文上进行训练，以生成自然的答案。4语篇提问为了研究多模态抽象问答系统，我们首先将自由形式的文本作为系统的上下文我们在Narra-t iv eQA数据集上针对文本上下文训练适配器层（ K o cKomiskovskiyetal. ， 2018 ）。 NarrativeQA是基于故事的复杂抽象问题回答该数据集在训练集中包含32，747个样本，在验证集中包含3，461个样本，在测试集中包含10，557个对于我们的任务，我们选择了输入上下文段落作为每个样本的人工注释摘要，这是故事的维基百科页面摘要模型的输入是每篇文章的问题、标题和摘要，目标是抽象的答案。5表格式提问我们研究了表格QA作为一种新的模式，它引入了大量的输入域转移到预先训练的语言模型。表格在其表示中强制执行结构为了通过使用统一的预训练语言模型来实现参数效率的目标，我们只训练表特定的然而，这需要表格和文本的统一输入表示另外一个挑战是在不同的表类型（常规的、分层的）之间保持一致性。对于我们的任务，我们探索2个表格QA数据集，即 Tablesum （ Zhang et al. ， 2020 ）和FeTaQA（Nan et al. ，2021年）。Tablesum由200个独特的维基百科表格组成，其中问题和摘要人工注释答案; 40%的样本是关于分层表的问题，但是它们发布的数据中的表在分层单元中缺少信息，并且它们的工作不处理分层结构。我们通过从相应的维基百科页面中提取wikitables来解决这个问题，并发布一个干净版本的数据集。1FeTaQA（Nan et al. ，2021）是一个更大的抽象表格QA数据集，由超过10，330个常规表格的问题和自由形式的答案的数据集由7，326个训练样本验证集中为1，001，测试集。FeTaQA由人工注释的答案组成，其中包含涉及实体和关系的解释。5.1表格表示对于我们的工作，我们选择在两个步骤中统一表示所有表：（1）将层次表转换为常规表;(2) 将常规表线性化为可以用语言模型编码的扁平序列。线性化分层表格标题。分层表格标题通过以下过程线性化为单行标题跨多列的标题单元格被复制并拆分为多个单元格。接下来，将此标题所跨越的单元格值对所有标题行重复此过程会将分层标题转换为顺序1清理后的数据和代码可以在github.com\u002Fkolk\u002FPea-QA上找到+v：mala2277获取更多论文e（f）1a（d）\u003Cd：\u003E−一BCDeFG我123J45HK6L78910a（d）a（e）Bc（f）g（i）g（j）11231145h（k）1146h78910(a) 表示为常规表的多跨度表。a（d）Be（f）g1213B2\u003Cd：\u003Eg（h）a（d）1B3(b) 将常规表线性化为一系列键：值对。图2：表格表示。一个.我们在图2a中描述了这个过程，它产生了线性报头a（d），a（d），b，e（f）。线性化表体。多跨度表体单元格的解析方式与表头不同每个表体单元格都与一个或多个标题单元格一起复制，跨多行的单元格将与所有跨行的单元格一起复制。这一过程导致了一个经常性的数据集。在Tablesum数据集上，我们遵循原始工作中描述的5重交叉验证来评估我们的模型。在FeTaQA和Narra- tiveQA上，我们利用测试分割来评估我们的模型。我们在每个数据集上训练模型 15 个时期，并在 Rouge-2 ，Rouge-L和sacreBLEU指标上进行评估。6.2适配器调谐我们执行适配器调整作为一个参数有效的替代方案，以适应BART-大模型的抽象问题回答任务在不同的模态。我们首先冻结预训练的BART 大模型的所有层，该模型是在原始BART 论文中提到的文本重建上训练的（Lewis et al. ，2019）。我们从Houlsby适配器配置中添加瓶颈适配器层（Houlsby et al. ，2019 a），这些训练适应下游抽象问题回答任务，也适应特定于表.我们以行为主的形式扁平化常规表，按顺序连接行。每一行都是一个（键，值）对序列，其中键是列标题，值是该列的单元格值，如图2b所示。6实验装置我们试图通过实验回答以下研究问题：（RQ1）在多模态输入的情况下，适配器调整(RQ2)编码器和解码器上的所有适配器层是否对任务\u002F模态的性能贡献相同？6.1微调我们的实验都是在大变量的BART模型上进行的。我们在3个数据集上微调BART-大型模型，因为最先进的微调模型针对不同的数据集利用不同的架构，使得与适配器调优的比较我们将3个数据集上的微调BART模型作为基线。我们从{8e−4，6e−4，3e−4，1e−4，5e−5，4e5，3e−5，2e−5，1e−5}中扫描学习率，并为每个数据集选择最佳执行学习率。我们在Tablesum上选择4e−5进行微调，在Fe-TaQA数据集上选择8e−4，在NarrativeQA上选择2e−5我们使用批量大小4和梯度累积8来模拟有效批量大小32。表格QA数据集的最大靶序列长度设置为200，文本QA数据集的最大靶序列长度设置为100把上下文。每个适配器层具有64的瓶颈嵌入尺寸。如第6.1节所述，我们扫描学习率并为每个数据集选择性能最佳的学习率。我们选择6e−4作为表格式QA数据集Tablesum和FeTaQA，并选择1e−1来训练文本QA数据集NarrativeQA。我们使用相同的批次大小和最大靶序列长度作为微调以进行有效的比较。超参数的总结见表1。数据集参数ATuneFTune所有调度器线性线性批量3232种子66最大历元1515表和学习率6e-44e-5输入长度200200学习率6e-48e-4FeTaQA输入长度100100NarrativeQA学习率1e-42e-5输入长度5050表1：用于训练的超参数。ATune表示适配器调整，FTune表示微调，All表示所有3个数据集。6.3消融研究：适配器修剪适配器层修剪已经在GLUE基准上进行了探索（Rucklé et al. ，2020年），其中+v：mala2277获取更多论文数据集模型训练Rouge-1 Rouge-2 Rouge-L BLEUGPT2微调0. 2720. 0730. 2005. 35（Nishida et al. ，2019年）表2：结果：在Tablesum、FeTaQA和NarrativeQA数据集上获得的评分演示了从BERT-base和RoBERTa模型的开头我们扩展适配器层烧蚀的编码器-解码器架构，并假设这种现象应观察到的编码器和解码器模块。然而，编码器和解码器中的适配器层如何彼此交互并对性能做出贡献是不平凡的。既往研究（Rucklé et al. ，2020）在适配器消除上修剪掩码语言模型中的连续适配器层。该方法不直接扩展到编码器-解码器的顺序模块，其中模块内适配器不仅有助于它们各自的编码和解码目标，而且有助于模块间交互和性能。为了测量不同模块中适配器层的影响，我们在编码器和解码器中执行适配器消融。首先，我们从编码器和解码器模块中统一删除适配器层，从两个模块的开始层开始，最后删除所有层。这导致12个实验，对应于消除12个编码器和12个解码器适配器层。为了研究不同层次的模块间适配器之间的相互作用，我们从编码器和解码器的最后6个层次进行了36个不同配置的适配器消除实验。我们在第7.3节中分析了每种配置的性能。7结果我们比较了我们的基线微调模型的结果与最先进的微调模型，在第7.1节中。我们解决（RQ1）“在多模态输入的情况下，适配器调整与微调相比如何执行？”节中7.2和（RQ 2）“编码器和解码器上的所有适配器层是否对任务\u002F模态的性能都有同等贡献？”在7.3。7.1微调模型我们研究了我们的基线微调模型的结果实验结果示于表2中。我们观察到，对于Tablesum数据集，我们的微调模型在Rouge-1上的表现优于最先进的 T5 模型 3 。 8% ，胭脂 -2 乘 4 。Rouge-L评分降低4%。这可以归因于在数据集的干净版本上微调我们的模型我们的微调模型在Fe-TaQA数据集上执行最先进的T5-大，即0。2%的胭脂-1，0。Rouge-2高出01%，0.Rouge-L高出04%。我们对NarrativeQA的微调结果低于使用复杂推理架构训练的最先进模型。这项工作的重点主要是比较微调和适配器调优，因此我们离开明确的推理作为未来工作的一部分。7.2适配器调谐型号我们通过比较适配器调整模型与我们的基线微调模型的性能来解决（ RQ 1 ）。对于Tablesum，如表2所示，微调（基线）的性能略优于适配器调优，Rouge-1和0高7%。Rouge-L 评分高 4% ，而 Rouge-2 评分相同。对于FeTaQA，adapter-tune显示了更大的TablesumT50。3620。1430。27610.43（Zhang et al. ，2020年）我们的（Pea-QA）微调（基线）0.4000.1860.316第六章30适配器调谐0。3930.1860。312第六章75T5-小型0。5500。3300。47021岁60FeTaQAT5基础微调0。6100。3900。51028岁14（Nan et al. ，2021年）T5-大号0。6300。4140。53030. 54我们的（Pea-QA）微调（基线）0。6320。4150。53430. 81+v：mala2277获取更多论文问：Akhila Kishore的前两部电影是什么时候目标：akhila kishore在卡纳达语电影padhe padhe（2013）中首次亮相，并出现在kathaithiraikathai vasanam iyakkam（2014）中。表：Adaper-tune：akhila kishore在卡纳达语电影padhe padhe（2013）和kathai thiraikathai vasanamiyakkam（2014）中首次亮相。微调：kathai thiraikathai vasanam iyakkam（2014）和inimey ippadithaan（2015）是卡纳达语电影。问：谁是Aastik的主演？目标：aastik是一部1956年的印地语电影，由shahu modak，paro devi和meenakshi主演。表：adaper调：aastik是1956年宝莱坞电影主演沙湖莫达克。由s导演的《微调》。p. 卡拉问：雅库布导演的三部电影是什么，什么时候上映的目标：雅库布执导了三部电影：1937年的《萨加尔卡舍尔》，1939年的《乌斯基塔曼纳》，以及1949年的《爱叶》。表：改编曲：雅库布执导了三部电影：1937年的《萨加尔之狮》、1939年的《她最后的欲望》和1949年的《爱也》。由雅库布执导的《微调：表3：适配器调整优于微调的示例性能增益为1。Rouge-1、Rouge-L和Rouge-2的9%。1%的胭脂-2相比，微调。在表格式QA中，微调相对于适配器调整的微不足道的收益可以归因于灾难性的遗忘（French，1999;Kirkpatricket al. ，2017; Chen et al. ，2020），这是由下游表格数据格式的分布与预训练的原始文本数据格式的差异引起的为了进一步探索这种现象，我们分析了表3中FeTaQA数据集的示例，其中适配器调整优于微调。我们观察到，在第一个例子中，微调模型无法从列语义中消除表面形式的问题中命名实体Akhila Kishore的预期语义是Actor。虽然表面形式类似于列值Akhila，但预期的语义是列标题“角色”。微调模型错误地预测表格上下文的第二行和第三行作为信息的正确基础，我们观察到，微调模型还预测来自错误列Direc- tor的信息，而不是第二个例子中的Castadapter-tune正确识别列，但在预测中部分生成所需的信息.第三个例子描述了微调模型的非事实和非流畅预测我们在表4中演示了一个Tablesum的分层表的示例。该问题要求在表格单元格上进行聚合，并具有与之关联的各种类似摘要的目标。分层表格提到了EdShepherd3次，但实际出现次数为10次，从年膜作用语言2013帕迪帕迪Kanchana卡纳达2014Kathai Thiraikathai Vasanam IyakkamDaksha泰米尔2015伊巴迪塔安阿希拉泰米尔.........标题主任铸造.........阿斯蒂克S. P. 卡拉Shahu Modak，Paro Devi，Meenakshi，B.M. 普拉文？保罗？维亚斯阿拉姆·阿拉纳努拜·瓦基勒Daljeet Chitra Tiwari Niranjan Sharma Minu Mumtaz.年膜主任.........1937萨加尔狮子（Sagar Lion）Yakub.........1939Uski Tamanna（Her LastDesire）Yakub.........1949艾叶Yakub.........+v：mala2277获取更多论文问：埃德谢夫登有多少次被列为表演者？目标：• 埃德·谢林在记录2014年瑞典热门歌曲的表格中两次被列为表演者。其他英语音乐的顶级表演者包括布鲁斯·斯普林斯汀、山姆·史密斯和酷玩乐队，这意味着英语音乐在瑞典取得了巨大的成功。• 根据该表，在2014年，埃德·谢林只被列为表演者一次。这是他在2014年1月和2月发行的一首名为“我看到火”的歌曲表：Adaper-tune：我找到了2014年的一张桌子它显示了一周中的一周、歌曲名称、艺术家、歌曲名称、专辑名称和表演者。有11次，埃德谢林被列为表演者在一年。这首歌的名字是“木材”，这张专辑是真的。微调：我找到了一张2014年埃德·谢利的表格。他在2014年他第一次上榜是在2014年1月3日，歌曲“Timber”和最后一首2014年4月4日，《我看见火》。适配器调谐表4：来自Tablesum数据集的示例这两种模型都能生成很长的答案，已移除编码器解码器适配器已移除#可训练参数来自上下文表的信息然而，由于模型没有显式地处理细胞聚集，我们在两个适配器调整的模型和微调的模型。模特们发现Tablesum示例具有挑战性，即使生成的语言是流畅和可读的。对于文本QA，在NarrativeQA数据集上，适配器调优的性能与微调相当，其中适配器调优的模型达到0。降低8%胭脂-1，1. Rouge-2和1高8%。低5%的Rouge-L分数比微调。微调406，291，456（100%）我们的结论是，适配器调谐性能更好而不是针对域外表格数据进行微调，表5：编码器和解码器中的可训练参数。编码器适配器层从0x-y第3周至第9周、第31周和第42周至第43。我们的表格转换过程处理这个问题，以生成一个包含10个单元格的常规表格，其中包含- ingEdShepherd作为值。模型可以简单地聚合提及。如表4所示，在域名文本上的性能相当。7.3适配器层我们通过烧蚀编码器和解码器模块中的适配器层来研究（RQ 2）我们统一地从编码器和解码器中消除连续的适配器层，从两个模块中的第一层开始，最后删除所有层。这导致12个实验对应于12个en-––6，343，680（1.（56%）0–212–144，757，760（1.17%）0–412–163，700，480（0。91%）0–612–182，643，200（0。（65%）周日期歌曲标题表演者专辑标题表演者12014年1月3日“木材”Pitbull feat. ......这是什么？真Avicii22014年1月1032014年1月17日《我看见火》Ed Sheeran厚望布鲁斯42014年1月24日52014年1月31真Avicii62014年2月7日克里斯特·舍格伦桑格·西纳特拉克里斯特·舍格伦72014年2月1482014年2月21日真Avicii92014年2月28............31二〇一四年七月三十一日XEd Sheeran+v：mala2277获取更多论文至−−(a) FeTaQA Rouge-L评分（b）表格Rouge-L评分（c）叙述性QA Rouge-L评分(d)FeTaQAsacreBLEU评分（e）Tablesum sacreBLEU评分（f）NarrativeQA sacreBLEU评分图3：适配器层消融评分。X轴表示删除的编码器适配器层的范围，Y轴表示删除的解码器适配器层的范围x-y意味着从x到y的所有适配器层。那里显示了36种模型消融配置消融从0到6个编码器适配器层移除开始以及由左下单元（（0-6），（12-18））表示的12到18解码器适配器层移除增加了沿X轴的编码器适配器层和沿Y轴的解码器适配器层的删除图4：适配器层消融Rouge2 F评分。X轴描绘了逐渐删除的编码器适配器层（0每个（x-y）表示具有编码器层p的图5：适配器层消融Rouge-L评分。X轴描绘了删除的编码器适配器层（0-11）和解码器适配器层（12-23 逐渐地。每个（x-y）表示具有编码器层p的（俄、西）Q被删除并且解码器层R到S被删除。编码器和12个解码器适配器层。我们将编码器适配器层编号为0-11，将解码器适配器层编号为 12-23 。我们使用 Rouge-2 ， Rouge-L2 和sacreBLEU3评分来衡量模型的性能。F分数2https:\u002F\u002Fpypi.org\u002Fproject\u002Frouge-score\u002F3https:\u002F\u002Fgithub.com\u002Fmjpost\u002FsacreBLEU（俄、西）到Q被删除并且解码器层R到S被删除。对于每个数据集（NarrativeQA，Tablesum，FeTaQA），分别如图4，5和6所示。我们观察到，随着更多的适配器层被消除，所有数据集的性能都会下降。然而，性能下降是最小的，直到最后一个适配器层也被删除.拐点在数据集之间变化，但限于编码器和解码器的最后2层对于纳拉-+v：mala2277获取更多论文−（俄、西）图6：适配器层消融sacreBLEU F评分。X轴描绘了逐渐删除的编码器适配器层（0-11）和解码器适配器层（12-23）。每个（x-y）表示删除了编码器层p到q和解码器层r到s的F分数。tiveQA数据集，这一点是当所有层，直到倒数第二个适配器层从编码器和解码器被删除。对于FeTaQA和Tablesum数据集，只有当最后的编码器和解码器层被删除时，性能才会急剧下降为了分析编解码器的第i层适配器对性能的贡献. .、（0. . ，（12 这导致了36个配置-其中构型（p-q移除从第p层到第q层的所有编码器适配器和从第r层到第s层的所有解码器适配器。结果如图3所示。我们观察到，性能保持可比，因为我们逐步消除适配器层从编码器和解码器，直到最后一层。当我们移除朝向图3a、3b和3c中的RougeL分数以及图3d、3e和3f中的BLEU分数的右上角描绘的最后编码器和解码器适配器层时，性能急剧下降。这意味着最后的适配器层学习大部分域信息。我们还观察到最后的编码器和解码器层对性能的贡献不同删除最后一个编码器层（列0-11）导致所有解码器层的分数大幅下降。这表明最后一个编码器层是必不可少的。仅保留最后一个解码器适配器（行12我们还观察到，仅保留适配器的最后50%，来自编码器和解码器两者的层将参数效率增加0。7%的参数，如表5中所总结，而不会显著损害性能。8结论我们是第一个研究参数有效的迁移学习表和文本的抽象问题的回答使用适配器。我们证明了参数有效的适配器调整优于微调域外的表格数据，并取得了可比的结果域内的文本数据。我们提出了一种从层次表到规则表的转换，并进一步转换为与预训练模型兼容的序列形式。我们将现有的适配器层消融研究扩展到编码器-解码器设置，并证明来自编码器末端的适配器层与同一级别的解码器适配器层相比，可指示编码模态特定我们的研究结果是有用的探索QA模型的可扩展性在内存受限的情况下，具有可比的性能，同时跨模式使用轻量级适配器扩展我们的工作的局限性之一是，我们的模型没有显式地推理和聚合表单元格。这可能会导致在具有挑战性的Tablesum数据集上出现流畅但实际上不正确的答案。解决这一限制问题将留待今后工作。9确认我们要感谢爱思唯尔在整个项目中的支持和资助。这项工作也得到了NWO创新研究激励计划Vidi（016.Vidi.189.039），NWO智能文化- 大数据\u002F数字人文（314-99-301），H2020-EU.3.4。 - 社会挑战-智能、绿色、综合交通（814961）。所有内容都代表作者的意见，不一定得到各自雇主和\u002F或赞助商的认可或认可+v：mala2277获取更多论文引用艾西瓦亚·阿格拉瓦尔，陆佳森，斯坦尼斯瓦夫·安托尔，马·米切尔，C.劳伦斯·齐特尼克，德鲁夫·巴特拉，和德维·帕里克。2016. VQA：视觉问题回答。arXiv预印本arXiv：1505.00468。Lisa Bauer，Yicheng Wang，and Mohit Bansal. 2018.生成式多跳问题回答任务的常识在EMNLP。作者：Alice H.哦2000.口语对话系统的随机语言生成在ANLP\u002FNAACL 2000年会议记录中。《对话系统》，第27-32页。陈三元、侯玉泰、崔一鸣、车万象、刘婷、余翔战。2020年。回忆和学习：微调深度预训练的语言模型，减少遗忘。在2020年自然语言处理经验方法会议（EMNLP）中，第7870计算语言学协会.Zhujun Cheng，Haoyu Dong，Zhiruo Wang，RanJia，Jiaqi Guo，Yan Gao，Shi Han，Jian-GuangLou，and Dongmei Zhang. 2021. Hitab：用于问答和自然语言生成的分层表数据集。arXiv预印本arXiv：2108.06712。作者声明：John R.崔帕斯，还有哈米德·扎曼尼.2021年多模态会话信息搜索。在SIGIRACM。Robert M.法语1999. 连接主义网络中的灾难性遗忘。Trends in Cognitive Sciences，3（4）：128Junliang Guo ， Zhirui Zhang ， Linli Xu ， Hao-RanWei，Boxing Chen，and Enhong Chen. 2020. 用适配器。神经信息处理系统进展，第33卷，第10843-10854页。Curran Associates，Inc.JonathanHerzig ， ThomasMüller ， SyrineKrichene，and Julian Eisenschlos.2021. 开放领域的问题通过密集检索表。计算语言学协会北美分会2021年会议论文集：人类语言技术。Jonathan Herzig，Pawel Krzysztof Nowak，ThomasMüller ， FrancescoPiccinno ， andJulianEisenschlos. 2020. TaPas：通过预训练进行弱监督表解析。在计算语言学协会第58届年会的会议记录中，第4320-4333页，在线。计算语言学协会。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentinDeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly.2019年a。NLP的参数有效迁移学习。第36届国际机器学习会议论文集，机器学习研究论文集第97卷，第2790-2799页。PMLR。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentindeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly. 2019年b. NLP的参数有效迁移学习。 arXiv 预印本 arXiv ：1902.00751。德鲁·A Hudson和Christopher D.曼宁2019. GQA：一个用于真实世界视觉推理和组合问题回答的新数据集。arXiv预印本arXiv：1902.09506。洪家谦，安妮·劳舍尔，西蒙娜·保罗·庞泽托，戈兰·格拉瓦托。2021. DS-TOD：面向任务对话的高效领域专门化。 arXiv 预印本 arXiv ：2110.08395。Yannis Katsis，Saneem Chemmengath，VishwajeetKumar， Samarth Bharadwaj ， Mustafa Canim ，Michael Glass，Alfio Gliozzo，Feifei Pan，Jay-deep Sen ， KarthikSankaranarayanan ， andSoumen Chakrabarti. 2021. AIT-QA：航空业复杂表格的问答数据集。 arXiv 预印本 arXiv ：2106.12944。JamesKirkpatrick ， RazvanPascanu ， NeilRabinowitz，JoelVeness，GuillaumeDesjardins，Andrei A. Rusu，Kieran Milan，JohnQuan ， Tiago Ramalho ， Agnieszka Grabska-Barwinska，Demis Hassabis，Claudia Clopath，Dharshan Kumaran，and Raia Hadsell. 2017.克服神经网络中的灾难性遗忘arXiv预印本arXiv：1612.00796。托马斯 ·K·o·c· 阿尼斯克， JonathanSchw arz ，PhilBlunsom， ChrisDyer ， KarlMoritzHermann，GáborMelis，andEdwardGrefenstette.2018. NarrativeQA阅读理解挑战。Transactions of the Association for ComputationalLinguistics，6：317-328.Shimi Salant，Tom Kwiatkowski，Ankur Parikh，Dipanjan Das，and Jonathan Berant. 2016.学习提取性问题回答的循环广度表征。arXiv预印本arXiv：1611.01436。Mike Lewis，Yinhan Liu，Naman戈亚尔，Mar-jan Ghazvininejad ， Abdelrahman Mohamed ，OmerLevy ， VesStoyanov ， andLukeZettlemoyer. 2019. Bart：用于自然语言生成、翻译和理解的去噪序列到序列预训练。林兆江，Andrea Madotto和Pascale Fung。2020. 通过参数有效的迁移学习探索通用生成语言模型。在计算语言学协会的调查结果：EMNLP 2020，第441-459页，在线。计算语言学协会.+v：mala2277获取更多论文Rajarshee Mitra 201"}],"previewType":2,"briefIntroduction":"+v：mala2277获取更多论文基于表格或文本的Vaishali1Evangelos Kanoulas2Maarten de Rijke21阿姆斯特丹大学发现实验室2阿姆斯特丹大学诉pal，e.kanoulas，m.uva.nl摘要信息搜索问答系统的一个长期目标是在多模态上下文上进行推理，并为用户查询生成自然答案。如今，通过在特定模态（如非结构化文本或结构化表格）的QA数据上微调模型，理论密集型预训练语言模型适用于下游任务，如QA。为了避免训练这种内存消耗的模型，同时为每个模态使用统一的架构，参数高效的适配器在Transformer层之间添加和训练小的特定于任务的瓶颈层。在这项工作中，我们研究了参数高效的抽象QA编码器-解码器模型在结构化的表格数据和非结构化的文本数据，只使用1.5%的额外参数，为每一个模态。我们还对编码器和解码器模块中的适配器层进行了消融，以研究效率-性能权衡，并证明将额外的可训练参数减少到0.7%我们的模型在表格 QA 数据集（如Tablesum和FeTaQA）上的表现优于当前最先进的模型，并在文本 QA数据集（如NarrativeQA）上实现了可比较的性能，使用的可训练参数明显少于微调。1介绍不同背景下的信息搜索系统需要模型能力来推理非结构化和结构化数据，如自由形式的文本、表格和图像（Agrawal et al. ，2016; Vaku-lenkoet al. ，2019; Hudson and Manning，2019;Zhang et al. ，2020; Zhu等人，2021; Deldjoo etal. ，2021年）。如果部署为面向任务的会话代理，则这样的系统可能具有生成自然语言响应的附加要求（Wen et al. ，2015; CarnegieandOh ， 2000;Rambowetal.， 2001;Ratnaparkhi，2002）。开放域问答（QA）的最新工作主要通过微调来解决这些挑战自然答案LM头部文本适配器Nx编码器工作台适配器文本适配器解码器表适配器提问表问题文件图1：使用特定模态（表\u002F文本）适配器进行抽象问题分类的基于不同模态（如表格和文本）的大规模预训练语言模型（Yin et al. ，2020; Herzig et al. ，2020 ， 2021; Katsis 等人， 2021; Nanet al. ，2021年）。然而，在特定输入类型上训练的每个模型与其他模态不兼容，并且需要模态特定的微调。例如，在表格式QA（Herzig et al. ，2020），通过训练附加位置嵌入（行和列标识符）来识别表格单元格属于哪一行和哪一列来学习表格这使得这种模态特定的模型与基于自由形式文本的模型不兼容多模态模型（Zhu etal. ，2021）可以通过连接文本上下文和扁平化的表来对表和文本两者进行推理，从而导致更长的输入序列并限制可以被编码的上下文的长度。为了应对这些挑战，我们研究了针对表格和文本的抽象QA的参数有效迁移学习。我们的动机是使用适配器层，在冻结的预训练Transformer层之间注入小瓶颈层，因为它们实现了与精细转换层相当的性能arXiv：2204.03357v1 [cs.CL] 2022年4+v：mala2277获取更多论文调整各种任务，如多语言翻译（Pfeiffer etal. ， 2020; Philip 等人， 2020; Guo et al. ，2020）、分类（Houlsby et al. ，2019a），文本到文本生成（Lin et al. ，2020）、对话状态跟踪中的域适应和响应生成（Hung et al. ，2021年）。适配器层的消融研究（Rucklé等人，，2020年）上的掩蔽语言模型，如BERT- base和RoBERTa在GLUE基准测试表明，删除开始适配器层导致性能下降最小。在单独的编码器和解码器模块上扩展适配器层烧蚀是重要的，因为层的顺序修剪的常规方法我们的工作探讨了在抽象QA的背景下，两个模块的适配器层的相互作用。Lin等人（2020）探索适配器瓶颈尺寸对各种语言生成任务的影响，这些任务超过了自回归模型，如GPT-2（Radford et al. ，2019）。他们不研究表格数据，也不消融适配器层，这对于理解顺序Transformer模块架构（如编码器-解码器）中单个适配器的影响至关重要。我们的分析是对（Lin et al. ，2020），因为我们消融适配器层以研究参数-性能权衡，而它们仅关注适配器瓶颈尺寸。此外，我们概括了文本到文本的设置，并探索从结构化或非结构化输入（如表格和文本）生成语言。这在下游数据的任务和结构我们提出了一个系统，名为 Partists ，Eefficient ， AbstractiveQ uestionA nswering（PeaQA），如图1所示，它使用共享的预训练语言模型和特定于模态的适配器层学习对非结构化和结构化输入进行推理。我们自动将层次表转换为常规表，以获得统一的表示，而不会破坏表单元格之间的关联。此外，我们扩展的研究消融适配器层的编码器和解码器模块。我们的主要贡献归纳如下：(1) 我们在多模态上下文上执行参数高效的抽象问题回答，每个模态仅使用额外的1.5%的可训练参数。我们的适配器调优模型通过以下方面优于现有的工作：在表格QA数据集上有很大的余量，在文本QA数据集上实现了相当的性能(2) 我们研究表格QA作为一种新的模态，它引入了大量的输入域转移到预先训练的语言模型。我们提出了一个两步的层次表到序列的转换，它产生了一个统一的表示，由一个单一的，共享的预训练的语言模型和模态特定的适配器层使用据我们所知，这是第一个以参数有效的方式探索表格QA问题回答的工作。(3) 我们烧蚀了编码器和解码器模块中的适配器层，以研究它们的影响，并表明可以消除编码器和解码器的起始层，而不会显着降低性能。我们还证明了最后的编码器适配器层是不可或缺的，并具有更大的贡献比解码器层在同一级别。2相关工作表格式问答。表格式QA系统旨在回答结构化表格中的问题，这些表格可以是规则的或分层的。分层表可以具有跨越多个行和列的标题单元格和主体单元格（Chenget al. ，2021年）。在大多数表格式QA系统中（Herziget al. ，2020; Zhu等人，2021; Katsis et al. ，2021），表的结构通过引入表特定的位置信息（诸如行id和列id）在大型语言模型的嵌入层中编码。，2021; Cheng et al. ，2021）提出了通过推理和聚合来自表格的不连续事实来生成自然答案的额外挑战。文本问答。文本上的问题回答测量系统理解用户问题和上下文段落中的自由形式文本并预测答案的能力。预测的答案本质上可以是提取的，其中系统识别上下文段落中的短文本跨度以回答用户查询（Lee et al. ，2016; Seo等人，2016; Rajpurkar等人。，2016; Pearce et al. ，2021），或者它可以是抽象的，其中需要生成自由形式的答案（Yin et al. ，2016; Mitra，2017; Bauer 等人， 2018; Reddy et al. ，2019）。迁移学习。迁移学习技术，如微调预训练模型，+v：mala2277获取更多论文流任务需要为每个新任务学习一组新参数为了避免这种记忆密集型迁移学习方法，已经提出了适配器作为适应新领域的参数有效方法（ Houlsby et al. ， 2019 b; Pfeiffer et al. ，2020）。适配器已经被扩展到各种生成任务中的语言生成，诸如翻译、摘要、多轮对话和面向任务的自然语言生成（Lin et al. ，2020）。我们的工作结合了上述所有方面，从表格和文本中生成抽象的答案，只有0。7%3模型我们专注于编码器-解码器模型的抽象问题回答的任务。我们使用BART（Lewis et al. ，2019）编码器-解码器架构，其包括双向编码器和自回归解码器。输入序列由问题、上下文标题和上下文序列组成，上下文序列之前有指示每个子序列开始的提示形式上，输入序列表示为question\u003Eqq1. . . qm\u003Ctitle\u003E t1t2.. . tp\u003C上下文\u003E c0c1。. . Cn，其中Qi是第i个问题令牌，Tj是第j个标题令牌，以及Ck是第k个上下文令牌。上下文可以是文本段落或展开的表格。预训练的BART模型的参数在训练期间被冻结添加到模型中的特定于模态的适配器层在表格上下文或文本上下文上进行训练，以生成自然的答案。4语篇提问为了研究多模态抽象问答系统，我们首先将自由形式的文本作为系统的上下文我们在Narra-t iv eQA数据集上针对文本上下文训练适配器层（ K o cKomiskovskiyetal. ， 2018 ）。 NarrativeQA是基于故事的复杂抽象问题回答该数据集在训练集中包含32，747个样本，在验证集中包含3，461个样本，在测试集中包含10，557个对于我们的任务，我们选择了输入上下文段落作为每个样本的人工注释摘要，这是故事的维基百科页面摘要模型的输入是每篇文章的问题、标题和摘要，目标是抽象的答案。5表格式提问我们研究了表格QA作为一种新的模式，它引入了大量的输入域转移到预先训练的语言模型。表格在其表示中强制执行结构为了通过使用统一的预训练语言模型来实现参数效率的目标，我们只训练表特定的然而，这需要表格和文本的统一输入表示另外一个挑战是在不同的表类型（常规的、分层的）之间保持一致性。对于我们的任务，我们探索2个表格QA数据集，即 Tablesum （ Zhang et al. ， 2020 ）和FeTaQA（Nan et al. ，2021年）。Tablesum由200个独特的维基百科表格组成，其中问题和摘要人工注释答案; 40%的样本是关于分层表的问题，但是它们发布的数据中的表在分层单元中缺少信息，并且它们的工作不处理分层结构。我们通过从相应的维基百科页面中提取wikitables来解决这个问题，并发布一个干净版本的数据集。1FeTaQA（Nan et al. ，2021）是一个更大的抽象表格QA数据集，由超过10，330个常规表格的问题和自由形式的答案的数据集由7，326个训练样本验证集中为1，001，测试集。FeTaQA由人工注释的答案组成，其中包含涉及实体和关系的解释。5.1表格表示对于我们的工作，我们选择在两个步骤中统一表示所有表：（1）将层次表转换为常规表;(2) 将常规表线性化为可以用语言模型编码的扁平序列。线性化分层表格标题。分层表格标题通过以下过程线性化为单行标题跨多列的标题单元格被复制并拆分为多个单元格。接下来，将此标题所跨越的单元格值对所有标题行重复此过程会将分层标题转换为顺序1清理后的数据和代码可以在github.com\u002Fkolk\u002FPea-QA上找到+v：mala2277获取更多论文e（f）1a（d）\u003Cd：\u003E−一BCDeFG我123J45HK6L78910a（d）a（e）Bc（f）g（i）g（j）11231145h（k）1146h78910(a) 表示为常规表的多跨度表。a（d）Be（f）g1213B2\u003Cd：\u003Eg（h）a（d）1B3(b) 将常规表线性化为一系列键：值对。图2：表格表示。一个.我们在图2a中描述了这个过程，它产生了线性报头a（d），a（d），b，e（f）。线性化表体。多跨度表体单元格的解析方式与表头不同每个表体单元格都与一个或多个标题单元格一起复制，跨多行的单元格将与所有跨行的单元格一起复制。这一过程导致了一个经常性的数据集。在Tablesum数据集上，我们遵循原始工作中描述的5重交叉验证来评估我们的模型。在FeTaQA和Narra- tiveQA上，我们利用测试分割来评估我们的模型。我们在每个数据集上训练模型 15 个时期，并在 Rouge-2 ，Rouge-L和sacreBLEU指标上进行评估。6.2适配器调谐我们执行适配器调整作为一个参数有效的替代方案，以适应BART-大模型的抽象问题回答任务在不同的模态。我们首先冻结预训练的BART 大模型的所有层，该模型是在原始BART 论文中提到的文本重建上训练的（Lewis et al. ，2019）。我们从Houlsby适配器配置中添加瓶颈适配器层（Houlsby et al. ，2019 a），这些训练适应下游抽象问题回答任务，也适应特定于表.我们以行为主的形式扁平化常规表，按顺序连接行。每一行都是一个（键，值）对序列，其中键是列标题，值是该列的单元格值，如图2b所示。6实验装置我们试图通过实验回答以下研究问题：（RQ1）在多模态输入的情况下，适配器调整(RQ2)编码器和解码器上的所有适配器层是否对任务\u002F模态的性能贡献相同？6.1微调我们的实验都是在大变量的BART模型上进行的。我们在3个数据集上微调BART-大型模型，因为最先进的微调模型针对不同的数据集利用不同的架构，使得与适配器调优的比较我们将3个数据集上的微调BART模型作为基线。我们从{8e−4，6e−4，3e−4，1e−4，5e−5，4e5，3e−5，2e−5，1e−5}中扫描学习率，并为每个数据集选择最佳执行学习率。我们在Tablesum上选择4e−5进行微调，在Fe-TaQA数据集上选择8e−4，在NarrativeQA上选择2e−5我们使用批量大小4和梯度累积8来模拟有效批量大小32。表格QA数据集的最大靶序列长度设置为200，文本QA数据集的最大靶序列长度设置为100把上下文。每个适配器层具有64的瓶颈嵌入尺寸。如第6.1节所述，我们扫描学习率并为每个数据集选择性能最佳的学习率。我们选择6e−4作为表格式QA数据集Tablesum和FeTaQA，并选择1e−1来训练文本QA数据集NarrativeQA。我们使用相同的批次大小和最大靶序列长度作为微调以进行有效的比较。超参数的总结见表1。数据集参数ATuneFTune所有调度器线性线性批量3232种子66最大历元1515表和学习率6e-44e-5输入长度200200学习率6e-48e-4FeTaQA输入长度100100NarrativeQA学习率1e-42e-5输入长度5050表1：用于训练的超参数。ATune表示适配器调整，FTune表示微调，All表示所有3个数据集。6.3消融研究：适配器修剪适配器层修剪已经在GLUE基准上进行了探索（Rucklé et al. ，2020年），其中+v：mala2277获取更多论文数据集模型训练Rouge-1 Rouge-2 Rouge-L BLEUGPT2微调0. 2720. 0730. 2005. 35（Nishida et al. ，2019年）表2：结果：在Tablesum、FeTaQA和NarrativeQA数据集上获得的评分演示了从BERT-base和RoBERTa模型的开头我们扩展适配器层烧蚀的编码器-解码器架构，并假设这种现象应观察到的编码器和解码器模块。然而，编码器和解码器中的适配器层如何彼此交互并对性能做出贡献是不平凡的。既往研究（Rucklé et al. ，2020）在适配器消除上修剪掩码语言模型中的连续适配器层。该方法不直接扩展到编码器-解码器的顺序模块，其中模块内适配器不仅有助于它们各自的编码和解码目标，而且有助于模块间交互和性能。为了测量不同模块中适配器层的影响，我们在编码器和解码器中执行适配器消融。首先，我们从编码器和解码器模块中统一删除适配器层，从两个模块的开始层开始，最后删除所有层。这导致12个实验，对应于消除12个编码器和12个解码器适配器层。为了研究不同层次的模块间适配器之间的相互作用，我们从编码器和解码器的最后6个层次进行了36个不同配置的适配器消除实验。我们在第7.3节中分析了每种配置的性能。7结果我们比较了我们的基线微调模型的结果与最先进的微调模型，在第7.1节中。我们解决（RQ1）“在多模态输入的情况下，适配器调整与微调相比如何执行？”节中7.2和（RQ 2）“编码器和解码器上的所有适配器层是否对任务\u002F模态的性能都有同等贡献？”在7.3。7.1微调模型我们研究了我们的基线微调模型的结果实验结果示于表2中。我们观察到，对于Tablesum数据集，我们的微调模型在Rouge-1上的表现优于最先进的 T5 模型 3 。 8% ，胭脂 -2 乘 4 。Rouge-L评分降低4%。这可以归因于在数据集的干净版本上微调我们的模型我们的微调模型在Fe-TaQA数据集上执行最先进的T5-大，即0。2%的胭脂-1，0。Rouge-2高出01%，0.Rouge-L高出04%。我们对NarrativeQA的微调结果低于使用复杂推理架构训练的最先进模型。这项工作的重点主要是比较微调和适配器调优，因此我们离开明确的推理作为未来工作的一部分。7.2适配器调谐型号我们通过比较适配器调整模型与我们的基线微调模型的性能来解决（ RQ 1 ）。对于Tablesum，如表2所示，微调（基线）的性能略优于适配器调优，Rouge-1和0高7%。Rouge-L 评分高 4% ，而 Rouge-2 评分相同。对于FeTaQA，adapter-tune显示了更大的TablesumT50。3620。1430。27610.43（Zhang et al. ，2020年）我们的（Pea-QA）微调（基线）0.4000.1860.316第六章30适配器调谐0。3930.1860。312第六章75T5-小型0。5500。3300。47021岁60FeTaQAT5基础微调0。6100。3900。51028岁14（Nan et al. ，2021年）T5-大号0。6300。4140。53030. 54我们的（Pea-QA）微调（基线）0。6320。4150。53430. 81+v：mala2277获取更多论文问：Akhila Kishore的前两部电影是什么时候目标：akhila kishore在卡纳达语电影padhe padhe（2013）中首次亮相，并出现在kathaithiraikathai vasanam iyakkam（2014）中。表：Adaper-tune：akhila kishore在卡纳达语电影padhe padhe（2013）和kathai thiraikathai vasanamiyakkam（2014）中首次亮相。微调：kathai thiraikathai vasanam iyakkam（2014）和inimey ippadithaan（2015）是卡纳达语电影。问：谁是Aastik的主演？目标：aastik是一部1956年的印地语电影，由shahu modak，paro devi和meenakshi主演。表：adaper调：aastik是1956年宝莱坞电影主演沙湖莫达克。由s导演的《微调》。p. 卡拉问：雅库布导演的三部电影是什么，什么时候上映的目标：雅库布执导了三部电影：1937年的《萨加尔卡舍尔》，1939年的《乌斯基塔曼纳》，以及1949年的《爱叶》。表：改编曲：雅库布执导了三部电影：1937年的《萨加尔之狮》、1939年的《她最后的欲望》和1949年的《爱也》。由雅库布执导的《微调：表3：适配器调整优于微调的示例性能增益为1。Rouge-1、Rouge-L和Rouge-2的9%。1%的胭脂-2相比，微调。在表格式QA中，微调相对于适配器调整的微不足道的收益可以归因于灾难性的遗忘（French，1999;Kirkpatricket al. ，2017; Chen et al. ，2020），这是由下游表格数据格式的分布与预训练的原始文本数据格式的差异引起的为了进一步探索这种现象，我们分析了表3中FeTaQA数据集的示例，其中适配器调整优于微调。我们观察到，在第一个例子中，微调模型无法从列语义中消除表面形式的问题中命名实体Akhila Kishore的预期语义是Actor。虽然表面形式类似于列值Akhila，但预期的语义是列标题“角色”。微调模型错误地预测表格上下文的第二行和第三行作为信息的正确基础，我们观察到，微调模型还预测来自错误列Direc- tor的信息，而不是第二个例子中的Castadapter-tune正确识别列，但在预测中部分生成所需的信息.第三个例子描述了微调模型的非事实和非流畅预测我们在表4中演示了一个Tablesum的分层表的示例。该问题要求在表格单元格上进行聚合，并具有与之关联的各种类似摘要的目标。分层表格提到了EdShepherd3次，但实际出现次数为10次，从年膜作用语言2013帕迪帕迪Kanchana卡纳达2014Kathai Thiraikathai Vasanam IyakkamDaksha泰米尔2015伊巴迪塔安阿希拉泰米尔.........标题主任铸造.........阿斯蒂克S. P. 卡拉Shahu Modak，Paro Devi，Meenakshi，B.M. 普拉文？保罗？维亚斯阿拉姆·阿拉纳努拜·瓦基勒Daljeet Chitra Tiwari Niranjan Sharma Minu Mumtaz.年膜主任.........1937萨加尔狮子（Sagar Lion）Yakub.........1939Uski Tamanna（Her LastDesire）Yakub.........1949艾叶Yakub.........+v：mala2277获取更多论文问：埃德谢夫登有多少次被列为表演者？目标：• 埃德·谢林在记录2014年瑞典热门歌曲的表格中两次被列为表演者。其他英语音乐的顶级表演者包括布鲁斯·斯普林斯汀、山姆·史密斯和酷玩乐队，这意味着英语音乐在瑞典取得了巨大的成功。• 根据该表，在2014年，埃德·谢林只被列为表演者一次。这是他在2014年1月和2月发行的一首名为“我看到火”的歌曲表：Adaper-tune：我找到了2014年的一张桌子它显示了一周中的一周、歌曲名称、艺术家、歌曲名称、专辑名称和表演者。有11次，埃德谢林被列为表演者在一年。这首歌的名字是“木材”，这张专辑是真的。微调：我找到了一张2014年埃德·谢利的表格。他在2014年他第一次上榜是在2014年1月3日，歌曲“Timber”和最后一首2014年4月4日，《我看见火》。适配器调谐表4：来自Tablesum数据集的示例这两种模型都能生成很长的答案，已移除编码器解码器适配器已移除#可训练参数来自上下文表的信息然而，由于模型没有显式地处理细胞聚集，我们在两个适配器调整的模型和微调的模型。模特们发现Tablesum示例具有挑战性，即使生成的语言是流畅和可读的。对于文本QA，在NarrativeQA数据集上，适配器调优的性能与微调相当，其中适配器调优的模型达到0。降低8%胭脂-1，1. Rouge-2和1高8%。低5%的Rouge-L分数比微调。微调406，291，456（100%）我们的结论是，适配器调谐性能更好而不是针对域外表格数据进行微调，表5：编码器和解码器中的可训练参数。编码器适配器层从0x-y第3周至第9周、第31周和第42周至第43。我们的表格转换过程处理这个问题，以生成一个包含10个单元格的常规表格，其中包含- ingEdShepherd作为值。模型可以简单地聚合提及。如表4所示，在域名文本上的性能相当。7.3适配器层我们通过烧蚀编码器和解码器模块中的适配器层来研究（RQ 2）我们统一地从编码器和解码器中消除连续的适配器层，从两个模块中的第一层开始，最后删除所有层。这导致12个实验对应于12个en-––6，343，680（1.（56%）0–212–144，757，760（1.17%）0–412–163，700，480（0。91%）0–612–182，643，200（0。（65%）周日期歌曲标题表演者专辑标题表演者12014年1月3日“木材”Pitbull feat. ......这是什么？真Avicii22014年1月1032014年1月17日《我看见火》Ed Sheeran厚望布鲁斯42014年1月24日52014年1月31真Avicii62014年2月7日克里斯特·舍格伦桑格·西纳特拉克里斯特·舍格伦72014年2月1482014年2月21日真Avicii92014年2月28............31二〇一四年七月三十一日XEd Sheeran+v：mala2277获取更多论文至−−(a) FeTaQA Rouge-L评分（b）表格Rouge-L评分（c）叙述性QA Rouge-L评分(d)FeTaQAsacreBLEU评分（e）Tablesum sacreBLEU评分（f）NarrativeQA sacreBLEU评分图3：适配器层消融评分。X轴表示删除的编码器适配器层的范围，Y轴表示删除的解码器适配器层的范围x-y意味着从x到y的所有适配器层。那里显示了36种模型消融配置消融从0到6个编码器适配器层移除开始以及由左下单元（（0-6），（12-18））表示的12到18解码器适配器层移除增加了沿X轴的编码器适配器层和沿Y轴的解码器适配器层的删除图4：适配器层消融Rouge2 F评分。X轴描绘了逐渐删除的编码器适配器层（0每个（x-y）表示具有编码器层p的图5：适配器层消融Rouge-L评分。X轴描绘了删除的编码器适配器层（0-11）和解码器适配器层（12-23 逐渐地。每个（x-y）表示具有编码器层p的（俄、西）Q被删除并且解码器层R到S被删除。编码器和12个解码器适配器层。我们将编码器适配器层编号为0-11，将解码器适配器层编号为 12-23 。我们使用 Rouge-2 ， Rouge-L2 和sacreBLEU3评分来衡量模型的性能。F分数2https:\u002F\u002Fpypi.org\u002Fproject\u002Frouge-score\u002F3https:\u002F\u002Fgithub.com\u002Fmjpost\u002FsacreBLEU（俄、西）到Q被删除并且解码器层R到S被删除。对于每个数据集（NarrativeQA，Tablesum，FeTaQA），分别如图4，5和6所示。我们观察到，随着更多的适配器层被消除，所有数据集的性能都会下降。然而，性能下降是最小的，直到最后一个适配器层也被删除.拐点在数据集之间变化，但限于编码器和解码器的最后2层对于纳拉-+v：mala2277获取更多论文−（俄、西）图6：适配器层消融sacreBLEU F评分。X轴描绘了逐渐删除的编码器适配器层（0-11）和解码器适配器层（12-23）。每个（x-y）表示删除了编码器层p到q和解码器层r到s的F分数。tiveQA数据集，这一点是当所有层，直到倒数第二个适配器层从编码器和解码器被删除。对于FeTaQA和Tablesum数据集，只有当最后的编码器和解码器层被删除时，性能才会急剧下降为了分析编解码器的第i层适配器对性能的贡献. .、（0. . ，（12 这导致了36个配置-其中构型（p-q移除从第p层到第q层的所有编码器适配器和从第r层到第s层的所有解码器适配器。结果如图3所示。我们观察到，性能保持可比，因为我们逐步消除适配器层从编码器和解码器，直到最后一层。当我们移除朝向图3a、3b和3c中的RougeL分数以及图3d、3e和3f中的BLEU分数的右上角描绘的最后编码器和解码器适配器层时，性能急剧下降。这意味着最后的适配器层学习大部分域信息。我们还观察到最后的编码器和解码器层对性能的贡献不同删除最后一个编码器层（列0-11）导致所有解码器层的分数大幅下降。这表明最后一个编码器层是必不可少的。仅保留最后一个解码器适配器（行12我们还观察到，仅保留适配器的最后50%，来自编码器和解码器两者的层将参数效率增加0。7%的参数，如表5中所总结，而不会显著损害性能。8结论我们是第一个研究参数有效的迁移学习表和文本的抽象问题的回答使用适配器。我们证明了参数有效的适配器调整优于微调域外的表格数据，并取得了可比的结果域内的文本数据。我们提出了一种从层次表到规则表的转换，并进一步转换为与预训练模型兼容的序列形式。我们将现有的适配器层消融研究扩展到编码器-解码器设置，并证明来自编码器末端的适配器层与同一级别的解码器适配器层相比，可指示编码模态特定我们的研究结果是有用的探索QA模型的可扩展性在内存受限的情况下，具有可比的性能，同时跨模式使用轻量级适配器扩展我们的工作的局限性之一是，我们的模型没有显式地推理和聚合表单元格。这可能会导致在具有挑战性的Tablesum数据集上出现流畅但实际上不正确的答案。解决这一限制问题将留待今后工作。9确认我们要感谢爱思唯尔在整个项目中的支持和资助。这项工作也得到了NWO创新研究激励计划Vidi（016.Vidi.189.039），NWO智能文化- 大数据\u002F数字人文（314-99-301），H2020-EU.3.4。 - 社会挑战-智能、绿色、综合交通（814961）。所有内容都代表作者的意见，不一定得到各自雇主和\u002F或赞助商的认可或认可+v：mala2277获取更多论文引用艾西瓦亚·阿格拉瓦尔，陆佳森，斯坦尼斯瓦夫·安托尔，马·米切尔，C.劳伦斯·齐特尼克，德鲁夫·巴特拉，和德维·帕里克。2016. VQA：视觉问题回答。arXiv预印本arXiv：1505.00468。Lisa Bauer，Yicheng Wang，and Mohit Bansal. 2018.生成式多跳问题回答任务的常识在EMNLP。作者：Alice H.哦2000.口语对话系统的随机语言生成在ANLP\u002FNAACL 2000年会议记录中。《对话系统》，第27-32页。陈三元、侯玉泰、崔一鸣、车万象、刘婷、余翔战。2020年。回忆和学习：微调深度预训练的语言模型，减少遗忘。在2020年自然语言处理经验方法会议（EMNLP）中，第7870计算语言学协会.Zhujun Cheng，Haoyu Dong，Zhiruo Wang，RanJia，Jiaqi Guo，Yan Gao，Shi Han，Jian-GuangLou，and Dongmei Zhang. 2021. Hitab：用于问答和自然语言生成的分层表数据集。arXiv预印本arXiv：2108.06712。作者声明：John R.崔帕斯，还有哈米德·扎曼尼.2021年多模态会话信息搜索。在SIGIRACM。Robert M.法语1999. 连接主义网络中的灾难性遗忘。Trends in Cognitive Sciences，3（4）：128Junliang Guo ， Zhirui Zhang ， Linli Xu ， Hao-RanWei，Boxing Chen，and Enhong Chen. 2020. 用适配器。神经信息处理系统进展，第33卷，第10843-10854页。Curran Associates，Inc.JonathanHerzig ， ThomasMüller ， SyrineKrichene，and Julian Eisenschlos.2021. 开放领域的问题通过密集检索表。计算语言学协会北美分会2021年会议论文集：人类语言技术。Jonathan Herzig，Pawel Krzysztof Nowak，ThomasMüller ， FrancescoPiccinno ， andJulianEisenschlos. 2020. TaPas：通过预训练进行弱监督表解析。在计算语言学协会第58届年会的会议记录中，第4320-4333页，在线。计算语言学协会。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentinDeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly.2019年a。NLP的参数有效迁移学习。第36届国际机器学习会议论文集，机器学习研究论文集第97卷，第2790-2799页。PMLR。NeilHoulsby ， AndreiGiurgiu ， StanislawJastrzebski ， BrunaMorrone ， QuentindeLaroussilhe，AndreaGesmundo，MonaAttariyan，and Sylvain Gelly. 2019年b. NLP的参数有效迁移学习。 arXiv 预印本 arXiv ：1902.00751。德鲁·A Hudson和Christopher D.曼宁2019. GQA：一个用于真实世界视觉推理和组合问题回答的新数据集。arXiv预印本arXiv：1902.09506。洪家谦，安妮·劳舍尔，西蒙娜·保罗·庞泽托，戈兰·格拉瓦托。2021. DS-TOD：面向任务对话的高效领域专门化。 arXiv 预印本 arXiv ：2110.08395。Yannis Katsis，Saneem Chemmengath，VishwajeetKumar， Samarth Bharadwaj ， Mustafa Canim ，Michael Glass，Alfio Gliozzo，Feifei Pan，Jay-deep Sen ， KarthikSankaranarayanan ， andSoumen Chakrabarti. 2021. AIT-QA：航空业复杂表格的问答数据集。 arXiv 预印本 arXiv ：2106.12944。JamesKirkpatrick ， RazvanPascanu ， NeilRabinowitz，JoelVeness，GuillaumeDesjardins，Andrei A. Rusu，Kieran Milan，JohnQuan ， Tiago Ramalho ， Agnieszka Grabska-Barwinska，Demis Hassabis，Claudia Clopath，Dharshan Kumaran，and Raia Hadsell. 2017.克服神经网络中的灾难性遗忘arXiv预印本arXiv：1612.00796。托马斯 ·K·o·c· 阿尼斯克， JonathanSchw arz ，PhilBlunsom， ChrisDyer ， KarlMoritzHermann，GáborMelis，andEdwardGrefenstette.2018. NarrativeQA阅读理解挑战。Transactions of the Association for ComputationalLinguistics，6：317-328.Shimi Salant，Tom Kwiatkowski，Ankur Parikh，Dipanjan Das，and Jonathan Berant. 2016.学习提取性问题回答的循环广度表征。arXiv预印本arXiv：1611.01436。Mike Lewis，Yinhan Liu，Naman戈亚尔，Mar-jan Ghazvininejad ， Abdelrahman Mohamed ，OmerLevy ， VesStoyanov ， andLukeZettlemoyer. 2019. Bart：用于自然语言生成、翻译和理解的去噪序列到序列预训练。林兆江，Andrea Madotto和Pascale Fung。2020. 通过参数有效的迁移学习探索通用生成语言模型。在计算语言学协会的调查结果：EMNLP 2020，第441-459页，在线。计算语言学协会.+v：mala2277获取更多论文Rajarshee Mitra 201","totalNum":1,"upLimitPageNum":0},"downloadNum":0,"previewInfo":{"coverImg":["https:\u002F\u002Fdl-preview.csdnimg.cn\u002F88589315\u002F0001-a3df28fcccb7ae33a15eb7077da062ae_thumbnail.jpeg"],"isPreview":true,"isFromSo":false,"totalPage":14,"defaultCoverImg":"https:\u002F\u002Fcsdnimg.cn\u002Frelease\u002Fdownload\u002Fstatic_files\u002Fpc\u002Fimages\u002Fthumbnail\u002FPDF.png","unloginPreviewNum":0,"soPage":0,"firstPage":1,"sourceType":1,"isPpt":0,"previewImg":[]},"upDate":1701446777000,"isPaySource":false,"tagArr":[{"tagUrl":"https:\u002F\u002Fdownload.csdn.net\u002Ftagalbum\u002F16119","tagName":"性能优化","key":"66ff8b355d764709993c84f8cac24338"}],"isVipExclusive":true,"button4BuyVip":{"broadcastBackgroundColor":"#f84428","url":"https:\u002F\u002Fmall.csdn.net\u002Fvip?spm=1003.2020.3001.4167&utm_source=vip_pc_xz_tabjb","name":"开通VIP（低至0.43\u002F天）","broadcastCharactersColor":"#ffffff","broadcastText":"送3个月"},"sourceLowestPrice":0.43,"userIsStudent":false,"button4Download":{"downloadVipIcon":false,"name":"立即下载"},"pubDate":1701403577000,"userVipCouponNum":0,"favoriteNum":0,"fileSize":1092711,"firstSourceId":88589315,"isFavorite":false,"flag":26,"sourcesStatus":2,"description":"《参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用》\n\n在信息技术领域，信息搜索系统正逐步向着多模态推理发展，以满足处理非结构化文本和结构化表格等多样化数据的需求。传统的问答系统(Question Answering, QA)通常依赖于特定模态的微调模型，这不仅需要大量的训练资源，而且限制了模型的通用性。为了解决这一问题，研究者们提出了参数高效的抽象QA模型，通过在Transformer层间添加小而专的瓶颈层，即适配器层，实现对不同模态数据的有效处理。\n\n该模型的核心在于适配器层的运用，它们能够在预训练的Transformer模型基础上进行微调，而无需大量额外的训练参数。这种设计允许模型在结构化表格数据和非结构化文本数据上同时表现出色，只需1.5%的额外参数。通过对编码器和解码器模块的适配器层进行消融研究，研究者们探索了效率与性能之间的平衡。进一步压缩可训练参数至0.7%，模型在表格QA数据集如TableSum和FeTaQA上超越了当前最先进的模型，并在文本QA数据集如NarrativeQA上实现了与微调模型相当的性能，但所用的参数显著减少。\n\n近年来，开放域问答系统的进步主要归功于大规模预训练的语言模型，如自然答案生成的LM头部、文本适配器和解码器中的适配器等。然而，这些模型往往需要针对特定模态进行微调，导致它们在处理不同类型的输入时兼容性较差。比如，对于表格格式的QA任务，模型需要学习表格单元格的行列位置，这使得此类模型难以应用于文本数据。多模态模型虽然尝试结合文本和表格进行推理，但由于输入序列的加长，可能导致上下文编码的限制。\n\n为了克服这些挑战，研究人员引入了适配器层的概念，这些层被插入到预训练的Transformer层之间，它们可以针对不同的任务进行微调，如多语言翻译、分类和文本生成等。尽管之前的研究已经验证了适配器层在语言模型如BERT和RoBERTa中的有效性，但对于编码器-解码器架构中单个适配器层的作用及其相互影响，尚未有深入的分析。本文的工作填补了这一空白，通过消融实验研究了编码器和解码器模块中适配器层的影响，揭示了参数与性能之间的微妙关系。\n\n这项工作为构建高效、灵活的多模态信息搜索系统提供了新的视角。通过适配器层的创新应用，模型能够在处理表格和文本数据时保持高性能，同时降低了训练成本，这对于未来的信息检索和问答系统设计具有重要的指导意义。","title":"参数高效的抽象QA编码器-解码器模型在多模态信息搜索系统中的应用","showCBeansBool":true,"abTest10140":1,"isShowCopyRightIcon":false,"viewCountInteger":107,"tagStr":"[\"性能优化\"]","sourcePrice":0,"downloadToday":false,"viewCount":"107","userBalance":0,"minVipBalance":8600,"bundledVipInfo":{"hitId":0,"isBundledVip":false},"cBeans":90,"vipDiscount":0.9,"isCertification":false,"fileSizeFormat":"1.04MB","firstIsessence":"WENKU_PDF_SOURCES","fileTypeUrl":"https:\u002F\u002Fcsdnimg.cn\u002Frelease\u002Fdownload\u002Fstatic_files\u002Fpc\u002Fimages\u002Fminetype\u002FPDF.png","tarArrString":"[{\"key\":\"66ff8b355d764709993c84f8cac24338\",\"tagName\":\"性能优化\",\"tagUrl\":\"https:\u002F\u002Fdownload.csdn.net\u002Ftagalbum\u002F16119\"}]","userPayExpire":true,"userIsEmployee":false,"couponsValue":0,"sourceScore":5,"sourceAuthor":"cpongm","tagNavList":[],"userIsRisk":true,"activitiesTips":"限时抽奖","fileType":"PDF","optimalCouponsExpirationDate":"","vipActivityConfig":{"vip11EndTime":1605283200,"renewalDiscount":8,"vip11beginTime":1604678400,"vip11word":"领券续费立减¥100"}}},"CFG":{"ALIPLAYER_VERSION":"v4","ALIPLAYER_H5_VERSION":"mobile_v1","ENV":"prod","VUE_APP_API_DOWNLOAD_SERVER_PROD":"https:\u002F\u002Fdownload.csdn.net\u002F","INTERNAL_SERVER_TIMEOUT":5000,"ROOT_URL":"https:\u002F\u002Fdownload.csdn.net\u002F","VUE_APP_API_URL_SERVER":"http:\u002F\u002Fcms-community-api.internal.csdn.net\u002F","VUE_APP_API_URL":"https:\u002F\u002Fcms-community-api.internal.csdn.net\u002F","VUE_APP_API_DOWNLOAD_SERVER":"http:\u002F\u002Fdownload.csdn.net\u002F","VUE_APP_API_WENKU_SERVER":"http:\u002F\u002Fwenku.csdn.net\u002F","VUE_APP_API_WENKU":"https:\u002F\u002Fwenku.csdn.net\u002F","VUE_APP_API_DOWNLOAD":"https:\u002F\u002Fdownload.csdn.net\u002F","VUE_APP_API_BIZAPI_URL":"https:\u002F\u002Fbizapi.csdn.net\u002F","VUE_APP_API_MOCK_URL":"https:\u002F\u002Fcms-api.csdn.net\u002F","VUE_MALL_API_URL":"https:\u002F\u002Fmall.csdn.net\u002F","VUE_APP_CMS_HOME_PAGE_ID":"202","VUE_APP_CMS_PAGE_ID":"174"},"queries":{},"basePath":"http:\u002F\u002Fwenku.csdn.net\u002Fpdf\u002F71ss855c0t","uaInfo":{"isMobile":false,"isWeixin":false,"isCsdnApp":false,"isCsdnEduApp":false,"isGoogleBot":false,"isIosMobile":false,"isAndroidMobile":false,"isWindows":false,"isMac":false},"adSize":{"maxWidth":1920,"minHeight":120,"proportion":16},"fullWidth":null,"showPreModal":false,"fixed":false,"browserRendered":false,"dialogStatus":{"default":false,"code":false,"codeWeapp":false,"money":false,"balancePay":false,"openVip":false,"useVip":false,"text":false,"isCopy":false,"yry":false,"joinVip":false,"bgLight":false,"spm":null,"lottery":false,"coupons":false,"cert":false,"activityAd":false},"showStopDownloadDialog":false,"stopDownloadCheckInfo":{},"canPayAdvance":false,"useBalancePay":false,"needGuideScan":false,"beforeDownloadLoading":false,"downloadLoading":false,"beforeDownloadData":{},"checkUrl":null,"checkShow":false,"isDownload":false,"adData":[],"navOffsetTop":48,"resizeObserver":null,"timer":null,"showDevelopEntrance":false,"topOneSourceInfo":{},"showSourcePreview":true,"activeTab":0,"autoJumpTestInfo":[]};</script><script type="text/javascript" src="https://csdnimg.cn/release/wenkucmsfe/public/js/runtime.64e880f5.js"></script><script type="text/javascript" src="https://csdnimg.cn/release/wenkucmsfe/public/js/chunk/common.c3360f06.js"></script><script type="text/javascript" src="https://csdnimg.cn/release/wenkucmsfe/public/js/chunk/tpl/download-detail/index-translate-pdf.edb6c036.js"></script></body>          <script src="https://g.csdnimg.cn/side-toolbar/3.4/side-toolbar.js" ></script> <script onload="window._docsdnToolbarLoaded()" src="https://g.csdnimg.cn/common/csdn-toolbar/csdn-toolbar.js"></script>     </html>