"CVPR 2023：图网络和少样本学习在自然语言理解前沿应用探索"

需积分: 0 24 浏览量更新于2023-12-24 收藏 4.98MB PDF 举报

近年来，图网络和少样本学习已成为自然语言理解领域的前沿应用探索。自然语言理解是体现机器智能的重要标志和应用，表现在智能问答，推荐搜索，人机协同，大规模知识图谱构建等商业和工业场景中。机器是否能够准确理解人类的文本和语义，成为了一个重要的挑战和研究方向。在这个过程中，图网络和少样本学习技术被广泛运用，并在不断探索和实践中取得了一系列进展。图网络技术作为一种新兴的形式化工具，被引入自然语言理解的研究中，以解决传统方法中的一些瓶颈和问题。图网络技术通过对语言和语义的抽象和建模，能够更好地处理文本数据之间的关联和复杂结构，提高了自然语言理解的效率和准确度。少样本学习技术则是针对数据稀缺和标注困难的问题，提出了一系列新的建模和学习方法，能够在少量标注数据的情况下，实现对文本语义的深入理解和建模，为自然语言理解的任务提供了新的思路和可能性。在自然语言理解的研究和实践中，图网络和少样本学习技术发挥了重要作用，取得了一些重要的进展和成果。例如，在智能问答系统中，通过图网络技术对知识图谱的构建和扩展，能够更好地实现对问题和答案之间的语义关联建模，提高了问答系统的效果和覆盖范围。在推荐搜索领域，少样本学习技术通过融合用户画像和行为特征，能够更好地实现对用户需求的理解和建模，为个性化推荐和搜索提供了新的思路和方法。在人机协同和大规模知识图谱构建等领域，图网络和少样本学习技术也发挥了重要作用，为机器理解人类文本和语义问题提供了新的解决思路和技术手段。总体来说，图网络和少样本学习技术在自然语言理解领域的应用探索和研究中，取得了一些重要的成果和进展。未来，随着人工智能和自然语言处理技术的不断发展，图网络和少样本学习技术将继续发挥重要作用，并为自然语言理解的任务和应用提供更多新的研究思路和解决方法。通过不断的实践和探索，相信图网络和少样本学习技术将为自然语言理解领域的发展带来更多的惊喜和突破，为实现机器对人类语义的准确理解和应用提供更加可靠和有效的支持。CVPR

540

541

542

543

544

545

546

547

548

549

550

551

552

553

554

555

556

557

558

559

560

561

562

563

564

565

566

567

568

569

570

571

572

573

574

575

576

577

578

579

580

581

582

583

584

585

586

587

588

589

590

591

592

593

594

595

596

597

598

599

600

601

602

603

604

605

606

607

608

609

610

611

612

613

614

615

616

617

618

619

620

621

622

623

624

625

626

627

628

629

630

631

632

633

634

635

636

637

638

639

640

641

642

643

644

645

646

647

CVPR

#****

CVPR

#****

CVPR 2020 Submission #****. CONFIDENTIAL REVIEW COPY. DO NOT DISTRIBUTE.

图 11. GLaRA 实验效果图

于允许节点带有标签（种子规则），也允许节点无标签

（候选规则）。作者认为相似语义的规则应该能够识别出

相似的实体类型，因此应用图注意力网络以传播节点

特征。图注意力模型公式和课上介绍的并无差别因此

不再展开。模型的损失函数为公式(8)：

total

= L

sup

+ L

reg

+ L

dist

(8)

sup

= −(y

log (p

)) + (1 − y

) log (1 − p

) (9)

reg

i,j∈N

∥h

− h

∥

(10)

dist

= dist (h

pos

, h

neg

) (11)

其中，公式(9)为了计算种子规则的有监督损失，公

式(10)为了鼓励相邻节点的表示更加相似，公式(11)为

了计算正规则和负规则的矩心距离（其目的是为了让

正负预测的平均向量相似度尽可能远）。当学习过程完

成时，每个规则都学习到了新的向量表示，并且根据每

个规则向量对于正种子规则矩心的距离选出 M 个 10

最小的作为增广规则。在预测阶段，作者将种子规则和

学习到的新规则结合模型 LinkedHMM（不是重点也不

展开了）进行预测。最终在弱监督任务上，GLaRA 均

获得了最好的效果。

2.1.4 Bipartite Flat-Graph Network for

Nested Named Entity Recognition, ACL

2020

嵌套实体抽取方向也是一个较难的任务，其他工

作也大多聚焦在平坦实体 (Flat Entities) 识别任务上。

以图片12为例，“Thomas Jeerson, third president of

the United States”是一个人名，而其内部又嵌套实

体“third president of the United States”（人名）和

实体”the United States”（地名）。Ying Luo [8]认为在

原有模型识别外部实体的基础上可以构建图网络以学

习和捕捉内部实体特征并且做进一步识别，因此提出

了一种二分平图网络 BiFlaG 用于嵌套实体抽取。网络

图 12. 嵌套实体识别样例（实线代表内部嵌套实体的起始位

置）

包含两个子图模块：一个常规 NER 层用于最外层实体

识别，一个图层用于所有内层实体识别。BiLSTM 和

GCN 用于联合学习常规实体和他们的内部依赖。

更进一步的，模型如图片13所示，首先对于外部实

体使用 Flat NER Module，即通过 BiLSTM 和 CRF

模块进行识别。随后进入构图层 Graph Module。图的

构建分为实体图 Graph

和邻接图 Graph

。Graph

的点为句子中被 Flat NER Module 识别为实体的所有

单词，边的构成满足以下公式 e

= (v

, v

), 其中 start

≤ i < j ≤ end，start 和 end 分别代表每个实体的首尾

位置。Graph

的目的在于学习词语的上下文关系，所

以按照句子的出现顺序顺次相连即可。

接下来为了学习实体内部和外部的关系，作者采

用双向图网络 BiGCN 来学习节点特征。与普通 GCN

不同的是，信息随着边的方向和反向分别传播，并得到

正向和反向两种节点向量。具体形式如公式(

14)：

−→

= ReLU





∈E



−→







(12)

←−

= ReLU





∈E



←−







(13)



;

←−

(14)

最后模型将两种向量融合，并且利用公式(15)对内

部嵌套实体进行预测：

= softmax (W

ReLU (W

⊕ W

)) (15)

剩余26页未读，继续阅读

白羊带你成长

粉丝: 28
资源: 328

"CVPR 2023：图网络和少样本学习在自然语言理解前沿应用探索"

图神经网络在自然语言处理中的应用

图和网络在实际问题中的应用

对自然语言理解领域的图网络和少数样本学习的前沿综述。本文旨在探索深度学习

预训练语言模型在自然语言处理中的应用探索

零样本学习在自然语言处理中的应用：文本分类和情感分析的革命

多任务学习在自然语言处理中的应用：探索神经网络的协同力量

复旦大学FudanNLP：探索自然语言处理的前沿与应用

循环神经网络及其在自然语言处理中的应用

向量范数在人工智能领域的应用：深度学习与强化学习，探索范数在人工智能中的前沿应用

MATLAB根号计算在自然语言处理中的应用：探索根号计算在文本分析中的作用，赋能自然语言处理

最新资源