当前位置：首页 > news >正文

Global Attention Decoder for Chinese Spelling Error Correction(ACL2021)

news 2025/4/26 23:13:56

Global Attention Decoder for Chinese Spelling Error Correction(ACL2021)

一.概述

在这里插入图片描述

作者认为现有的纠错方法大多是基于局部上下文信息进行纠错，没有考虑句子中错词的影响。将注意力放在错误上下文信息上可能会误导并降低CSC(Chinese Spelling Correction)的整体性能。为此，提出了一种用于CSC的全局注意力解码器(GAD)方法。具体而言，该方法学习了潜在正确输入字符与潜在错误候选字符之间的全局关系。获得丰富的全局上下文信息，减轻了局部错误上下文信息的影响。此外，设计了一种带有混淆集引导的BERT替换策略(BERT_CRS -> Confusion set guided Replacement Strategy)，以缩小BERT与CSC之间的差距。BERT_CRS生成的候选词覆盖正确字符的概率超过99.9%。

本文首先提出了一种带混淆集引导的BERT替换策略(BERT_CRS)，缩小了BERT与CSC任务之间的差距。然后，我们提出了一种新的基于BERT_CRS模型的全局注意解码器(GAD)，它学习了丰富的全局上下文表示，以减轻错误上下文信息在校正过程中的影响。具体来说，为了解决局部错误上下文信息的影响，我们引入了BERT_CRS生成的潜在错误字符和隐藏状态的附加候选。然后，全局注意力组件学习候选对象之间的关系，得到候选对象的全局隐藏状态和全局潜在关注权重。然后，对候选字符进行加权和运算，生成丰富的全局上下文隐藏状态。最后一个全连接层来生成正确的字符。

本文主要贡献如下：

A.为了缩小BERT和CSC之间的差距，我们引入了一种带有混淆集引导替换策略的BERT，该策略包含一个决策网络和一个全连接层，分别模拟CSC的检测子任务和校正子任务。

B.提出了一种全局注意解码器模型，该模型学习潜在正确输入字符和潜在错误字符候选字符之间的全局关系。学习了丰富的全局上下文信息，有效减轻了局部错误上下文信息的影响。

二.方法概述

在这里插入图片描述

1.问题定义

输入一个句子X={x1,x2,…,xn}，n为字符数量，Bert_CRS模型将其编码成一个连续的表示空间V={v1,v2,…,vn}，vi∈Rd是第i个字符的上下文特征，维度为d。决策网络Φd 对V建模去拟合一个序列Z={z1,z2,…,zn}，这里的zi表示对第i个字符的检测label，1表示错误，0表示正确。Bert_CRS之上一个全连接层作为校正网络Φc ,此网络对V建模去拟合一个序列Y={y1,y2,…,yn}，这里的yi第i个字符的正确label。全局注意力解码器GAD模型对额外的候选c={c1,c2,…,cn}进行建模，以减轻局部错误上下文信息的影响，其中c表示可能正确的输入字符和可能错误的候选字符：
在这里插入图片描述