摘要: |
针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确定修改策略生成对抗样本。使用两个主流的模型CNN和BiLSTM在不同分类数据集上验证其有效性和可转移性。实验结果表明,与其它攻击方法相比,WordBeguiler具有攻击成功率高、扰动率低的优势,同时既保留了原始语义也一定程度上保证了语法正确性,并且可以有效地转移到BERT模型中。 |
关键词: 中文文本分类 对抗样本 深度神经网络 汉字特征 黑盒 |
DOI:10.3969/j.issn.1005-9490.2023.05.029 |
|
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目);内蒙古自治区自然科学基金项目 |
|
|
|
() |
Abstract: |
|
Key words: |