引用本文:[点击复制]
[点击复制]
【打印本页】 【在线阅读全文】【下载PDF全文】 查看/发表评论下载PDF阅读器关闭

←前一篇|后一篇→

过刊浏览    高级检索

本文已被:浏览 319次   下载 542 本文二维码信息
码上扫一扫!
面向中文文本分类的对抗样本生成方法
弓 燕,张晓琳,刘月峰,刘立新,徐 立
0
(内蒙古科技大学信息工程学院,中国人民大学信息学院,包头医学院计算机科学与技术系)
摘要:
针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确定修改策略生成对抗样本。使用两个主流的模型CNN和BiLSTM在不同分类数据集上验证其有效性和可转移性。实验结果表明,与其它攻击方法相比,WordBeguiler具有攻击成功率高、扰动率低的优势,同时既保留了原始语义也一定程度上保证了语法正确性,并且可以有效地转移到BERT模型中。
关键词:  中文文本分类  对抗样本  深度神经网络  汉字特征  黑盒
DOI:10.3969/j.issn.1005-9490.2023.05.029
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目);内蒙古自治区自然科学基金项目
()
Abstract:
Key words:  

用微信扫一扫

用微信扫一扫