摘要:
社交媒体已成为当前发布和传播突发灾害信息的重要媒介,有效识别并利用其中的真实信息对灾害应急管理具有重要意义。针对传统文本分类模型的不足,提出一种基于 BERT 预训练模型的灾害推文分类方法。经数据清洗、预处理及算法对比分析,在 BERT 预训练模型基础上,研究构建了基于长短期记忆-卷积神经网络(LSTM-CNN)的文本分类模型。在 Kaggle 竞赛平台的推文数据集上的实验表明,相比传统的朴素贝叶斯分类模型和常见的微调模型,该分类模型性能表现优异,识别率可达 85%,可以更好地应对小样本分类问题。有关工作对精准识别真实灾害信息、提高灾害应急响应与沟通效率具有重要意义。
中图分类号:
林佳瑞, 程志刚, 韩宇, 尹云鹏. 基于 BERT 预训练模型的灾害推文分类方法[J]. 图学学报, 2022, 43(3): 530-536.
LIN Jia-rui, CHENG Zhi-gang, HAN Yu, YIN Yun-peng. Disaster tweets classification method based on pretrained BERT model[J]. Journal of Graphics, 2022, 43(3): 530-536.