图学学报 ›› 2021, Vol. 42 ›› Issue (2): 307-315.DOI: 10.11996/JG.j.2095-302X.2021020307
摘要: 建筑施工安全事故分析是施工安全管理的重要环节,但分散在事故报告中的施工安全知识不 能得到良好的复用,无法为施工安全管理提供充分的借鉴作用。知识图谱是结构化存储和复用知识的工具, 可以用于事故案例快速检索、事故关联路径分析及统计分析等,从而更好地提高施工安全管理水平。命名实 体识别(NER)是自动构建知识图谱的关键工作,目前主要研究集中于医疗、金融、军事等领域,而在建筑施 工安全领域,尚未见到 NER 的相关研究。根据建筑施工安全领域知识图谱的应用需求,定义了该领域 5 类 概念,并明确了实体标注规范。采用改进的基于 Transformer 的双向编码表征器(BERT)预训练语言模型获取 动态字向量,并采用双向长短期记忆-条件随机场(BiLSTM-CRF)模型获取实体最优标签序列,提出了适用于 建筑施工安全领域的 NER 模型。为了训练该模型并验证其实体识别效果,收集、整理和标注了 1 000 篇施 工安全事故报告作为实验语料。实验表明,相比于传统模型,该模型在建筑施工安全事故文本中具有更优的 识别效果。
中图分类号: