摘要:
随着科学技术的发展,科研文献数量越来越大,如何从海量文献信息中找出特定领域的研究主题、有影响力的学者和高水平论文是一个巨大的挑战。为此提出一种基于词表示模型的领域文献数据可视分析方法,首先利用词嵌入模型 word2vec 向量化推荐领域相关的关键词,根据这些词向量之间的近似度筛选出领域相关的论文;然后应用 BERTopic 模型从领域论文摘要中提取主题;基于 PageRank 算法计算论文影响力,应用综合考虑作者署名顺序、发表论文数量和论文影响力的作者影响力评价方法 Author-Rank 计算作者的影响力;最后使用多视图协同和交互的可视化方法帮助研究人员从领域的主题词频、主题演变、文献影响力和引用关系、作者影响力等多个角度对特定领域进行快速理解和分析。将该方法应用于食品安全领域的文献数据分析,应用结果和用户测试说明了其有效性。
中图分类号:
张清慧, 陈谊, 武彩霞. 基于词表示模型的领域文献数据可视分析方法[J]. 图学学报, 2022, 43(4): 685-694.
ZHANG Qing-hui, CHEN Yi, WU Cai-xia. A visual analysis approach for domain literature data based on word representation model[J]. Journal of Graphics, 2022, 43(4): 685-694.