期刊简介
本刊是由中国航天科工集团公司主管, 由航天科工集团十七所主办。它是仿真技术领域的综合性科技期刊。98年起已列入国家科技部中国科...【详细查看】
过刊浏览
信息公告
- 17/11深圳航天工业技术...
- 17/11中国航天科工集团...
- 17/11中国航天建设集团...
- 17/11关于集团公司改制...
- 17/11关于中国航天科工...
- 17/11中国航天科工集团...
- 17/11中国航天科工集团...
大数据下数据库引文索引匹配误差检测仿真
【出 处】:
【作 者】:郭玉栋 左金平
【摘 要】为了改善当前数据库引文索引匹配误差检测过程中受语境和歧义词影响,存在检测准确率不高、检测召回率较低、检测耗时较长的缺点,提出了基于APMI的大数据下数据库引文索引匹配误差检测方法。方法采用基于相对词频语境计算模型对数据库引文索引词语做分词消岐处理;采用TF-IDF方法提取数据库引用文献和被引用文献的特征词,并计算每个提取的特征词在语料库中的上下文概率分布,通过对比两个特征词在数据库中的上下文概率分布情况,将消岐后特征词之间的相对熵作为两篇参考文献中特征词之间的语义相似度;并以两篇参考文献中特征词之间的语义相似度平均值作为特征词和参考文献之间的匹配度;结合TF-IF方法计算大数据下数据库参考文献之间的匹配度,完成引文索引匹配误差检测。仿真测试结果显示,所提方法克服了当前方法受语境和歧义词影响的问题,具有较高的检测准确率、检测召回率,极大地缩短了检测耗时。