成果速递
首页» 成果速递
[论文]陈翀:《情报学报》——科技文献内容语义识别研究综述
发布时间:2023-02-09     浏览量:

科技文献内容的语义识别是将蕴含在文本中的科研要素显式地揭示出来。它属于细粒度文本挖掘,是获取和利用知识的基础。本文梳理科技文献内容的语义识别相关研究,为后续研究提供参考。首先概括现有的文献内容语义标注模型,然后围绕章节、句子、词汇三种识别粒度,梳理科技文献内容语义识别问题的研究发展,总结识别方法、评测手段以及典型应用,并据此提出现存问题及未来发展方向。本文探讨了五个方面的问题:(1)人们关注文献内容中哪些语义类型;(2)选取什么粒度的文本单元作为识别对象;(3)识别方法分为哪些类型;(4)如何评测识别结果;(5)语义识别有哪些典型应用。本文发现目前还存在语义类型标准不一、优质文献数据集欠缺、研究关注点不平衡、识别方法存在局限等问题,需要在后续研究中探寻解决方法。

黄红、陈翀、张婧莹. 科技文献内容语义识别研究综述[J]情报学报,2022, (09): 991-1002.