新闻中心
首页» 新闻中心
闫宏飞副教授作“中国事件检索与发现 —— 一个真实的大数据系统”学术讲座
发布时间:2014-07-02     浏览量:

201472日,北京大学信息科学技术学院闫宏飞副教授应邀为我院师生作“中国事件检索与发现 —— 一个真实的大数据系统”的主题讲座。闫宏飞老师主要的研究方向是网络与分布式和信息检索,并取得了丰硕的研究成果,参与实现了天网搜索引擎的升级和完善,设计并实现了网页搜索量达千万量级的分布式搜索引擎;连续4年主持中文Web信息检索评测,并作为主要人员参加了国家重大基础研究项目(973)。

闫老师指出在大数据的背景下,生活中海量的事件以图文音像等丰富的形式出现在互联网的多种信息渠道上,在全网范围内实现对事件的搜索、关联与展示,具有重大的意义。

为了让大家对大数据有更加深入的理解,闫宏飞老师在介绍大数据基础知识的基础上,以自主研发的事件检索系统为例,带我们了解真实的大数据系统。该系统是针对历史事件的检索系统,以10年的新闻联播视频资料、新闻网页、人民日报以及微博为数据源,对数据进行处理,形成基于事件的索引和基于文档的索引,支持以关键词、时间、地点为线索的检索,并提供无检索词输入情况下事件发现的导向功能。此外,闫老师还提出该系统进一步完善和改进的方向。

在讲座的最后环节,闫宏飞老师与参加讲座的师生展开了深入交流。闫教授精彩的演讲、独到的见解,进一步启迪了师生们对大数据环境下事件检索系统的认识和思考。