新闻中心
2014年11月20日,中国人民大学信息学院计算机系陈晋川副教授应邀为信息管理系师生做题为“不确定数据的管理”的讲座。陈晋川副教授的主要研究方向包括:不确定数据的管理,数据集成,非结构化数据管理。他主持承担和参与了多项关于不确定性数据的研究课题。同时,他是数据库领域等多个国际顶级期刊及顶级国际会议的审稿人,其中包括IEEE Transactions on Knowledge and Data Engineering,SIAM International Conference on Data Mining,Asia-Pacific Web Conference等。
在本次讲座中,陈老师首先简要介绍了不确定数据的概念,并举出一些不确定性数据的实际案例。在此基础上,陈老师导入了国际上一个非常重要的研究方向:概率数据库。
基于概率数据库,陈老师讲解了概率查询。概率查询提出的基本原因在于数据本身是不确定的,因此查询结果也是不精确的。概率查询返回的结果中的概率值将有助于查询提交者理解结果的可靠程度,便于进一步做出决策。此外,本次讲座还重点介绍了概率数据库中两类最为普遍的区域查询和近邻查询,并对概率数据库中某些复杂查询做了简要介绍。最后,陈老师从数据模型、查询处理、数据清洗及OLAP挖掘等方面对不确定性数据管理的研究内容进行了概括性总结,并就自己的研究成果与大家进行了深入的交流。
陈老师精彩的报告引发了同学们对大数据环境下的数据管理的兴趣。