报告人简介: 王瑞平,中科院计算所研究员、博导,国家优青。研究领域为计算机视觉与模式识别,重点关注真实开放环境下的视觉场景理解问题。发表主流国际期刊和会议论文70余篇,Google Scholar引用4900余次,获授权国家发明专利8项。担任国际期刊Pattern Recognition、Neurocomputing、The Visual Computer编委,国际会议IEEE CVPR2021、ICCV2021、FG2021、WACV2018-2020、ICME2019-2021、IJCB2020、ICPR2020领域主席。
报告内容简介: 近年来面向视觉场景理解的认知任务探索成为热点,研究视角从关注局部的视觉实体(object-centric)转向关注全局的实体间关系(relationship-centric),如何建立纷繁视觉信息与其本质语义内涵之间的跨模态通路成为关键挑战。结构化的视觉场景图(scene graph)为连接底层的物体识别检测等感知任务与高层的语言描述问答等认知任务提供了桥梁。本课题组近几年围绕场景图的表示、生成与应用开展了系列研究,致力于建立“物体-->场景-->语言-->知识”的递进式场景理解统一框架。报告将介绍取得的一些具体进展,包括:结构化图推理驱动的物体检测、场景关系图的自动生成、复杂场景跨模态图文检索、图像描述生成的认知评测体系等工作。
|