专家简介:俞俊杭州电子科技大学教授、博士生导师,2016年获国家优青,2017年获教育部长江学者“青年学者”。主要研究方向为跨媒体分析技术。相关工作发表于SCI源期刊论文100余篇,包括ACM汇刊与IEEE汇刊及CCF A类会议40余篇。论文的Google Scholar引用次数6000余次。10余篇论文入选ESI高被引/热点论文;近年来主持科技部重点研发计划、国家自然科学基金重点项目、国家自然科学基金面上项目等,2015、2016、2017连续获得IEEE TMM、TIP、TCYB最佳论文奖,2018年教育部自然科学二等奖。担任多个国际期刊的副主编。 主要内容:视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务,系统对视频及图像的内容和问题进行深度理解和推理后,给出相应的回答,相比于其他视频分析手段,视频问答能根据用户的提问,对视频内容进行细粒度语义理解。在面对复杂视频时可有效过滤冗余信息,方便用户进行决策。视频问答被广泛应用在社交媒体监管、智能监控分析、国防智能决策、智慧视频教育等多个领域,本报告将介绍团队近年来在视觉问答方面所作的研究工作。
|