1月21日,教育部“长江青年学者”、 国家优秀青年科学基金获得者、杭州电子科技大学俞俊教授应邀来校,为计算机系教师作“视觉问答——利用深度学习沟通视觉与语言”专题报告。
视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务,系统对视频及图像的内容和问题进行深度理解和推理后,给出相应的回答,相比于其他视频分析手段,视频问答能根据用户的提问,对视频内容进行细粒度语义理解。在面对复杂视频时可有效过滤冗余信息,方便用户进行决策。视频问答被广泛应用在社交媒体监管、智能监控分析、国防智能决策、智慧视频教育等多个领域。本次报告会上,俞教授首先结合自己多年的科研成果,回顾了当前深度学习技术的发展与应用状况,就其优缺点进行了详细的阐述;接着根据自己多年的科研经验,从视觉问答应用方面阐述了深度学习技术对传统的机器学习领域的颠覆性改进和提升。
俞俊教授主要研究方向为跨媒体分析技术,相关工作发表于SCI源期刊论文100余篇,包括ACM汇刊与IEEE汇刊及CCF A类会议40余篇,担任多个国际期刊的副主编。报告会后,俞教授和参加报告的师生进行了深入的交流和探讨。