今天是:
首页 - 讲座报告 - 正文

【电信学院】学术讲座:彭宇新《细粒度多模态协同感知、认识与生成》

作者:       点击数:   更新时间:2023-05-18

报告题目

细粒度多模态协同感知、认知与生成

报 告 人

彭宇新,北京大学教授,国家杰出青年科学基金获得者

报告时间

202305230900­0930

报告地点

椒江校区行政楼四楼会议室


个人简介:

彭宇新,北京大学二级教授、博雅特聘教授、国家杰出青年科学基金获得者,863项目首席专家、中国人工智能产业创新联盟专家委员会主任、中国工程院“人工智能2.0”规划专家委员会专家、中国电子学会会士、中国图象图形学学会会士、副秘书长、提名与奖励委员会副主任、北京图象图形学学会副理事长。主要研究方向为跨媒体分析、计算机视觉、机器学习、人工智能。以第一完成人获2016年北京市科学技术奖一等奖和2020年中国电子学会科技进步一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然科学基金重点等30多个项目,发表论文180多篇,包括ACM/IEEE TransCCF A类论文80多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任IEEE TMMTCSVT等期刊编委

主要内容:

互联网数据具有图像、文本、视频、音频等多模态并存的特点,而现有多模态分析技术通常聚焦于粗粒度的大类,难以满足医疗、交通等诸多领域的精细化需求。细粒度多模态协同感知、认知与生成旨在使计算机能够对多模态内容进行精细化分析,研究目标是借鉴人脑的跨模态特性,通过挖掘并协同多源、互补、关联的细粒度和多模态信息,使得计算机从能看会认的“感知智能”迈向能理解会思考的“认知智能”。本报告将从细粒度辨识增强、多模态关联、多模态协同、跨模态生成四个方面介绍我们在细粒度图像分类、行人再识别、细粒度视频检索、细粒度跨模态检索、跨模态推理、文本到视觉生成上的最新研究进展,并进行相关系统展示。



承办学院

电子与信息工程学院(大数据学院)

发布日期

2023.05.18

欢迎广大教师、学生参加!


文:项美晶/图:无/审核:金燕仙/责任编辑:李明亮