2017年12月15日,西安交通大学人工智能与机器人研究所(以下简称人机所)邀请美国微软研究院首席研究员/研究经理华刚博士为人机所师生做了题为“Deep Visual Patterns beyond Recognition”的学术报告。此次报告在人机所“周五学术报告讨论会”上举行,讨论会由所长郑南宁教授主持,华刚博士在报告中介绍了美国微软研究院当前在计算机视觉领域的最新进展,并就相关热点问题与参会师生进行了深入讨论和交流。
华刚博士是微软人工智能与研究部首席研究员、微软核心计算机视觉技术中心机器感知与认知组负责人,曾先后在微软、IBM、诺基亚等科技公司担任研究员,2011年加入史蒂文斯理工学院任计算机科学专业副教授,2011年起受聘西安交通大学兼职教授。华刚博士于1994年进入西安交通大学少年班学习,2002年获西安交通大学模式识别与智能系统专业硕士学位,是从人机所毕业的优秀校友,2006年获美国西北大学电气与计算机工程博士学位。多年来,华刚博士一直致力于计算机视觉理论和技术的研究,并取得丰硕成果,在计算机视觉领域顶级学术期刊和国际会议发表论文140余篇,相关研究成果获得18项美国专利授权。2016年当选IAPR Fellow和ACM杰出科学家。
报告会开始前,所长郑南宁教授作了开场致辞,介绍了西安交通大学人工智能人才拔尖班的筹备情况。郑老师说,我们不仅需要培养一流的科学家,也需要培养一流的工程师,只有这样,才能真正推动人工智能研究的不断进步和发展。报告会上,华刚博士首先回顾了计算机视觉和模式识别研究的几个重要发展阶段。然后指出目前黑箱式的深度神经网络逐渐取代了传统的模块化分步式的视觉信息处理框架,虽然在识别等任务上的性能不断提升,但是其背后的理论依据比较匮乏,大部分研究人员仅将深度网络当作黑箱进行组合和重构来处理新问题。针对上述问题,华刚博士及其课题组希望从对视觉模式解构和理解的角度出发,通过引入特定域的知识来破解深度神经网络的黑箱,使研究人员能够有目的地控制深度神经的结构设计,并获得可理解的深度模型。例如,通过在自编码器中嵌入可替换的卷积核,对视觉风格模式解构,实现高效的图像艺术化风格自动转换。通过在生成对抗网络中嵌入自然语言的属性描述,对视觉信息的结构和类别模式解构,实现符合特定描述的图像生成。通过对最新研究成果的介绍,华刚博士表示,虽然追求识别性能的提升对于计算机视觉的研究具有重要意义,但是对视觉模式的解构和理解同样意义非凡,是我们不能忽视的重要研究方向。
报告会气氛热烈,会后大家踊跃提问,华刚博士认真细致地回答了大家提出的问题,并同师生们就相关热点问题进行了深入讨论和交流。通过此次报告,师生们表示深受启发,并对当前计算机视觉最新进展有了更深入的了解和认识。