[新闻动态] 在线峰值2.6万!CSIG-CVPR 2020图像语义分割和跨模态学习专题报告会成功举办

作为中国图象图形学学会成立三十周年全国科技工作者日系列活动之一,CSIG-CVPR 2020图像语义分割和跨模态学习专题报告会以云直播的方式于202066日成功召开,本次学术报告会由中国图象图形学学会(CSIG)主办,CSIG-机器视觉专委会、CSIG-文档图像分析与识别专委会、山东大学和山东省人工智能研究院联合承办。北京大学林宙辰教授、南开大学程明明教授和西安电子科技大学邓成教授等参加本次报告会。山东大学甘甜副教授、吴建龙助理教授和山东省人工智能研究院的程志勇博士担任本次报告会的执行主席。

本次报告会由林宙辰教授进行开场致辞。林教授首先对各位专家学者的到来表示热烈的欢迎和衷心的感谢。随后,林教授简要介绍了本次报告会的主题流程与讲者信息。最后,林教授表示,希望各位专家学者和与会观众能在交流中学习知识、汲取灵感,共同为领域的发展助力。本次报告会分为图像语义分割专题和跨模态学习专题,每个专题的专家就该领域的前沿进展做了精彩的报告,同时该领域的部分优秀青年学子也分享了他们CVPR 2020的最新研究成果。专题还附有圆桌讨论环节,专家和青年学子各抒己见,就该专题从数据层面到未来发展层面的议题进行了交流讨论,与该领域的相关研究者、技术开发人员和研究生分享自己的心得体验和思路历程。

图像语义分割专题

首先,程明明教授介绍了图像语义分割的前沿进展,他的报告题目是《自适应图像语义分割技术》。程教授介绍了图像语义分割技术面临的挑战,并就如何解决这些挑战分享了他的团队在TPAMI 2020CVPR2020的两个最新工作——富尺度空间的深度神经网络通用架构Res2Net和其应用场景以及自适应的池化方式Strip Pooling

程明明教授的分享

随后,图像语义分割领域的优秀青年学子分享了他们在CVPR 2020的最新研究成果。中科院自动化所研究生李彦玮报告的题目是Learning Dynamic Routing for Semantic Segmentation,研究了一种在概念上减轻语义表示中尺度差异的新方法,能够根据不同的输入调整不同的路径从而适应输入的尺度分布,称为动态路由结构;北京大学研究生李夏报告的题目是Spatial Pyramid Based Graph Reasoning for Semantic Segmentation,把图卷积网络用在语义分割上,使空间金字塔有可能探索来自不同尺度的多个远程上下文模式;澳大利亚阿德莱德大学博士生陈昊报告的题目是BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation,提出的BlendMask可以通过很少的通道有效地预测密集的每像素位置敏感实例特征,并且仅使用一个卷积层就可以为每个实例学习注意力图,从而可以快速进行推理。

最后,程教授、李彦玮、李夏和陈昊就图像分割领域的数据层面、模型算法层面、应用层面以及未来发展层面的问题进行了精彩的交流分享。

图像语义分割专题集中讨论

跨模态学习专题

   邓成教授报告的题目是Security Analysis in Deep Learning Models。邓教授首先介绍了目前跨模态领域中面临的挑战性问题,并指出跨模态领域面临的一个安全问题在于对抗样本攻击深度模型。随后,邓教授分享了他的团队在对抗样本生成方面的一些工作——在汉明搜索空间中如何生成对抗样本来破坏检索效果(HAG)、在跨模态的检索系统中的对抗样本学习问题(CMLA)、在跨模态检索领域探索鲁棒性和效率问题(DACM)最后,邓教授分享了对抗样本特性分析的一些工作。



邓成教授的分享

清华大学博士生陈辉报告的题目是IMRAM: IMRAM: Iterative Matching with Recurrent Attention Memory for Cross-Modal Image-Text Retrieval,提出了一种带有循环注意力记忆的迭代匹配(IMRAM)方法,该方法通过多步对齐来捕获图像和文本之间的对应关系;中国科学技术大学研究生陆岩报告的题目是Cross-modality Person Re-identification with Shared-Specific Feature Transfer,通过提出一种新颖的跨模态共享特定特征转移算法(称为cm-SSFT)以探索模态共享信息和特定于模态特征的潜力从而促进重新识别;电子科技大学博士生位纪伟报告的题目是Universal Weighting Metric Learning for Cross-Modal Matching,提出一种通用的权重框架,为分析各种损失函数的可解释性提供了一种工具,并在通用加权框架下引入了一个新的多项式损失;中国科学技术大学博士生张攀报告的题目是Cross-Domain Correspondence Learning for Exemplar-Based Image,提供了一个基于示例的图像翻译的通用框架,从给定示例图像的不同域的输入中合成出具有与示例中语义上对应的对象一致样式的逼真图像。

在该专题的集中讨论环节,邓成教授和陈辉、陆岩、位纪伟、张攀就图像分割领域的数据层面、模型算法层面和应用层面分享了自己的理解和经验。

跨模态学习专题集中讨论

报告会在CSIG机器视觉专委会主任、北京大学林宙辰教授的致辞中闭幕。林教授首先赞扬了程明明、邓成两位教授以及七位同学在语义分割和跨模态学习方面的优秀工作。随后,林教授高度肯定了成本低、效率高、效果好、影响广的云会议、云直播形式,希望以后这种学术报告交流会的形式可以继续推广,使更多的人能参与到前沿知识的分享中。最后,林宙辰教授对参与这次活动的老师、同学、听众、讲者、组织者和直播平台表示了感谢。


CSIG理事、CSIG机器视觉专委会主任林宙辰教授致闭幕辞

此次CSIG-CVPR 2020图像语义分割和跨模态学习专题报告会持续了五个半小时,九位专家讲者既生动展示了两个领域的前沿技术、最新研究成果,又为与会观众开展研究指明了方向。报告会采用云直播的方式,线上参与人气峰值达到2.6万,并进入娱乐小时榜前50。观众通过线上弹幕积极进行互动、交流和提问,专家也给出了详细的解答,极大地鼓舞了大家的科研热情。我们期待更多的优秀青年学子在计算机视觉领域取得研究进展,并在未来的报告会中踊跃参与、共同进步!

直播获得了高人气

观众参与弹幕提问

感谢极市平台提供直播支持。大会演讲视频将进行适当整理后,向广大学者提供开放录播服务,错过直播的同学可以关注极市平台微信公众号(微信搜索极市平台即可),及时获得报告录播回放信息,也可前往B站搜索极市平台,观看回放视频。极市平台B站链接:https://space.bilibili.com/85300886



Scroll to Top