西电电院陈渤团队研究成果被NeurIPS和IJCV录用
多年来,雷达信号处理国家级重点实验室陈渤教授团队针对智能感知识别、深度学习、概率建模、信息压缩等方向中的挑战问题,开展了认知概率深度网络,序列数据压缩重构等相关研究,并于近日在机器学习与模式识别领域顶级会议以及顶级期刊发表相关工作。
其中,陈渤教授指导的硕士生段志斌和博士生徐逸石合作完成的工作,《TopicNet: Semantic Graph-Guided Topic Discovery》,被第35届 Conference on Neural Information Processing Systems(简称NeurIPS)录用。作为当前全球最负盛名的人工智能学术会议,本届NeurIPS总计收到9122篇有效论文投稿,接收率26%。本篇论文延续了团队在概率深度网络方面的系列工作。众所周知,深度神经网络在各种基于感知的任务(如检测与识别)中甚至已经达到了超越人类的水平,但是其逻辑推理能力却远远落后于人类。其中很重要的一点原因就是神经网络缺乏常识,常识虽然很常见,但它往往难以公式化。因此,如何将常识嵌入神经网络是一项富有挑战性的任务。该论文针对现有概率深度网络缺乏融入先验知识的灵活性问题,探索性地提出将常识(概念之间的包含关系)编码为一种层次结构的先验知识,通过建立概念与网络参数之间的对应关系,可以将常识作为网络学习过程中的有效正则。此外,为了使常识更好地辅助模型,该论文还开发了一种方法从大规模通用知识图谱中提取出有效的常识与任务数据进行适配,并与该团队在ICML2021提出的锯齿形网络结构进行巧妙结合,被应用于概率深度模型中,取得了良好的实验效果。
(a)概率深度模型(b)结构化的常识
词嵌入的分布表示
锯齿形网络结构能够将多层的网络参数投影至同一嵌入空间中,语义相似的参数在嵌入空间中也会距离较近。该论文在此基础上将每个参数都用一个分布来表示,这使得概念之间的包含关系可以被自然地表达,即覆盖范围大的参数(对应于更抽象的概念)可以包含覆盖范围小的参数(对应于更具体的概念),如图展示了模型学习到的单词在嵌入空间中的分布表示。
陈渤教授指导的博士生鲁瑞颖撰写的论文《Dual-view Snapshot Compressive Imaging via Optical Flow Aided Recurrent Neural Network》也被计算机视觉CCFA类期刊International Journal of Computer Vision (IJCV) 录用。该论文延续了团队在快照压缩成像方面的系列工作,旨在从多个视场(FOV)捕获视频并使用2D传感器压缩于单帧快照中,实现多视场压缩感知,享有低带宽、低功耗和低成本的优势,在高速摄影和传输带宽受限的场景下具有巨大的应用潜力。然而,基于迭代优化的传统方法难以在性能和效率上取得平衡,尤其是对于大场景数据重构时间过长且计算量过大,很难应用于现实场景。
双视场视频快照压缩重构框架
该论文针对上述多视场视频快照压缩重构问题,提出一种深度学习方法,能够在数秒内重构出多视野的高质量视频。首先,为了增加不同场景的辨识区别度,该论文基于多视场视频压缩原理提出了一种差异放大机制。随后,构造双分支深度网络从单帧压缩快照中初步重构出不同场景的视频。最后,为了对视频中的动态变化特征进行显式建模,该论文将动态的双向光流信息巧妙地融入递归神经网络,从而完成对双场景视频的精细化重构。该方法在仿真测试数据能够快速完整地重构出双视场的多帧视频,并在真实快照压缩成像系统上验证了其优越性及实用性。该论文构建了针对多视场视频快照压缩成像的高效重构深度网络,促进了实验室对该领域最新技术的研究与发展。
两篇论文的发表是国际学术领域对实验室及学院科研工作的认可,一方面扩大了学校的学术影响力,另一方面也促进了实验室与领域内顶尖学者的交流以及对该领域最新研究进展的了解。今后实验室与学院将继续鼓励师生积极探究前沿科技,提升综合素质。
相关论文链接:
NeurIPS2021:https://neurips.cc/
IJCV:https://link.springer.com/article/10.1007/s11263-021-01532-1