分享到微博 分享到人人 分享到LinkedIn 分享到Email
微软亚洲研究院博士生学术交流会——2016年第二期:稀疏编码和低秩表示

为了加强计算机领域博士生之间的学术交流和研究合作,微软亚洲研究院联合培养博士班推出“博士生学术交流会”系列学术交流活动。继成功举办第一次交流会之后,2016年4月28号,我们举办了以“稀疏编码和低秩表示”为主题的第二次交流会。我们有幸邀请近些年在此方向上有过出色工作的博士生和年轻教师来到微软亚洲研究院,并分别做了精彩的学术分享。交流会期间,大家非常活跃的表达了自己的观点,并与现场的听众做了自由的讨论,一起探讨了”稀疏编码与低秩表示”的现状与趋势。

如何高质量地获取高帧率的高光谱视频 王立志 西安电子科技大学-微软亚洲研究院联合培养博士生

压缩感知理论证明能够以较少的采样来恢复较多的未知信息,其应用在四维的光谱视频获取上具有很高的实际意义。首先,我们设计了一个基于双相机的硬件原型系统,通过系统标定,能够完成对原始光谱视频的压缩采样,获得一路高帧率的全色视频和一路低帧率的压缩光谱视频。然后,利用获得的全色视频自适应地训练一个用于稀疏表示的字典。最后,基于这个自适应的字典,利用迭代优化的方式,完成光谱视频的重构。此系统能够获得100FPS的光谱视频,是国际上首次提出能够达到如此高帧率的光谱视频摄像机。

非凸低秩模型能够更好地复原图像 张健 北京大学 在读博士后

在主流图像压缩算法中,每个图像块的变换系数都要经过独立的量化,这种方式引入了非常明显的块效应误差。在不改变压缩编码方案的前提下,经过后处理过程,有效的去除这些块效应是非常有意义的。我们提出了一种利用最大后验概率的框架来实现图像的去块效应。为了刻画图像的低秩先验,我们在图像的奇异值上引入了非凸的p(0<p<1)范数惩罚函数。与此同时,明确的引入量化范围的影响,这样能够更好的优化目标函数。在迭代求解的过程中,我们自适应的调节了函数参数,这样能够使得整个算法框架更加的实际。

张量信号的多维稀疏表示更有意义 齐娜 北京工业大学 在读博士生

在稀疏表示模型中,多维信号必须要经过向量化转换成一维信号。这种转换虽然简单,但是忽略了多维信号内在的结构信息,并且打破了其局部相关性,同时增加了内存的消耗和计算的复杂度。基于以上观察,我们提出了一种多维张量的稀疏表示模型。通过在信号的每个维度上训练可分离的字典,张量稀疏表示能够更好的利用和逼近信号的结构信息,同时降低计算复杂度。

结构稀疏模型能够更准确的完成图像重建任务 刘航帆 北京大学 在读博士生

我们提出了两种基于结构稀疏的模型来完成图像的重建任务,第一,基于图像梯度域的结构性稀疏。TV模型在图像重建中应用很广,可以看做梯度域的稀疏性约束。但是图像的统计特性是不平稳的,假设其梯度均值为零,方差固定可能很不准确。因此我们想应该对每个像素位置分别自适应正则化。通过利用非局部相似信息,自适应的估计梯度的均值和方差。第二,基于图像频带自适应的结构性稀疏,在利用最大后验概率模型完成图像重建任务时,对于图像在频带的稀疏估计是非常重要的。通过利用图像的结构信息,能够有效的完成对当前图像块的频带稀疏进行估计。

稀疏结构化模型能够更鲁棒进行视觉追踪 刘偲 中科院 副教授

视觉追踪是计算机视觉的一个重要领域,在最近几年,一个比较火的方向是通过稀疏优化和字典学习来进行目标追踪。我们总结了以往的稀疏追踪方法,提出了一个比较通用的追踪模型,该通用的模型挖掘了备选框之间,以及内部块之间的内在联系,从而保证了结构上的稀疏性和鲁棒性。同时该通用模型也可以通过稀疏优化方法进行高效地求解。

低秩矩阵的鲁棒求解算法 辛博 北京大学 在读博士生

低秩矩阵求解是一个NP难的问题。常用的核范数最小化的方法仅能够在非常有限的条件下得到原始问题的最优解;而近期提出的一些非凸算法常常会落入局部最小解。为此,我们从概率的视角出发,利用经验贝叶斯的思想,提出了一个简单而有效的低秩求解算法。我们的算法在几乎所有的常见用例上都可以成功地求得原始问题的最优解,甚至可以到达理论上界(即观察次数和矩阵的真实自由度相当的时候)。通过分析目标函数的全局和局部最优解的性质,我们从理论上提供了相应的支持。