我整理了一些关于【软考】的专题学习资料(有讲解~~)与大家分享学习:
内容一、基础知识——向量的内积
1.1 向量内积的定义:也称为向量的点积,对两个向量进行内积运算,是将两个向量的相应位一一相乘并相加的运算。内积的结果是一个标量。
1.2 示例:
a和b的内积公式为:
1.3 功能:
内积决定了向量a和向量b之间的角度和方向关系
Gram矩阵是两个向量的内积,因此Gram矩阵可以反映向量组中向量之间的某种关系。
2. Gram 简介 2.1 定义
n维欧几里德空间中任意一对k向量的内积组成的矩阵称为这k向量的格拉姆矩阵(Gram)。显然,这是一个对称矩阵。
更直观的理解:
2.2 计算及特征表示
输入图像的映射是[ch,h,w]。我们可以通过(即将h*w压平为一维向量)和矩阵转置操作将其变换为[ch, h*w]和[h*w, ch]矩阵。然后将二者进行内积得到Gram。 (蓝色条代表每个通道之后的特征点,最终得到[ch *ch]的G矩阵)
2.3 进一步理解
Gram矩阵可以看作是之间的偏心协方差矩阵(即没有减去均值的协方差矩阵)。在图中,每个数字都来自特定位置的特定滤波器的卷积,因此每个数字代表了一个特征的强度,而 Gram 实际计算的是两个特征之间的相关性,即哪两个特征同时出现,这两者是互补的,等等。
格拉姆矩阵用于衡量各个维度的特征以及各个维度之间的关系。内积后得到的多尺度矩阵中,对角线元素提供不同特征图的信息,其余元素提供不同特征图之间的相关信息。这样的矩阵不仅可以反映有哪些特征,还可以反映不同特征之间的接近程度。
关键点:gram矩阵是计算每个通道i的图和每个通道j的图的内积。 gram的每个值可以说代表了I通道的图和j通道的图之间的互相关程度。
3. Gram 式迁移的应用
深度学习中经典风格迁移的一般流程为:
1. 准备基础镜像和样式镜像
2. 使用深度网络分别提取基础图像(加白噪声)和风格图像的特征向量(或特征图)。
3. 分别计算两幅图像的特征向量的Gram矩阵。以最小化两幅图像的Gram矩阵之间的差异作为优化目标。不断调整基准图像,使风格不断接近目标风格图像。
关键是网络中提取的特征图。一般来说,浅层网络提取局部细节纹理特征,深层网络提取轮廓、大小等较为抽象的信息,这些特征组合所表达的整体感觉就是图像的风格。由这些特征向量计算出的格拉姆矩阵可以提取图像特征之间隐藏的联系,即每个特征之间的相关性。
如果两幅图像的特征向量的Gram矩阵差异较小,则可以判定两幅图像的风格相似。用Gram代表风格,要衡量两张图片的风格差异,只需比较它们的Gram的差异即可。
详细内容请参见另一篇文章《认识风格转移纸——A of Style》中的介绍。
附件:手写图例以帮助理解:
我整理了一些关于【软考】的专题学习资料(有说明~~),需要大家自行领取:
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。