视频重压缩检测学习计划和笔记( 四 )


例如:一幅100×100像素大小的图片,划分为10×10=100个子区域(可以通过多种方式来划分区域),每个子区域的大小为10×10像素;在每个子区域内的每个像素点,提取其LBP特征,然后,建立统计直方图;这样,这幅图片就有10×10个子区域,也就有了10×10个统计直方图,利用这10×10个统计直方图,就可以描述这幅图片了 。之后,我们利用各种相似性度量函数,就可以判断两幅图像之间的相似性了;
而实际检测人脸时,因为不同块的表示人脸的贡献值不同,如眼睛的LBP的统计直方图对识别人脸的贡献明显要比光秃秃的额头的贡献大,在检测到人脸的情况下,我们通常给不同位置的块不同的权重来提高人脸识别的准确率,下面给出一组7*7时用到的权重模板的例子
2,1,1,1,1,1,2,
2,4,4,1,4,4,2,
1,1,1,0,1,1,1,
0,1,1,0,1,1,0,
0,1,1,1,1,1,0,
0,1,1,2,1,1,0,
0,1,1,1,1,1,0
对LBP特征向量进行提取的步骤
(1)首先将检测窗口划分为16×16的小区域(cell);
(2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0 。这样,3*3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;
(3)然后计算每个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率;然后对该直方图进行归一化处理 。
(4)最后将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量;
然后便可利用SVM或者其他机器学习算法进行分类了 。
3 视频编码压缩中的主要参数
比特率(Bit Rate):比特率是指每秒钟传送的比特数,通常用bps(bit per )来表示 。在视频压缩中,表示单位时间内视频压缩后所包含的信息量大小 。
比特率(Bit Rate) = 帧宽度 × 帧高度 × 帧率 × 像素位数 × 压缩比率
码率( Rate):码率是指编码器每秒钟压缩的数据量,通常用bps来表示 。在视频编码中,码率是指对视频进行压缩编码后每秒钟所占用的数据传输带宽 。码率越高,视频的画面质量越高,但传输带宽也越大 。码率是影响视频传输带宽的关键参数之一 。在视频压缩编码中,码率与比特率是相同的,因为视频流中传输的就是比特数据 。但在其他类型的数据传输中,如音频流或网络传输,码率可能不仅仅是比特率,它也可能包括一些其他的控制数据、头信息等 。因此,虽然比特率和码率在视频压缩编码中通常可以互换使用,但它们在不同的领域中有所不同 。比特率更加强调视频数据的传输速率和质量,而码率则更强调整个数据传输过程的速率和稳定性 。
QPs代表量化参数( ),是一种用于控制压缩比和图像质量之间平衡的参数 。量化是压缩编码的过程中,将输入的连续信号转换为离散信号的过程 。QPs决定了量化步长的大小,因此越高的QP会导致更大的量化步长,从而减少了编码时需要传输的数据量,但也会降低图像的质量 。因此,QPs是控制压缩比和图像质量之间平衡的重要参数 。量化参数越大,压缩比就越高,图像质量就越低 。
量化步长和量化参数QP的关系如下:
量化矩阵与量化步长的关系:
编码帧率是指视频压缩时每秒钟编码的帧数,也就是编码器处理视频的速度,它受到多个因素的影响,包括GOP大小、码率、视频分辨率等等 。编码帧率越高,视频文件的大小就会越大,但也会有更高的画面流畅度和更好的视频质量 。
视觉帧率是指观看视频时每秒钟显示的画面数,也就是人眼能够感知到的画面切换的速度 。通常情况下,人眼可以感知到每秒钟大约24帧的画面切换,因此24fps被认为是最低要求的视觉帧率 。视觉帧率越高,视频就会有更好的流畅度和更真实的感觉,但也会增加视频文件的大小 。