图像压缩入门

常见的压缩方式

jpg、png等
以手机中照片为例:格式为jpg,大小为3000x4000,则存储需要的字节为

这里的乘以3表示有三通道,乘以8表示每一个像素点占用8位,除以8即为占用的字节,除以1024为kb,再除以1024为MB。

约为34.3M,但是手机中只占用了2.47M,这就是使用算法进行了压缩。即拍完照片手机按照某种算法进行编码并进行编码,当使用图像查看器查看图片的时候,首先进行读取图片,接着使用内嵌在图像查看器的解码方法进行解码,还原出4000x3000的像素并展示。

常见的压缩算法流程

1
2
3
4
5
6
7
8
9
st=>start: 原始图片
op1=>operation: 压缩
op2=>operation: 编码与量化
op3=>inputoutput: 压缩结果
op4=>operation: 解码与反量化
op5=>operation: 解压

e=>end
st->op1->op2->op3->op4->op5
  • 压缩主要使用DWT(离散小波变换)或DCT(离散傅里叶变换)等算法。
  • 编码,例如哈夫曼编码,可以减小存储空间
  • 量化,例如浮点型转为整数型,从占用16bit缩小为8bit,可以减小存储空间

    智能压缩算法

    识别图中的目标,对目标区域压缩比例较小,对背景区域压缩比例较大

    目前想法

  • 将压缩算法替换成自编码器,中间隐藏层单元个数为4。将解压缩过程替换为GAN,输入中间隐藏层的输出结果。将生成的图像与真实图像做比较。
  • RBM网络,中间层的输出不仅仅为0和1,还包括0到7。
------ 本文结束------
坚持原创技术分享,您的支持将鼓励我继续创作!

欢迎关注我的其它发布渠道