PIL总结

PIL的基本概念：

PIL中所涉及的基本概念有如下几个：通道（bands）、模式（mode）、尺寸（size）、坐标系统（coordinate system）、调色板（palette）、信息（info）和滤波器（filters）。

通道

每张图片都是由一个或者多个数据通道构成。PIL允许在单张图片中合成相同维数和深度的多个通道。

以RGB图像为例，每张图片都是由三个数据通道构成，分别为R、G和B通道。而对于灰度图像，则只有一个通道。

对于一张图片的通道数量和名称，可以通过方法getbands()来获取。方法getbands()是Image模块的方法，它会返回一个字符串元组（tuple）。该元组将包括每一个通道的名称。

Python的元组与列表类似，不同之处在于元组的元素不能修改,元组使用小括号，列表使用方括号，元组创建很简单，只需要在括号中添加元素，并使用逗号隔开即可。

方法getbands()的使用如下：

from PIL import Image
im = Image.open("xiao.png")
print(im.getbands())
输出：
('R', 'G', 'B')

model

图像的模式定义了图像的类型和像素的位宽。当前支持如下模式：

1：1位像素，表示黑和白，但是存储的时候每个像素存储为8bit。
L：8位像素，表示黑和白。
P：8位像素，使用调色板映射到其他模式。
RGB：3x8位像素，为真彩色。
RGBA：4x8位像素，有透明通道的真彩色。
CMYK：4x8位像素，颜色分离。
YCbCr：3x8位像素，彩色视频格式。
I：32位整型像素。
F：32位浮点型像素。
PIL也支持一些特殊的模式，包括RGBX（有padding的真彩色）和RGBa（有自左乘alpha的真彩色）。

可以通过mode属性读取图像的模式。其返回值是包括上述模式的字符串。

属性mode的使用如下：

from PIL import Image
im = Image.open("xiao.png")
print(im.mode)
输出：
'RGB'

这几个model的总览图如下：

尺寸

通过size属性可以获取图片的尺寸。这是一个二元组，包含水平和垂直方向上的像素数。

属性size的使用如下：

from PIL import Image
im = Image.open("xiao.png")
print(im.size)
输出:
(670, 502)

坐标系统

PIL使用笛卡尔像素坐标系统，坐标(0，0)位于左上角。注意：坐标值表示像素的角；位于坐标（0，0）处的像素的中心实际上位于（0.5，0.5）。

坐标经常用于二元组（x，y）。长方形则表示为四元组，前面是左上角坐标。例如，一个覆盖800x600的像素图像的长方形表示为（0，0，800，600）。

调色板

调色板模式 (“P”)使用一个颜色调色板为每个像素定义具体的颜色值

定义：im.palette ⇒ palette or None
含义：颜色调色板表格。如果图像的模式是“P”，则返回ImagePalette类的实例；否则，将为None。
例子：
from PIL import Image
im = Image.open("jing.jpg")
print(im.mode)
print(im.palette)
输出： 
RGB
None

信息

使用info属性可以为一张图片添加一些辅助信息。这个是字典对象。加载和保存图像文件时，多少信息需要处理取决于文件格式。

属性info的使用如下：

from PIL import Image
im = Image.open("xiao.png")
print(im.info)
输出：
{}

滤波器

对于将多个输入像素映射为一个输出像素的几何操作，PIL提供了4个不同的采样滤波器：

NEAREST：最近滤波。从输入图像中选取最近的像素作为输出像素。它忽略了所有其他的像素。
BILINEAR：双线性滤波。在输入图像的2x2矩阵上进行线性插值。注意：PIL的当前版本，做下采样时该滤波器使用了固定输入模板。
BICUBIC：双立方滤波。在输入图像的4x4矩阵上进行立方插值。注意：PIL的当前版本，做下采样时该滤波器使用了固定输入模板。
ANTIALIAS：平滑滤波。这是PIL 1.1.3版本中新的滤波器。对所有可以影响输出像素的输入像素进行高质量的重采样滤波，以计算输出像素值。在当前的PIL版本中，这个滤波器只用于改变尺寸和缩略图方法。
注意：在当前的PIL版本中，ANTIALIAS滤波器是下采样（例如，将一个大的图像转换为小图）时唯一正确的滤波器。BILIEAR和BICUBIC滤波器使用固定的输入模板，用于固定比例的几何变换和上采样是最好的。

Image模块中的方法resize()和thumbnail()用到了滤波器。

方法resize()的使用如下：

方法resize()的定义为：resize(size, filter=None)=> image
from PIL import Image
im = Image.open("xiao.png")
print(im.size)
im_resize = im.resize((256,256))
print(im_resize.size)
输出：
(670, 502)
(256,256)

对参数filter不赋值的话，方法resize()默认使用NEAREST滤波器。如果要使用其他滤波器可以通过下面的方法来实现：

from PIL import Image
im = Image.open("xiao.png")
print(im.size)
im_resize0 = im.resize((256,256), Image.BILINEAR)
print(im_resize0.size)
im_resize1 = im.resize((256,256), Image.BICUBIC)
print(im_resize1.size)
im_resize2 = im.resize((256,256), Image.ANTIALIAS)
print(im_resize2.size)
输出：
(670, 502)
(256,256)
(256,256)
(256,256)

Image类的属性

Image模块是PIL中最重要的模块，它有一个类叫做image，与模块名称相同。Image类有很多函数、方法及属性，接下来将依次对image类的属性进行介绍。属性的官方地址介绍

Format

定义：im.format ⇒ string or None
含义：源文件的文件格式。如果是由PIL创建的图像，则其文件格式为None。
例子：
from PIL import Image
im= Image.open("xiao.png")
print(im.format)
输出：
'png'

Mode

1 2	定义：im.mode ⇒ string 含义：图像的模式。这个字符串表明图像所使用像素格式。该属性典型的取值为“1”，“L”，“RGB”或“CMYK”。

Size

1 2	定义：im.size ⇒ (width, height) 含义：图像的尺寸，按照像素数计算。它的返回值为宽度和高度的二元组（width, height）。

Palette

定义：im.palette ⇒ palette or None
含义：颜色调色板表格。如果图像的模式是“P”，则返回ImagePalette类的实例；否则，将为None。
例子：
from PIL import Image
im = Image.open("jing.jpg")
print(im.mode)
print(im.palette)
输出
RGB
None

Info

定义：im.info ⇒ dictionary

含义：存储图像相关数据的字典。文件句柄使用该字典传递从文件中读取的各种非图像信息。大多数方法在返回新的图像时都会忽略这个字典；因为字典中的键并非标准化的，对于一个方法，它不能知道自己的操作如何影响这个字典。

如果用户需要这些信息，需要在方法open()返回时保存这个字典。

图片转换

首先看看几个概念。

所谓图像模式，就是把色彩分解成部分颜色组件，对颜色组件不同的分类就形成了不同的色彩模式。（摘自百度百科）

所谓位图，又称栅格图（英语：Raster graphics）或点阵图，是使用像素阵列(Pixel-array/Dot-matrix点阵)来表示的图像。位图的像素都分配有特定的位置和颜色值。每个像素的颜色信息由RGB组合或者灰度值表示。根据位深度,可将位图分为1、4、8、16、24及32位图像等。每个像素使用的信息位数越多，可用的颜色就越多，颜色表现就越逼真，相应的数据量越大。例如，位深度为 1 的像素位图只有两个可能的值（黑色和白色），所以又称为二值位图。位深度为 8 的图像有 28（即 256）个可能的值。位深度为 8 的灰度模式图像有 256 个可能的灰色值。（摘自维基百科）

所谓RGB图像，由三个颜色通道组成。8 位/像素的 RGB 图像中的每个通道有 256 个可能的值，这意味着该图像有 1600 万个以上可能的颜色值。有时将带有 8 位/通道 (bpc) 的 RGB 图像称作 24 位图像（8 位 x 3 通道 = 24 位数据/像素）。通常将使用24位RGB组合数据位表示的的位图称为真彩色位图。
所谓BMP文件，是微软公司所开发的一种交换和存储数据的方法，各个版本的Windows都支持BMP格式的文件。Windows提供了快速、方便的存储和压缩BMP文件的方法。BMP格式的缺点是，要占用较大的存储空间，文件尺寸太大。

在PIL中，图像模式大致分为九种，分别为：1，L，P，RGB，RGBA，CMYK，YCbCr，I， F。

对于彩色图像，不管其图像格式是PNG，还是BMP，或者JPG，在PIL中，使用Image模块的open()函数打开后，返回的图像对象的模式都是“RGB”。而对于灰度图像，不管其图像格式是PNG，还是BMP，或者JPG，打开后，其模式为“L”。

对于PNG、BMP和JPG彩色图像格式之间的互相转换都可以通过Image模块的open()和save()函数来完成。具体说就是，在打开这些图像时，PIL会将它们解码为三通道的“RGB”图像。用户可以基于这个“RGB”图像，对其进行处理。处理完毕，使用函数save()，可以将处理结果保存成PNG、BMP和JPG中任何格式。这样也就完成了几种格式之间的转换。同理，其他格式的彩色图像也可以通过这种方式完成转换。当然，对于不同格式的灰度图像，也可通过类似途径完成，只是PIL解码后是模式为“L”的图像。

当保存图片的时候，模式与图片格式有一定的对应关系，详细关系在官方地址给出，如jpeg可以保存 “L”, “RGB”, or “CMYK” ，但是不可保存模式“P”。

Convert方法总览

定义1：im.convert(mode)⇒ image
含义1：将当前图像转换为其他模式，并且返回新的图像。
当从一个调色板图像转换时，这个方法通过这个调色板来转换像素。如果不对变量mode赋值，该方法将会选择一种模式，在没有调色板的情况下，使得图像和调色板中的所有信息都可以被表示出来。
当从一个颜色图像转换为黑白图像时，PIL库使用ITU-R601-2 luma转换公式：
L = R * 299/1000 + G * 587/1000 + B * 114/1000
当转换为2位图像（模式“1”）时，源图像首先被转换为黑白图像。结果数据中大于127的值被设置为白色，其他的设置为黑色；这样图像会出现抖动。如果要使用其他阈值，更改阈值127，可以使用方法point()。
为了去掉图像抖动现象，可以使用dither选项。
　
例子1：
from PIL import Image
im1 = Image.open("jing.jpg")
print(im1.mode)
im_c = im1.convert("1")
im_c.save("he.jpg")
print(im_c.mode)
输出：
注：将“RGB”模式的im01图像，转换为“1”模式的im_c图像。

定义2：im.convert(“P”,**options) ⇒ image
含义2：这个与第一个方法定义一样，但是当“RGB”图像转换为8位调色板图像时能更好的处理。可供选择的选项为：
      Dither=. 控制颜色抖动。默认是FLOYDSTEINBERG，与邻近的像素一起承担错误。不使能该功能，则赋值为NONE。
      Palette=. 控制调色板的产生。默认是WEB，这是标准的216色的“web palette”。要使用优化的调色板，则赋值为ADAPTIVE。
      Colors=. 当选项palette为ADAPTIVE时，控制用于调色板的颜色数目。默认是最大值，即256种颜色。
 
定义3：im.convert(mode,matrix) ⇒ image
含义3：使用转换矩阵将一个“RGB”图像转换为“L”或者“RGB”图像。变量matrix为4或者16元组。
例子3：下面的例子将一个RGB图像（根据ITU-R709线性校准，使用D65亮度）转换到CIE XYZ颜色空间：
from PIL import Image
im1 = Image.open("jing.jpg")
im1.mode
rgb2xyz = （
    0.412453, 0.357580, 0.180423, 0,
    0.212671, 0.715160, 0.072169, 0,
    0.019334, 0.119193, 0.950227, 0 )
im_c3 = im1.convert("L", rgb2xyz)
im_c3.save("he.jpg")
print(im_c3.mode)
输出：
L

模式”1”

以上面这张图片作为实验样例(empire.jpg)，上图是RGB模式的，现在将其转换为模式为”1”.

模式”1”为二值图像，非黑即白。但是它的每个像素用8个bit表示，0表示黑，255表示白。

from PIL import Image

empire = Image.open('empire.jpg')
print(empire.mode)                       # RGB
empire_1 = empire.convert('1')
print(empire_1.mode)                     # 1
print(empire.size, empire_1.size)        # (1920, 1080) (1920, 1080)
print(empire.getpixel((0, 0)))           # (9, 5, 2)
print(empire.getpixel((10, 120)))        # (21, 16, 10)
print(empire_1.getpixel((0, 0)))         # 0
print(empire_1.getpixel((10, 120)))      # 255
empire_1.save("empire_1.jpg")

以上代码，先是打开一个RGB模式的图片，然后将其转换为模式为”1”的图片，可以看到模式变化后，图片大小前后并未发生改变，然后对比了相同坐标位置的不同模式下的像素值，可以看到，对于RGB模式图像，像素值包含R,G,B三点要素的占比，而对于模式为”1”的图像，像素值只有0和255两种取值。最后，将转换成功的模式为”1”的图像保存，图片显示如下：

模式”L”

模式”L”为灰度图像，它的每个像素用8个bit位表示，其中0表示黑，255表示白，其它数字表示不同的灰度。在PIL模式中，从模式”RGB”转换到模式”L”，有一个计算公式，即：L = R 299/1000 + G 587/1000+ B * 114/1000（只取整数部分）。

下面将模式”RGB”的图像转换为模式”L”的图像：

同样地，先是打开一个RGB模式的图片，然后将其转换为模式为”L”的图片，可以看到模式变化后，图片大小前后并未发生改变，然后对比了相同坐标位置的不同模式下的像素值，可以看到，对于RGB模式图像，像素值包含R,G,B三点要素的占比，而对于模式为”L”的图像，不同于模式”1”, 像素值可以取到0-255之间的任何值。然后校验一下”RGB”与”L”模式转换的像素转换公式：

最后，将转换成功的模式为”L”的图像保存，图片显示如下：

模式”P”

模式”P”为8位彩色模式，它的每一个像素用8个bit表示，其对应的色彩是按照调色板查询出来的。
下面将模式”RGB”的图像转换为模式为”P”的图像。

from PIL import Image

empire = Image.open('empire.jpg')
print(empire.mode)                       # RGB
empire_1 = empire.convert('P')
print(empire_1.mode)                     # 1
print(empire.size, empire_1.size)        # (1920, 1080) (1920, 1080)
print(empire.getpixel((0, 0)))           # (9, 5, 2)
print(empire.getpixel((10, 120)))        # (21, 16, 10)
print(empire_1.getpixel((10, 1)))        # 11
print(empire_1.getpixel((101, 33)))      # 17
empire_1.save("empire_P.bmp")

代码基本不变，转换后的图像如图：

模式”RGBA”

“RGBA”模式为32位彩色模式，其中24个bit分别表示红色，绿色，蓝色三个通道，另外8个bit 表示alpha通道，即透明通道。

from PIL import Image

empire = Image.open('empire.jpg')
print(empire.mode)                       # RGB
empire_1 = empire.convert('RGBA')
print(empire_1.mode)                     # 1
print(empire.size, empire_1.size)        # (1920, 1080) (1920, 1080)
print(empire.getpixel((0, 0)))           # (9, 5, 2)
print(empire.getpixel((10, 120)))        # (21, 16, 10)
print(empire_1.getpixel((10, 1)))        # (25, 20, 14, 255)
print(empire_1.getpixel((101, 33)))      # (47, 33, 22, 255)
empire_1.save("empire_RGBA.jpg")

当将RGB转换为RGBA模式的图像时，alpha通道全部为255，即完全不透明。图像如下：

模式”CMYK”

模式“CMYK”为32位彩色图像，它的每个像素用32个bit表示。模式“CMYK”就是印刷四分色模式，它是彩色印刷时采用的一种套色模式，利用色料的三原色混色原理，加上黑色油墨，共计四种颜色混合叠加，形成所谓“全彩印刷”。四种标准颜色是：C：Cyan = 青色，又称为‘天蓝色’或是‘湛蓝’M：Magenta = 品红色，又称为‘洋红色’；Y：Yellow = 黄色；K：Key Plate(blacK) = 定位套版色（黑色）。

下面我们将模式为“RGB”的lena图像转换为“CMYK”图像。

from PIL import Image

empire = Image.open('empire.jpg')
print(empire.mode)                       # RGB
empire_1 = empire.convert('CMYK')
print(empire_1.mode)                     # 1
print(empire.size, empire_1.size)        # (1920, 1080) (1920, 1080)
print(empire.getpixel((0, 0)))           # (9, 5, 2)
print(empire.getpixel((10, 120)))        # (21, 16, 10)
print(empire_1.getpixel((10, 1)))        # (230, 235, 241, 0)
print(empire_1.getpixel((101, 33)))      # (208, 222, 233, 0)
empire_1.save("empire_CMYK.jpeg")

从实例中可以得知PIL中“RGB”转换为“CMYK”的公式如下：

C = 255 - R
M = 255 - G
Y = 255 - B
K = 0

由于该转换公式比较简单，转换后的图像颜色有些失真。

转换后的图像如下：

模式”YCbCr”

模式“YCbCr”为24位彩色图像，它的每个像素用24个bit表示。YCbCr其中Y是指亮度分量，Cb指蓝色色度分量，而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感，因此在通过对色度分量进行子采样来减少色度分量后，肉眼将察觉不到的图像质量的变化。

from PIL import Image

empire = Image.open('empire.jpg')
print(empire.mode)                       # RGB
empire_1 = empire.convert('YCbCr')
print(empire_1.mode)                     # 1
print(empire.size, empire_1.size)        # (1920, 1080) (1920, 1080)
print(empire.getpixel((0, 0)))           # (9, 5, 2)
print(empire.getpixel((10, 120)))        # (21, 16, 10)
print(empire_1.getpixel((10, 1)))        # (20, 124, 131)
print(empire_1.getpixel((101, 33)))      # (35, 120, 135)
empire_1.save("empire_YCbCr.jpeg")

转换后的图像如下：

模式”I”

模式”I”为32位整型灰色图像，它的每个像素用32个bit表示，0表示黑，255表示白，(0,255)之间的数字表示不同的灰度。在PIL中，从模式”RGB”转换为”I”模式是按照下面的公式转换的：

1	I = R * 299/1000 + G * 587/1000 + B * 114/1000

模式”F”

模式”F”为32位浮点灰色图像，它的每个像素用32个bit表示，0表示黑，255表示白，(0,255)之间的数字表示不同的灰度。在PIL中，从模式”RGB”转换为”F”模式是按照下面的公式转换的：

1	F = R * 299/1000+ G * 587/1000 + B * 114/1000

模式”F”与模式”L”的转换公式是一样的，都是RGB转换为灰色值的公式，但模式”F”会保留小数部分。

参考

利用python PIL库进行图像模式的转换
 第一篇 Python图片处理模块PIL（pillow）
PIL包中图像的mode参数