要在计算机中处理图像,必须先把真实的图像(照片、画报、图书、图纸等)通过数字化转变成计算机能够接受的显示和存储格式,然后再用计算机进行分析处理。图像的数字化过程主要分采样、量化与编码三个步骤。 采样的实质就是要用多少点来描述一幅图像,采样结果质量的高低就是用前面所说的图像分辨率来衡量。简单来讲,对二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构,所形成的微小方格称为像素点。一副图像就被采样成有限个像素点构成的集合。例如:一副640*480分辨率的图像,表示这幅图像是由640*480=307200个像素点组成。
如图“图像采样”所示,左图是要采样的物体,右图是采样后的图像,每个小格即为一个像素点。
采样频率是指一秒钟内采样的次数,它反映了采样点之间的间隔大小。采样频率越高,得到的图像样本越逼真,图像的质量越高,但要求的存储量也越大。
在进行采样时,采样点间隔大小的选取很重要,它决定了采样后的图像能真实地反映原图像的程度。一般来说,原图像中的画面越复杂,色彩越丰富,则采样间隔应越小。由于二维图像的采样是一维的推广,根据信号的采样定理,要从取样样本中精确地复原图像,可得到图像采样的奈奎斯特(Nyquist)定理:图像采样的频率必须大于或等于源图像最高频率分量的两倍。 量化是指要使用多大范围的数值来表示图像采样之后的每一个点。量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。
例如:如果以4位存储一个点,就表示图像只能有16种颜色;若采用16位存储一个点,则有216=65536种颜色。所以,量化位数越来越大,表示图像可以拥有更多的颜色,自然可以产生更为细致的图像效果。但是,也会占用更大的存储空间。两者的基本问题都是视觉效果和存储空间的取舍。
假设有一幅黑白灰度的照片,因为它在水平于垂直方向上的灰度变化都是连续的,都可认为有无数个像素,而且任一点上灰度的取值都是从黑到白可以有无限个可能值。通过沿水平和垂直方向的等间隔采样可将这幅模拟图像分解为近似的有限个像素,每个像素的取值代表该像素的灰度(亮度)。对灰度进行量化,使其取值变为有限个可能值。
经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素,灰度取值上表现为有限个离散的可能值的图像称为数字图像。只要水平和垂直方向采样点数足够多,量化比特数足够大,数字图像的质量就比原始模拟图像毫不逊色。
在量化时所确定的离散取值个数称为量化级数。为表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长,一般可用8位、16位、24位或更高的量化字长来表示图像的颜色;量化字长越大,则越能真实第反映原有的图像的颜色,但得到的数字图像的容量也越大。
例如:图“线段AB(量化)”,沿线段AB(左图)的连续图像灰度值的曲线(右图),取白色值最大,黑色值最小。
先采样:沿线段AB等间隔进行采样,取样值在灰度值上是连续分布的,如图“线段的采样和量化”左图;
再量化:连续的灰度值再进行数字化(8个级别的灰度级标尺),如图“线段的采样和量化”右图。 数字化后得到的图像数据量十分巨大,必须采用编码技术来压缩其信息量。在一定意义上讲,编码压缩技术是实现图像传输与储存的关键。已有许多成熟的编码算法应用于图像压缩。常见的有图像的预测编码、变换编码、分形编码、小波变换图像压缩编码等。
当需要对所传输或存储的图像信息进行高比率压缩时,必须采取复杂的图像编码技术。但是,如果没有一个共同的标准做基础,不同系统间不能兼容,除非每一编码方法的各个细节完全相同,否则各系统间的连接十分困难。
为了使图像压缩标准化,20世纪90年代后,国际电信联盟(ITU)、国际标准化组织ISO和国际电工委员会IEC已经制定并继续制定一系列静止和活动图像编码的国际标准,已批准的标准主要有JPEG标准、MPEG标准、H.261等。