深入解析数字媒体基础知识:第二部分

更新:11-13 神话故事 我要投稿 纠错 投诉

大家好,今天小编来为大家解答以下的问题,关于深入解析数字媒体基础知识:第二部分,这个很多人还不知道,现在让我们一起来看看吧!

2 位图

2.1 创建位图

位图可以通过使用Photo Shop 等绘图软件绘制、使用扫描仪扫描模拟图像或使用数码相机拍照来创建。这里我们重点关注使用数码相机拍摄的位图。

使用数码相机创建位图的过程可以分为两个阶段:采样和量化。采样是指从连续的模拟图像中提取离散像素的过程。有些设备允许用户在拍照或录制视频时设置采样率,即采样时在水平和垂直维度上采集的像素数。例如,在iOS12系统的iPhone中,可以在设置界面中设置视频录制的采样率。

量化是指定颜色模型和相应位深度,并使用实际数值来表示像素颜色的过程。正确采样和量化的图片如下。

对正常拍摄的照片进行采样和量化的过程会引入误差。也就是说,得到的图像并不是我们观察到的原始图像。如果采样过程中使用的采样率太低,图像就会丢失很多细节。当显示尺寸与原图相同时,我们会看到大量类似马赛克效果的色点,如下图。

类似地,对于过采样的照片,如果在量化过程中将位深度设置得太低,则生成的图像可表示的颜色数量将非常有限。即一些相似的颜色被表示为相同的颜色,图片也会丢失很多细节,如下图。

位深度太低的照片

2.2 像素尺寸、分辨率和图像大小

当我们描述照片的尺寸时,我们通常使用宽度和高度方向的像素数。对于电脑屏幕来说,像素的数量与屏幕上特定亮点的数量有关。因此,为了清楚地区分这两种不同的上下文,我们在描述图像尺寸时使用术语“逻辑像素”,在描述计算机屏幕时使用术语“物理像素”。

现实生活中的广告经常将手机的摄像头描述为具有几百万像素,这是指设备可以支持的最大像素尺寸。例如,其硬件可以生成的图像的最大逻辑像素为2048*1536,即设备可以生成的最大图像包含3 145 728个像素,即300万像素。值得注意的是,一些相机制造商通过使用“数字变焦”来夸大其相机的功能,“数字变焦”是一种向图像添加像素但实际上并没有增加清晰度的软件方法。

分辨率定义为图像文件一定尺寸内每英寸空间的像素数,单位为ppi。比如200ppi。打印分辨率是指打印机每英寸空间可打印的最大点数,其单位为dpi,如1440dpi。

图像的大小定义为图像文件打印或显示在计算机屏幕上时的物理大小。单位是英寸或厘米。

更改图像的像素尺寸称为重采样。通过上采样来增加图像的像素大小称为上采样,通过缩小来减小像素大小称为下采样。上采样的像素只是在原始像素的基础上进行插值计算,下采样的像素值是现有像素值的平均值。它们都不能提高图像的清晰度。

2.3 数字图像的空间频率

在这一系列关于数字数据的文章中,我们已经介绍了数据可以使用函数来表示,并且可以在不丢失信息的情况下从一个域转换到另一个域。这个规则也可以应用于数字图像,奈奎斯特定理在数字图像中仍然适用。

周期性灰度图像到周期性波形的转换对于上图左边的灰度图像,想象一条平行于x轴的直线,将其灰度值表示为y,将其像素点位置表示为x,可以得到右波形图。对于具有RGB通道的彩色图像,只需对其三个通道进行相同的处理即可。在右图中,我们假设左侧的灰度图像周期性重复,从而得到周期性重复的波形。

周期灰度信号到周期波形的转换在处理数字图像时,我们得到的是离散化数据,如上左图所示。我们还可以通过重复周期信号来获得周期波形,如上右图所示。

实际照片的某行像素灰度波形。事实上,在处理真实的数码照片时,也可以将图像分成RGB 3个通道,并且可以单独处理每个通道的图像。这里对于简单的颜色,我们将图像处理为灰度,如上左图所示。我们选择某一行像素并使用与之前相同的技术绘制其波形,如上右图所示。可见,我们可以用二维波形来描述数字图像中的某一行像素。

将数字信号转换为空间波形正如前面提到的,二维波形可以用来描述数字图像中的某一行像素,但这还不够。图片具有二维特性,所以我们还必须找到一种方法来同时描述x轴和y轴上像素的变化。空间波形可以很好地实现这一目标。例如,上图左图是灰度图。通过将其像素点的位置映射到3维空间中的x轴和y轴,将其实际灰度值映射到z轴上,我们可以得到3维空间波形图,即右上方的图片。

将实际照片转换为空间波形对于实际的数字图像,我们仍然以鸟类图片为例,我们只考虑其灰度图像。对于具有RGB通道的彩色图像,只需将RGB三个颜色通道分开并进行类似的处理即可。上左图是实际的数字图像,转换后的空间波形如右图所示。可见,我们可以用空间波形图来描述任何数字图像。这很重要,因为只有当我们能够使用物理模型来描述数字图像时,我们才能促进它们的进一步处理。通过空间波描述,我们可以将其转换为空间频率,这是图像有损压缩的数学基础。

3 离散余弦变换

在本系列文章的第一篇文章中,详细介绍并推导了傅里叶级数以及由其派生的各种傅里叶变换。如前所述,任何具有复合狄利克雷条件的周期函数都可以分解为无数个简单的正弦函数。在公式中,我们可以看到有一个余弦分量。这是因为正弦函数Asin(x+)可以利用三角公式展开得到余弦值。离散余弦变换是在一定条件下减少正弦项的结果。详细介绍请参见本系列第一篇文章《数字信号的表示和处理》。

离散余弦变换示意图上图是离散余弦变换的示意图。再次强调,这只是示意图。最右边的波形可以由左边的三个基本波形合成。对于比较复杂的波形,仍然可以转换成简单波形的组合。这种组合数字图像的主题可以理解为单行像素的波形图,可以转换为多个基本波形的组合。

一维逆离散余弦变换公式上面是逆离散余弦变换的公式,其中f[u]是原始信号在频域的函数,M是原始信号的个数。这是一个一维离散余弦变换公式。事实上,数字图像处理需要的是二维离散余弦变换公式。这将在本文后面介绍。我们首先关注一维离散余弦变换以及如何将彩色图像中的一行像素分割成多个波形的组合。

摘录一行像素假设有一张数字图像,一行灰度图像中的8个相邻像素如上图所示。

基本波形和对应的像素行我们选择了8 个基本波形。并根据每个波形计算8个像素。如上图所示,最左边的函数是基本波形的三角公式,中间的图是它的波形图,右边的像素行是根据这个基本波形计算出来的前8个有效像素值。

如前所述,任何一行像素都可以用二维波形表示。这些二维波形必须满足狄利克雷条件,并且必须将它们分解为多个基本波形的组合。现在我们要做的就是计算每个基本波形的系数,也就是函数在频域的值。这可以通过离散余弦变换公式来计算。一维离散余弦变换公式如下。

一维离散余弦变换公式。上式中,f(r)为空间域函数。对于灰度数字图像处理来说,它是一行像素的具体灰度值。 r是像素点的坐标,M是行。像素总数。 u可以理解为频域函数的频率值,cos后面括号中的部分是基本波形的三角函数。需要注意的是,频域函数的频率值的数量与空间域函数的自变量值的数量相同。对于数字图像来说,即如果一行有几个像素,就可以获得几个频率分量。

利用上面的公式,我们可以计算出频域函数的值。由于示例中像素行中有8 个像素,因此我们可以计算8 个有效频域分量,即F(u) 在[0, 7] 中的值与离散余弦中的常数的乘积变换公式分别为[w0 ~ w7]=[389.97, -280.13, -93.54, 83.98, 54.09, -20.51, -19.80, -16.34]。他们将基本波形混合成原始波形是每个基本波形的系数。也就是说,所有频率分量的食欲函数乘以它们的系数之和就是原始图像。

基本波形合成原始图像上图是利用基本波形得到的图像来合并原始图像的示意图。需要说明的是,离散余弦变换得到的频率成分较多,F(0)称为直流成分,F(1)至F(M-1)称为交流成分。该术语来自模拟电路,其中直流分量与直流电路相关,交流分量与交流电路相关。

数字图像具有二维物理特性,因此我们在处理数字图像时实际使用的是二维离散余弦变换。公式如下。

二维离散余弦变换公式对于灰度数字图像,上式中,空间二维函数为f(r,s),描述了原始图像在像素坐标上的灰度值(横坐标为r,纵坐标为s)值,M和N分别为水平和垂直方向的像素数,(u,v)为空间频率,两个cos函数的乘积就是基本二维空间波的函数,F(u, v)描述了原始图像的空间域函数f(r, s)是频域中的对应函数。 u和v的有效值分别为[0,M-1]和[0,N-1]。函数F(u, v)的每个值都是对应二维空间波形的系数。

需要说明的是,图像处理领域中的离散余弦变换通常仅限于88像素的子块,也称为宏块。这可以大大降低计算复杂度,提高图像处理效率。这是JPEG图像压缩和MPEG视频压缩中最重要的一步。当然,不同的编码标准对宏块大小的选择也不同,但通常选择在88和1616之间。数字视频将在后续文章中详细讨论。

一个8*8像素的宏块上图是一个88像素的宏块。我们统计其中的灰度值,得到如下颜色矩阵表。

颜色矩阵表我们然后利用刚刚介绍的二维离散余弦变换来计算每个空间频率分量的系数,即函数F(u, v)的值,得到下面的频率分量幅度矩阵。与一维离散余弦变换公式类似,F(0, 0)称为DC分量,其余值称为DC分量。

频率分量幅度矩阵就像一排像素一样,可以通过一维离散余弦变换分解为多个基本函数,然后由这些函数复合恢复。二维数字图像还可以通过二维离散余弦变换分解为多个基本函数,然后由这些基本函数合成。不同的是,一维离散余弦变换分解得到的基函数可以用二维波形表示,而二维离散余弦变换分解得到的基函数必须用空间三维波形表示。二维逆离散余弦变换的公式如下。

二维离散余弦逆变换公式对于上例中的88像素宏块,二维离散余弦逆变换公式需要由88,总共64个基函数组成,每个基函数可以可以表示为二维波形,每个波可以表示为简单的二维图像,如下所示。

8*8像素宏块离散余弦变换分解的基函数示意图。每幅图像都是离散点P(r, s)处二维逆离散余弦变换公式最后两个余弦分量的值相乘的结果,其中r和s的值空间均为[0 ,7]。

通过上述基函数可以合成任意88的二维图像,通过二维离散余弦变换可以计算出每个基函数的系数,即权重。 F(u,v)除去常数部分的值也称为频率分量幅度矩阵。对于使用RGB颜色模型的彩色图像,只需要分别处理三个通道,即三个DCT过程。

上述88像素宏块示例的频率分量幅度矩阵与二维逆离散余弦变换公式中的常数的乘积乘以其对应的基频函数,最后相加,合成原来的两个三维图像。

我们来看一个更实际的例子,就是之前的鸟图。我们选择了8 x 8 像素宏块之一,如下所示。

对于灰度位图中的8*8像素宏块,我们用z轴表示每个像素的颜色值,用xy轴分别表示该像素在水平和垂直方向的索引值,并绘制以下空间像素直方图。

对于空间域像素直方图,我们使用二维离散余弦变换来计算每个频率分量的系数,即频域函数F(u,v)的值。我们使用z 轴来表示F(u, v) 的值。值,用xy轴分别表示水平和垂直方向的频率。最后我们得到如下频率分量幅度直方图。

频率分量幅值直方图我们可以看到,在上面的频率分量幅值直方图中,直流分量最大,还有一些较小的交流分量。将它们与二维离散余弦变换公式中的常数项的乘积作为基频函数的系数。可以恢复原始图像。

这里需要注意的是,在频率分量幅度直方图中,除了少数远离坐标原点的频率分量有值外,其余交流分量的值几乎为0。也就是说,我们完全可以丢弃右下角的频率分量,仍然恢复原始图像。这是因为右下角的空间频率极高,从心理上来说,已经超过了人眼的分辨精度。这种处理方法也是JPEG压缩和MPEG中帧内压缩的理论基础。

4 失真

4.1 模糊效应和块效应

奈奎斯特频率在数字图像上的应用可以理解为当水平和垂直采样率小于人眼敏感的最高频率的两倍时,得到的图像就会失真。当生成的样本放大到原始大小时,会出现明显的锯齿和块效应。

我们使用适当的采样率发出的照片如下。

正常拍摄的照片,但是当我们使用太低的采样率时,会拍摄到以下照片。这种现象也称为过采样。

过采样获得的照片

4.2 摩尔纹

莫尔图案是指数字图像采样过程中,采样频率不够但足够接近以捕获原始图像细节时所获得的高频干扰条纹。使图像呈现彩色的高频不规则条纹。另外,当采样方向与原始图像的纹理方向有一定角度时,也会得到摩尔纹。

产生莫尔图案的采样如上图所示。左侧图像的纹理与采样方向成一定角度。同时,采样频率接近原始图像的频率。我们假设样本的黑色部分超出了其面积。如果采样结果有一半是黑色,否则就是白色。这样我们最终得到的图像就是右图。我们可以看到图像已经明显扭曲了。这就是有趣的莫尔图案。

当我们了解了什么是摩尔纹后,回想一下当我们看到透明窗帘折叠时的闪烁效果,以及当我们透过屏幕看编织椅时的旋转效果。这些是生活中常见的摩尔纹。

同样,我们考虑生活中的实际图像。高频纹理材料制成的背包如下图所示。

高频纹理材质的背包对于这类场景,当我们的采样率和原始图像频率不同步时,很可能会出现莫尔条纹,如下。

下面是莫尔图案和实际原始图像的特写。

真实图像特写。使用数码相机拍照时出现的莫尔条纹可以通过倾斜相机角度、改变焦距或更换镜头来解决。这改变了采样方向和广义原始图像空间频率。

4.3 相机中图片的感知方式

传统相机使用涂有银涂层的胶片来创建图像。该薄膜有三层,每层对红光、绿光和蓝光敏感。

数码相机使用电荷耦合器件(CCD)技术来感应光线和颜色,而互补金属氧化物半导体(CMOS)是另一种新型感光技术。

CCD由二维像点阵列组成,每个像点对应一个样本(数字图像上的一个像素),每个像点都被红、绿、蓝滤光片覆盖。

CCD的实现有四种方法。第一个将入射光分成3束,每个光敏点有3个传感器。每个传感器只能分别感应红、绿、蓝。这样做的好处是每个像素可以直接获取原始的3色值,但缺点是价格昂贵并且导致相机体积过大。

第二种会在拍照时旋转传感器,使其能够连续感应红、绿、蓝光。这种方法的缺点是不能同时感知三种颜色,只能拍摄静态图片。

第三种方法,例如Foveon X3,使用硅传感器并采用垂直堆叠技术。不同深度的硅吸收不同波长的光,从而允许在一个图像点中同时感知三种颜色。

第四种也是最常见的方法是使用拜耳滤色镜。每个图像点仅感知一种颜色,并使用插值来计算其他两个分量的值。虽然这种方法很便宜,但有时会导致颜色失真。

拜耳滤色片阵列上图是拜耳滤色片的示意图。拜耳滤色片中绿色感光像点的总数是其他两种像点的两倍。这是因为人眼对绿光更敏感。

获得原始数据后,我们需要通过插值计算像素的颜色。这种颜色计算方法称为去马赛克算法。最简单的方法之一是最近邻法。对于采集G分量的每个图像点,在计算R和B分量的值时,只需取相邻两个图像点的平均值即可。在计算收集R和B分量的图像点的其他两个分量的值时,需要取四个相邻图像点的平均值。其计算区域内的相邻色点如下图所示。

像素插值示意图。插值算法的本质无法很好地重建要拍摄的场景,因此在过程中会出现一定的畸变,例如摩尔纹、块状、斑点等。

导致颜色失真的插值计算如上左图所示。假设拍摄一条白线,这条线恰好穿过CCD传感器。假设线的两边都是黑色。那么其他图像点感受到的光强度为0。如右图所示,在进行插值计算时,对于白线经过的图像点,计算插值时从相邻图像点得到的值每个图像点始终为0。因此,对于白线穿过的图像点,无法从其相邻图像点计算这些点的颜色,最终得到一个扭曲的图像。

有些相机在镜头上使用去颗粒或抗锯齿镜,可以有效模糊图像并减少色彩失真。相机制造商将此作为可选功能,并且可以在设置中打开抗锯齿滤镜。但通常高质量相机不提供此功能。

4.4 锯齿状边缘

在计算机屏幕上渲染对角线时,有时会看到锯齿状边缘。这种失真是由于计算机的分辨率有限造成的。在几何学中,线条是由无限的点组成的,而计算机屏幕上的线条是由离散的像素组成的。

锯齿状2 像素宽直线在上图中,左边的图像是实际的2 像素直线。假设当每个样本内部超过一半的区域被覆盖时,我们将样本涂成黑色,那么我们将得到如右图所示的锯齿状直线。

抗锯齿2 像素宽直线抗锯齿是一种减少直线中锯齿或边缘失真程度的技术。一种可能的方法是用指定的颜色沿线的边缘绘制像素,该颜色与覆盖率成正比并相对于线上最近点的颜色。

放大位图后的锯齿效果如上图。位图放大时,通过上采样增加像素值,通过插值计算得到像素的颜色,这样会突出锯齿状边缘。

矢量图像放大后的锯齿效果如上图。由于矢量图像是实时绘制的,当放大时,其失真程度不像位图那么严重。

5 颜色

色彩科学是一门独立且有趣的学科。这里只介绍最重要的基础知识。更详细的内容可以参考以下两本参考书。

颜色科学参考书目

5.1 颜色感知和表示

颜色既是一种物理现象(电磁波),又是一种心理现象(当这些电磁波落入人眼的颜色感受器时,人脑以一种隐晦的方式控制着电磁波之间的相互作用)波和眼睛)相互作用,即颜色感知)。我们在自然界中感受到的颜色是不同波长的组合。

现代解剖学研究表明,人眼中有三种类型的视锥细胞,即L型、M型和S型视锥细胞,分别对长波、中波和短波电池波敏感,如图以下。

人眼视锥细胞敏感度和菠菜叶对不同光谱的反射率示意图。自然界的物质对于不同波长的电磁波有不同的反射率。例如,菠菜叶主要反射波长为550nm左右的电磁波。然后反射的电磁波被视锥细胞感受到,最后在大脑中产生颜色的概念。

牛顿是第一个对颜色进行系统研究的人。他发现颜色可以通过混合颜色来获得,并在他的文章中提出了色轮的概念,也称为牛顿色轮,如下图。

牛顿色轮- 1665 色彩的三要素是色调(hue)、饱和度(purity)和明度。色相(Hue,也叫色相)可以理解为颜色的主波长。圆圈的外围是白光分解得到的所有单位能量的单色。色调从红色开始,逐渐向黄色增加。

饱和度(色度,也称为纯度)可以理解为白光混合成单一颜色的量。如果有足够多的白光混入,饱和度越低,就越接近灰色。

亮度是一个主观概念,与观察者的感知有关。它表示人眼感知到的颜色发光的强度。通常将单位能量的单一颜色的亮度值定义为1。随着光强度逐渐降低,亮度也随之降低。当光强度变为0时,其亮度值也为0。

需要注意的是,亮度、亮度和亮度这三个词很容易混淆。事实上,它们都有不同的含义。

亮度是指人眼对光辐射的能量感知值。单位是尼特,即坎德拉每平方米。通常我们在谈论亮度时,指的是相对亮度,即它的Y/Yr,Yr指的是参考白光的亮度。

亮度是指我们视觉上感知到的光量是多还是少。这是一个非常主观的概念,世界上没有数学定义。亮度不同。它有明确的数学定义。它与光的波长和能量以及人眼感受到的亮度有关。有趣的是,对于不同波长、相同功率的光,人眼会认为550nm的波看起来最亮。

亮度是指在相同光照环境下,彩色与白色的相对亮度。

下图中的孟塞尔颜色系统是较早的描述颜色的系统。它通过三个维度来描述颜色:亮度(Value)、色调(Hue)和饱和度(Chroma)。

Munsell 颜色系统- 1900 表示颜色的科学方法是光谱密度函数,但它通常不用于计算机系统中。因为多个光谱密度函数可以代表人眼感知的相同颜色。

上图描绘了一个简化的光谱密度函数,其中色调由主波长决定,亮度由函数包围的图像面积决定,饱和度由峰值部分与总面积的比值决定。其计算公式如下。

常用颜色的表示方法有很多种,称为颜色空间。主要包括RGB、CMKY、圆锥变换(圆柱变换)、标准CIE、亮度+色度五种颜色模型系列。

5.2 RGB颜色模型族-RGB颜色模型

RGB是一个基于波长的常数,rgb是每个常数分量的系数,也称为颜色通道。请注意,RGB 颜色模型没有定义所使用的三种光波长。

RGB颜色系统的示意图如上所示。 RGB颜色模型中的所有颜色都是三基色混合的结果。红色、绿色和蓝色的补色分别是青色、品红色和黄色。 rgb在数学模型中的取值范围是0到1,在图像处理程序中通常是0到255。心理学研究表明,人眼对绿色最敏感。利用对三种颜色的敏感度,从RGB 颜色模型计算灰度或亮度的公式如下。

5.3 CMYK颜色模型族-CMYK颜色模型

CMY是减色模型,分别表示白光中扣除红、绿、蓝颜色成分的比例。该颜色模型与RGB颜色模型之间的转换公式如下。

由于CMY混合的结果不是纯黑色,因此在CMYK颜色模型中引入K分量来表示纯黑色。换算公式如下。

5.4 圆锥转换颜色模型族

表示基于色调(基本颜色)、饱和度、值或亮度的颜色。色相-饱和度-值(HSV)颜色模型也称为色相-饱和度-亮度(HSB)颜色模型,如下图所示。

HSV颜色系统示意图色相-亮度-饱和度(HLS)颜色模型。

HLS颜色系统示意图

5.5 CIE颜色模型族和色域

国际发光与照明委员会(CIE)进行了一项混色实验。实验采用波长分别为700nm、546.1nm、435.8nm的标准红、绿、蓝光作为三种单色光。参与者被要求控制这三种光的单位能量的光量,直到他们认为它与可见光谱中单位能量的单色光的颜色相同。并以此为基础,绘制出如下图的配色函数。

CIE-1931-RGB配色函数实验表明,如果想用RGB三色光来混合自然界中所有单一波长的纯色光,有时需要从绿光和红光中减去一部分红光。蓝色混合光,即添加到纯色红光中。

此外,没有计算机显示器可以通过其自身的红光、绿光和蓝光来组合所有可见光。给定显示器可以显示的颜色范围称为色域。相同颜色型号的不同型号显示器可能具有不同的色域。同样,在同一台显示器上使用不同的颜色模型必然具有不同的色域。

5.5.1 CIE-XYZ颜色模型

根据这个实验结果,国际发光照明委员会提出CIE函数值全部为正。并且经过刻意选择,上式中Y的系数与发光效率函数的数学模型具有相同的形状,这意味着Y可以理解为亮度。

RGB颜色模型和CIE-XYZ颜色模型可以通过以下公式进行转换。

为了更方便地表示各种颜色模型的重叠区域,需要在二维平面上绘制色域图。首先,对XYZ三个分量的能量函数进行标准化,其计算公式如下。

那么CIE-XYZ颜色模型参数函数表达如下。

在三维空间中,画一个色品分量之和为1的平面,这个平面就是CIE-XYZ颜色模型中所有颜色的色品投影平面,即可以表示所有颜色的色品信息。

将所有单位能量饱和颜色(即所有可见光谱中的单位亮度单色)的CIE-XYZ 颜色模型表示投影到色度平面上,如下所示。图中的实线代表色品投影平面,即X+Y+Z=1的平面,短须代表所有单位能量的饱和颜色,粗虚线代表这些饱和颜色的投影在色度平面上。

可见色谱在色品平面上的投影如下图所示。马蹄形轮廓和连接原点的线形成一个圆锥体,代表CIE-XYZ颜色模型中不同能量的可见光谱的所有单色。将这个平面延伸到无穷大,其上和内部的点可以代表所有可见颜色及其他颜色。

CIE色彩空间中的可见颜色

5.5.2 色域

如下图所示,投影在z=0平面上的色品平面上的马蹄形轮廓称为CIE色品图。国际照明委员会颜色

度图能够直观的观察不同颜色模型的色域范围。但是颜色是3维现象,CIE色度图在二维空间中表示颜色,忽略了能量。所以不能表示所有颜色,如棕色,是一种低亮度的橘红色。 CIE-1931-色度图转换后的RGB和CMKY颜色模型的色域在CIE-1931色度图中表示如下图。从图中我们可以看出没有一个计算机能够识别的颜色空间能够表示出所有的颜色。它们都存在色域限制。 CIE-1931-色度图中CMKY和RGB色域示意图下图演示了如何计在CIE色度图中计算一个颜色的色调和饱和度,其中中C点称为白光C,也称满饱和白。马蹄形边缘上表示的是满饱和度的光谱颜色。底部直线上的颜色是不能通过单波长光谱产生的颜色。 CIE-1931-色度图中饱和度和色度计算示意图主波长决定了一个颜色的色度,可以由该颜色点到C点的连线到马蹄形边缘的交点确定,如颜色A的主波长约为550nm,为暗绿色。如果交点在底部直线上,如颜色D的交点为F,则颜色D称为非光谱色,颜色E为其补色的主波长。饱和度可以通过表示颜色的任意一点和C点的连线确定,如AC/BC。
5.5.3 色温
对于颜色而言我们还会遇到另外一个概念,那就是色温。需要注意的是这里要和冷色调暖色调相区分,冷暖色调指的是心理感受,通常蓝色系被称为冷色调,红色系被称为暖色调。而色温指的是加热绝对黑体时,颜色由红到白,最后变为蓝色时,绝对黑体的温度也就是其对应颜色的色温。CIE-LUV色度图中的色温曲线如下图所示。 image.png这里还需要注意的点是,我们说CIE-XYZ颜色空间是一个设备无关的颜色空间,并且前面讲到颜色匹配函数时也说到过是通过和可见光谱的单位能量存色做的对比,CIE-XYZ颜色模型建议我们使用D65,也就是7000k的白色来作为单位能量。
5.5.4 感知均匀性以及CIE-Lab,CIE-LUV颜色模型
感知均匀性指的颜色模型在数值上的变化和人眼所感受到的颜色成线性变化关系。RGB和CMKY颜色空间都不是感知均匀颜色空间,而CIELAB和CIELUV是感知均匀性的颜色空间。 CIELAB颜色模型如下图,其中中L轴表示光亮度值从0~100变化,对应了黑色到白色。A轴表示色度从绿色(负)到红色(正)变化,B轴表示色度从蓝色(负)到黄色(正)变化。另外CIELAB是一个减色模型,被用于各种颜色转换的中间模型。 1976-CIE-LAB-颜色空间中可见色域图CIELUV颜色模型如下图,其中L轴表示光亮度值从0~100变化,对应了黑色到白色。U和V轴为色度轴,没有具体的含义。另外CIELUV颜色模型是一个加色模型。 1976-CIE-LUV-颜色空间中可见色域图通过CIE-LUV得到了新的CIE-LUV色度图如下图所示。 1976-CIE-LUV-色度图

5.6 亮度和色度颜色模型族

亮度颜色模型通常用于数字视频领域,指的是通过提取颜色的1个亮度分量,和2个颜色分量来描述颜色的颜色模型,他和CIE颜色模型族的区别是亮度和色度颜色模型族都是设备相关的,而CIE颜色模型族是设备无关的。 常见的亮度和色度颜色模型是YIQ颜色模型,它可以有RGB颜色模型转换而得,其转换公式如下。 亮度和色度颜色模型的发展有两个原因。第一,早期的电视播出的是黑白信号,而后来彩色电视发展起来的时候需要兼容早期的黑白电视,而使用亮度和色度颜色模型就可以使用黑白电视只使用亮度信号,而彩色电视使用三个分量信号,这样就能在传送同样的信号前提下既支持黑白,也支持彩色电视的播放。 第二,因为人眼对与亮度的敏感层度会明显高于对色度的敏感程度,使用亮度和色度颜色模型后,通过适当的丢弃一些色度信号就能很大的提升视频的压缩效率。 实际上常见的用于电视信号的颜色模型一共有三种,它们在世界范围内的分布情况如下图下图。其中YIQ用于美国国家电视委员会主导的电视格式(National Television System Committee,NTSC)。YUV颜色模型用于欧洲的逐行倒相制(Phase Alternation Line,PAL)的模拟视频标准的。YDbDr用于法国主导的顺序存储电视格式(Sequential Color and Memory)。 不同电视格式全球覆盖图另外,常见的亮度和色度颜色模型还有YCbCr,它常用于JPEG和MPEG格式压缩处理中。这些不同的亮度和色度颜色模型区别在于通过RGB颜色模型转换时其矩阵的值选取不同。这是因为不同标准的电视其硬件发出的3个单色光的频率和能量都有所区别的原因。

5.7 颜色管理系统

某种颜色空间的颜色,在不同的光线环境中,不同的设备上,以及颜色空间转换时可能会出现颜色失真。而颜色管理系统可以在颜色空间、基色设置和从颜色值到像素和油墨到物理表现的绘制过程中,完成从一个硬件设备与另外一个硬件设备的交换。CIE颜色空间是一个通用的,独立于硬件的颜色空间,通常CIE-LAB作为中间转换颜色模型。常见的颜色空间转换方式如下图。 不同颜色空间转换示意图颜色管理分为校准显示器、描述显示器的颜色配置、创建图像独有的颜色配置、保存颜色配置和图像、在其他设备或者程序中重置图像的颜色。

6 矢量图

6.1 几何图形

矢量图是一种由分割明显,颜色单一的区域组成的图像。通常用于卡通、商标等图像。 图像格式尽管很多,但是它们背后描述图像的数学公式非常相似,如两个端点确定一个线段,一个边长确定一个正方形等。对于曲线而言,可以选取一系列控制点,然后利用数学公式平滑的绘制出一条曲线,如厄米曲线(Hermite)、贝塞尔(Bezier)曲线、自然样条曲线(Natural cubic splines)。

6.2 曲线的函数表现方式

参数化三次多项式函数能很好的描述曲线。一个N次多相似函数表示如下。当n为3时,如下函数能够很好的描述一条曲线。 函数的三种表现方式为显函数、隐函数,和参数函数。其中显函数表示如下。 隐函数表示如下。 参数函数表示如下。 表示曲线的带三次多项式的参数函数如下。 其矩阵形式表示如下。其中ax…dy矩阵为参数矩阵,需要根据控制的的坐标以及曲线类型计算。 其简写形式如下。 对于给定的控制点,将它们连接成曲线的方式有多种,在不同的环境下可以根据它们的优缺点选择最适合的方式。总的来说分为内插值算法和进似算法。 内插值算法需要将所有控制点直接连接成一条曲线。如Hermite曲线和自然三次样条曲线。进似算法计算出的曲线不需要通过所有的控制点,如贝塞尔曲线。近似算法允许移动单一的控制点,在不影响其他部分的前提下,仅更改曲线的一部分,称为局部控制。

6.3 贝塞尔曲线

贝塞尔曲线由许多控制点近似形成的曲线。这里讨论最简单的由4个控制点组成的贝塞尔曲线。定义:4个控制点分为两个终点P0和P3,两个内部控制点P1和P2。控制点P0和P1的连线、以及P2和P3的连线分别是曲线的两条切线。可以得如下两个方程。 根据P0和P3是曲线的起点和终点可以得到如下两个方程。 将上述的4个方程写为矩阵形式可以得到。 通过矩阵的转换,最后算出参数矩阵C和控制点矩阵G的关系如下。 最后得到曲线上任意点Pt的函数如下。M称为基矩阵,G称为集合矩阵。 在贝塞尔曲线的矩阵基础上再次转化可以得到如下曲线复合函数。其中四个参数称为伯恩斯坦(Bernstein)多项式。 对于复杂的贝塞尔曲线,对n次多项式都适用的通用公式如下。 描述三次贝塞尔曲线的方式是适用算法描述。下图中De Castejau算法描述了如何通过4个的控制点递归建立一条贝塞尔曲线的过程。 De Castejau算法绘制贝塞尔曲线示意图程序中绘制贝塞尔曲线的方式如下。 贝塞尔曲线绘制示意图

6.4 算法艺术和程序建模

算法艺术(也称程序建模)是除位图和矢量图之外的第三中图像格式。它通过基于数学计算或者独特的算法来编写计算机程序,创建数字图像。它和矢量图的区别在于,后者基于已经想象好的具体几何形状,而后者却不是。 算法艺术最好的例子就是分形图像的生成。分形是一种具有递归循环结构的图像。自然界中的分形结构如下。 自然界中的分形结构下图中的科赫雪花(Koch snowflake)是算法艺术的例子。 科赫雪花下图中的谢尔宾斯基垫片(Sierpinski’s gasket)同样也是算法艺术的例子。 谢尔宾斯基垫片Mandelbrot分形并没有明确创造出一个无穷重复形状的分形,而是通过计算本身得到一个美丽复杂的几何形状。

OK,本文到此结束,希望对大家有所帮助。

用户评论

毒舌妖后

学习数字媒体基础真敲打好!

    有19位网友表示赞同!

我一个人

期待了解最新的数字媒体技术和趋势!

    有10位网友表示赞同!

┲﹊怅惘。

这样课程感觉很有深度,能够让我更好地 understand 数字媒体的世界!

    有15位网友表示赞同!

败类

想从零开始学习数字媒体,这门课看起来合适!

    有6位网友表示赞同!

安陌醉生

最近对数字媒体比较感兴趣,正好来学习一下基础知识!

    有18位网友表示赞同!

寂莫

不知道课程里会讲很多什么具体内容呢?

    有16位网友表示赞同!

巷口酒肆

我之前学过一些简单的数字媒体,想深入学习更专业的知识!

    有16位网友表示赞同!

玻璃渣子

希望能掌握一些实用的技能,将来在工作中能派上用场!

    有12位网友表示赞同!

别悲哀

听说这门课老师讲得很深入,期待课程直播!

    有9位网友表示赞同!

走过海棠暮

数字媒体发展越来越快,基础知识很重要啊!

    有10位网友表示赞同!

你与清晨阳光

终于找到了一门适合学习数字媒体基础的课程了!

    有11位网友表示赞同!

心脏偷懒

感觉这种课程很有深度,会学到很多新东西!

    有7位网友表示赞同!

顶个蘑菇闯天下i

我已经开始期待学习这门课的内容了!

    有15位网友表示赞同!

淡抹丶悲伤

数字媒体越来越重要啦,学习它对我来说非常有意义!

    有18位网友表示赞同!

孤岛晴空

希望课程能让我理解数字媒体的运作原理!

    有7位网友表示赞同!

逾期不候

学习一些数字媒体基础知识,可以拓展我的视野!

    有20位网友表示赞同!

发型不乱一切好办

这个标题看着就很专业了,一定能学到很多关于数字媒体的信息!

    有16位网友表示赞同!

命里缺他

想了解一下数字媒体的市场现状和发展趋势!

    有19位网友表示赞同!

执拗旧人

这门课应该会介绍一些常用的数字媒体工具吧?

    有10位网友表示赞同!

【深入解析数字媒体基础知识:第二部分】相关文章:

1.蛤蟆讨媳妇【哈尼族民间故事】

2.米颠拜石

3.王羲之临池学书

4.清代敢于创新的“浓墨宰相”——刘墉

5.“巧取豪夺”的由来--米芾逸事

6.荒唐洁癖 惜砚如身(米芾逸事)

7.拜石为兄--米芾逸事

8.郑板桥轶事十则

9.王献之被公主抢亲后的悲惨人生

10.史上真实张三丰:在棺材中竟神奇复活

上一篇:未来十年,安乐死可能成为更受青睐的死亡方式 下一篇:古典诗篇赠别苏子远赴边疆之旅