论文部分内容阅读
古人云:“温故而知新”。那些没落的、已经被淘汰的技术,我们大可置之不理地迅速忘掉,而那些至今依然具有生命力、不断升级并继续影响计算机应用的技术,我们不能忘记它们的贡献。这些技术并非最新,但它的影响力持续不断,值得我们一起去咀嚼、回味。
数字多媒体的三度跨越
文/ jl_chang
视频压缩技术开创了PC多媒体时代,讲述MPEG的故事,让我们聆听。
MPEG-1数字视频压缩标准被应用于VCD光碟中,使得计算机可以直接播放影碟,娱乐性大大增强。接下来,就是具有MPEG-2压缩技术的DVD播放能力,提供相当不俗的视频/音频质量。而这个时候,互联网已经走入千家万户,以之为载体的视频流开始变得火爆,MPEG-4压缩技术成为新宠。向前展望,HDTV电视和HDTV质量视频开始进入普及推广阶段,鉴于数字技术的先天融合性,基于PC的多媒体应用也将配合发展。下面,我们就对数字视频技术的发展作完整的回顾。

图1早期的MPEG-1硬件解压卡
MEPG-1: 多媒体时代的开始
我们知道,目前的电视机属于模拟制式,从物理学上看,其对应的视频/音频电信号就是模拟的正弦电波。而计算机以二进制数字技术为基础,所有的信息都以“0”和“1”来表达,而从物理学上看,它所使用的各类电信号都是数字化的方波。不同的技术体系决定了模拟技术与数字技术在多媒体发展方向上的巨大差异,其中关键的一环就是,数字多媒体普遍要求使用特定的压缩技术才能够使之正常工作。
MPEG-1(ISO/IEC1172)就是我们所知的第一个视频压缩标准,该标准由MPEG动态图像专家组在1992年提出(MPEG,全称为Moving Pictures Experts Group)。MPEG专家组专门负责运动图像(MPEG的视频部分)及伴音编码压缩技术(MPEG的音频部分)的标准化工作,以提供给产业界一个可遵循的共同规范。该组织成立于1988年,发起者为ISO国际标准化协会(International Standards Organization)与IEC国际电子协会(International Electronic Committee)。MPEG-1的制定目标是在1-1.5Mbps的低速率下,提供30帧NTSC标准运动图像的实时播放—一般以640× 480作为标准图像的分辨率,若像素为真彩色,每个像素就要使用24bit二进制数来表达,而流畅的运动图像播放效果至少要求每秒30帧,这样它的标准数据率就达到640×480×24×30=221Mbps,相当于28MBps。换句话说,如果要播放NTSC视频,要求的最低码率为28MBps,一张600MB容量的CD-ROM光盘只能够存储20秒时间的NTSC视频。同时要求光盘的读取设备能够以同样的速度将数据读出,而这还仅仅是图像的数据量,不包括附带的声音。即便以现在的技术水平,这样的高标准仍然难以达到,采用压缩技术将成为唯一的选择。

图2MPEG-2编码专业设备所用的芯片
MPEG-1很好的实现了这个目标,它的压缩比高达200:1,也就是可以将221Mbps的NTSC视频压缩到只有1.2Mbps码率,伴音编码达到CD音质水准—使用这种算法,我们就可以将一部120分钟长的电影压缩到1.2GB左右,用两张CD光盘即可装载。在具体实现上,MPEG-1借助了JPEG图像压缩技术,具体压缩过程如下:自第一张画面开始,利用JPEG算法将其压缩为JPEG图片,并以此作为参考影像—通常它也被称为“I帧(Intracoded frame,内部编码帧)”。接下来,同样利用JPEG算法压缩下一张画面,并通过比较与I帧的不同,剔除重复的信息,只记录两幅画面的差异—它也被称为“P帧(Predicted frame,预先参照帧)”。然后下面的步骤依此类推,直到压缩完30幅图像为止。为了纠正P帧生成时逐级放大的影像误差,MPEG-1要求根据情况重新插入一张新的I帧来进行重设定,或者插入一张用以比较前后两帧图像差异的特殊帧,以达到提升算法效能的目的—这称为“B帧(Bidirectional frame,双向修正帧)”。不过,MPEG-1使用的是固定的码率,这样无法根据图像的细节情况进行适应性校正,这个缺点在后来的MPEG-2编码中得到修正。
在前期的压缩和播放时的解压处理上,MPEG-1并不是等向性的,压缩算法需要非常庞大的运算量,而解压算法所需的运算量则少得多。当时的PC根本无法完成压缩处理任务,而必须采用价格昂贵的专业设备才能进行处理,幸好这不是什么问题,光碟生产商们有足够的财力购买设备,而普通用户又不需要自行制作MPEG-1多媒体影像。

图3采用MPEG-4压缩技术的硬盘录像机
MPEG-1技术的出现对多媒体应用产生革命性的影响,采用这项技术,业界才能在两张VCD光盘中装载入两小时的电影节目,由此也催生了一个庞大的VCD产业。而PC机同样因此受益,当时PC还处在486阶段,用户们使用一块专门的MPEG-1硬解压卡才能流畅播放VCD影碟。但随着硬件技术的不断发展,CPU软解压方式逐步取代成本较高的硬解压卡。再往后,显卡厂商直接在图形芯片中集成了MPEG-1硬解压能力,大大降低了CPU的工作负担。可以说,MPEG-1标准的出现,奏响PC机走向多媒体的号角,它的功能也由此得到进一步的延伸。
MPEG-2: DVD与HDTV浪潮
在MPEG-1成功推出之后,MPEG组织开始着手下一代MPEG-2压缩技术的标准制定。1996年,MPEG-2(ISO/IEC13818)标准正式推出,它在图像分辨率、声音质量等指标上都有长足的进步,可以达到电视广播甚至HDTV高清晰数字电视的标准—在当时,数字电视已经提上日程,为其设计对应的压缩编码技术自然而然。MPEG-2实际上是以MPEG-1为基础,基本原理差别不大,但不同之处在于MPEG-2可支持动态码率,根据图像细节和清晰程度的不同在3-15Mbps之间调整,提供SNR、时间、空间三种分级编码,压缩比在40:1左右。如果将该标准应用于卫星广播,在一个传统的模拟信道中可提供5路数字化的NTSC质量编码节目。而120分钟长的电影可以被压缩到4-8GB—容量比MPEG-1压缩处理的数据大得多,但MPEG-2在画面清晰度上有质的提高。另外,MPEG-2可支持最多8声道扩展,亦即一个低音声道和多达7个伴音声道,音频效果远比MPEG-1出色。
MPEG-2的一大方向是为广播、有线电视网、电缆网络等提供广播级的数字视频,但这些应用并没有获得全面展开,因为现有的电视、广播都还属于模拟系统,只有在中间的卫星传输环节可以进行转换处理。绝大多数消费者都是从DVD影碟中真正感受MPEG-2技术—DVD光盘拥有4.7GB(单面单层)和8.5GB(单面双层)的高容量,采用MPEG-2压缩技术刚好可以装载2小时长的电影节目,而它的清晰度指标明显优于VCD。DVD技术在得到应用之后获得市场的广泛欢迎,VCD产业和计算机的光存储产业都朝向DVD方向升级,到现在为止,DVD应用已经是家庭影院和PC机中的绝对主流了。在DVD开始普及的时候,计算机已经拥有强劲的性能,图形厂商也先知先觉,在自己的GPU芯片中设计了MPEG-2硬件引擎,所以PC机播放DVD视频没有受到过什么困扰。当然,MPEG-2要求的编码算法照样极其耗费资源,当时普通计算机根本无法胜任,多媒体工作室往往都会使用专用的工作站来执行MPEG-2压缩编码任务。
在MPEG-2之后,MPEG组织还打算专门为HDTV制定MPEG-3压缩标准,但由于MPEG-2的性能已经相当出色,完全可适用于HDTV,MPEG-3标准没有被正式制定。而在数字电视方面,无论是美国的ATSC、欧洲的DVB还是日本的ISDB,都选择了MPEG-2作为视频压缩的主要标准。
MPEG-4: 互动性的优秀技术
无论是MPEG-1还是MPEG-2,它们都是定位于用户被动接受的多媒体视频压缩技术,换句话说,用户只有被动接收、播放这些多媒体的权限,而无法亲自参与到视频媒体的制作中,可以说是一项比较机械、未顾及到信息交互性的技术—在制定标准之时,还不存在这类需求,MPEG工作组自然做不到未雨绸缪。再者,互联网应用的飞速发展对传输多媒体数据提出迫切的需求,而无论MPEG-1还是MPEG-2,生成的多媒体文件体积过于庞大,根本无法实现网络的实时传播。意识到这两方面的不足,MPEG工作组决定开发一项针对未来的视频压缩技术,它就是现在十分流行的MPEG-4。
1999年1月,MPEG-4标准的第一版推出,不过MPEG组织很快又在同年12月公布了该标准的第二版,并被ISO正式编号为“ISO/IEC14496”。标准提出之后,MPEG-4引起人们的广泛关注,但当时还缺乏实质性的应用支撑,很多消费者都不了解它的具体优点体现在什么地方。本来,互动性是MPEG-4标准最大的要务,用户不仅仅可以被动地接收、播放MPEG-4视频流,更可以亲手进行制作、编辑,带领人们进入一个全新的媒体互动时代。然而,人们更直接体验到的好处还是MPEG-4可以在高压缩率条件下获得较高清晰度的画面质量,那么,MPEG-4如何做到这一点?
答案就是MPEG-4标准引入了一项新颖的“图像模型”概念,我们知道,多媒体的具体编码对象是视频和音频,术语称之为“AV对象”,连续的AV对象组合在一起就可以形成AV场景,也就是多媒体数据流。MPEG-4标准紧紧围绕着AV对象的编码、存储、传输和组合进行技术规格制定,尽一切可能提高上述处理步骤的高效性。例如,在视频编码方面,MPEG-4支持对自然/合成视觉对象的编码,其中合成的视觉对象指的就是2D、3D动画和人面部表情动画等等需要图形合成的元素。MPEG-4没有对每一帧图像的详细内容都进行处理,而只是处理图像帧与帧之间存在差异的元素,相同的元素则被完全舍去,这样编码生成的多媒体文件的体积就被大大缩小了。而在音频编码上,MPEG-4则是借助一组特殊编码工具,对人声、音乐等自然声音对象和具有回响、空间方位感的合成声音对象分别进行处理,确保其高压缩比得以实现。从算法角度来看,MPEG-4之于MPEG-1、MPEG-2可以说是一个大跨越。而在上述机制帮助下,MPEG-4很好实现了预期设计目标:获得高压缩率(可达到100:1)的同时保持很高的成像清晰度。如果采用MPEG-4编码,一部高清晰度的DVD电影可以被压缩存放在一张或两张CD光盘之内,且保持优良的画面品质,非常节省存储空间。其次,MPEG-4在码率上弹性空间很大,它既可支持64kbps码率以下的视频应用,也可以支持高达38.4Mbps码率的广播/HDTV等级的视频应用。这些特性使得MPEG-4非常适合被用于针对互联网传输的视频文件的制作,加上MPEG-4所提供的交互性,普通用户都可以根据自己喜好,制造出个性化的多媒体视频文件并将其放在互联网上共享,这也是今天我们在网络上可以看到大量实时视频服务的主要原因。MPEG工作组的本意是拓展多媒体娱乐的范畴,未想到它却被盗版业首先发扬光大。
MPEG-4还存在的另一个优点,尽管算法复杂,但它对机器的硬件配置要求却很低,300MHz以上的处理器、64MB内存和拥有8MB显存的显卡就可以流畅播放MPEG-4视频文件。早些时候,市面上的多数显卡都没有集成硬件MPEG-4解码引擎,CPU占用率会高一些,但目前nVIDIA和ATi的新一代产品均将它加以整合,用户只要手头有一部主流性能的电脑,就可以借助它来制作MPEG-4视频,这或许是MPEG-4技术在PC平台中较实质性的应用吧。而在家庭影音娱乐领域,MPEG-4主要为硬盘录像机所采用—这类产品可以将模拟电视或数字电视节目直接录制在硬盘上,清晰度高、压缩率大的MPEG-4几乎是唯一的选择。而随着数字电视逐渐流行,这类硬盘录像机应该会变得寻常可见。
结束语
从MPEG-1到MPEG-4,每一次新标准的推行都带来计算机多媒体应用的巨大提升。现在,MPEG-2与MPEG-4的成果还没有得到充分的挖掘,而HDTV质量视频的普及又将成为今后计算机视频应用上的又一个兴奋点。
注:TDX2002组织——全球著名的地下电影发行组织,每年在网上放出数千部最新且高品质的DVDrip影片;0dayz组织——全球著名的破解组织,名字的意思是在不到一天的时间里破解各类软件或其他产品。
DVDrip与DivX、XviD编码技术
2004年视频领域最热门的应用莫过于DVDrip,简单点说,它是一种高压缩比的视频压缩技术,它的核心部分其实由三部分组成:用MPEG-4技术进行视频压缩,用MP3或AC-3技术来压缩音频部分,并结合字幕播放软件实现外挂字幕。不过在具体的视频编码实现方面,DVDrip可以使用多种技术,其中最流行的就是大家常见到的DivX和XviD。如果仔细观察,便会发现一个有趣的现象:“XviD”与“DivX”的字母排列次序刚好相互颠倒,这其中大有玄机,而要阐述二者的关系,我们还得从微软公司说起。

1998年,微软公司开发出针对PC平台的MPEG-4编码器,它们包含MS MPEG4 V1、MS MPEG-4 V2、MS MPEG-4 V3系列编码内核,其中V1和V2版本用于制作AVI文件,但编码质量都不够理想,始终未能得以流行。V3版本开始则有了非常明显的改进,微软遂决定将它专用于Windows Media流媒体(也就是我们熟知的ASF格式),无法用于通行的AVI格式中,意图获得该领域的绝对优势。这种做法引起一些程序员的强烈反感,一个27岁的法籍影音发烧友罗达(Rota)及电脑黑客基尔(Gej)破解了MS MPEG-4 V3内核并将代码完全重写,让它可以支持AVI格式,并将一些压缩的参数对外开放。于是,一种新的MPEG-4编码器就诞生了,它就是著名的DivX 3.11,诞生时间是在1998年。
然而,DivX 3.11的出身有欠光明,实现产品化困难重重。面对此种情形,破解者之一的罗达联合一些精于视频编码的程序员,并在投资人士的支持下成立了一家名为“DivXNetworks”的技术公司(简称DXN)。随后,DXN发起了“ProjectMayo”开放源码项目,雄心勃勃计划开发出一套完全符合ISO MPEG-4标准的开源编码软件。这个项目吸引了大量软件高手的参与,在这些人的无偿帮助下,DXN很快开发出OpenDivX编码器和解码器的原型产品,之后又拿出性能更高的Encore 2编码器。在看起来一帆风顺的时候,最富戏剧性的事件上演了:DXN将原来的网站封闭,搞出一个DIVX.COM网站,发布了他们自己的DivX 4,源代码被完全封闭。DivX 4变成DXN的私有财产。整个0dayz组织宣布永远拒绝DXN公司的DivX 4/5,而原有OpenDivX项目的开发者重新组织起来,在最后一个OpenDivX版本的基础上开发一种完全遵守GPL公约的开源编码器,它就是XviD。
数字多媒体的三度跨越
文/ jl_chang
视频压缩技术开创了PC多媒体时代,讲述MPEG的故事,让我们聆听。
MPEG-1数字视频压缩标准被应用于VCD光碟中,使得计算机可以直接播放影碟,娱乐性大大增强。接下来,就是具有MPEG-2压缩技术的DVD播放能力,提供相当不俗的视频/音频质量。而这个时候,互联网已经走入千家万户,以之为载体的视频流开始变得火爆,MPEG-4压缩技术成为新宠。向前展望,HDTV电视和HDTV质量视频开始进入普及推广阶段,鉴于数字技术的先天融合性,基于PC的多媒体应用也将配合发展。下面,我们就对数字视频技术的发展作完整的回顾。

图1早期的MPEG-1硬件解压卡
MEPG-1: 多媒体时代的开始
我们知道,目前的电视机属于模拟制式,从物理学上看,其对应的视频/音频电信号就是模拟的正弦电波。而计算机以二进制数字技术为基础,所有的信息都以“0”和“1”来表达,而从物理学上看,它所使用的各类电信号都是数字化的方波。不同的技术体系决定了模拟技术与数字技术在多媒体发展方向上的巨大差异,其中关键的一环就是,数字多媒体普遍要求使用特定的压缩技术才能够使之正常工作。
MPEG-1(ISO/IEC1172)就是我们所知的第一个视频压缩标准,该标准由MPEG动态图像专家组在1992年提出(MPEG,全称为Moving Pictures Experts Group)。MPEG专家组专门负责运动图像(MPEG的视频部分)及伴音编码压缩技术(MPEG的音频部分)的标准化工作,以提供给产业界一个可遵循的共同规范。该组织成立于1988年,发起者为ISO国际标准化协会(International Standards Organization)与IEC国际电子协会(International Electronic Committee)。MPEG-1的制定目标是在1-1.5Mbps的低速率下,提供30帧NTSC标准运动图像的实时播放—一般以640× 480作为标准图像的分辨率,若像素为真彩色,每个像素就要使用24bit二进制数来表达,而流畅的运动图像播放效果至少要求每秒30帧,这样它的标准数据率就达到640×480×24×30=221Mbps,相当于28MBps。换句话说,如果要播放NTSC视频,要求的最低码率为28MBps,一张600MB容量的CD-ROM光盘只能够存储20秒时间的NTSC视频。同时要求光盘的读取设备能够以同样的速度将数据读出,而这还仅仅是图像的数据量,不包括附带的声音。即便以现在的技术水平,这样的高标准仍然难以达到,采用压缩技术将成为唯一的选择。

图2MPEG-2编码专业设备所用的芯片
MPEG-1很好的实现了这个目标,它的压缩比高达200:1,也就是可以将221Mbps的NTSC视频压缩到只有1.2Mbps码率,伴音编码达到CD音质水准—使用这种算法,我们就可以将一部120分钟长的电影压缩到1.2GB左右,用两张CD光盘即可装载。在具体实现上,MPEG-1借助了JPEG图像压缩技术,具体压缩过程如下:自第一张画面开始,利用JPEG算法将其压缩为JPEG图片,并以此作为参考影像—通常它也被称为“I帧(Intracoded frame,内部编码帧)”。接下来,同样利用JPEG算法压缩下一张画面,并通过比较与I帧的不同,剔除重复的信息,只记录两幅画面的差异—它也被称为“P帧(Predicted frame,预先参照帧)”。然后下面的步骤依此类推,直到压缩完30幅图像为止。为了纠正P帧生成时逐级放大的影像误差,MPEG-1要求根据情况重新插入一张新的I帧来进行重设定,或者插入一张用以比较前后两帧图像差异的特殊帧,以达到提升算法效能的目的—这称为“B帧(Bidirectional frame,双向修正帧)”。不过,MPEG-1使用的是固定的码率,这样无法根据图像的细节情况进行适应性校正,这个缺点在后来的MPEG-2编码中得到修正。
在前期的压缩和播放时的解压处理上,MPEG-1并不是等向性的,压缩算法需要非常庞大的运算量,而解压算法所需的运算量则少得多。当时的PC根本无法完成压缩处理任务,而必须采用价格昂贵的专业设备才能进行处理,幸好这不是什么问题,光碟生产商们有足够的财力购买设备,而普通用户又不需要自行制作MPEG-1多媒体影像。

图3采用MPEG-4压缩技术的硬盘录像机
MPEG-1技术的出现对多媒体应用产生革命性的影响,采用这项技术,业界才能在两张VCD光盘中装载入两小时的电影节目,由此也催生了一个庞大的VCD产业。而PC机同样因此受益,当时PC还处在486阶段,用户们使用一块专门的MPEG-1硬解压卡才能流畅播放VCD影碟。但随着硬件技术的不断发展,CPU软解压方式逐步取代成本较高的硬解压卡。再往后,显卡厂商直接在图形芯片中集成了MPEG-1硬解压能力,大大降低了CPU的工作负担。可以说,MPEG-1标准的出现,奏响PC机走向多媒体的号角,它的功能也由此得到进一步的延伸。
MPEG-2: DVD与HDTV浪潮
在MPEG-1成功推出之后,MPEG组织开始着手下一代MPEG-2压缩技术的标准制定。1996年,MPEG-2(ISO/IEC13818)标准正式推出,它在图像分辨率、声音质量等指标上都有长足的进步,可以达到电视广播甚至HDTV高清晰数字电视的标准—在当时,数字电视已经提上日程,为其设计对应的压缩编码技术自然而然。MPEG-2实际上是以MPEG-1为基础,基本原理差别不大,但不同之处在于MPEG-2可支持动态码率,根据图像细节和清晰程度的不同在3-15Mbps之间调整,提供SNR、时间、空间三种分级编码,压缩比在40:1左右。如果将该标准应用于卫星广播,在一个传统的模拟信道中可提供5路数字化的NTSC质量编码节目。而120分钟长的电影可以被压缩到4-8GB—容量比MPEG-1压缩处理的数据大得多,但MPEG-2在画面清晰度上有质的提高。另外,MPEG-2可支持最多8声道扩展,亦即一个低音声道和多达7个伴音声道,音频效果远比MPEG-1出色。
MPEG-2的一大方向是为广播、有线电视网、电缆网络等提供广播级的数字视频,但这些应用并没有获得全面展开,因为现有的电视、广播都还属于模拟系统,只有在中间的卫星传输环节可以进行转换处理。绝大多数消费者都是从DVD影碟中真正感受MPEG-2技术—DVD光盘拥有4.7GB(单面单层)和8.5GB(单面双层)的高容量,采用MPEG-2压缩技术刚好可以装载2小时长的电影节目,而它的清晰度指标明显优于VCD。DVD技术在得到应用之后获得市场的广泛欢迎,VCD产业和计算机的光存储产业都朝向DVD方向升级,到现在为止,DVD应用已经是家庭影院和PC机中的绝对主流了。在DVD开始普及的时候,计算机已经拥有强劲的性能,图形厂商也先知先觉,在自己的GPU芯片中设计了MPEG-2硬件引擎,所以PC机播放DVD视频没有受到过什么困扰。当然,MPEG-2要求的编码算法照样极其耗费资源,当时普通计算机根本无法胜任,多媒体工作室往往都会使用专用的工作站来执行MPEG-2压缩编码任务。
在MPEG-2之后,MPEG组织还打算专门为HDTV制定MPEG-3压缩标准,但由于MPEG-2的性能已经相当出色,完全可适用于HDTV,MPEG-3标准没有被正式制定。而在数字电视方面,无论是美国的ATSC、欧洲的DVB还是日本的ISDB,都选择了MPEG-2作为视频压缩的主要标准。
MPEG-4: 互动性的优秀技术
无论是MPEG-1还是MPEG-2,它们都是定位于用户被动接受的多媒体视频压缩技术,换句话说,用户只有被动接收、播放这些多媒体的权限,而无法亲自参与到视频媒体的制作中,可以说是一项比较机械、未顾及到信息交互性的技术—在制定标准之时,还不存在这类需求,MPEG工作组自然做不到未雨绸缪。再者,互联网应用的飞速发展对传输多媒体数据提出迫切的需求,而无论MPEG-1还是MPEG-2,生成的多媒体文件体积过于庞大,根本无法实现网络的实时传播。意识到这两方面的不足,MPEG工作组决定开发一项针对未来的视频压缩技术,它就是现在十分流行的MPEG-4。
1999年1月,MPEG-4标准的第一版推出,不过MPEG组织很快又在同年12月公布了该标准的第二版,并被ISO正式编号为“ISO/IEC14496”。标准提出之后,MPEG-4引起人们的广泛关注,但当时还缺乏实质性的应用支撑,很多消费者都不了解它的具体优点体现在什么地方。本来,互动性是MPEG-4标准最大的要务,用户不仅仅可以被动地接收、播放MPEG-4视频流,更可以亲手进行制作、编辑,带领人们进入一个全新的媒体互动时代。然而,人们更直接体验到的好处还是MPEG-4可以在高压缩率条件下获得较高清晰度的画面质量,那么,MPEG-4如何做到这一点?
答案就是MPEG-4标准引入了一项新颖的“图像模型”概念,我们知道,多媒体的具体编码对象是视频和音频,术语称之为“AV对象”,连续的AV对象组合在一起就可以形成AV场景,也就是多媒体数据流。MPEG-4标准紧紧围绕着AV对象的编码、存储、传输和组合进行技术规格制定,尽一切可能提高上述处理步骤的高效性。例如,在视频编码方面,MPEG-4支持对自然/合成视觉对象的编码,其中合成的视觉对象指的就是2D、3D动画和人面部表情动画等等需要图形合成的元素。MPEG-4没有对每一帧图像的详细内容都进行处理,而只是处理图像帧与帧之间存在差异的元素,相同的元素则被完全舍去,这样编码生成的多媒体文件的体积就被大大缩小了。而在音频编码上,MPEG-4则是借助一组特殊编码工具,对人声、音乐等自然声音对象和具有回响、空间方位感的合成声音对象分别进行处理,确保其高压缩比得以实现。从算法角度来看,MPEG-4之于MPEG-1、MPEG-2可以说是一个大跨越。而在上述机制帮助下,MPEG-4很好实现了预期设计目标:获得高压缩率(可达到100:1)的同时保持很高的成像清晰度。如果采用MPEG-4编码,一部高清晰度的DVD电影可以被压缩存放在一张或两张CD光盘之内,且保持优良的画面品质,非常节省存储空间。其次,MPEG-4在码率上弹性空间很大,它既可支持64kbps码率以下的视频应用,也可以支持高达38.4Mbps码率的广播/HDTV等级的视频应用。这些特性使得MPEG-4非常适合被用于针对互联网传输的视频文件的制作,加上MPEG-4所提供的交互性,普通用户都可以根据自己喜好,制造出个性化的多媒体视频文件并将其放在互联网上共享,这也是今天我们在网络上可以看到大量实时视频服务的主要原因。MPEG工作组的本意是拓展多媒体娱乐的范畴,未想到它却被盗版业首先发扬光大。
MPEG-4还存在的另一个优点,尽管算法复杂,但它对机器的硬件配置要求却很低,300MHz以上的处理器、64MB内存和拥有8MB显存的显卡就可以流畅播放MPEG-4视频文件。早些时候,市面上的多数显卡都没有集成硬件MPEG-4解码引擎,CPU占用率会高一些,但目前nVIDIA和ATi的新一代产品均将它加以整合,用户只要手头有一部主流性能的电脑,就可以借助它来制作MPEG-4视频,这或许是MPEG-4技术在PC平台中较实质性的应用吧。而在家庭影音娱乐领域,MPEG-4主要为硬盘录像机所采用—这类产品可以将模拟电视或数字电视节目直接录制在硬盘上,清晰度高、压缩率大的MPEG-4几乎是唯一的选择。而随着数字电视逐渐流行,这类硬盘录像机应该会变得寻常可见。
结束语
从MPEG-1到MPEG-4,每一次新标准的推行都带来计算机多媒体应用的巨大提升。现在,MPEG-2与MPEG-4的成果还没有得到充分的挖掘,而HDTV质量视频的普及又将成为今后计算机视频应用上的又一个兴奋点。
注:TDX2002组织——全球著名的地下电影发行组织,每年在网上放出数千部最新且高品质的DVDrip影片;0dayz组织——全球著名的破解组织,名字的意思是在不到一天的时间里破解各类软件或其他产品。
DVDrip与DivX、XviD编码技术
2004年视频领域最热门的应用莫过于DVDrip,简单点说,它是一种高压缩比的视频压缩技术,它的核心部分其实由三部分组成:用MPEG-4技术进行视频压缩,用MP3或AC-3技术来压缩音频部分,并结合字幕播放软件实现外挂字幕。不过在具体的视频编码实现方面,DVDrip可以使用多种技术,其中最流行的就是大家常见到的DivX和XviD。如果仔细观察,便会发现一个有趣的现象:“XviD”与“DivX”的字母排列次序刚好相互颠倒,这其中大有玄机,而要阐述二者的关系,我们还得从微软公司说起。

1998年,微软公司开发出针对PC平台的MPEG-4编码器,它们包含MS MPEG4 V1、MS MPEG-4 V2、MS MPEG-4 V3系列编码内核,其中V1和V2版本用于制作AVI文件,但编码质量都不够理想,始终未能得以流行。V3版本开始则有了非常明显的改进,微软遂决定将它专用于Windows Media流媒体(也就是我们熟知的ASF格式),无法用于通行的AVI格式中,意图获得该领域的绝对优势。这种做法引起一些程序员的强烈反感,一个27岁的法籍影音发烧友罗达(Rota)及电脑黑客基尔(Gej)破解了MS MPEG-4 V3内核并将代码完全重写,让它可以支持AVI格式,并将一些压缩的参数对外开放。于是,一种新的MPEG-4编码器就诞生了,它就是著名的DivX 3.11,诞生时间是在1998年。
然而,DivX 3.11的出身有欠光明,实现产品化困难重重。面对此种情形,破解者之一的罗达联合一些精于视频编码的程序员,并在投资人士的支持下成立了一家名为“DivXNetworks”的技术公司(简称DXN)。随后,DXN发起了“ProjectMayo”开放源码项目,雄心勃勃计划开发出一套完全符合ISO MPEG-4标准的开源编码软件。这个项目吸引了大量软件高手的参与,在这些人的无偿帮助下,DXN很快开发出OpenDivX编码器和解码器的原型产品,之后又拿出性能更高的Encore 2编码器。在看起来一帆风顺的时候,最富戏剧性的事件上演了:DXN将原来的网站封闭,搞出一个DIVX.COM网站,发布了他们自己的DivX 4,源代码被完全封闭。DivX 4变成DXN的私有财产。整个0dayz组织宣布永远拒绝DXN公司的DivX 4/5,而原有OpenDivX项目的开发者重新组织起来,在最后一个OpenDivX版本的基础上开发一种完全遵守GPL公约的开源编码器,它就是XviD。