MPEG-7标准概述
MPEG-7标准概述
一、MPEG-7产生的背景
为解决现有的国际标准中还没有多媒体信息定位工具的问题,活动图像专家组的成员们决定在该应用领域制订一项新的国际标准--MPEG-7,其正式名称为"多媒体内容描述接口(Mul- timedia Content Description Interface)"。MPEG-7标准可独立于其它MPEG标准使用,而MPEG-4标准所定义的音、视频对象的描述适用于MPEG-7。
二、MPEG-7的对象
制订MPEG-7标准的目的是要建立一种针对各类多媒体信息的描述标准。该描述与内容有关,并能够达到快速高效地搜索用户感兴趣的素材。 无论形式如何,描述都可以附在任何一种多媒体素材之后,具有此种附加信息的存储素材即可被方便地索引和搜索。MPEG-7描述内容在一定程度上仍依赖于MPEG-4标准,该标准提供了一种将声音、图像内容作为在时间(同步)和空间(屏幕)方面有一定联系的对象来编码的方法。 对不同类型、不同应用的多媒体信息作标准化描述,可以在若干不同的语义层上进行。以视频内容为例,低抽象的语义层可以是对场景中物体的形状、大小、纹理、色彩和位置的描述,而最高抽象的语义层则以高效编码的形式给出语义信息,也可以有中间层存在,不同的应用决定了相同的内容可以有不同的描述,对不同类型的信息描述也不相同。
对MPEG-7而言,需要描述的各种多媒体信息素材包括静止图片、图形、声音、运动图像,以及有关这些元素如何组合成多媒体表述的组合信息。因此,MPEG-7定义的"多媒体"含义十分广泛,主要包括:
1.客观类:图像、图表、文本、三维模型、音频、语音、视频等;
2.主观类:对对象/事件的概括、人的感性色彩等;
3.合成类:各种元素之间的有机结合以构成真正意义的多媒体演示。
MPEG-7定义的"标准描述子集合(Standard Set of Descriptors)"用于描述各种类型的多媒体数据,与之相应的"描述方案(Description Schemes)"用于规范多媒体描述子集合的生成和不同描述子集合之间的联系。这些描述子集合与所指定的多媒体对象的内容联系紧密,采用提取对象特征的方法为实现基于内容的语义的准确检索提供了接口。在此基础上,MPEG-7定义了"描述定义语言(Description Definition Language)"来指定和生成描述方案。
DDL语言是MPEG-7的核心。
要充分地利用多媒体信息描述,特征的自动提取是十分有用的。但根据MPEG-7一贯坚持的"制订最少的、最有用的"原则,MPEG-7主要对便于多媒体信息分类的表达方法进行标准化;而特征提取算法、声音图像内容识别工具不属于MPEG-7标准的界定范围;同样,搜索机制和音频或视频回放技术也不包括在MPEG-7标准中,而只描述与搜索机制之间的接口。开发声音图像内容识别工具、特征抽取工具、搜索和音频视频回放工具是工业界的任务,并以此生产销售符合MPEG-7的产品。在标准制订过程中,活动图像专家组建立了一些编码工具,但这些编码工具只作研究之用,并不作为标准。
符合MPEG-7标准的描述可以是手工输入的,也可以是自动提取的,标准对此未作规定。但某些特征最好自动提取,另一些特征则很难甚至不可能自动提取,根据描述的内容和层次来决定。
MPEG-7虽然可以独立于其它MPEG标准使用,但是MPEG-7标准也利用了MPEG-4标准提供的用对象来描述声音图像数据的方法,该表达方法是多媒体信息分类过程的基础。同时,MPEG-7描述又可以帮助改进以往MPEG标准编码的性能,所以各MPEG标准是既相互独立又相互联系的。
三、MPEG-7标准的特点
MPEG-7标准中,最具特点的相关应用方案是交换处理、多媒体内容的个性化窗口和分配处理。
1.内容交换:一个可交互操作的内容描述标准使来自不同视频音频数据库的多媒体内容交换成为可能。MPEG-7提供了各种方法用来表达、翻译、交换和重新利用不同来源的视频音频资料。因为MPEG-7提出采用单一的可交互操作的交换格?剑庵纸换桓袷蕉懒⒂谌魏蜗低澈托畔⑻峁┥蹋苟嗝教迥谌菝枋龅幕セ坏靡允迪帧?
2.个性化窗口:MPEG-7标准提供的检索和交换视频音频数据结构和语义注解能力,使得在用户端能设定显示而无需从内容广播商那里再次将其以不同格式下载一遍。
3.分配处理:独立于任何系统、应用和厂商,MPEG-7将保证视频音频资料描述的交换能力。因此,服从此标准,来源不同的数据能适用各种各样的应用。
四、MPEG-7标准的应用
MPEG-7标准的应用领域十分广泛,包括数字图书馆、多媒体目录服务、广播媒体选择(广播波段、TV频道等)、多媒体编辑(个人电子新闻服务、媒体写作)等,在教育、娱乐(例如查找游戏、卡拉OK)、医疗应用和地理信息系统等领域也有潜在的应用价值。