视频驱动的综合场景表达方法与呈现技术

来源 :北京大学 | 被引量 : 0次 | 上传用户:sym409198933
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
综合媒体并不是一种具体的媒体形式,而是文本、动画、音频、视频、交互性信息的综合表达,是由多种媒体信息有机构成的动态可交互集合,支持按照指定的时间、空间布局同步呈现各种媒体,可以描述各媒体元素时间、空间场景布局等信息,并且支持媒体处理以及与用户的交互。这些综合媒体内容是通过综合场景来组织与管理的。   用综合场景表达综合媒体环境,首先需要考虑两个问题,一是数据的组织表示,也就是综合场景的表达方法;二是场景的解析管理与呈现,也就是综合场景的呈现技术。   综合场景的表达需要包含各种元数据信息(例如关于音视频资源的信息、图形图片信息、文本信息等等)以及呈现信息(比如场景表示所采用的描述语言)。在数据信息的组织管理上本文采用了MPEG-21的数字内容项(Digital Item)相关标准来对这些数据进行表示,呈现信息则采用MPEG轻量级应用场景表示标准LASeR(Lightweight Application Scene Representation),通过将二者结合,本文设计并实现了MPEG结构化信息呈现(Presentation of Structured Information)的标准,提出了综合场景的表达方法。相关提案被MPEG标准组接收,该标准将以MPEG-21 Digital Item标准补篇的形式发布。   在此基础上,本文同时设计并实现了一个综合场景引擎,可以进行综合场景解析以及对场景中多个对象和用户交互的管理以及呈现,实现了综合场景的呈现技术。在综合场景引擎中,本文提出了并应用了基于对象的时序模型来处理场景中各元素的时间管理,据此所写的论文也被PCM2008会议所接收。相关的理论在北京奥运WIM TV试验系统中也得到了有效的验证。   本文将综合场景与视频分析引擎相结合,提出了一个增量场景模型来处理非预期的场景内容,解决了处理动态场景的技术问题,实现了综合场景的一种高层次应用。在本文提出的系统设计中,首先利用视频分析引擎分析来自各种流媒体服务系统的视频数据,从中解析出一些语义线索(例如新闻中的字幕、人脸信息或者关键镜头的切换等等),这些语义线索信息以增量场景方式传送给用户终端。在用户终端上,视音频与动态增量信息以综合场景的方式进行集成,即增量信息以叠加的方式添加到用户终端初始场景之中,从而支持用户与视频的动态交互,此即本文设计的增量场景处理模型。利用这一模型,可以支持用户在视频中点击其感兴趣的内容,并将这些用户互动信息反馈给服务端,服务端对海量用户点击数据进行分析处理,生成一些记录用户敏感区域的虚拟场景,从而支持用户在一种内容丰富的可交互环境中消费数字媒体内容。这就是本文所提出的基于用户标注的综合场景系统。   在标准研究和模型设计的基础上,本文进行了软件系统开发和可行性验证。
其他文献
文字是一份电子文档的主要内容,而字体是文字的一个重要属性,任何文字都不能脱离字体而单独存在。在文档格式转换中,对字体的处理是一个十分重要的方面。   为了保证电子文档
本文首先从项目背景方面探讨了国内外P2P技术研究现状,P2P流媒体应用的研究现状。对本文的研究内容进行了阐述,对本文研究的意义进行简要概括。   本文分析了Bancast原有流
随着下一代网络和第三代移动通信技术的发展,通信领域出现了全新的市场需求和商业模式,人们对网络业务的需求也逐步呈现出多样化、综合化和个性化的趋势。以软交换为核心的下一
全局函数指针具有生命周期长,在内存中的位置易于获取等特点,使得针对全局函数指针的攻击成为了一种常见的攻击手段。这类攻击能够改变程序的执行流程,转而执行攻击者所期望的恶
开放平台作为一种全新的业务模式,在当今互联网时代发挥着巨大的作用。面对来自于互联网的激烈竞争,传统电信行业迫切的需要通过开放自身的用户数据,为第三方企业或个人开发
现代城市的快速发展以及遥感、航天海量数据的不断更新,要求尽可能快速地获取城市中的地理信息。利用航空影像获取城市地理环境信息是城市规划的主要技术之一,而如何从航空影像
EPCglobal系统被越来越多的应用到各行各业,但是其安全性还不能得到保证。使用现在的方法,很难评估网络攻击对EPCglobal系统造成的影响。如果直接对需要测试的系统进行测试,
无线传感器网络的出现为很多领域带来了全新的应用方式。在环境监测领域,无线传感器网络使很多传统方法无法完成的监测任务成为可能。本文针对复杂河道中的环境监测问题提出了
声誉模型被视为是对等系统中解决文件污染,蠕虫,病毒等安全问题的有效机制,因此对等系统将声誉模型作为其协议设计不可或缺的一部分。然而,由于对等系统的开放性,它允许任何节点投
本文的研究来源于“国家科技基础条件平台应用服务支撑系统”项目下的“网络科技资源应用集成环境建设”子项目。元数据具有资源描述、发现、识别和资源管理等作用,针对我国科