论文部分内容阅读
视频检索的传统方法之一是首先从视频中摘取出文本信息(如标题,关键词等等),然后基于一关键字集上回答用户的查询,由于自动摘取文本信息的过程至今尚未自动化,因而从视频中摘取信息主要由人工来完成,这在实际应用上证明是不现实的,另一种方法则是上一情形的极端,即它是利用低层的视频内容,诸如颜色,纹理,形状,运动特征等等,目的在于克服人工摘取关键字所涉及的困难,文中提出了基于ToC视频结构的语义表达,从视频的