1000-9825/2002/13(04)0000-00 ©2002 Journal of Software 软件学报 ,
Ã
镜头内容分析及其在视频检索中的应用
林通 1, 张宏江 2, 封举富 1, 石青云 1
1(北京大学视觉与听觉信息处理国家重点实验室,北京 100871);
2(微软中国研究院,北京 100080)
E-mail: ******@iscas.; ******@.
http://
摘要: 本文提出了一种新的镜头内容分析方法,及其在视频检索中的两个应用:
了刻画一个镜头的内容变化,首先引入两个新的内容描述子:
捕捉那些持续时间最长的颜色,
,
,还可用于
实了本文方法在镜头检索和场景提取的优异表现.
关键词: 基于内容的视频检索;镜头内容分析;镜头相似性度量;场景结构提取
1 引言
随着在多媒体数据制造,存储,与传播方面取得的重大技术进步,数字视频已经成为人们的日常生活中不
十年来全球学术界和工业界一个富有挑战性的热门话题之一. 因此, 基于内容的视频检索(CBVR,
Content-based Video Retrieval)方面的研究和被称为多媒体内容描述接口的国际标准 MPEG-7 的制定也就引
起了人们广泛的关注.
通常一段视频数据可以划分为几个场景(也叫做故事单元),
是指一系列连续纪录的图像帧,
,它们一般发生在相同的时间和地点,出现相同的
:视频(video),场景(Scene),镜头
(Shot),和图像帧(Frame).
目前大多数研究主要集中于镜头边界检测和关键帧选取,
自然结构单元,,视频镜头通常用几个
关键帧来表示[1],颜色,纹理,
进行关键帧选取,,一个变焦(zoom)镜头可以简单表示为变
焦之前和之后的两个关键帧[2],一个扫描(pan)镜头可以通过构造一个全景图(panoramic)来表示[3].最近,文
献[4]提出一种基于最近特征线(NFL, nearest feature line)
à 收稿日期:
镜头内容分析及其在视频检索中应用 来自淘豆网m.daumloan.com转载请标明出处.