..页眉.. 页脚. 基于图像显著性快速场景分析的模型摘要: 受早期神经元视觉系统结构的启发, 一个视觉注意一通被创建出来。多种图像特征结合于一张地志显著性图样上。一个动态神经元网络依显著性递减的顺序选择位置。系统用有效的计算方法解决了关于快速选择场景识别的复杂问题,从而具体分析显著性的位置。 1. 导语灵长类动物具有实时识别复杂场景的出色能力, 尽管他们神经元硬件在实现这些功能时是需要一定时间的。中层或更高层的视觉倾向于在整个过程当中先选择一个集中区域, 这很可能是为了减少分析过程的复杂程度。这种选择通过形成一个有限空间的视觉区域来实现, 通常称作”集中的注意”, 这种快速、从上往下、显著性驱使和目标的独立的浏览方法也就是缓慢地从下往上,意志驱使,目标分散的方法。注意力模型里包含一种叫“动态路线”的模式, 这种模式下的信息来源于一小块区域可以通过表层视觉来活动。这种区域是通过对表层关联性或者是实时活动模式的修改来选择, 在从上往下(目标- 独立)和从下往上(场景- 依赖)的控制下。这里用到的模型建立在一个被 Koch 和 Ullman 所推荐并且基于多种基本模型看似可信的次等生物结构上, 它和一种“特征集成理论”想关联, 解释了人类视觉寻找策略。视觉输入首先被分解成一些具图像特征的图谱。不同的空间位置具有不同的显著性, 只有那种可以从周围环境中脱颖而出的位置才能出现。所有特征图谱以一种纯粹的由下往上的方式流入一个从整个可见场景依照地理位置为不同位置的显著性编码主宰“图像显著性”。在最初期。这种图谱被认为是在次级顶骨腔壁和丘脑的枕核中心。模型的显著图谱被赋予可以形成注意性转变的内部动态。因此模型显现出一种完整的自下而上的显著性并且不需要任何自上而下的引导去转变注意。这种结构提供了一个用来快速选择一小群赋予吸引力图像位置的巨大平行的方式。这种位置需要以一种更复杂而且时间不确定物体识别的过程。将这种方式延伸到“引导寻找”从跟高的表层区域反馈本来是用作衡量不同特征的重要性, 所以只有较高级别重要性的才能到达进一层的过程。..页眉.. 页脚. 2. 模型输入的静态图像通常被数字化正分辨率为 640 ﹡ 480 像素的图片。利用二阶高斯三角创建的九度空间是一个渐进低通滤波器并且从八个阶梯采样尺度从 1:1 (零度空间)到 1:256 (八度空间)的图像。每个特征都被一系列“中心环绕”操作计算, 类似于视觉可接受范围: 典型视觉神经元在一个小区域的视觉空间里( 中心) 是最敏感的, 当刺激作用在一片更宽, 更弱和抑制神经反应的中心( 周围) 同心的对抗性区时。这样一个对空间不连续性敏感的结构, 恰好适合于发现那些从环境中凸显并且是一个在视网膜, 侧面膝状原子核, 和初级视觉皮质的一般计算性公式。中心环绕在一个模型中被当作细小于粗大范围之间的区别而实行, 中心是一个像素为c∈{2,3,4} ,环绕是于在 s=c+ δ( δ∈{3,4} )范围内的像素。两幅图之间跨尺度的差别(用Θ标记) ,通过插入细小范围和点对点的减法来获得。不仅是为了获得 c ,用几个范围更是为了获得δ=s—c 服从通过包含在中心与环绕区域之间不同大小比率多尺度特征提取(和之前使用的修正比率相反)。 早期视觉特征的提取 r,g和b 分别是红,绿和蓝色的图像输入通道,图像的密度 I=( r
基于特征区域的显著性快速的分析 来自淘豆网m.daumloan.com转载请标明出处.