复杂性分析方法在语音及图像处理中的应用研究

复杂性分析方法在语音及图像处理中的应用研究

刘伟[1]2007年在《图像检索中若干问题的研究》文中进行了进一步梳理图像含有比文本更为丰富的信息,在人们日常生活中发挥着重要作用。近年来由于因特网技术的发展及各种消费型电子产品的普及,每天都有巨量的数字图像产生和发布。在多媒体数据库中快速、有效地寻找所需要的图像是一个非常有意义的课题。目前工业界的许多图像搜索引擎(如Google~(TM)和百度~(TM))在搜索图像时并没有按照图像内容本身来搜索,而是根据与图像相关联的文字信息来完成搜索任务。导致搜索结果不尽如人意。基于内容的图像检索是有望解决这一问题的关键技术。本文对这一技术中的几个问题进行了研究,取得了如下结果:纹理特征是图像检索中广泛使用的重要底层视觉特征。本文将图像纹理视为非线性动力系统产生的信号,使用2种非线性信号分析方法-复杂性方法和希尔伯特-黄变换(HHT)方法来提取图像的纹理特征并将之用于纹理图像检索。得出的结果有:(1)将时间序列复杂性方法用于图像纹理分析与检索。所做的工作和得到的结论是:比较了8种时间序列复杂性方法用于图像检索时的性能,发现基于符号动力学和基于熵的方法不适于图像检索;基于频谱分析的CO复杂性特征适于图像检索,该特征的检索性能与二维图像一维化的扫描方法有关;实验表明采用Hilbert扫描方式的CO复杂性特征在Brodatz纹理库上取得了和Gabor特征极为接近的检索结果,计算特征所需要的时间比Gabor特征少了一个数量级;由图像阈值化算法得到启发,提出了一个新的一维时间序列粗粒化框架;提出了多种基于二维CO复杂性测度的纹理特征:复杂度直方图和多尺度复杂度直方图、复杂度共生矩阵、复杂度纹理谱和多尺度复杂性特征;实验表明基于金字塔分解的多尺度复杂性特征在不同的实验图像库上检索性能稳定,是一种较好的纹理特征;(2)将希尔伯特-黄变换方法用于图像纹理分析与检索,所做的工作和得到的结论是:提出了一种新的基于聚类的边界处理算法以改善经验模式分解(EMD)方法所产生的边界效应问题;使用二维Hilbert变换计算了内禀模态函数(IMF)的幅值作为检索用的图像纹理特征。实验表明,提出的HHT特征可以取得和Gabor特征较为接近的图像检索结果。图像的显着性区域是表达图像语义的主要部分。本文尝试使用一个基于视觉生理和心理物理实验基础的选择性视觉注意计算模型用于自然图像检索的研究。所做的工作和得到的结果是:(1)使用视觉注意计算模型计算了图像中的兴趣点并提取兴趣点周围的局部特征用于图像检索。提出的检索特征有图像的显着性直方图特征、图像的显着性标签和注意焦点(FOA)空间关系直方图特征。实验结果表明显着性标签和FOA空间关系混合编码的直方图特征可以取得比全局直方图特征更好的检索结果;在采用视觉注意计算模型计算得到的图像显着性区域上提取的一些区域特征可以取得比全局特征更好的检索结果;(2)提出了将潜在语义标引方法和视觉注意计算模型结合起来用于自然图像检索的方法;(3)提出了在多示例学习框架下基于视觉注意计算模型和JSEG图像分割算法的包生成器方法,并将其用于自然图像检索。图像检索实验表明基于JSEG分割算法的包生成器取得了比一些文献中提出的包生成器更好的实验结果。本文提出了“图像语义阈值”的新概念及其度量方法。通过计算机实验和心理物理学实验初步得到如下结论:在自然图像认知或理解时存在一个语义阈值;可以通过图像的图像熵和图像分维数及类似Weber律的方法来度量该阈值;差别阈限图像及其原始图像的度量值的比值与图像语义内容无关,而和色彩模式(彩色或灰度)及图像的变换方法相关。本文作者还设计与开发成功了一个图像检索实验平台。使用该平台方便了研究者进行图像检索实验研究,提高了工作效率,便于他们之间进行学术交流。这项工作具有一定的应用价值。

曹华[2]2004年在《复杂性分析方法在语音及图像处理中的应用研究》文中认为现阶段,信号处理的传统方法大部分是基于线性的理论,而信号本身并不是线性的,我们用线性的方法处理非线性的信号仅仅是最大似然的逼近,并不能真正反映信号本质的东西,这就需要我们研究用非线性的方法来处理非线性的信号。 本论文的目的是用非线性的处理方法进行信号处理。本文主要探讨了复杂性测度在说话人识别、车牌定位中的应用,并取得了可喜的研究结果。可以说,非线性的处理方法将在信号处理的研究中起到越来越大的作用。 说话人识别方面,本文做了以下研究工作: 1.提出了一种能够有效反映说话人个人特征的KC复杂性特征。 2.基于传统的MFCC美尔倒谱特征和这种新的特征(KC复杂性特征)建立说话人辨认系统,本文设计了文本有关和文本无关的说话人辨认系统。 车牌定位方面,本文做了以下研究工作: 1.提出一种反应不同模块特征的KC复杂性特征对所关心的车牌区域和背景模块进行标测,实现车牌定位。 2.本文还特别研究了背景模块有竖条纹理干扰情况下的车牌定位有效性。

刘勍[3]2011年在《基于脉冲耦合神经网络的图像处理若干问题研究》文中进行了进一步梳理脉冲耦合神经网络(Pulse Coupled Neural Networks, PCNN)是基于生物视觉系统机理形成的具有模数混合处理、串并联混合处理及动态自适应处理的一种空时编码新型人工神经网络。由于PCNN模型的动态变阈值、非线性调制耦合、同步脉冲发放、动态脉冲发放及时空总和等特性,使其在图像处理、自动目标识别、组合优化、人工生命等领域的研究和应用得到国内外的广泛重视。本文围绕图像处理中脉冲噪声滤除、高斯噪声滤除、弱小目标检测、二值图像自动分割、多值图像自动分割及基于内容的图像检索等若干关键问题,针对脉冲耦合神经元结构复杂性及其在图像信号处理中存在阈值反复衰减、自适应性能差和无法自动选择最佳处理结果等一些不足,研究了PCNN模型的机理,并提出改进思路与方法。论文主要内容如下:1.为有效滤除图像中严重脉冲噪声的干扰,提出了基于脉冲耦合神经网络噪声检测的两级脉冲噪声滤波算法。首先在改进自适应单位连接PCNN(AULPCNN)模型的基础上,利用其同步脉冲发放特性区分定位脉冲噪声点和信号像素点位置,其次根据噪声点局部邻域信息对噪声点进行第1级自适应滤波,然后再对前一级的滤波输出利用具有保护边缘细节特点的多方向信息中值第2级细微辅助滤波。该算法在噪声检测中无需设定检测阈值,噪声检测精度较高;在去噪过程中不但有效滤除噪声干扰,而且能很好地保护图像边缘细节等信息,具有较好的主观视觉效果和客观评价指标,去噪能力强、信噪比高和适应性好,特别是对受严重噪声污染的图像,显示了更大的优越性。2.针对图像高斯噪声的去除,提出了一种基于改进型脉冲耦合神经网络的双边滤波算法。在考虑图像高斯噪声特征的前提下,引入平滑抑制因子和自适应链接强度,并与相似神经元同步激活特性相结合,形成平滑抑制自适应连接PCNN(SIAL-PCNN)模型,然后应用在含噪图像预滤波迭代处理中,在滤除极值噪声的同时形成反映图像空时信息的赋时矩阵,最后将生成的赋时矩阵信息运用在双边滤波中,并对其进行了自适应性改进与滤除高斯噪声的处理。该算法在较好保护图像边缘细节等信息的情况下,能有效地滤除平滑区域噪声,在信噪比和去噪能力方面都有一定的提高。3.从含单一弱小目标图像特征出发,提出了结合灰度熵变换的脉冲耦合神经网络小目标图像检测算法。该方法在对含随机噪声和有复杂背景的图像进行非线性灰度熵变换滤波的基础上,考虑灰度熵值映射图在满足目标背景比先验概率的条件下,利用局部最小交叉熵判据,自动选取包含单一小目标局部窗口作为处理图像区域,并进行改进型PCNN迭代检测处理。该算法能自动可靠地检测出复杂背景及随机噪声干扰下的弱小目标。4.为自动对图像进行二值分割,提出了一种新的自适应迭代全局阈值图像自动分割算法。首先对二维超模糊集隶属函数进行自适应修正,并将其引入到图像超模糊熵概念中,然后从适应图像分割角度考虑,将传统脉冲耦合神经网络模型改进为具有单调指数上升阈值函数的单位链接脉冲耦合神经网络(ULPCNN)抑制捕获模型,最后把ULPCNN与最大超模糊熵判据相结合对图像进行自动分割。该算法能自动确定最佳分割阈值,对图像目标划分清晰、细节保持较好,改善了图像的分割性能。5.考虑原始图像与分割图像之间的相互关系,以最大互信息为分割目标,以互信息熵差作为一种新的分类判据,在对传统脉冲耦合神经网络模型改进的基础上,提出了一种基于最大互信息改进型PCNN多值图像自动分割算法。该算法能够自动确定最佳分割迭代次数及最佳分割灰度类数,对分割图像具有良好的特征划分能力,且在分割类数较少的情况下,能较好地保持图像细节、纹理及边缘等信息,对图像分割精度高,具有较强的适用性。6.为简单有效地提取图像重要特征信息,从而更好地提高检索图像的精度,提出了一种基于脉冲耦合神经网络的图像归一化转动惯量(NMI)特征提取及检索算法。首先利用改进简化PCNN模型相似神经元同步时空特性及指数衰降机制,将图像分解为一系列具有相关性的二值图像,然后提取能反映原图像目标形状、结构分布的系列二值图像的一维NMI特征矢量信号,并将其应用在图像检索中。同时,考虑到系列二值图像间的相关性及不同图像间NMI序列值的差异性,引入了马氏距离结合Pearson积矩相关法的综合相似性度量方法。所提算法对图像特征矢量序列具有良好抗几何畸变不变特性及对图像表述的唯一性,且有较好的图像检索效果。

佚名[4]2006年在《通信》文中认为TN912006010862CVAAS自适应动态电源管理策略/卜爱国,胡晨,刘昊,李杰(东南大学国家专用集成电路系统工程技术研究中心)//应用科学学报.―2005,23(3).―269~273.在嵌入式和便携式系统的低功耗设计中,动态电源管理(dynam

佚名[5]2003年在《通信》文中研究指明TN91 2003040847在Windows CE下实现串口通信/刘鑫,陈峰,李瑾(大连铁道学院))I通信技术一2003,(1)一36一37,44首先简单介绍了在W indows CE下设备驱动程序的访问方式,然后详细介绍了在Window、CE下实现串

李响[6]2015年在《铁路机车司机驾驶疲劳评测方法与在线检测技术的研究》文中研究说明铁路运输生产力的高速发展,对铁路行车的安全保障提出了更高要求。由于机车司机的驾驶疲劳是引发铁路行车安全事故的主要原因之一,机务管理部门迫切需求防范机车司机驾驶疲劳的相关先进技术和设备,期望以此减少由机车司机驾驶疲劳所导致的人因事故发生。本文以铁路机车司机这一特殊驾驶领域的作业人员为研究对象,围绕其驾驶疲劳的形成机理、驾驶疲劳的影响因素与风险评价、驾驶疲劳相关音视频表现特征参数的提取与分析、以及多信息融合检测技术等核心问题展开全面深入的理论和实验研究,并以此设计和实现了一个实时、准确、鲁棒的机车司机驾驶疲劳在线检测及预警系统。具体的研究内容如下:(1)针对铁路机车驾驶作业的特殊性,通过对机车司机作业行为、值乘制度以及工作条件等方面的调查研究,系统分析了机车司机驾驶疲劳的形成过程和产生机理。由此,总结了机车司机工作负荷、轮班方式、职业素质和作业环境等方面的多种疲劳影响因素,为机车司机驾驶疲劳的风险评价提供了依据。同时,讨论了司机处于驾驶疲劳状态下,在行为、生理和心理上所可能产生的各种表现特征,以及这些表现特征在驾驶疲劳检测应用方面的适用性和可行性。(2)机车司机的工作负荷计算与驾驶疲劳风险分析。首先,通过对机车司机具体作业任务的层次分解以及各作业任务的需量估计,提出了一种机车司机工作负荷计算方法。该方法以具体机车驾驶任务对人体的需量为研究对象,可以客观准确地反映出司机在执行不同作业任务下的工作负荷指标。随后,采用改进的模糊层次分析法将工作负荷指标与轮班方式、职业素质和线路环境等方面的多种疲劳影响因素指标相结合,建立了机车司机驾驶疲劳风险的多指标评价模型。最终,通过对不同车次不同时段下的机车司机驾驶疲劳风险评价实例,验证了该模型在实际应用时的准确性和有效性。这部分研究所得的驾驶疲劳风险评价结果,不仅能够为司机轮班工作的编排管理上避免驾驶疲劳提供依据;还为多信息融合的驾驶疲劳检测系统提供了概率推理所需的疲劳先验知识。(3)确立了一种基于语音与视频多传感器信息融合的机车司机驾驶疲劳在线检测方案,并对相关的疲劳特征参数进行了提取分析。首先,根据驾驶疲劳对人体发音器官的影响,提取分析了基音频率、共振峰和Mel频标倒谱系数等传统语音特征,以及语音混沌非线性动力学模型下的最大Lyapunov指数、分形维数和近似熵等语音非线性特征与人体疲劳的变化规律,并通过实验验证了这些语音特征与机车司机驾驶疲劳的相关性。其次,为了能够从视频数据中快速、准确、鲁棒地提取司机眼部及面部等多种疲劳特征参数,针对实际机车场景下的光照条件变化以及司机头部倾斜旋转等具体问题,提出了:基于肤色自适应更新模型的图像肤色分割算法,基于Haar特征与Adaboost分类器的人脸识别算法,以及基于Zernike矩特征的人眼定位及开合度识别方法等,一系列逐步缩小特征提取范围的图像处理与识别算法。并在此基础上,提取分析了机车司机的眼部闭合时间百分比、平均闭眼速度、最大持续闭眼时间、平均睁眼程度和眨眼频率等眼部特征,以及哈欠频率和点头频率等司机面部特征在不同疲劳状态下的统计规律。(4)提出一种特征层融合与决策层融合相结合的多信息融合检测方法,将驾驶疲劳风险评价结果以及所提取的多种特征参数综合应用于驾驶疲劳的在线检测。首先在特征层融合部分,采用模糊支持向量机算法设计了多特征驾驶疲劳分类器,并对算法中的样本模糊隶属度函数做了相应改进。随后在决策层融合部分,通过动态贝叶斯网络融合算法,将语音多特征、眼部多特征、哈欠频率和点头频率等四种特征层分类器的初步判决结果与驾驶疲劳风险评价所得的先验知识相结合,以因果概率推理的方式融合得到最终的一致性驾驶疲劳检测结果。实验结果表明,这种多信息融合检测方法不仅能够根据驾驶疲劳的先验风险来自适应地动态调节疲劳判决标准,还可以良好地抑制各特征层分类器的误检和漏检对最终检测结果的影响,从而在整体上表现出良好的驾驶疲劳检测性能。

佚名[7]2007年在《自动化技术、计算机技术》文中认为TP13 2007012024一类时滞线性切换系统的稳定性和镇定/陈松林,姚郁(哈尔滨工业大学控制与仿真中心)//黑龙江大学(自然科学学报).―2006,23(2).―206~210.针对一类具有状态延迟的连续线性切换系统,研究了其渐近稳定性及状态反馈和输出反馈镇定控制律的设计问题。首先利用公共李亚普诺夫函数法给出了系统渐近稳定的充分条件及该条件下切换律的构造方法,然后给出了状态反馈和输出反馈镇定的充分条件,同时给出了稳定化控制律的参数化表示和相应切换律的构造方法。最后举例说明了结果的有效性。图2表0参12

参考文献:

[1]. 图像检索中若干问题的研究[D]. 刘伟. 浙江大学. 2007

[2]. 复杂性分析方法在语音及图像处理中的应用研究[D]. 曹华. 浙江大学. 2004

[3]. 基于脉冲耦合神经网络的图像处理若干问题研究[D]. 刘勍. 西安电子科技大学. 2011

[4]. 通信[J]. 佚名. 中国无线电电子学文摘. 2006

[5]. 通信[J]. 佚名. 中国无线电电子学文摘. 2003

[6]. 铁路机车司机驾驶疲劳评测方法与在线检测技术的研究[D]. 李响. 北京交通大学. 2015

[7]. 自动化技术、计算机技术[J]. 佚名. 中国无线电电子学文摘. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

复杂性分析方法在语音及图像处理中的应用研究
下载Doc文档

猜你喜欢