HI,欢迎来到学术天下网

基于稀疏表示和半监督主动学习的小样本高光谱数据分类问题研究

分享到:
  • 论文详细
作者:
周千琪
导师:
张春梅
学科专业:
计算机应用技术 
文献出处:
北方民族大学 2016年
关键词:
高光谱数据论文  小样本论文  稀疏表示论文  半监督学习论文  主动学习论文  分类准确度论文  

摘要:高光谱数据含有的光谱波段数量少则几十多则数百,提供了大量的有价值信息,有利于对地物进行精细分类。而高光谱数据分类却面临着数据维数高,标记样本有限,人工标记成本昂贵等具有挑战性的问题。为了解决高光谱数据分类问题,不断有学者提出新的方法。无监督分类不需要人工进行标记,但是分类准确度相对较低。传统的监督学习取得了较好的分类效果,但需要大量的标记样本。此外,为了避免休斯现象,许多算法都需要对数据进行降维处理,而降维会导致一些有价值信息的丢失。稀疏表示算法既不需要对高维数据进行降维处理,也不需要训练和学习分类器,便可实现对高光谱数据的分类。本文以稀疏表示算法为基础,围绕高光谱数据的分类问题主要做了以下几个方面的研究:1.基于稀疏表示算法探讨小样本高光谱数据分类问题中分类准确度与标记样本数量的关系问题。虽然研究人员在提高小样本高光谱数据分类准确度方面做出了不懈努力,但尚无人在标记样本数量与分类准确度的关系方面做进一步研究。本文从理论和实验两个方面推导和验证了两者之间成正相关关系,并根据实验绘制出函数曲线。该研究成果为小样本高光谱数据的分类研究提供了很好的理论和实验依据。2.针对半监督高光谱数据分类准确度不高的伪标记样本识别问题,本文在对前期工作进行总结的基础上,分析失败原因,提出了基于稀疏表示和半监督主动学习的分类框架。采用稀疏表示算法构建基分类器,结合半监督主动学习算法,一方面利用主动学习对少量“关键”样本进行标记,以降低对随机选择样本进行标记的工作量和成本,另一方面利用半监督学习得到的伪标记样本集来增加训练样本数量。为了降低伪标记样本的错分率,算法融入了伪标记确认程序来剔除可能标记错误的伪标记样本。通过实验与其它算法进行对比证明了所提算法的有效性,实现了小样本高光谱数据的高精度分类。本文基于稀疏表示算法探讨小样本高光谱数据分类问题,通过理论分析和实验论证创新性地提出分类准确度与标记样本数量之间的函数关系,与此同时,提出将稀疏表示和半监督主动学习相结合的算法框架,提高了小样本高光谱数据的分类准确度。

摘要

Abstract

第一章 引言

1.1 研究背景与意义

1.2 高光谱遥感概述

1.2.1 高光谱遥感图像

1.2.2 高光谱遥感数据处理技术

1.2.3 高光谱图像分类的国内外研究概况

1.3 高光谱遥感的应用

1.4 本文主要研究内容

1.5 本章小结

第二章 主要算法的理论基础

2.1 稀疏表示

2.1.1 稀疏表示优化算法

2.1.2 稀疏分类

2.2 半监督学习

2.2.1 基于生成式模型算法

2.2.2 半监督支持向量机算法

2.2.3 基于图的半监督算法

2.2.4 基于分歧的半监督算法

2.3 主动学习

2.3.1 基于委员会的采样策略

2.3.2 基于边缘的采样策略

2.3.3 基于泛化误差减小的采样策略

2.4 本章小结

第三章 高光谱数据分类准确度与标记样本数量关系的研究

3.1 引言

3.2 理论分析

3.2.1 相干系数

3.2.2 MP的收敛和重构

3.2.3 推论

3.3 实验分析

3.3.1 数据集

3.3.2 数据预处理和实验步骤

3.3.3 实验结果和分析

3.4 本章小结

第四章 小样本高光谱数据分类问题的研究

4.1 引言

4.2 前期研究工作

4.2.1 基于稀疏表示和集成学习算法

4.2.2 基于稀疏表示和半监督学习算法

4.2.3 实验结果与分析

4.3 基于稀疏表示和半监督主动学习算法

4.4 实验结果及分析

4.5 本章总结

第五章 总结与展望

5.1 工作总结

5.2 研究展望

参考文献

致谢

硕士期间主要的研究成果