报告题目:视线追踪技术及其在图像分类中的应用

报 告 人:王加俊教授苏州大学

时间:2017314日(周二)下午2:30

地点:C205

举办单位:电子与信息工程学院

个人简介:

王加俊,男,196911月生,博士,教授,博士生导师。1999年毕业于浙江大学生物医学工程专业,并获博士学位。19997月起就职于苏州大学电子信息学院,先后任讲师、副教授、教授职务。2006年被聘为苏州大学“信号与信息处理”专业首批博士生导师。曾多次前往澳大利亚悉尼大学、香港理工大学、香港城市大学进行学术交流与访问,担任研究助理、研究员和访问教授等职务,并和这些知名高校保持着长期合作关系。主要研究方向包括:图像重建,图像处理与模式识别(包括图像分类、图像检索、图像配准等),生物信息学。主持国家自然科学基金项目2项,江苏省自然科学基金2项,苏州市自然科学基金项目一项,是江苏省“六大高峰人才”项目获得者。至今,在国际、国内期刊或重要学术会议上发表论文50余篇。

报告内容:

基于内容的图像分类是图像检索、图像识别、图像过滤等技术的关键,已成为模式识别领域中的一个重要研究方向,它的目的是将图像数据按照自身的特征进行分类。当前,随着图像数据朝着大规模,高维度化的方向发展,这给传统的图像分类带来了严重的挑战。过高的特征维数一方面容易产生“过学习现象”,另一方面特征间的冗余性会严重影响学习算法的速度,降低算法在后续应用中的性能。所以特征选择在图像分类处理过程占据着举足轻重的地位。通过高效的特征选择,去除不相关或者冗余特征,可以提高分类的准确性,加快算法的运行效率。尽管借助于完善的数学算法,大部分现有的特征选择算法已取得了较好的性能,但是,人类本身却很少参与到特征选择中,对于图像识别来说这点往往又显得特别重要。由于人类在目标识别上的超强能力,通过对人眼处理视觉特征机制的研究,找到人类在物体识别过程中所使用的视觉特征子集,无疑对提高图像分类的性能具有很大的帮助。为此,我们引入了视线追踪技术,利用眼动数据提取出人类在对图像进行分类时所注视的图像区域(感兴趣区域, ROI)并以此作为样本集,利用量子遗传算法对视觉特征进行粗选。为了平衡算法的效率和分类性能,我们结合Filter类方法的高效率和Wrapper类方法的高性能优点,提出了一种混合算法(mRMR-SVM-RFE算法)用于图像特征的精选。大量的实验证明:眼动数据的引入可以在很大程度上提高图像分类的性能。