NEWS CENTER
新闻资讯
|
废旧铅酸蓄电池的X射线图像识别分类研究工业的高速发展,使得铅酸蓄电池的使用量与使用范围越来越大,与此同时,报废的铅酸蓄电池数量也在与日俱增,而随着国家对资源再生技术的重视,废旧蓄电池资源回收利用技术也在加快改进。铅酸蓄电池的主要由极柱、极群组、汇流条等部分组成,通常情况下,铅酸蓄电池的汇流条与极柱部分主要含有铅锑合金,而网栅主要含有铅钙合金[1]。由于在回收工艺中的冶炼过程需要对铅钙以及铅锑熔铸去渣,常常对锑、锡、硒等贵重金属产生不必要损失,也不利于铜铁的去除,所以选择把废旧铅酸蓄电池中主要含有的铅钙合金以及铅锑合金的两部分分开进行处理。考虑到铅酸蓄电池的自身结构以及汇流条根部是汇流条与网栅连接部分,也是电池结构中较薄弱处,所以将切割高度定在汇流条的根部。而由于人力切割蓄电池的精度和效率较低,并且废旧铅酸蓄电池中的稀硫酸对工人身体健康有较大危害,因此采用自动化系统提高处理效率具有重要的意义。 考虑近年来识别技术在工程领域的快速发展以及铅酸蓄电池的结构特点,提出利用铅酸蓄电池的X射线影像,结合图像识别技术实现废旧铅酸蓄电池分类识别,铅酸蓄电池X射线图像,如图1所示。当前国内外图像识别方法主要有:(1)对研究图像提取特征信息并采用分类器进行训练识别[2];(2)将经过预处理后的图像采用kNN算法进行识别;(3)提取预处理后图像的感兴趣区域,采用模板匹配算法识别。以上算法虽然被广泛地应用于各行各业,但仍存在不足的地方。诸如模板匹配算法虽然识别效果不错,但是抗干扰能力较差;神经网络算法虽然自学能力强,识别率较高,但是容易陷入局部极小值中;kNN算法虽然原理直观简单,但是计算维度高效率低。 分别运用计算效率较高的主成分分析法、二次线性判别分析法,PCA+LDA算法对6种常用的铅酸蓄电池的X射线成像图进行特征提取,并通过支持向量机对废旧铅酸蓄电池的X射线图进行识别分类。实验对比了三种方法在不同情况下的识别率,并根据实验结果对提出的三种方法进行了分析评价。 2 废旧铅酸蓄电池X射线图像特征提取2.1 主成分分析法 主成分分析法(PCA)的原理是将数据特征投影为少数综合特征[2]的一种统计分析方法。它采取一种降维的方式,找出几个主要的特征向量来替代原来的大量特征,使这些主要的特征向量能最大地反映出原信息,同时使得数据之间彼此互不相关,而由此产生的新变量则称之为主成分。 PCA算法[3-4]能够有效地压缩数据进行特征提取,可以将高维度的数据分解为低维度,PCA算法对数据的处理步骤如下: (1)样本矩阵获取 假定N张大小为m×n的铅酸蓄电池X射线图像,将每张图像的列向量首尾串接成大小为m×n的列向量,那么N张图像数据可以构成(m×n)×N的矩阵。令 M=(m×n),则样本数据的矩阵为X=[X1,X2,…,XN],其中 XN=[X1,N,X2,N,…,XM,N]T。 (2)样本均值计算 将样本矩阵的数据均值化,可将原始数据中的量纲和数据量级消除,使得获取的主成分更具代表性,由式(1)可得原始样本数据的均值: ![]() (3)构建协方差矩阵 根据概率论的定义,协方差矩阵Cx与数据的均值有关,可根据式(2)近似计算获取: ![]() 式中:E—数据的数学期望运算。式(3)中单个元素的协方差矩阵: ![]() 当下标 i=j时,σ1,1,σ1,1,…,σM,M,是协方差矩阵中各变量间的方差,而在非对角线元素上,下标 i≠j,σi,j是变量 xi与 xj间相关程度的协方差。 (4)计算特征值及其特征向量 由特征值分解,可得协方差矩阵 Cx的特征值 λ1,λ2,…,λM以及相应的特征向量[v1,v2,…,vM],并对协方差矩阵的特征值以及相应的特征向量进行降序排列。通过式(4)得到相应的标准正交投影向量[u1,u2,…,uM],最后从获取的正交投影向量选取前k个作为图像数据的主成分。 ![]() 2.2 线性判别分析法 线性判别分析法(LDA)[5]是以提高数据样本在子空间中的可分性为目标,其基本思想就是把高维的模式样本映射到最佳特征空间中去,实现降低特征空间维度并获得相关分类信息的目标。样本在投影空间中不同类别数据间距离最大,而相同类别中数据距离最小,因此可使得类间可分离性达到最优。线性判别分析法算法的计算步骤如下: (1)样本均值 假定有N张铅酸蓄电池的X射线成像图,每张图像为(m×n)维数据 xi,其组成的训练样本集{x1,x2,…,xN}分别属于 ω1,ω2,…,ωc这c个不同的类别,其中类ωi的样本数目为ni,则类ωi的样本数据的均值mi为: ![]() 所有样本的均值为: ![]() (2)离散度计算 设Sw为样本数据的类内离散度,Sb为样本数据的类间离散度,则 ![]() (3)求解最优映射向量 LDA算法的分类特性在于,希望数据经过LDA算法运算后,可使得所分的类间距离最大,而类内距离最小,这样才能具有较好的分类效果。那么,这就需要求得一个最优映射向量W,使得子空间J能通过Fisher准则求得,即: ![]() 式(9)对W求偏导,令W为0,求得极大值,则最终得到投影向量W*是矩阵 (4)映射样本数据 将训练样本xi向LDA子空间J做映射,那么有yi=W*Txi,即获得的向量yi就是xi的LDA特性。 3 SVM(支持向量机)简介支持向量机是文献[6-7]提出的一种基于结构风险最小化准则的机器学习方法,它比传统的方法拥有更强的推广能力。它还具有解决小样本、高维数以及非线性等实际问题的特点。 对于非线性可分的问题,SVM将输入向量由低维空间投影到高维空间,来实现样本数据分类。分类过程中,只需调用合适的核函数K(x,xi)[8],则可避免求解非线性映射函数具体形式,也解决了在高维空间计算所带来的“维数灾难”问题。常用的核函数有:多项式函数、径向基RBF函数、S形函数,在这三种核函数中,径向基RBF函数对于高维、低维、大样本、小样本等情况都适用。因此本实验选用径向基RBF函数作为SVM的核函数来进行铅酸蓄电池的识别分类。SVM最初是用于二分类问题的方法,由于铅酸蓄电池具有多种类型,因此需要将SVM扩展到多分类问题。具体的识别流程,如图2所示。图像经过预处理后,所有图像维度一致,并分为训练集和测试集两部分,将两部分图像分别经三种方法特征提取后,需要通过归一化将数据权重统一至(0,1),再由SVM对处理后的数据进行分类。 图2 识别流程图 4 识别分类实验结果与分析4.1 铅酸蓄电池的数据集处理 实验选用6类常用的铅酸蓄电池的X射线图像作为数据集,由于采集的原始图像尺寸为(986×256)像素并且铅酸蓄电池影像的长宽不一,为减小数据维度且能完整的获取所有类型电池的图像,统计所有X射线图像中的铅酸蓄电池影像的像素尺寸,发现所有影像的长宽分别小于460个像素和230个像素,因此采用460×230像素窗口对数据集中的图像进行截取,实验中采集的部分样本图像,如图3所示。 实验环境采用MATLAB进行编程。本数据集共有108张经过预处理后的图像(每类蓄电池18幅,图像大小均为(460×230)像素),且对数据集内图像分类编号便于区分,每张图像数据可构成样本矩阵的列向量为105800维。由于处理对象是废旧铅酸蓄电池,在回收和运输过程中,蓄电池往往存在一定程度的挤压变形,因而实际成像的效果会存在一些差异。实验中训练集大小和测试集大小需保持一致,分别选取每类蓄电池图像(5~9)张作为训练集,选取剩下的(5~9)张作为测试集,用来检测该方法识别率。 ![]() 图3 实验中采集的部分样本图像 4.2 识别实验及分析 分别采用PCA、PCA+LDA、二次LDA(在LDA初始值上再进行一次LDA)对训练集图像进行特征提取,并通过网格搜索法[9-10]对训练集数据进行交叉验证,获取精度最高的RBF核的参数gamma以及惩罚系数C,最优gamma=0.0078125,C=0.03215,其交叉识别率为95%。废旧铅酸蓄电池图像的识别界面,如图4所示。由表1可以看出,在特征维数为10,训练样本数量较小时,PCA特征提取方法的铅酸蓄电池识别率较高,但随着每类电池图像的样本数的上升,PCA特征提取方式逐渐下降,而二次LDA却随着样本数目的增加,识别率由最初的83.3%提升至90%以上。PCA+LDA特征提取方式,首先对识别图像采取降维处理,再对主成分进行LDA的特征提取,随着样本数的增加,其识别率有所下降,但相对于PCA算法要高。 图4 废旧铅酸蓄电池识别界面 表1 特征维数相同时各征提取方法识别结果 样本数/每类56789PCA 96.7% 94.4% 91.4% 90% 86.7%二次LDA 83.3% 83.3% 88.6% 92.5% 92.5%PCA+LDA 96.7% 94.4% 91.4% 92.5% 88.9% 在训练集样本为5时,特征维数与铅酸蓄电池图像的识别率的关系,当维数大于15后,测试集的识别率趋于固定,如图5所示。说明各种方法提取的前15维特征对铅酸蓄电池图像之间区分占有较大比例,其中由于二次LDA方法在原始的LDA方法上对测试集再一次进行了运算,不仅实现了降维过程,而且使得测试集数据之间的类间离散度增大,而类内离散度更为紧密,因此分类结果较其他两种方法更好。 图5 特征维数与蓄电池识别率的关系 实验对比了PCA,PCA+LDA,二次LDA算法在不同特征空间维度以及不同样本数目下的识别率。在样本数量不变的情况下,特征维数仅在一定范围内对三种特征提取法的识别有影响。但随着图像样本的增加,PCA算法的识别率有所下降,体现了该算法面对图像样本数量增加时,去除相关性能力的弱化。而由于LDA算法强调不同图像数据中的差别,增大不同类别数据间的离散度并减小同类数据间离散度,因此在样本量增加的情况下,PCA+LDA算法的识别率高于PCA算法,而二次LDA算法高于PCA+LDA算法。这也说明,相比PCA算法,LDA算法去除了与分类无关的某些因素。 |