基于PCA-SVM的高职院校专业评估体系研究
第23卷第6期重庆科技学院学报(自然科学版)2021年12月基于PCA-SVM的高职院校专业评估体系研究
张延义赵莹
(滁州职业技术学院教务处,安徽滁州239000)
摘要:引入主成分分析(PCA)和支持向量机(SVM)技术,构建高职院校专业评估体系。该体系有利于专业建设成效分析与质量评价,其中包括9个一级指标和23个二级指标。应用Libsvm软件进行专业等级特征模型训练与测试实验,验证了该体系的合理性O
关键词:专业建设;专业评估;主成分分析;支持向量机
中图分类号:TP315文献标识码:A文章编号:1673-1980(2021)06-0050-05
高职院校的专业评估,是指在学校管理自我完善的基础之上,依据相关评估标准,针对各专业的教育质量进行评判口切。在实践中,大多是由主管部门领导下(或第三方评估机构)组建的多元化专家组对专业评估指标逐项进行评测、赋分,依据人为设定的指标权重来计算专业评估总分,最后确定专业建设的等级。这种评估流程通常存在以下问题:一是人为设定权重,主观成分大,导致评估结果不合理;二是以总分衡量专业建设的水平,忽视了专业建设的多维度特征,掩盖了某些方面的突岀问题;三是组织多元化专家组测评的流程比较复杂,不便于日常管理。为了优化评估工作、提高评估效率,本次研究将依据《国家职业教育改革实施方案》构建高职院校专业评估指标体系⑶,利用支持向量机(SVM)在小样本、非线性及
高维模式识别问题中的特有优势,以及主成分分析(PCA)中的数据降维技术,针对2所高职院校44个专业的评估指标数据进行专业等级模型训练和专业评估测试。
1主成分分析和支持向量机理论
1.1主成分分析(PCA)
主成分分析(principal component analysis,PCA) 是最常用的降维方法之一,其思想是通过正交变换法将可能存在相关性的变量转换为一组线性不相关的变量。具体方法是,从原始的空间中按顺序到一组相互正交的坐标轴,第一个新坐标轴选择原始数据中方差最大的方向,第二个新坐标轴选取与第一个坐标轴正交的平面中使得方差最大的方向,以
此类推即得到n个新坐标轴;前面k个新坐标轴中包含了大部分方差,后面的坐标轴可以忽略,以此实现对数据特征的降维处理-6。
将数据集/={也严2,”3,…严”}降到%维,一般过程如下:
(1)样本矩阵中心化。
(2)生成协方差矩阵丄XXT。
n
(3)对协方差矩阵丄兀疋进行特征值分析,组
TL
成投影矩阵。
(4)对原始数据进行投影。对特征值从大到小进行排序,并选择其中最大的%个值;然后,将其对
应的k个特征向量作为行向量,从而组成特征向量矩阵
(5)获得降维后的新样本数据。将数据转换到%个特征向量构建的新空间y中,y=px o
1.2支持向量机
支持向量机(support vector machine, SVM)是从线性可分条件下的最优分类面(optimal hyperplane)发展而来,其原理如图1所示。最优分类面,不但能将两类样本点准确无误地分开,而且还能使其分类间隔最大⑷。对于总数为n的线性可分观测样本(签,%),其中如e e j-1,+1},4=1,2,3,
收稿日期:2021-08-02
基金项目:安徽省教育厅重大教研项目“现代学徒制培养滁州制造业技能人才的实践与研究”(2018JYXM0833)
作者简介:张延义(1963—),男,硕士,教授,研究方向为计算机应用技术、高等职业教育;赵莹(1989—),女,硕士,助教,研究方向为思想政治教育。
•50•
张延义,等:基于PCA-SVM的高职院校专业评估体系研究
…,“,线性判别函数的一般形式为g&)=wx+b;以E为最优分类线将两类数据分隔开,陌、尽皆为既过距离分类超平面最近的点又平行于分类线的直线,耳之间的距离为分类间隔(恥),駕、爲上的训练样本为支持向量何。
图1支持向量机原理示意图
设分类面方程为wx+b=0,其中卩是一个垂直于超平面的向量,&为超平面偏置。对判别函数进行归一化处理,使所有样本都能满足|g&)1,且距离分类面最近的样本|g(”)|=1。若要此分类面对所有样本都能进行正确分类,就必须满足条件: (w»i+6)一1m0,i=1,2,•••,»□
两类样本的分类空隙间隔为皿=希p若要
使分类间隔最大,就要使||*||2最小。
对于线性不可分的情况,可以在条件中增加松弛变量g和惩罚因子C,将约束条件放宽,从而实现广义的线性分类[9】。对于非线性分类的情况,通过核函数将输入空间映射到高维特征空间,用核函数K(聲,叼)代替最优分类平面中的点积(%;,勺),其优化函数如下:
n-n n
e(a)=2為-不•Y Y8•丐•
£=1乙i=l;=1
兀•为・K(长坷)(1)相应的判别函数式为:
fM=sgn[(v
*)T•</>(«)+6*]
n
=昨[§亦+b*](2)选择不同的裱函数就可以构成不同的算法,常用的核函数有:
(1)多项式核=[(久•知)+1]?0
⑵径向基核,K(%,擬)=exp(一”%)
(3)S形核,K(%,做)=tanh[v(«•+c]o
采用SVM处理多类别问题:一种方法是通过组合多个二类分类机来实现多类别分类;另一种方法是将两类支持向量机扩展为多类别分类支持向量机。
2高职院校专业评估指标体系
我国高等职业教育目前已进入高质量发展新阶段。2019年,国务院印发了《国家职业教育改革实施方案》,教育部也启动了“双高”建设行动计划和“现代学徒制”试点工作,为高等职业教育的专业建设赋予了新的内涵。本次研究将在此基础上依据成果导向(OBE)教育理念构建新的高职院校专业评估指标体系,帮助专家组有针对性地评判专业建设的成效。新指标体系中增加了“核心课程满足度、就业满意度、产教融合、校企合作、价值观提升、内部质量保证”等内容,从专业内涵建设和人才培养主动适应市场需求的发展机制等角度构建专业评估指标体系,其中包含9个一级指标和23个二级指标(见表1)。
表1高职院校专业评估指标体系
_级指标二级指标
序号名称序号名称
1专业定位与特
1
2
专业定位
专业特
2产教融合与培养模式
3
4
产教融合与校轴作
人才培养模式
5师资结构与水平3师资队6专业带头人
7双师型教师
8核心课程满足度4课程与资源9课程资源
10课程教学方法与考核5实践教学
11
12
实践教学条件
实践教学内容与管理6技能大赛与创新创业
13
14
技能大赛
创新创业
7科研、社会服务与国际
交流
15
16
17
科技研发与应用
社会服务
国际交流
8专业规模与
18
19
规模与招生
经费投入
20触状况
9专业影响与质量保证
21价值观提升
22专业MS待
23内部质量保证
3基于PCA-SVM的专业评估
基于专家组给出的现场专业评估数据与专业等
・51
电子商务专业怎么样
张延义,等:基于PCA  - SVM 的高职院校专业评估体系研究
级分类结果,通过数据降维、模型训练与测试实验,将 测试结果与专家现场评估的专业等级进行对比,据此
判断PCA  - SVM 专业评估方法的准确率与有效性。
3.1专业评估数据集
专家组在对两所高职院校的44个专业进行了 现场评估,其中部分评估数据如表2所示。
专家组进行现场评估,通常是先成立由学校管 理人员、教师、用人单位代表、毕业生等组成的多元
化专家组,采用问卷、现场查看测评、学校人才培养 状态数据分析、用人单位调查等手段进行评估。针 对待评估的专业,分别对照专业评估指标体系中的
23个关键评估指标逐项对其进行评测和赋分(满分
为10分),然后按照各指标项的权重计算总分,并综 合评审数据明确划分出“优秀、良好、一般”等专业
分类等级。采用PCA  - SVM 专业评估方法则无须 使用指标项的权重,也不计算总分。
表2专业评估数据集部分数据
部质量保证
业建设特
值观提升
业状况
费投入 规
模与招生
际交流
会服务 科
技研发与应用
新创业
能大赛 实
践教学内容与管理
践教学条件
学方法与考核
程资源
心课程满足度
师型教师
业带头人 师
资水平与结构
才培养模式
产教融合与校企合作
专业特
业定位
专业名称
电子商务88&5
&2
97787
8488878788&3  6.8727.688工商企业管理67  6.6&2666
77738
6
6
77
7878.3  3.961
6.5
6
6会计9
99.49.3
99897959855559
9
9.4  6.7938.789
市场营销
88
&5&297787
84
8
88787888.3  6.8727.6
88物流管理67  6.5
9.366677739665556
7  6.2  3.7
61
6.6
66财务管理6
7  6.4&2666
777386
677
787
&3  3.862  6.5
6
6
动漫制作技术88&58.299987
84889
99988&3  6.9929.788计算机应用技术
8
8
8.58.2
9
9
9
86958
8
89
9
9
6
9
6.3
6.8929.7
8
6
3.2专业评估数据降维
应用PCA 分析实现数据降维。在SAS 统计分 析系统中新建practice 逻辑库,将其导入学校专业
评估数据集zypg- sas7bdat,应用princomp 函数进行
主成分分析。相关语句如下:
proc  princomp data  = Practice  ・ zypg out  = Practice. zypg_out
prefix  = pc
outstat  二 Practice. zypg_stat ;
var  vl  v2 v3 v4 v5 v6 v7 v8 v9 vlO  vll  vl2 vl3 vl4 vl5 vl6 vl7 vl8 vl9 v20 v21 v22 v23 ;
run
相关系数矩阵的特征值及其累计贡献率如表3 所示。其中,特征值越大,则其对应的主成分变量所
包含的信息就越多;累计贡献率前4项已达0.940 6,
所以选择这4个主成分(即主成分分析产生的新数 据集前4项pcl 、pc2、pc3、pc4)代替原来专业评估数
据中的23项指标,实现数据集降维。降维后的专业
评估数据如表4所示。
3.3专业等级的特征模型训练与测试
应用Libsvm 软件进行专业等级特征模型训练 与测试。Libsvm 软件是台湾大学林智仁等学者开 发的SVM 模式识别与回归软件包,其特点是对SVM
所涉及的参数调节相对较少,默认参数较多3〕。为
了保证模型的训练效果,避免各指标项评分值级差
过大而导致小特征被大特征所掩盖的情况,在开始 特征模型训练前对专业测评数据在[0,1]区间进行 归_化处理。
(1) Libsvm 软件中的核函数选择。专业评估是
对专业建设质量的综合判断,专业评估指标体系又 是一个多维、非线性的模型,所以选择了分类(C  - SVC)模型、径向基形式(RBF)核函数,最终生成式 (3)所示决策函数:
n
/(«) = sgn  | 丫处•
i  = 1
exp( - r  II  - % II  2) ] + b  (3)
・52・
张延义,等:基于PCA-SVM的高职院校专业评估体系研究
式中:做为支持向量;%为待预测标签的样本;||Xi-x II为二范数距离》为一个标量数值;叫为支持向量的系数。
表3相关系数矩阵的特征值及其累计贵献率
序号特征值相邻特征值差贡献率累计贡献率116.122413.52290.70100.7010
2  2.59950.94940.11300.8140
3  1.65010.38730.07170.8857
4  1.26270.80730.05490.9406
50.45540.19440.01980.9604
60.26100.05190.01130.9718
70.20910.05110.00910.9809
80.15800.05050.00690.9877
90.10750.04710.00470.9924
100.06040.01250.00260.9950 110.04790.02050.00210.9971
120.02730.00860.00120.9983 130.01870.00540.00080.9991
140.01330.01030.00060.9997 150.00300.00190.00010.9998 160.00110.000100.9999 170.00100.000300.9999 180.00070.00030  1.0000 190.00040.00000  1.0000 200.00040.00020  1.0000 210.00020.00010  1.0000 220.00010.00010  1.0000 2300  1.0000
表4降维后的4个主成分数据
专业名称pci pc2pc3po4
电子商务0.62270.44390.25500.0624
工商企业骨理0.16860.35290.10960.2648
0.6959  1.00000.93690.1495
市场营销0.62270.44390.25500.0624
物流管理00.58220.82420
财务管理0.16510.35090.11500.2703
动漫制作技术0.80700.23940.53990.4219
计算机应用技术0.76270.08500.99540.1164…•一•一…•一
(2)Libsvm软件中的参数选择。调用网格参数寻优函数SVMcgForClass实现c、g参数寻优,本例寻优结果如图2、图3所示。其中,降维前的专业评估数据集最佳参数为c=4,g=0.0156;降维后对应的专业评估数据集最隹参数为c=4,g = l o
最住参数:c= 4,g=1,A=90,4762%
图2降维前的专业评估参数c、g寻优结果
Ai件:参数:c=4,g=0.015626,4=90.4762%
图3降维后的专业评估参数c、g寻优结果
接下来进行模型训练与测试:
(1)对降维前的数据进行模型训练与测试。从以上数据集中,随机选择21项专业评估数据作为专业训练样本集,其余23项专业评估数据作为专业测试样本集;然后,分别调用Svmstrain模型训练函数^Svmpredict测试函数,获得的分类准确率为91.3043%o结果表明,应用Libsvm软件得到的专业分类结果与专家组评估得出的专业建设结果吻合率为91.3043%o
(2)对降维后的数据进行模型训练与测试。选择专业评估数据中降维后对应的主成分数据,再分
别调用Svmstrain模型训练函数与Svmpredict测试函数,获得的分类准确率为95.6522%。此次准确率比降维前提高了4.3479%(见表5)。
通过数据降维,去除了样本中信息的重叠部分,提高了分类精度。PCA-SYM评估方法与专家组现
・53
张延义,等:基于PCA-SVM的高职院校专业评估体系研究
场评估结果的吻合率高达95.6522%,即在23个测试专业中仅有1个专业分类相异。这一个相异分类的原因是,专家组对该专业的评估指标赋分或综合评审的尺度不一。其余22个专业分类均相符,这表明PCA-SVM评估方法的可靠性,可代替专家组的现场评估工作。
表5降维前后专业评估最佳参数及分类准确率
Libsvm分类准确率/%最佳参数
降维前降维后C g
65.217495.652241
91.304352.173940.0156
4结语
在本次研究中,构建了高职院校专业评估体系,引入主成分分析(PCA)和支持向量机(SVM)技术进行分析。该体系有利于专业建设成效分析与质量评价,其中包括9个一级指标和23个二级指标。应用Libsvm软件进行专业等级特征模型训练与测
试实验,验证了该体系的合理性。采用PCA-SVM专业评估方法,可以充分发挥SVM在小样本、非线性及高维模式识别以及主成分分析数据降维方面的优势,训练专业等级特征模型,以取代专业组现场评估。该评估方法可避免人为设定权重所导致的主观性偏差,能够体现专业建设的多维特征,提高专业评估的工作效率。
参考文献
[1]李梦卿,刘晶晶.我国优质高职院校建设的逻辑、特征与
机制[J].高等教育研究,2018,39(2):45-53.
[2]陈寿根.高职院校内部专业评估研究[J].黑龙江高教
研究,2012,30(5):93-96.
[3]刘民钢.从《国家职业教育改革实施方案》看高等职业
教育评估方案的改进趋向[J].上海教育评估研究,2021,10(3):11-15.
[4]刘哲,周天,彭东东,等.一种改进的基于PCA的ICP点
云配准算法研究[J].黑龙江大学自然科学学报,2019, 36(4):473-47&
[5]袁旭,迟耀丹,吴博琦,等.基于PCA算法的人脸识别技
术研究[J].信息技术与信息化,2021(3):34-37, [6]NUGROHO B.The Face Recognition Performance in Every
Lighting Condition of Testing Data[J].Journal of Physics: Conference Series,2020,1569(2):022052.
[7]邢卫强,刘从军.改进人脸识别算法在APP中的应用研
究[J].电子设计工程,2019,27(23):185-193.
[8]展领,景新幸.基于VQ-MAP和SVM融合的说话人识
别系统[J].计算机工程与应用,2011,47(13):136-13& [9]朱海林,宋承祥,刘弘,等.基于支持向量机的教学质量
评价研究[J].山东师范大学学报(自然科学版),2008, 23(4):4-6.
[10]朱丹.基于便携式脑电采集设备的机械臂控制系统
[D],南京:南京邮电大学,2015:36-38.
Study on the Course Assessment in Higher Vocational Colleges
Based on PCA-SVM
ZHANG Yanyi ZHAO Ying
(Teaching Affairs Office,Chuzhou Vocational and Technical College,Chuzhou Anhui239000,China) Abstract:The technology of principal component analysis(PCA)and support vector machine(SVM)is introduced to construct the course evaluation system of higher vocational colleges.The system is conducive to the effectiveness analysis and quality evaluation of course construction,including9primary indicators and23secondary indicators. With the help of Libsvm software,the course grade feature model is trained and tested,and the rationality of the sys­tem is verified.
Key words:course construction;course assessment;principal component analysis;support vector machine
・54・

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。