我国现行休假制度满意度及影响因素分析
我国现行休假制度满意度及影响因素分析*
王琪延  姜媛媛
内容摘要:本文基于2019年中国人民大学休闲经济研究中心“国家休假制改革”调查数据,使用逻辑回归和随机森林模型对我国现行休假制度满意度的影响因素进行分析。研究发现,带薪
休假制度是制约休假制度满意度的最重要的影响因素,法定节假日时长和周休天数次之。落实带
薪休假制度、提高法定节假日时长等,将有助于提升对现行休假制度的满意度。
关键词:休假制度;做四休三;逻辑回归;随机森林
中图分类号:C812    文献标识码:A    文章编号:1004-7794(2021)01-0066-08
DOI: 10.13778/jki.11-3705/c.2021.01.009
一、文献综述
母亲节送啥礼物好休闲能够促进身心健康,拉动休闲消费。休假制度是对休闲在时间上的重要保障。本文着力探讨现行休假制度满意度的影响因素,力图对完善现行休假制度提出合理建议,通过休假制度改革促进提升休闲消
费。
国内外学者对休闲消费[1-2]和休假满意度方面有一定研究,主要探讨带薪休假制度、休假满意度的影响因素、休假和工作、生活等的关系。在带薪休假方面,部分学者探究了带薪休假对工作压力和生活幸福感的影响。Etzion(2003)将51名休了带薪年假的员工和51名在同一时间段没有休带薪年假的员工进行休假前后的压力和倦怠问卷测试,研究发现休假组在压力和倦怠上有明显降低,未休假组没有明显变化[3]。Hilbrecht et al(2016)从加拿大统计局2010年总体社会调查中抽取了3451名全职从事有薪工作的人,研究发现与带薪休假时间显著相关的因素包括年龄,社会经济地位等;线性回归的结果表明带薪休假的天数与总体健康和生活满意度呈正相关[4]。另外,有学者对带薪休假制度及其满意度的影响因素进行了探究。田童等(2019)基于结构方程模型对北京市职工的带薪休假满意度进行了研究,结果表明带薪休假制度执行情况是最重要的影响因素[5]。在休假满意度的影响因素及休假对工作生活的影响上,John W et al(1985)从满足休假需求出发通过休闲动机量表对休假满意度进行了研究,并对休假需求的性别差异进行了讨论[6]。John et al(1992)从人口统计学变量、工作相关变量和假期相关变量三方面对影响休假满意度的因素进行了调查,结果表明婚姻和家庭满意度是重要影响因素之一[7]。Chen et al(2016)对家庭成员和休假满意度间的关系进行研究,发现配偶对受访者休假满意度的影响更大[8]。
综上,已有文献的研究多围绕某一种休假类型展开,没有从全局视角对总体休假制度进行研究;而且
已有文献在相关关系的研究上集中于休假对工作生活等方面的影响而没有关注人们对休假制——————––—––—––––
*基金项目:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)“2020年小康社会建成后休假制度改革研究”(项目编号:XNL009);国家社会科学基金重点项目“促进中国休闲产业转型升级研究”(项目编号:17ATJ003)。
win7声卡驱动度本身的感受被哪些因素影响;另外已有文献在研究方法上较为单一,以定性研究和传统的回归模
型为主。本文从现行休假制度的全局视角出发,基于问卷调查法研究现行休假制度的满意度现状和影响因素。在方法选择上,本文分别使用逐步回归和group lasso 两种变量筛选方法进行变量选择,并基于逻辑回归和随机森林两种模型给出变量重要性排序,使数据更加真实客观、研究更加准确可靠。
二、模型与方法
(一)group lasso-logistic 模型
Tibshirani (1996)首次提出Least absolute shrinkage and selection operator (lasso )模型[9],该模型可以通过将某些变量的系数压缩至0从而实现变量选择。Lasso 的表达形式如下:
2
01111p p p n
i j ij j j i j j j y x RSS ββλβλβ====⎛⎫
--+=+ ⎪⎝⎭∑∑∑∑  (1)
由式(1)可知,lasso 是在残差平方和(RSS )的基础上加了一个惩罚项1
p
j j λβ=∑,称为L 1范数。λ
是可调节的参数,λ越大惩罚力度越大,被保留的变量数越少。
传统的lasso 方法在通过L 1范数加罚进行变量筛选时只对每个单一变量进行筛选却忽略了组特征结构。因此Yuan et al (2006)提出了group lasso 方法[10],它可以将特征以组为单位进行筛选。对于普通的线性回归,group lasso 给出的估计量的表达式如下:
2
2112ˆ()arg min p G
j j Ig j g Y X ββλβλβ==⎛⎫ ⎪=-+ ⎪⎝⎭
∑∑  (2)
逻辑回归(logistic regression )在二分类预测中有着广泛的应用,它通过logistic 函数实现概率估计
腾讯qq查和变量间关系的研究,是一个分类模型,通过极大似然估计和梯度下降法实现对参数的估计。logistic 函数的形式和预测函数形式分别如式(3)和式(4)所示:
1
b twin
()1z
g z e -=+
(3)
1
()()1T
T x
h x g x e θθθ-==+  (4)
Meier et al (2008)提出将group lasso 应用到逻辑回归中,并给出了估计量的表达式[11]:
21()arg min ()()G g g g l s df ββλβλβ=⎛⎫
=-+ ⎪⎝⎭
(5)
(二)随机森林
随机森林(Random Forest )是一种机器学习算法。它在市场营销、客户流失预警、预测患病风险等
多种场景中都有着广泛的应用。随机森林是一种集成学习方法,它是由多棵决策树组成的,通过综合多棵决策树的预测结果给出最终的预测。主要包括三个步骤[12-13]:构建决策树,筛选特征,筛选森林。
三、我国现行休假制度满意度研究
本文采用的数据来源于中国人民大学休闲经济研究中心于2019年5月进行的“国家休假制改革”调查数据。该数据调查范围覆盖北京多个城区(西城区、东城区、海淀区、朝阳区、丰台区、石景山区等),调查方法是多阶段抽样。问卷是自填式结构,由5部分组成,包括休假制度现状、休假制度满意度、对
2020年小康社会建成后的休假制度期望、人口统计信息和有业人员的基本信息。本次调查共计回收有效问卷1010份。本文中的数据针对有业体,样本量为881。样本结构如表1所示。
表1
样本结构
单位:%
变量
频率 变量
频率 性别
46.4 最高受教育程度
小学及以下    1.2 女 53.5 初、高中 16.3 年龄
19岁以下    3.1 专科 29.7 20~24岁 18.5 大学 47.9 25~29岁
23.8 研究生及以上    4.8 30~39岁 30.7 个人税前年收入 0~5万元 16.1 40~49岁 12.9 5~10万元 37.3 50~59岁    4.9 10~15万元 24.4 60岁以上
5.7 15~20万元 9.9 工作状态
有业 87.3 20~25万元    5.6 无业
12.6
25万元以上
6.3
注:不足100%的部分为该变量缺失的部分
(一)总体满意度与大、中、小休满意度表现出高度相关性
王琪延等(2019)指出按休假时间长短分,我国现行休假制度由三部分构成,包括大休(带薪休假制度)、中休(法定节假日制度)和小休(周休制度)[14]。为了探究总体休假制度满意度和大、中、小休满意度之间的关系,提取出现行休假制度满意度、带薪休假制度满意度、法定节假日制度满意度和周休制度满意度4个变量进行研究,并剔除缺失数据,这4类变量之间的关系如图1所示。
图1  休假制度满意度情况
本次调查采用7级量表来度量调查者的满意度情况。图1中的横轴表示法定节假日制度满意度的
1~7个等级,纵轴表示带薪休假制度满意度的1~7个等级,气泡面积的由小到大表示周休满意度的1~7个等级,颜由浅到深表示现行休假制度满意度的1~7个等级。调查数据显示对现行休假制度满意度评级主要集中在3~6,评分5级及以上的体占50%左右。由图1可以看出面积较大、颜较深的气泡主要集中在x =4的右边和y =4的上边,
说明带薪休假制度满意度、法定节假日制度满意度和周休制度满意度与现行休假制度满意度在各个评级上的分布具有一定的一致性,带薪休假制度满意度、法定节假日制度满意度和周休制度满意度越高,则现行的休假制度满意度越高。
为了进一步探究这4个变量之间的关系,将现行休假制度满意度作为因变量,将其余3个变量作为自变量建立基于逐步回归的逻辑回归模型,得出的回归系数如表2所示。
表2
休假制度回归系数表
Intercept
周休制度满意度
法定节假日制度满意度
带薪休假制度满意度
–2.972893 1.7169*** 1.7176*** 2.0372*** 注:***表示在0.01的显著性水平上显著。
表2的结果表明带薪休假制度、法定节假日制度和周休制度满意度与现行休假制度满意度高度正相
关,其中影响最大的是带薪休假制度满意度,其次是法定节假日制度满意度和周休制度满意度。
(二)带薪休假执行情况和周休对总体满意度起重要作用
为进一步探究带薪休假和周休对现行休假制度满意度的影响,提取现行休假制度满意度、带薪休假执行情况满意度和周休是否满两天三类变量,并剔除缺失数据,得到不同体的满意度情况如图2所示。
图2不同体的满意度情况
将评级为1~4的记为不满意,5~7的记为满意。图2的结果显示,对带薪休假执行情况满意的体中有78.6%的被调查者对现行休假制度表示满意,对带薪休假执行情况不满意的体中有75.5%的被调查者对现行带薪休假制度表示不满意。可见,带薪休假的执行情况与现行带薪休假制度有较大关联。
周休满两天的体中有77.4%的被调查者对总体休假制度满意,周休不满两天的体中有77.68%的体对总体休假制度不满意。可见,周休情况也是影响现行带薪休假制度满意度的重要因素。
四、我国现行休假制度满意度影响因素分析
本文初步选取包含30个变量的数据集并对信息缺失的样本进行了删除处理,最终得到745个样本。对于这些样本按8:2的比例划分训练集和测试集,分别建立逻辑回归模型和随机森林模型。其中,对于逻辑回归模型采用group lasso和逐步回归(stepwise)两种方法选择变量。在测试集上逻辑回归和随机森林的准确率都超过了77.1%,表明筛选后的变量能较好地解释我国现行休假制度满意度的变动情况。
(一)变量说明
水垢清洗剂
在问卷中对现行休假制度的满意度评分为1~7等级。本文将1~4级看作是不满意,5~7级看作是满意;共383个样本表现为不满意和362个样本表现为满意。本文主要从大休、中休、小休和个人情况等四方面考虑现行休假制度满意度的影响因素。为了在逻辑回归中引入非线性关系,增强模型的表达能力,提高模型的拟合能力,增强模型的稳定性,本文将大多数值型变量都进行了离散化,并以虚拟变量的形式代入模型中,具体的变量见表3。
(二)logistic回归结果分析
本文采用R语言中的grpreg包进行group lasso-logistic回归[15],得到group lasso的系数解路径图如图3所示。其中参数λ表示对系数的压缩程度,λ值越大,对系数的压缩程度越大。因此可以通过调整参数λ的取值,来控制对回归系数的压缩程度。为了提高模型的稳健性,本文采用留一交叉验证(Cross-validation)和准则法选择最适的参数λ。交叉验证的结果如图4所示。横坐标为λ的自然对数ln λ,纵坐标为交叉验证的误差平方和。可以看到,在虚线附近,交叉验证的误差平方和以及压缩的效果达到最佳,λ=0.0168。
在准则法中,采用BIC、AIC、GCV三种准则进行求解的结果如图5所示,求得的λ值分别为0.02943756、0.01534877、0.01534877。
综合以上的选取方法,发现CV、AIC、GCV三者的结果十分接近,最后取AIC准则给出的λ系数,得到
group lasso-logistic回归的系数值。
在stepwise 的逻辑回归中同样采用AIC 准则进行建模,两种模型得出的回归结果如表4所示。 总体来看,带薪休假和周休情况是影响现行休假制度满意度最主要的因素,对带薪休假执行满意度越高的人对现行休假制度的满意度越高。其次,周休情况的系数为正,说明周休两天得到落实的情况越好对现行休假制度的满意度越高。
3
我国现行休假制度影响因素研究变量表
类型
符号 含义
说明
大休情况
Y 现行休假制度满意度 1=不满意,2=满意 X1 带薪休假执行满意度 1=不满意,2=满意
X2 过去十年带薪休假总次数 1=0次,2=1~3次,3=4~5次,4=6~9次,5=其他
X3
过去一年带薪休假天数 1=无,2=少于5天,3=5~10天,4=11~15天,5=16天及以上 X4 单位补偿 1=没有补偿,2=有补偿,3=有带薪休假
500克是多少斤?X5 对带薪休假法律规定的了解程度 1=不太了解,2=了解一些,3=有大致的了解,4=有详细的了解 X6 是否完全享受带薪休假 1=不能完全享受,2=能够完全享受 X7 累计工龄 1=10年以下,2=10~20年,3=20年及以上 X8 带薪休假期望天数 1=小于等于15天,2=大于15天 中休情况
X9 过去一年享受法定假日个数 1=不足7个,2=7个及以上(7个法定假日包括:元旦,春节, 清明节,“五一”劳动节,端午节,中秋节,国庆节) X10 元旦期望天数 数值型变量 X11
春节期望天数 数值型变量 X12 清明期望天数 数值型变量 X13 “五一”劳动节期望天数 数值型变量 X14 端午期望天数 数值型变量 X15 中秋期望天数 数值型变量 X16 国庆期望天数
数值型变量
小休情况
X17 周休情况 1=不足两天,2=周休两天 X18
工作日休息时间 1=不足4小时,2=4小时及以上 X19 每天工作时间 1=不足8小时,2=8小时及以上
X20 通勤时间 1=  1 小时及以内,2=1~2小时,3=2小时及以上 X21 周就业时间 1=42小时以内,2=42小时及以上 X22 周休期望天数 1=期望天数非3天,2=期望3天 个人情况
X23 性别 1=男,2=女
X24 年龄 1=24岁及以下,2=25~29岁,3=30~39岁,4=40岁及以上 X25
婚姻 1=未婚,2=已婚,3=离异、丧偶 X26 最高受教育程度 1=高中及以下,2=专科,3=大学及以上
X27 个人税前年收入 1=0~5万元,2=5~10万元,3=10~15万元,4=15~20万元,5=20万元及以上 X28 家庭税前年收入 1=10万元以下,2=10~15万元,3=15~20万元,4=20~25万元,5=25万元及以上 X29
过去一年旅游次数 1=0次,2=1~2次,3=3~4次,4=5次及以上
图3  group lasso 系数路径图
图4  交叉验证结果图

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。