行业应用与交流《自动化技术与应用》2021年第40卷第2期
Industrial Applications and Communications
基于智能推荐的离退休干部信息管理系统研究
张小俊
(江苏省南京市疾病预防控制中心工会离退办,江苏南京210003)
摘要:离退休干部管理对于人力资源部门关于干部管理以及人力资源利用有重要的作用,传统的信息系统仅实现了对于离退休干部人事信息、档案信息的基本管理,对于系统用户并不能提供智能化的人力资源信息推荐。本文提出一种基于术语频率(TF)和反向文档频率(IDF)等思想构建TF-IDuF方法实现档案信息的推荐,文中主要对关键的TF-IDuF模型进行了介绍,并于传统的TF-IDF模型进行了推荐准确率的对比,结果表明该模型的推荐效果较优。
关键词:智能推荐;术语频率;反向文档频率;干部信息管理
中图分类号:TP315文献标识码:A文章编号:1003-7241(2021)002-0141-03
Research on Retirement Cadre Information Management System Based on Intelligent Recommendation
ZHANG Xiao-jun
(Nanjing,Jiangsu Province Disease Control and Prevention Center trade Union Retired,Nanjing210003China)往国外寄东西用什么快递
Abstract:The management of retired cadres plays an important role in the management of cadres and the utilization of human resources in the human resources department.The traditional information system only realizes the basic management of personnel information and archive information of retired cadres,and does not provide intelligence for system users.Human resource information recommendation.This paper proposes a method based on the term frequency(TF)and reverse document frequency(IDF)to construct TF-IDuF method to realize archival information.The key TF-IDuF model is introduced in the paper,and the traditional TF-The IDF model compares the recommended accuracy rates,and the results show that the proposed model has better recommendations.
Key words:intelligent recommendation;term frequency;inverse document frequency;cadre informatio
n management
1引言
离退休干部作为国家建设的重要人力资源组成,各单位对离退休干部的管理的重点之一是对其档案进行管理,目前主流的干部信息管理系统均实现了通用的干部基本信息管理,以及通过不同手段实现干部信息采集、干部档案管理以及干部信息查询等功能。然而老干部信息档案对于各单位干部组织工作开展参考的重要渠道,即智能化的档案搜索是干部信息管理系统的核心,本文介绍了一种基于词频率(术语频率)(Term Frequency,TF)和反向文档频率(Inverse Document Frequency,IDF)用于构建离退休干部档案的查询,为组织管理者提供智能
收稿日期:2019-09-04化的推荐手段,其中TF是所要查询的术语在文档或用户模型中出现的频率,设计原理是一所查询术语发生的频率越高,该术语越有可能描述文档的内容或用户的信息需求,如档案管理中常见的“籍贯”信息可作为检索条件.IDF通过计算在要搜索或推荐的整个文档集合中包含该术语的文档的反向频率来反映该术语的重要性,涉及原理是—
—如果很少有其他文档也包含该术语,则应该赋予术语更高的权重,因为罕见的术语可能更能代表文档的内容或用户的兴趣。虽然TF-IDF最初是为经典搜索开发的,但TF-IDF也是用户建模和搜索推荐最受欢迎的术语加权方案之一。例如,83%的调查基于文本的论文推荐系统[1]使用TF-IDF,IDF的概念
应用于推荐系统的其他领域,并应用不仅涉及条款,还涉及引用等实体[2]o
Techniques ofAutomation&Applications1141
《自动化技术与应用》2021年第40卷第2期
行业应用与交流
Industrial Applications and Communications
在本文设计的离退休干部管理系统的智能检索模块 何实现智能推荐功能),利用TF —IDF 的典型用户建模和
推荐过程,具体流程设计如图1所示。
具体各步骤说明如下:t 1,...,n
1、 用户u 拥有一个文件集C u o 例如,该集合可能包
含用户下载,购买或阅读的所有文档。
2、 用户建模引擎识别来自用户C u 的与建模用户信息
需求相关的文档。例如,相关文档可以是用户在过去x 天
内下载或购买的文档。引擎选择这些文档作为临时文档 集合C um ,用于用户建模。
3、 用户建模引擎使用TF —IDF 对C um 与发生的每个
术语进行加权计算。
TF-IDF = tf(t)*
\ogH 其中:t 表示术语权值;
tf(t)表示临时文件C um 中t 的频率;
C r 表示可能向用户u 推荐的文档集合;
N r 表示C r 中文档的数量;
6表示C r 中包含t 的文档数量。
4、 用户建模引擎将z 最高加权项存储为用户模型 um ,这些术语旨在表示用户的信息需求。
5、 推荐系统将其与C r 中的文档进行匹配,并向用户u
推荐最相关的推荐候选人。
在本文中,引入TF —ID u F ,用于解决干部档案管理中 的术语加权方案,即可以在不访问推荐语料库的情况下
计算TF —ID u F ,并且它考虑用户的整个文档集合。
2档案检索TF-ID u F 模型
TF —ID u F 中的术语频率(TF)分量与TF —IDF 中的相
同:术语加权越高,它们在选择用于构建用户模型的文档 中出现的次数越多[3—4]o 但是,以用户为中心的逆文档频
率(ID u F )与经典IDF 不同。虽然使用推荐语料库中的文
档频率计算经典IDF ,但是使用用户的个人文档集合C u
中的文档频率来计算ID u F ,其中术语的权重更强,用户集 合中的文档越少包含这些术语。
TF — ID ”F = /(/)* log 验
n u
其中:t 表示术语权值;
过年高速免费时间2022最新通知tf(t)表示临时文件C um 中t 的频率;
C u 表示用户的文档集合;
N u 表示C u 中的文档数量;
n u 表示C u 中包含t 的文档数量。
用户建模引擎选择用户最近下载的两个文档d 1和
d 2。d 1中词频t 1与氏中词频t 2相同。仅基于术语频率,这
u盘文件被隐藏两个术语将被视为同样适用于描述用户的信息需求[5—6]。 但是,用户的文档集合包含许多包含t 2的附加文档,但是
没有为用户建模过程选择这些文档,例如,由于用户文档
是在几个月前下载的,用户的文档集合中没有其他文档 包含t 1,在这种情况下,可以假设匕描述了作者之前不感
哈哈镜原理兴趣的新主题,假设在这种情况下,t 1的权重比t 2更强,元 婴如下:
用户可能倾向于支持较新主题t 1的推荐,而不是旧 主题t 2。
更容易为t 1生成比匕更好的建议,因为与t 2上的文档 相比,用户还不知道t 1上可能存在更多文档。
用户可能在过去收到了针对t 2的建议,但用户可能尚
未收到很多关于t 1的建议。因此,对于t 2,可能已经向用 户推荐了最相关的文档。
如图2所示为按照以上流程执行的模型分析案例图。
食品的分类2.1模型测试结果
如图3所示为对TF,TF —IDF 和TF —ID u F 的推荐率
图。结果表明对于信息用户来说,实现智能推荐一即
离退休干部档案信息推荐,TF —ID u F 更为有效。如图3所 示,对于所有三种加权方案,CTR 在前几个月略有下降,然
用户u 拥有文件 用于用户建模得临时文件集合用户u 的用户模型"力 獄斗库推荐候选人C ”
集合q
图1 TF-IDF 流程图
142 | Techniques ofAutomation&
Applications
行业应用与交流《自动化技术与应用》2021年第40卷第2期In d ustrial Applicati o nsand Com m un icati o ns
用户u采集的文档集合c”用户模型G”收集的文档集合
图2模型分析案例图
CTR(点击率)
[9;12][13;18]>=18 TF-Only(Dspld.Rea)22,82013,79911^789,7037,99619,39222,26922,9238,994 TF-IDF(Dspld.Rea)6,8875,0774,1194,0962,8906,5295,8046,9934,005沁沁TF-IDuF(Dspld.Rec.)6,8794,6963,8034,0962,5015,4235,0396,3974,054・・♦•■・・•TF-Only(CTR) 5.43% 3.53% 3.04% 3.30% 3.54% 3.77% 3.41% 4.61% 4.84%25,000 20,000 15,000|
10,000推5,000荐0的
档
数
量
TF-IDF(CTR)7.03% 4.26% 3.59% 3.91% 4.19% 4.44% 5.63% 5.81% 5.19%—«—TF-IDuF(CTR) 5.89% 4.94% 4.58% 4.86% 4.45% 4.67% 4.80% 5.56% 5.75%
用户注册的月份时间
图3推荐率结果图
后再次略微增加。在第一个月,TF-ID u F比TF-Only略微有效,同样,这是预料之中的,因为在第一个月,用户的概念漂移是不太可能的,并且用户在其集合中具有相当少的文档(其中大多数用于用户建模过程)。因此,TF-IDF是第一个月最有效的加权计划(7.03%)。在2到5个月期间,TF-IDuF的表现优于TF-IDF,这可以看作是几个月后用户开始转移焦点,在接下来的几个月里,两种加权方案的表现同样出。
3结束语
离退休干部管理一直是相关部门人事管理的难题,传统的档案管理模式对于干部信息推荐效果较差,本文提出一中基于TF和IDF的用于解决离退休干部档案信息管理的方法,称为TF-IDuF,该方法基于术语概率为人事管理员提供智能化的档案推荐功能。commender systems:A literature survey[J].International Journal on Digital Libraries,2015:1-34.
[2]徐自雄•“互联网+”时代老干部工作转型发展思考[J].管理观察,2018(24):66-67.
[3]廖仲明•高校干部管理信息化平台设计研究[J]•中国教育信息化,2018(5):78-80.
[4]陈柳•浅谈高校干部信息化管理系统的分析与思考[J].计算机产品与流通,2017(9):170-171.
[5]赵雪梅,申正忠,周锦良•干部管理信息系统开发及应用[J].电力信息与通信技术,2015,13(9):102-106.
[6]黄嘉诚,董晶•基于微服务的智能档案服务系统设计与实现[J].电子设计工程,2018,26(2):26-30.
参考文献:
茅台飞天53度价格回收价格2020[1]Beel J,Gipp B,Langer S,et al.Research-paper re-
作者简介:张小俊(1963-),男,本科,高级政工师,从事工会,离退休思想政治工作等等。
Techniques ofAutomation&Applications1
143
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论