门诊量是衡量医院管理水平的一项重要指标,门诊量预测是根据门诊量的发展变化规律,预计和判断其未来发展趋势和状况的活动。近年来,随着医院医疗服务水平不断提高,日门诊量变化较大,有时会超出医疗管理部门的预期,致使安排诊疗资源不够合量,影响服务质量。及时准确的预测医院日门诊量变化可为管理部门决策提供科学依据,减少盲目性。
医院门诊量预测的传统研究方法主要有时间序列数据季节指数分析和ARIMA方法,以上方法通过找出医院门诊量随时间变化规律对月度和季度门诊量进行预测。由于传统方法预测模型过于简单,难以描述影响因素与日门诊量变化之间复杂的非线性关系,近年来神经网络预测方法逐渐被应用于医院门诊量预测。极限学习机(Extreme Learning Machine,简称ELM)是由黄广斌团队提出的一种新型单隐层前馈神经网络(Single hidden Layer Feed forward Network)学习方法,该算法随机产生输入层与隐含层间的连接权值及隐含层神经元阈值,训练过程中无需调整,只需设置隐含层神经元个数,便可求得唯一最优解。与传统神经网络方法相比,该方法具有学习速度快,训练时间短,泛化能力强等特点。论文以某综合性医院五年日门诊量数据为实验样本,采用相似日和极限学习机的方法建立预测模型。仿真结果表明,该方法在医院日门诊量预测中取得了较好的准确率。
1基于相似日和极限学习机的预测模型
相似日原理在大量已有文献中,门诊量的预测模型都是将前期门诊量作为预测后期门诊量的输入变量,这种方案对月度和年度预测能得到较高的准确度。但对于日门诊量预测,由于受节假日因素影响较大,模型的预测准确度较低。
相似日的基本原理是将日门诊量的影响因素构成一个特征向量,根据日特征向量的相近程度通过某种相似评估方法从历史日中选取若干相似日。影响日门诊量的主要因素有日类型因素(星期一、星期二、…、星期日)、月度因素、季节因素、节假日因素等。结合部分关于门诊量动态变化分析的文献和对实际数据的分析,医院日门诊量数据按日类型因素表现出很强的规律性。为对日门诊量进行有效预测,根据相似日原理,论文将历史数据以星期一、星期二、…星期日进行分块,去除节假日数据,而后分别建立预测模型。
极限学习机(ELM)算法
表1 极限学习机算法
2仿真实验和结果分析
实验数据实验数据来自某三甲医院2010年10月至2016年1月门诊量数据,采集周期为24小时。由于节假日门诊量波动较大,为保证预测结果的一般性,从样本数据中去除变化较大的节假日数据,如春节、十一等国家法定长假日,按日类型分类后星期一至星期日各数据点分别为242、253、253、253、251、248、249。
评价指标为科学评价模型预测效果,选用平均绝对误差(MAE)和平均相对误差(MAPE)作为评价指标,计算公式如下:
实验过程论文以前两日数据作为输入,预测后一日输出,具体步骤如下:(1)去除春节、十一等国家法定节日数据,按照相似日理论,将数据按日类型(星期一、星期二、……、星期日)进行分类。(2)将分类好的数据分别划分为训练集和测试集(每一类前80%数据为训练集,后20%数据为测试集)。(3)对数据进行归一化,使样本数据在[-1,1]之间变化,以减少数据差异较大对模型性能的影响,提高收敛速度。(4)创建ELM模型,设定隐含层的激励函数、节点数,随机产生输入层与隐含层间的连接权值及隐含层神经元的阈值。实验中隐含层节点数选为8,激励函数为sigmod。(5)应用训练集数据对模型进行训练。(6)应用测试集对训练好的模型进行测试,得到预测结果和误差。
结果及分析论文使用matlab2015a软件进行仿真,得到星期一至星期日数据类型预测结果如图1所示,误差情况如表2所示。由图1可知,预测值较为准确的反映了实际值变化趋势,表明论文所提方法对日门诊量预测具有一定的适应性。表2显示该模型预测结果的平均相对误差(MAPE)最高为6.9818%,最低为5.5223%,预测值和实际值之间有较大偏差,分析原因主要有两个方面,一是近年来医保政策变化较多,如分级诊疗等对医院门诊量影响较大,二是模型对季节因素反映不充分,导致部分数据预测精度不高。然而,对于设有数十个科室的大型综合医院,该预测模型精度可以接受。
3结论与展望
论文研究了基于相似日和极限学习机方法在医院门诊量短期预测中的应用,仿真结果表明,该方法可取得较高精度。下一步将就日类型因素、月度因素、季节因素、节假日因素对模型的影响进行量化分析,对模型进行优化,并对医院日门诊量中长期预测进行研究。
文章来源:《中国数字医学》杂志2018年第02期,作者及单位:桑发文韦哲陈辉杜小加,兰州军区兰州总医院。
欢迎关注,CHINC服务号获取最新大会消息
公众号ID:jcdm2006
发表评论