-
梅毒是由梅毒螺旋体引起的危害严重的性传播疾病,不仅可严重损害机体多个器官,还可由母体经胎盘垂直传播给胎儿,侵犯胎儿全身器官,引起流产、早产、死胎和畸胎或胎传梅毒[1]。近年来,全球的梅毒发病率一直居高不下,我国梅毒的感染率和发病率也呈直线上升趋势[2]。自20世纪80年代以来,性病在我省死灰复燃,尤其是近年来梅毒发病率呈现逐年上升趋势,梅毒、淋病一直位居37种法定报告传染病的第4、5位,成为我省严重的公共卫生问题[3]。本文采用自回归滑动平均混合模型(autoregressive integrated moving average,ARIMA)拟合蚌埠市梅毒发病率,探讨模型的可行性,为蚌埠市制定梅毒防控措施提供依据。
-
蚌埠市2008-2016年梅毒发病率的时间序列图(见图 1)显示,蚌埠市梅毒月发病率呈现上升趋势;在大多数年份中,发病率高峰在当年的第三季度,其次为第二季度;随着序列的时间推移,发病高峰与低谷的间距增大(以年分组进行方差齐性检验Levene统计量=2.203,P < 0.05,序列方差不齐)。原序列不符合零均值平稳性要求,应对原序列进行平稳化处理。
-
随着序列的时间推移,月发病率增加,发病高峰与低谷的间距增大(原序列方差不齐),所以首先对原序列进行对数转换,再进行一阶差分使序列平稳,差分后的平稳序列记为Z(见图 2)。
-
平稳序列是将原序列经过对数转换和一阶差分得到,故有d=1,Z的ACF和PACF(见图 3)。根据图 3,初步选定非季节模型=0或1,q=1。季节模型的P、Q判断比较困难,P和Q很少超过2,一般取0、1、2,且p、d、P、Q不能同时取0。对以上几种情况经过模型的拟合优度、参数估计情况、残差情况进行综合判断。
-
选取不同p、d、P、Q组合进行拟合优度检验,选取BIC较小,模型参数估计有意义的模型为较优模型,通过比较结合实际获得较优模型ARIMA(0, 1, 1)(1, 0, 0)12, 此时非季节滑动平均系数MA1=0.725(t=10.42, P < 0.01), 季节滑动平均系数SMA1=-0.298(t=3.11, P < 0.01), BIC=-4.604。绘制ARIMA(0, 1, 1)(1, 0, 0)12模型的残差值得ACF图和PACF图(见图 4)对模型进行诊断;本模型残差序列的ACF和PACF均在95%可信区间内,并且残差序列的Box-Jenkins统计结果显示统计量差异无统计学意义(P>0.05), 说明残差是随机分布的, 因此可以用ARIMA(0, 1, 1)(1, 0, 0)12模型来预测蚌埠市梅毒发病情况。
-
运用模型对蚌埠市2008年1月至2017年6月各月发病率进行预测并比较,其中以2008-2016年的发病率作为模型拟合点,对2017年1-6月各月发病率进行预测,图 5显示该模型对2008年1月至2017年6月各月梅毒发病率的拟合值及其95%可信区间与实际发病率基本一致,表 1给出2017年1-6月各月梅毒实际发病率的预测值的比较情况,可见2017年1-6月各月梅毒发病率实际值和预测值基本趋势一致,且发病率均在预测值的95%可信区间内,除了2017年1月的发病率预测值相对偏高外,其他月份预测精确度均较高,可以认为该模型能够对发病率进行及时准确的预测,具有一定的实际意义。
月份 实际发病率 发病率预测值 预测值95%CI 误差 相对误差/% 1 3.50 4.26 2.79~6.50 -0.75 -21 2 4.24 3.78 2.44~5.86 0.46 11 3 4.32 4.11 2.61~6.47 0.22 5 4 4.69 4.11 2.57~6.57 0.58 12 5 5.19 4.45 2.74~7.21 0.74 14 6 4.77 4.32 2.63~7.09 0.45 10 表 1 蚌埠市2017年1-6月各月梅毒发病率实际值与预测值比较
ARIMA模型在蚌埠市梅毒预测中的应用
Application value of ARIMA model in the prediction of syphilis in Bengbu city
-
摘要:
目的探讨时间序列分析中的乘积季节自回归移动平均(ARIMA)模型在蚌埠市梅毒发病率预测中应用的可行性,为制定梅毒防控措施提供参考依据 方法应用SPSS21.0软件对蚌埠市2008-2016年的梅毒发病率进行ARIMA模型拟合,依据BIC准则确定最优模型。用所得模型预测2017年1-6月的梅毒发病率,并与实际发病率进行比较,检验预测效果。 结果ARIMA(0,1,1)(1,0,0)12,可以较好地拟合梅毒月发病率规律,模型统计量Ljung-Box Q=16.726,P>0.05,残差序列为白噪声,用所得模型预测蚌埠市2017年1-6月梅毒月发病率,预测值与实际值吻合情况良好,实际值均在预测值的95%可信区间内。 结论ARIMA模型能较好拟合蚌埠市梅毒发病情况,对梅毒防治工作提供一定的参考价值。 Abstract:ObjectiveTo explore the feasibility of applying the seasonal autoregressive moving average (ARIMA) model for predicting the incidence of syphilis in Bengbu city, and provide reference in the prevention and control of syphilis. MethodsARIMA model was used to fit the monthly incidence of syphilis in Bengbu from 2008 to 2016 by SPSS21.0 software, and the optimal model was established according to the BIC criterion.The incidence rate of syphilis from January to June 2017 was predicted, which was compared with the actual incidence in order to test the prediction effect. ResultsThe monthly incidence rate of syphilis was well fitted by ARIMA (0, 1, 1) (1, 0, 0) 12.The model statistic Ljung-Box Q=16.726, P>0.05, and the residual sequence was white noise.The predictive value of syphilis incidence from January to June 2017 in Bengbu was well consistent with the actual value, and the actual values were within the 95% confidence interval of the predicted value. ConclusionsARIMA model can well simulate the incidence of syphilis in Bengbu, and provide some reference basis for prevention and control of syphilis. -
Key words:
- autoregressive moving average model /
- syphilis /
- prediction
-
表 1 蚌埠市2017年1-6月各月梅毒发病率实际值与预测值比较
月份 实际发病率 发病率预测值 预测值95%CI 误差 相对误差/% 1 3.50 4.26 2.79~6.50 -0.75 -21 2 4.24 3.78 2.44~5.86 0.46 11 3 4.32 4.11 2.61~6.47 0.22 5 4 4.69 4.11 2.57~6.57 0.58 12 5 5.19 4.45 2.74~7.21 0.74 14 6 4.77 4.32 2.63~7.09 0.45 10 -
[1] AGRAWAL PG, JOSHI R, KHARKAR VD, et al.Congenital syphilis:the continuing scourge[J].Indian J Sex Transm Dis, 2014, 35(2):143. doi: 10.4103/0253-7184.142411 [2] ZHANG W, DU Z, TANG S, et al.Syphilis in the economic center of South China:results from a real-time, web-based surveillance program[J].BMC Infect Dis, 2015, 15:318. doi: 10.1186/s12879-015-1072-z [3] 刘姝颖, 李延庆, 孟庆联, 等.安徽省2004~2010年梅毒、淋病流行趋势分析[J].安徽医学, 2012, 33(2):220. [4] 孙振球.医学统计学[M].4版.北京:人民卫生出版社, 2016:384. [5] 中国人民银行调查统计司.时间序列X-12-ARIM A季节调整-原理与方法[M].北京:中国金融出版社, 2006:59. [6] BOX G, JENKINS G, GREGORY REINSEL, et al.时间序列分析预测与控制[M].北京:中国统计出版社, 1997:377. [7] 宇传华.SPSS与统计分析[M].北京:电子工业出版社, 2014:593. [8] 高云云, 李军, 杨海燕, 等.ARIMA模型在河南省甲型病毒性肝炎发病数预测中的应用[J].现代预防医学, 2017, 44(7):1294. [9] 马晓梅, 刘颖, 杨梦利, 等.手足口病月发病率ARIMA乘积季节模型预测探讨[J].现代预防医学, 2017, 44(9):1541. [10] 陈伟, 陈正利, 李少芳, 等.ARIMA模型在河南省梅毒月发病率预测中的应用[J].中国卫生统计, 2013, 30(4):604. [11] 胡冰雪, 曲波, 刘洁, 等.中国1990-2011年梅毒流行特征分析与趋势预测[J].现代预防医学, 2014, 41(6):961. [12] 王永斌, 李向文, 柴峰, 等.ARIMA模型在我国梅毒发病率预测中的应用[J].现代预防医学, 2015, 42(3):385. [13] 郭璐, 张敏, 朱正平, 等.ARIMA模型在南京市梅毒预测中的应用[J].现代预防医学, 2015, 42(2):205.