Prediction of Waiting Time in Tandem Queueing Systems Based on Machine Learning

WEI Annie; ZHAO Ning; ZHANG Zhijian

doi:10.13718/j.cnki.xsxb.2022.12.002

2022 Volume 47 Issue 12

Article Contents

Previous Article Next Article

WEI Annie, ZHAO Ning, ZHANG Zhijian. Prediction of Waiting Time in Tandem Queueing Systems Based on Machine Learning[J]. Journal of Southwest China Normal University(Natural Science Edition), 2022, 47(12): 11-21. doi: 10.13718/j.cnki.xsxb.2022.12.002

Citation:

WEI Annie, ZHAO Ning, ZHANG Zhijian. Prediction of Waiting Time in Tandem Queueing Systems Based on Machine Learning[J]. Journal of Southwest China Normal University(Natural Science Edition), 2022, 47(12): 11-21. doi: 10.13718/j.cnki.xsxb.2022.12.002

Prediction of Waiting Time in Tandem Queueing Systems Based on Machine Learning

College of Science, Kunming University of Science and Technology, Kunming 650500, China

More Information

Corresponding author: ZHAO Ning ;
Received Date: 04/08/2022
Available Online: 20/12/2022
MSC: TP181

Abstract

Tandem queueing system is the basic structure of queueing network, and it is important to study the tandem queueing system to analyze the queueing network. There are correlations between stations in a tandem queueing system, and the output process of the upstream station is the input process of the downstream station. For queueing systems that do not satisfy Markovianity, the arrival process of the downstream station is difficult to analyze by the analytical method. For the general tandem queueing system, this paper proposes to predict the mean waiting time of the system based on machine learning, and compare the prediction effect of linear regression model and nonlinear regression model in machine learning through numerical experiments. The experimental results show that the nonlinear regression model outperforms the linear regression model, and the XGBoost algorithm has a higher accuracy in predicting the mean waiting time of the tandem queueing system. In addition, this paper compares the XGBoost algorithm with the traditional approximate analysis method and finds that the prediction effect of the XGBoost algorithm is better than that of the traditional approximate analysis method.
- tandem queueing system,
- machine learning,
- simulation,
- mean waiting time,
- XGBoost algorithm

References

[1]	KLIMENOK V, DUDIN A, VISHNEVSKY V. Tandem Queueing System with Correlated Input and Cross-Traffic[M]// Computer Networks. Berlin, Heidelberg: Springer Berlin Heidelberg, 2013: 416-425. Google Scholar
[2]	O'BRIEN G G. The Solution of some Queueing Problems[J]. Journal of the Society for Industrial and Applied Mathematics, 1954, 2(3): 133-142. doi: 10.1137/0102010 CrossRef Google Scholar
[3]	JACKSON R R P. Queueing Systems with Phase Type Service[J]. Journal of the Operational Research Society, 1954, 5(4): 109-120. doi: 10.1057/jors.1954.23 CrossRef Google Scholar
[4]	JACKSON R R P. Random Queueing Processes with Phase-Type Service[J]. Journal of the Royal Statistical Society: Series B (Methodological), 1956, 18(1): 129-132. doi: 10.1111/j.2517-6161.1956.tb00218.x CrossRef Google Scholar
[5]	BURKE P J. The Output of a Queuing System[J]. Operations Research, 1956, 4(6): 699-704. doi: 10.1287/opre.4.6.699 CrossRef Google Scholar
[6]	WHITT W. Performance of the Queueing Network Analyzer[J]. Bell System Technical Journal, 1983, 62(9): 2817-2843. doi: 10.1002/j.1538-7305.1983.tb03205.x CrossRef Google Scholar
[7]	HARRISON J M, NGUYEN V. The QNET Method for Two-Moment Analysis of Open Queueing Networks[J]. Queueing Systems, 1990, 6(1): 1-32. doi: 10.1007/BF02411463 CrossRef Google Scholar
[8]	HORVÁTH A. A Joint Moments Based Analysis of Networks of MAP/MAP/1 Queues[J]. Performance Evaluation, 2010, 67(9): 759-778. doi: 10.1016/j.peva.2009.12.006 CrossRef Google Scholar
[9]	WHITT W, YOU W. A Robust Queueing Network Analyzer Based on Indices of Dispersion[J]. Naval Research Logistics (NRL), 2022, 69(1): 36-56. doi: 10.1002/nav.22010 CrossRef Google Scholar
[10]	WU K, MCGINNIS L. Interpolation Approximations for Queues in Series[J]. ⅡE Transactions, 2013, 45(3): 273-290. Google Scholar
[11]	吴登磊, 赵宁, 刘文奇. 基于指标比对串联排队系统平均排队时间的近似方法[J]. 南京航空航天大学学报, 2020, 52(4): 644-649. doi: 10.16356/j.1005-2615.2020.04.017 CrossRef Google Scholar
[12]	侯佳辰, 赵宁, 刘文奇, 等. 串联排队系统平均等待时间的近似分析[J]. 山西大学学报(自然科学版), 2022, 45(1): 41-49. Google Scholar
[13]	GUO Y J. Asymptotic Variability Analysis for a Two-Stage Tandem Queue, Part I: The Functional Law of the Iterated Logarithm[J]. Journal of Mathematical Analysis and Applications, 2017, 450(2): 1479-1509. doi: 10.1016/j.jmaa.2017.01.062 CrossRef Google Scholar
[14]	HU G S, DENG F Q. The Analysis of Queuing System Based on Support Vector Machine[C]//ICARCV 2004 8th Control, Automation, Robotics and Vision Conference. New York: IEEE Press, 2004: 2320-2325. Google Scholar
[15]	JOSEPH A, HERRERA D, HIJAL T, et al. Sci-Fri AM: Quality, Safety, and Professional Issues 04: Predicting Waiting Times in Radiation Oncology Using Machine Learning[J]. Medical Physics, 2016, 43(8): 4953. Google Scholar
[16]	PAK A. Predicting Waiting Time to Treatment for Emergency Department Patients[J]. International Journal of Medical Informatics, 2021, 145: 104303. doi: 10.1016/j.ijmedinf.2020.104303 CrossRef Google Scholar
[17]	NATAFGI M B, OSMAN M, HAIDAR A S, et al. Smart Traffic Light System Using Machine Learning[C]//2018 IEEE International Multidisciplinary Conference on Engineering Technology. New York: IEEE Press, 2018: 1-6. Google Scholar
[18]	KYRITSIS A I, DERIAZ M. A Machine Learning Approach to Waiting Time Prediction in Queueing Scenarios[C]//2019 Second International Conference on Artificial Intelligence for Industries (AI4I). New York: IEEE Press, 2019. Google Scholar
[19]	TAN B, KHAYYATI S. Supervised Learning-Based Approximation Method for Single-Server Open Queueing Networks with Correlated Interarrival and Service Times[J]. International Journal of Production Research, 2022, 60(22): 6822-6847. doi: 10.1080/00207543.2021.1887536 CrossRef Google Scholar
[20]	KHAYYATI S, TAN B. Supervised-Learning-Based Approximation Method for Multi-Server Queueing Networks under Different Service Disciplines with Correlated Interarrival and Service Times[J]. International Journal of Production Research, 2022, 60(17): 5176-5200. doi: 10.1080/00207543.2021.1951448 CrossRef Google Scholar
[21]	王岩, 苏子怡, 李晓锋, 等. 基于数据驱动的地下车站能耗预测模型对比研究[J]. 都市快轨交通, 2022, 35(3): 135-140. doi: 10.3969/j.issn.1672-6073.2022.03.021 CrossRef Google Scholar
[22]	雷相东. 机器学习算法在森林生长收获预估中的应用[J]. 北京林业大学学报, 2019, 41(12): 23-36. doi: 10.12171/j.1000-1522.20190356 CrossRef Google Scholar
[23]	杨剑锋, 乔佩蕊, 李永梅, 等. 机器学习分类问题及算法研究综述[J]. 统计与决策, 2019, 35(6): 36-40. Google Scholar
[24]	KINGMAN J F C. Some Inequalities for the Queue GI/G/1[J]. Biometrika, 1962, 49(3-4): 315-324. doi: 10.1093/biomet/49.3-4.315 CrossRef Google Scholar

Access History

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

Figures(7) / Tables(5)

Export Citation

PDF

XML

Article Metrics

Article views(906) PDF downloads(353) Cited by(0)

Access History

Other Articles By Authors

on this site
on Google Scholar

HTML

排队网络模型在流水生产线、交通运输、计算机通信等领域应用十分广泛，吸引了众多学者的关注. 串联排队系统是排队网络的基本结构^[1]，顾客在一个站接受服务后按照一定的规则接受下一个站的服务，研究该系统对深入分析复杂的排队网络具有重要意义.

串联排队系统的研究最早可追溯到20世纪50年代，文献[2-5]研究了具有马尔可夫性的串联排队系统的平均等待时间等性能指标. 随后，关于满足马尔可夫性的串联排队系统得到了广泛研究. 然而，实际生活中排队系统一般不满足马尔可夫性，这导致串联排队系统的性能很难用解析的方法来求解，通常使用近似方法进行分析. 文献[6]提出了排队网络分析方法(queueing network analysis，QNA)研究不满足马尔可夫性的串联排队系统. 文献[7]利用到达过程和服务时间的一阶矩和二阶矩的近似提出了排队网络方法(queueing network，QNET)估计顾客的平均逗留时间. 文献[8]基于分解的方法使用联合矩对MAP/MAP/1排队网络进行了分析. 文献[9]同样基于分解算法提出鲁棒排队网络分析器算法(robust queueing network analyzer，RQNA)近似开排队网络的稳态性能. 文献[10]使用固有比的方法近似串联排队系统的平均排队时间. 文献[11]采用指标比研究M/G/1-G/1串联排队系统的平均等待时间. 文献[12]提出三阶近似的方法分析GI/G/1-G/1串联排队系统的平均等待时间. 文献[13]基于泛函重对数律和重对数律极限的方法，分析GI/G/1-G/1串联排队系统的性能指标的波动程度.

近年来，基于机器学习分析排队系统引起一些学者的关注. 文献[14]利用支持向量机(support vector machine，SVM)对排队系统中到达和服务时间的概率密度函数进行分类和识别，并通过支持向量回归(support vector regression，SVR)解决概率密度函数回归的问题. 文献[15]使用机器学习的方法对患者的治疗数据进行预测，根据预测的治疗时间推断其等待时间，结果表明随机森林模型为每日治疗时间提供了最佳的预测. 文献[16]使用分位数、普通最小二乘(ordinary least square，OLS)回归以及机器学习算法对某医院患者的平均等待时间进行预测，结果表明套索回归(lasso regression，Lasso)和分位数回归方法的准确率更高. 文献[17]使用交通模拟器对神经网络进行训练，得到一个自适应交通系统. 文献[18]使用神经网络方法对银行排队的等待时间进行预测，证明机器学习是预测排队等待时间的一种可行方法. 文献[19-20]使用高斯过程回归预测单服务器和多服务器排队网络的平均逗留时间.

在日常生活中，串联排队系统广泛存在于生产系统等领域. 串联排队系统中站与站之间存在关联性，上游站的输出过程是下游站的输入过程，对于不满足马尔可夫性的排队系统，下游站的到达过程很难用解析的方法分析. 本文考虑具有两个站的串联排队系统，其到达过程和服务时间均服从一般分布，通过模拟串联排队系统的平均等待时间生成训练集，使用机器学习预测一般串联排队系统的平均等待时间，并与近似方法进行比较.

本文结构如下：第1节描述了两个站的串联排队模型；第2节介绍了常见的线性和非线性机器学习回归算法；第3节利用机器学习的方法预测串联排队系统的平均等待时间；第4节将机器学习中的XGBoost算法与其他近似方法进行比较；第5节为结论.

2. 机器学习回归算法

近年来，机器学习快速发展，广泛应用于数据挖掘、人工智能、医疗保健、排队等领域. 与传统回归方法相比，机器学习能够分析和挖掘数据中的规律，并对新的样本进行预测，适合处理复杂的回归问题. 下面介绍机器学习中常见的回归算法.

2.1. 线性回归模型

机器学习中常见的线性回归模型为多元线性回归(multiple linear regression，MLR)、岭回归(ridge regression，Ridge)以及套索回归(lasso regression，Lasso). 线性回归模型属于一种监督学习算法，研究两个随机变量之间的线性关系. 该模型可表示为

其中：X表示线性回归模型的自变量集合，Y表示线性回归模型的因变量，β表示偏回归系数，ε表示模型拟合后每一个样本的误差项.

为了求解线性回归模型的参数，将该模型的目标函数表示为^[16]

其中：λ为目标函数的惩罚系数，‖β‖₁和‖β‖₂²分别表示回归系数β的l₁和l₂正则项. 该目标函数由最小二乘误差平方和与正则项组成. 当λ=0时，该目标函数退化为MLR的目标函数；当λ≠0，α=0时，该目标函数退化为Ridge的目标函数；当λ≠0，α=1时，该目标函数退化为Lasso的目标函数. 对于Ridge和Lasso回归而言，寻找合理的λ值是平衡模型方差和偏差的关键. MLR的目标函数通过最小二乘误差平方和的方法获得；Ridge是一种替代最小二乘的压缩估计拟合方法，通过正则化减少方差，能够将系数向零的方向进行压缩，在MLR中实现变量重要性的筛选；Lasso也是通过正则化减少方差，与Ridge的差异在于Lasso可以将系数压缩至零，能够实现变量的筛选，得到输出参数较少的稀疏模型^[21].

2.2. 非线性回归模型

对于比较复杂的非线性回归模型，需要在因变量和多个自变量之间构建复杂的非线性关系. 机器学习的非线性回归算法主要包括K近邻(k-nearest neighbor，KNN)、支持向量机(support vector machine，SVM)、决策树(decision tree，DT)、随机森林(random forest，RF)、梯度提升树(gradient boosting decision tree，GBDT)以及极端梯度提升(extreme gradient boosting，XGBoost)算法. 本文将以上非线性回归算法分为3类：递归划分方法、黑箱方法和集成学习方法^[22].

递归划分方法主要包括决策树(DT)算法. 该算法按照一定的规则持续拆分数据，每次将数据划分为两个相对一致的子集，直到达到目标，从而形成树状结构，直观反映变量的重要性，但该算法结构不稳定，容易产生过拟合的现象.

黑箱方法包括K近邻算法(KNN)以及支持向量机(SVM)算法. 这类算法的输入到输出过程是通过一个模糊的“箱子”进行处理. KNN通过比较已知样本和预测样本的相似度，寻找最相似的k个样本作为未知样本的预测. 采用多重交叉验证法选取最佳k值. SVM利用某些支持向量构成的“超平面”，将不同类别的样本点进行划分，SVM算法与其他单一的算法相比，能够将低维不可分的空间转化为高维的线性可分空间，具有较高的预测准确性，但其最大的缺点是容易受共线性影响，运算成本高. 这类方法对数据缺失较敏感，处理大规模数据的效率较低.

集成学习方法通过选择某种结合策略将若干弱学习器集合起来，以得到一个预测效果较好的强学习器. 随机森林(RF)、梯度提升树(GBDT)以及极端梯度提升(XGBoost)算法是一类以决策树(DT)为基学习器的集成学习算法. RF采用多棵决策树的投票机制，即将多棵树的回归结果进行平均，最终得到样本的预测值. 类似的，GBDT也是通过对多棵树的结果进行综合，不同的是每棵树是从之前所有树的残差中学习的，并以新树每个叶子的信息增益来进行最后的全局预测. XGBoost采用了随机森林的思想，作为升级版的GBDT算法，XGBoost使用损失函数的一阶导和二阶导作为残差的近似值，而GBDT仅利用损失函数的一阶导作为残差的近似值. 集成学习方法通常优于单一的回归方法，但预测速度明显下降，随着学习器数目的增加，所需的存储空间也急剧增加^[23].

通常采用线性回归模型以及非线性回归模型进行预测时，需要将不同模型的运行时间成本和准确率进行对比分析，从中选择合理的模型进行预测. 本文将准确率作为衡量标准，选择较优的模型对串联排队系统的平均等待时间进行预测.

4. 机器学习与近似方法的比较

目前，对于到达过程为更新过程，服务时间服从一般分布的排队系统的平均等待时间的研究均采用近似方法. 文献[24]研究了GI/G/1排队系统的平均等待时间. 文献[6]基于文献[24]的方法使用排队网络分析方法(QNA)研究了具有非马尔可夫性的串联排队系统的平均等待时间. 基于布朗运动，文献[7]利用一阶矩和二阶矩的近似方法提出了使用QNET方法估计串联排队系统中顾客的平均逗留时间.

为了验证本文方法的有效性，下面分别对GI/G/1-G/1系统以及M/G/1-G/1系统的平均等待时间的误差进行比较.

系统1：在GI/G/1-G/1串联排队系统中，假设相邻顾客到达时间间隔服从伽马分布，X~Gamma$\left(\frac{1}{5}, \frac{150}{\rho}\right) $，第1个站和第2个站的服务时间分别为S₁~Gamma$\left(\frac{1}{8}, 200\right) $，S₂~Gamma(2，15)，令ρ={0.1，0.2，…，0.9}.

系统2：在M/G/1-G/1串联排队系统中，假设到达过程为泊松过程，相邻顾客到达时间间隔服从指数分布$X \sim \exp \left(\frac{\rho}{30}\right) $，第1个站和第2个站的服务时间分别为$S_1 \sim {Gamma}(2,10), S_2 \sim {Gamma}\left(\frac{10}{9}, 27\right) $，令ρ={0.1，0.2，…，0.9}.

对于上述串联排队系统，分别采用Kingman方法以及本文提出的XGBoost方法对第1个站的平均等待时间进行预测；使用QNA，QNET以及本文提出的XGBoost方法对第2个站的平均等待时间进行预测，各种方法预测的相对误差如表 4，5所示.

由表 4可知，在不同的繁忙程度下，对于第1个站的平均等待时间，XGBoost方法、Kingman方法的平均相对误差分别为0.43%，28.02%. Kingman方法是对平均等待时间上限的近似分析，其预测效果比XGBoost方法差.

对于第2个站的平均排队时间，XGBoost方法、QNA方法以及QNET方法的平均相对误差分别为0.56%，30.49%以及19.42%. 相比于其他方法，XGBoost方法的相对误差最小且平均误差均小于1%. 在繁忙程度ρ较小时，顾客的平均等待时间较短，相对误差较大. 由此可知，本文提出的XGBoost方法明显优于其他方法，并且在繁忙程度ρ较大时，预测效果最佳.

在M/G/1-G/1排队系统中，第1个站的平均等待时间存在精确解析表达式，因此，仅对第2个站的平均等待时间的相对误差进行比较. QNA方法、QNET方法均通过考虑离去过程的一阶矩和二阶矩来刻画串联排队系统中第1个站对第2个站的影响. 虽然这些方法很容易计算平均等待时间的近似值，但是其计算的精确度不高. 由表 5可知，当ρ={0.1，0.2，0.3，0.5，0.6，0.8，0.9}时，本文提出的XGBoost方法相对误差最小，XGBoost方法、QNA以及QNET方法的平均相对误差分别为0.83%，4.58%以及3.55%. XGBoost方法的平均相对误差最小，QNET方法优于QNA方法，这是由于QNA方法在平方变异系数较大的情况下，参数分解方法的性能下降导致预测效果不佳^[7]. 综上所述，XGBoost方法优于其他方法，近似效果较好，能够比较准确地计算串联排队系统的平均等待时间.

5. 结论

本文采用机器学习中的线性回归算法和非线性回归算法预测串联排队系统的平均等待时间. 将仿真的通用性与机器学习的计算效率相结合，提高了平均等待时间预测的准确性. 大量的数值实验表明，XGBoost方法对平均等待时间的预测效果较好.

本文主要研究了两个站的串联排队系统，未来可以使用该方法对其他排队系统进行深入研究，例如具有多个服务站的串联排队系统、具有有限缓冲区的串联排队系统、具有批量服务的串联排队系统以及复杂的排队网络等.

Figure (7) Table (5) Reference (24)

Name
	Name cannot be empty!
E-mail
	Mailbox cannot be empty! Mailbox cannot be empty!
Telephone
	Mobile number cannot be empty! Please enter a valid mobile number!
Title

Content
Verification Code

Message Board

Prediction of Waiting Time in Tandem Queueing Systems Based on Machine Learning