Преподаватели кафедры бизнес-информатики Уральского государственного экономического университета заведующий кафедрой, доктор экономических наук Дмитрий Назаров, ассистенты кафедры Антон Назаров и Денис Ковтун разработали модель распространения новой коронавирусной инфекции COVID-19, которая только цифрами иллюстрирует необходимость самоизоляции. На примере статистических данных заболеваемости по Екатеринбургу они подтвердили правильность самоизоляции и необходимости сокращения количества работающих мест обычного скопления людей.
Построение модели – это достаточно увлекательное и полезное с точки зрения приобретения новых компетенций в условиях самоизоляции занятие. В представленной модели есть допущения в условиях неполной информации, но в целом получившаяся общая картина весьма близка к реальности.
Начнем с вычисления вероятности единичного инфицирования в предположении, что очагов инфекции в нашем красивом и большом городе нет. Для этого нам понадобится официальная статистика случаев заболевания по Свердловской области и Екатеринбургу. В этом нам помогут данные, которые подготовили Антон Назаров и Денис Ковтун. Также молодые ученые кафедры бизнес-информатики провели анализ этих данных, получили достаточно интересные зависимости и сделали выводы.
Официальная численность населения города Екатеринбурга в 2019 году составила 1 483 119. Это число на самом деле больше, если добавить к нему проживающих в городе неофициально, однако для построения и логики работы модели этого достаточно. Берем официальную статистику по Свердловской области с сайта Стопкоронавирус.рф и получаем следующую таблицу с данными. Данные представлены по Свердловской области, однако учитывая, что г. Екатеринбург – это крупнейшая агломерация СО, то при вычислении вероятности инфицирования в нашем городе можно использовать эти данные.
Дата |
Общая заболеваемость на дату по СО |
Вероятность инфицирования |
17 марта |
1 |
0,0000006667 |
18 марта |
1 |
0,0000006667 |
19 марта |
6 |
0,0000040000 |
20 марта |
6 |
0,0000040000 |
21 марта |
9 |
0,0000060000 |
22 марта |
9 |
0,0000060000 |
23 марта |
9 |
0,0000060000 |
24 марта |
13 |
0,0000086667 |
25 марта |
13 |
0,0000086667 |
26 марта |
20 |
0,0000133333 |
27 марта |
20 |
0,0000133333 |
28 марта |
24 |
0,0000160000 |
29 марта |
24 |
0,0000160000 |
30 марта |
24 |
0,0000160000 |
31 марта |
33 |
0,0000220000 |
1 апреля |
33 |
0,0000220000 |
2 апреля |
38 |
0,0000253333 |
3 апреля |
39 |
0,0000260000 |
4 апреля |
40 |
0,0000266667 |
5 апреля |
40 |
0,0000266667 |
6 апреля |
44 |
0,0000293333 |
7 апреля |
51 |
0,0000340000 |
8 апреля |
56 |
0,0000373333 |
9 апреля |
59 |
0,0000393333 |
10 апреля |
61 |
0,0000406667 |
11 апреля |
74 |
0,0000493333 |
12 апреля |
78 |
0,0000520000 |
13 апреля |
85 |
0,0000566667 |
14 апреля |
93 |
0,0000620000 |
15 апреля |
105 |
0,0000700000 |
Эти данные помогают определить некоторое типичное значение вероятности, а самое главное, оценить скорость роста инфицирования. По имеющимся данным видно, что скорость роста примерно одинакова, учитывая, что с 10 апреля медики Екатеринбурга получили возможность самостоятельно проводить тестирование. Это очень хорошая тенденция, ведь при увеличении количества тестирований жителей очевидно растет и вероятность обнаружения инфицированных (рост на 11 человек) с 10 на 11 апреля. Поэтому мы отметим ключевые даты. В частности, начало самоизоляции (28 марта), выход персонала некоторых организаций на работу (6 апреля), начало ослабления самоизоляции 13 апреля.
Теперь перейдем к моделированию ситуации распространения коронавируса, исходя из особенностей этой вирусной инфекции, которые сформулированы медиками по результатам исследований:
Эти факты необходимы для построения нашей модели. Для того, чтобы аналитически оценить скорость распространения, необходимо декомпозировать все места скопления людей по какому-либо критерию. Критерий этот – средняя посещаемость ТЦ, ресторанов и других мест. В условиях неполной и ограниченной информации мы решили применить для построения аппарат теории нечетких множеств и разбить все места города на классы «очень низкая посещаемость», «низкая посещаемость», «средняя посещаемость», «высокая посещаемость», «очень высокая посещаемость».
Максимальная проходимость будет у крупных ТЦ, таких в городе Екатеринбурге, по статистике https://vyborok.com/rejting-luchshih-torgovyh-czentrov-ekaterinburga/, 4. В этих центрах проходимость в месяц от 800 000 до 1000000 посетителей, а также средних торговых центров 6, посещаемость которых от 300000 до 800000 в месяц. Исходя из этих данных нами была составлена следующая таблица:
Посещаемость в день |
Минимум |
Максимум |
Типичный |
Кол-во организаций |
очень низкая |
100 |
1000 |
500 |
6000 |
низкая |
1000 |
4000 |
2500 |
500 |
средняя |
4000 |
10000 |
7000 |
100 |
высокая |
10000 |
27000 |
18000 |
6 |
очень высокая |
27000 |
35000 |
30000 |
4 |
Типичный показатель был рассчитан с учетом неполной информации с применением аппарата теории нечетких множеств. Если Вам захотелось узнать об этой замечательной теории побольше, то можете почитать книгу, которая в 2019 г. вышла в издательстве «Юрайт» https://urait.ru/book/intellektualnye-sistemy-osnovy-teorii-nechetkih-mnozhestv-453458.
Количество торговых центров, магазинов, кафе, ресторанов в нашем городе около 7000, что необходимо учитывать при построении модели. Экспертным путем мы попытались оценить количество таких организаций. Обращаясь к критикам модели, сразу скажем, что главное в этой оценке порядок чисел.
Совершенно очевидно, что вероятность инфицирования в случае высокой посещаемости выше, чем в случае со средней и низкой, значит, для получения адекватной модели нам надо учесть и этот факт. Включение его в модель относится к пониманию теории вероятности, в частности выбора закона распределения. Без ограничения общности можно считать, что закон распределения в этом случае (единичная вероятность низкая, а количество испытаний судьбы L достаточно высокое) – закон Пуассона. Исходя из этого закона рассчитывают количество звонков в единицу времени, количество заправочных станций на трассе, количество бракованных изделий в партии и т.д. Пока распространение коронавируса подчиняется этому закону.
Этот закон мы применим для расчета вероятности количества инфицированных для всех типов организаций.
Начнем с поиска ответа на вопрос. А если бы Президент РФ и Губернатор СО не ввели жесткие карантинные меры? Что бы было через неделю? Две недели?
Сначала оценим вероятность инфицирования жителя города в одной организации в зависимости от типа посещаемости. Для этого считаем параметр лямбда (6 строка), в предположении, что вероятность единичного инфицирования берется от 28 марта). Обратим внимание на строку 8, это вероятность быть не инфицированным. Казалось, бы все в порядке, «нам не страшен серый волк». Однако, как обычно, дьявол кроется в деталях. Сейчас мы вам их и раскроем. Первое: наглядно видно, что степень неинфицированности снижается в зависимости от посещаемости места. Для таких торговых центров, как «Гринвич», вероятность остаться здоровым сравнима с вероятностью подбрасывания монеты. Но мы, русские, знаем, что бутерброд падает всегда маслом вниз!
Строчка 9 показывает вероятность единичного заражения на территории с разной степенью посещаемости в день. Наглядно видно, что вероятность увеличивается кратно в зависимости от посещаемости места.
№ |
Посещаемость в день |
очень низкая |
низкая |
средняя |
высокая |
очень высокая |
|||||
1 |
минимум |
100 |
1000 |
4000 |
10000 |
27000 |
|||||
2 |
максимум |
10000 |
4000 |
10000 |
27000 |
35000 |
|||||
3 |
типичная |
500 |
2500 |
7000 |
18000 |
30000 |
|||||
4 |
Кол-во организаций |
6000 |
500 |
100 |
6 |
4 |
|||||
5 |
3000000 |
1250000 |
700000 |
108000 |
120000 |
||||||
6 |
лямбда |
0,008 |
0,04 |
0,112 |
0,288 |
0,48 |
|||||
7 |
Кол-во инфицированных, x |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Математическое ожидание прироста больных |
||||
8 |
0 |
0,992031915 |
0,960789439 |
0,8940443 |
0,749761592 |
0,618783 |
|||||
9 |
1 |
0,007936255 |
0,038431578 |
0,100133 |
0,215931339 |
0,297016 |
79,33026852 |
||||
10 |
1<=x<=2 |
0,007968 |
0,039200209 |
0,1057404 |
0,247025451 |
0,3683 |
80,93749905 |
||||
11 |
1<=x <=3 |
0,007968085 |
0,039210458 |
0,1059497 |
0,250010486 |
0,379705 |
81,02759751 |
||||
12 |
1<=x <=4 |
0,007968085 |
0,03921056 |
0,1059556 |
0,250225409 |
0,381074 |
81,03500007 |
||||
13 |
1<=x <=5 |
0,007968085 |
0,039210561 |
0,1059557 |
0,250237788 |
0,381205 |
81,03561345 |
||||
Строчка 10 показывает, какова вероятность инфицирования от 1 до 2 человек, строчка 11 – от 1 до 3 и т.д. А вот последний столбец таблицы очень удручает, он показывает средний прирост заболевших в день по всему городу Екатеринбургу, поскольку учитывает количество организаций каждого типа. Так вот, по модельным данным, при необъявлении карантина, на следующий день в городе прирост составил бы 80 больных. А дальше легко понять: цепная реакция (возможно, уже не подчиняющаяся закону Пуассона), коллапс системы здравоохранения и хаос, как Европе. Посмотрите на числа, оцените их с точки разумного человека, тогда принять девиз России «Мы вместе», не составит труда.
Модель 1
Дата |
Кол-во инфицированных, x |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Математическое ожидание прироста инфицированных |
28 марта |
0 |
0,965927338 |
0,840857282 |
0,615492 |
0,28707838 |
0,12493 |
|
29 марта |
1 |
0,033485481 |
0,145748596 |
0,2987188 |
0,358273818 |
0,259855 |
306,8481248 |
30 марта |
0 |
0,872260931 |
0,50493108 |
0,1475876 |
0,007299131 |
0,000275 |
|
30 марта |
1 |
0,119208994 |
0,345036238 |
0,2823843 |
0,035911724 |
0,002252 |
916,2349906 |
31 марта |
0 |
0,642699291 |
0,109657693 |
0,0020517 |
1,22541E-07 |
3,02E-12 |
|
31 марта |
1 |
0,284123429 |
0,242386448 |
0,012698 |
1,95022E-06 |
8,02E-11 |
1827,203616 |
Не правда ли, ужасающая статистика? Уже на 31 марта число инфицированных составило бы около 3000 человек. А на 1 апреля 5000. Начался бы хаос, «Скорые» бы не успевали приезжать за инфицированными, больницы были бы перегружены. Врачи стали бы выбирать, кого лечить.
Что же дала самоизоляция?
Модель 2
№ |
Посещаемость в день |
очень низкая |
низкая |
средняя |
высокая |
очень высокая |
|||
1 |
Кол-во организаций |
100 |
9 |
10 |
0 |
0 |
|||
2 |
лямбда |
0,008 |
0,04 |
0,112 |
0,288 |
0,48 |
|||
3 |
Кол-во инфицированных, x |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Вероятность инфицирования |
Математическое ожидание прироста больных |
||
8 |
0 |
0,992032 |
0,960789 |
0,894044 |
0,749762 |
0,618783 |
|||
9 |
1 |
0,007936 |
0,038432 |
0,100133 |
0,215931 |
0,297016 |
2,140839 |
||
10 |
1<=x<=2 |
0,007968 |
0,0392 |
0,10574 |
0,247025 |
0,3683 |
2,207006 |
||
11 |
1<=x <=3 |
0,007968 |
0,03921 |
0,10595 |
0,25001 |
0,379705 |
2,2092 |
||
12 |
1<=x <=4 |
0,007968 |
0,039211 |
0,105956 |
0,250225 |
0,381074 |
2,20926 |
||
13 |
1<=x <=5 |
0,007968 |
0,039211 |
0,105956 |
0,250238 |
0,381205 |
2,209261 |
||
Мы видим, что полученные модельные данные соответствуют действительности, реальный прирост был нулевым. В модели 2 мы уменьшили количество работающих организаций в разы. Торговые центры закрыты, поэтому в тех ячейках таблицы стоят нули.
Построенная нами модель еще раз показывает, что сидеть дома – это единственный выход из сложившейся ситуации. Мы видим, что это возможно только благодаря резкому снижению публичных мест в городе. В класс организаций с низкой и очень низкой посещаемостью вошли организации малого и среднего бизнеса, парикмахерские, кафе, маленькие киоски и магазины. Именно их резкое сокращение привело к более позитивной статистике.
Если мы увеличим количество открытых, работающих организаций с низкой и очень низкой посещаемостью в 6 раз, прирост инфицированных по городу составит в среднем 8 человек и будет увеличиваться в 4 раза каждый следующий день. Мы математически доказали, что меры, принятые Президентом и Губернатором, своевременные и эффективные, что и подтверждают данные модели.