Skip to content

open-data-science/covid19-tutu

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

57 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

covid19-tutu

TODO

  • Разбиение на транспорт
    • Добавить рёбра под виды транспорта
    • Посчитать константы для видов траспорта
    • Добавить модель на пересчёт числа заболевших в пути
  • Уточнение модели для города
    • Подобрать константы recovery rate, contact rate
    • Разбиение по возрастным группам (группа риска 65+)
  • Покрутить параметры, посмотреть что получится:
    • Симулировать карантин (снизить contact rate)
    • Удалёнка рёбер (выкинуть часть рейсов)
  • Посмотреть насколько влияет инициализация
    • Официальная статистика собирается через гузно: насемплировать разных случайных инициализаций
    • Данные по транспорту шумные: пошатать частоты перемещения в разных направлениях

Как оно работает сейчас

На каждую итерацию у нас есть два цикла: в первом мы обновляем считаем динамику в городах, в следующем перемещаем между городами людей.

В городе сейчас считается SIR модель. Можно учитывать намного больше разных деталей, вроде возрастных групп, сообществ, случайных факторов, но нужно помнить, что это потребует уточнения и по транспорту (например если добавим возрастные группы в городе, надо будет добавить их и по перемещениям), во-вторых может оказаться, что SIR даст тот же результат, если ей чуть параметры подвинуть.

Между городами перемещение реализовано самым наивным способом. Здесь легко добавить реалистичности не трогая модель города. Однако тоже может оказаться, что тот же результат получится линейным преобразованием от наивного способа, то есть подкруткой скорости транспорта, например.

Первым делом

Перебрать параметры и посмотреть что на что влияет, а что вовсе не важно. Точные числа мы скорее всего не предскажем, или не сможем проверить, а динамику и зависимости знать важно.

Описание data

raw_data.csv - как к нам данные пришли от туту.

cities.csv - заполненные данные по городам из датасета. Везде есть координаты и население.

cities_infection.csv - добавлены столбцы с заболевшими и выздоровевшими по датам: 16.03 - 23.03

full_graph.csv - данные с маршрутами с заполненными полями. Удобно для визуализации.

age65.csv - группа риска 65+ с разбиением по регионам.

cities_infection.csv - добавлены столбцы с заболевшими/выздоровевшими в файл cities с датами: 16.03 - 22.03

CSSEGISandData - исторические данные по заболеваемости от института Джона Хопкинса (https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series). Данные обновляются ежедневно

population.csv - народонаселение по городам (https://datahub.io/JohnSnowLabs/population-figures-by-country)

cities_new.csv - добавлены данные по плотности населения (http://worldgeo.ru/russia/lists/?id=26), количеству аппаратов ИВЛ и ЭКМО (https://meduza.io/feature/2020/03/20/v-italii-iz-za-koronavirusa-katastroficheski-ne-hvataet-apparatov-ivl-v-rossii-ih-gorazdo-bolshe-no-eto-ne-znachit-chto-my-luchshe-gotovy-k-epidemii), а также по уровню развития инфраструктуры и общественной жизни (чистота, транспорт, спорт, магазины: https://www.domofond.ru/statya/polnyy_reyting_250_gorodov_rossii_po_kachestvu_zhizni/6764)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published