В целом эта работа о Казахстане. Нужно будет сначала проанализировать слегка в целом, а далее сделать упор именно на Казахстане. Основной задачей в данной работе будет являться процесс вакцинирования, какие аспекты влияют на прогресс вакцинирования: политика, экономика, уровень здравоохранения и многое другое. Какие страны и в каком темпе прививаются быстрее; с чем это связано.
Задача, это исследование алгоритмов машинного обучения и подходов к прогнозированию темпов вакцинации.
"политика, экономика, уровень здравоохранения и многое другое" тогда должны быть эти данные как независимые переменные. Скорее всего будет time series модель.
То есть я хочу предсказать вакцинирование от коронавируса разными методами, linear regr, logistic, random forest, xgboost, decision tree. Это я просто как пример привел. Взять три основных метода и их сравнить, которые будут предсказывать. Три наиболее лучшие на твой вариант.
И можно взять какой-нибудь датасет и связать их два, чтобы посмотреть, влияет ли например экономика.
Код должен состоять как обычно из обозрения датасета, основных атрибутов, потом визуал, различные графики, диаграммы, схемы и т.д. Наиболее полезные. И можно сравнить график двух, трех стран. И уже сами методы, сравнение их и предсказание.
в целом работа будет такая:
Очистить полностью датасет, без нулей и тд.
потом можно просто визуализацию сделать,
обучение и предикт по стране например США, там много вроде данных и сравнить с Казахстаном. Просто для сравнения