Skip to content

InnaAndreeva/AutoML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 

Repository files navigation

AutoML🌟

Автоматизированное машинное обучение (англ. Automated Machine Learning, AutoML) — процесс создания динамической комбинации различных методов для формирования простой в использовании сквозной конвейерной системы машинного обучения.

Инструменты AutoML упрощают процесс обработки данных, делая все возможное, используя имеющуюся информацию.

Процесс состоит из трех основных этапов:

  1. Обработка данных
  2. Генерация модели/моделей машинного обучения, настройка гиперпараметров
  3. Тестирование производительности и выбор лучшего исполнителя

Цель лабораторной работы 🎯

Ознакомиться с AutoML фреймворками на примере задачи классификции или регрессии. Сравнить эффективность работы каждой системы применительно к выбранному набору данных.

Необходимое ПО 💻

Jupyter Notebook, Google Colab.

Задача 📈

Лабораторная работа выполняется по вариантам.

❗ Наборы данных для классификации и регрессии прилагаются к лабораторной работе. Можете взять свой набор данных.

  • Набор данных для регрессии - powerplant_output.csv
  • Набор данных для классификации - winequalityN.csv

Предлагаю следующие AutoML системы:

Можно выбирать свои AutoML системы, но не менее 3 штук:)

  1. Установить систему при помощи pip. Желательно с каждой системой работать в отдельном ноутбуке либо сбрасывать среду выполнения перед установкой каждой последующей системы (это связано с разными версиями зависимостей).
  2. Загрузить набор данных, провести разведочный анализ выборки (построить матрицу корреляции, диаграммы рассеивания для признаков, вывести основные статистики набора данных).
  3. При помощи каждой системы предсказать значение целевого признака. Исследовать возможность построения отчета по итогу процесса генерации модели при помощи каждого фреймворка. Построить отчет.
  4. Оценить точность каждой модели с помощью метрик точности. Метрики на ваш выбор. Для регрессии:
  • MSE
  • MAE
  • MedAE
  • R2

Для классификации:

  • accuracy_score
  • precision_score
  • recall_score
  • f1_score

Сделать вывод по итогам работы.

Полезные ссылки 🔗

  1. Что такое автоматизированное машинное обучение (AutoML)
  2. Автоматическое машинное обучение
  3. AutoML.org
  4. AutoML: A Survey of the State-of-the-Art

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published