Close
Задать вопрос
Telegram
WhatsApp
Viber
Messenger
Skype
Mail
Phone
Новые технологии Google для бизнеса
AutoML от Google – новый облачный продукт от гугл, объединяющий различные готовые и обученные до определенного уровня инструменты машинного обучения. Он базируется на алгоритме нейронно-архитектурного поиска Neural Architecture Search (NAS).
Новые технологии открывают все больше и больше возможностей и для бизнеса в том числе. Совсем недавно, около года назад, Google представила новинку для применения технологий искусственного интеллекта - Google AutoML. Изначально заточена она была на распознавание изображений, для работы с текстом и переводов. Это, конечно, хорошо, но хотелось бы использовать ML и для бизнес задач. И вот, наконец, дождались. Появилось приложение, которое можно использовать напрямую для бизнес задач.
Тут нужно отдать должное, что еще 2017 года Google в том или ином виде давал возможность применять технологии Machine Learning. Однако, продукт AutoML сделал это совершенно простым и доступным.

Какие же бизнес задачи можно решать? В общем задачи понятны и стандартны. Это и различного рода классификации (например выявление VIP клиентов), и поиск фрода, и предсказание поведения клиентов, и прогнозирование, и многое другое. В общем круг задач достаточно широк, хватало бы фантазии.
Как это все работает?
Как же работает Google AutoML? Система позволяет автоматизировать большую часть процесса обработки данных и построения модели. Вот список задач, которые автоматизированы в AutoML:

  • Автоматическая подготовка и обработка данных
  • Подбор характеристик и их изъятие, мета-обучение и трансферное обучение
  • Автоматический трансферный подбор
  • Автоматическй выбор модели
  • Автоматическая проверка на наличие проблем
  • Обнаружение утечки
  • Обнаружение ошибок
  • Автоматический анализ результатов
  • Автоматический выбор и оценка метрики/процедур валидации

Таким образом сейчас можно сосредоточится на самих задачах и не тратить время на работу с ними. Система ни коим образом не может заменить бизнес аналитика, но необходимость в дата сайнтистах потихоньку снижается. Так глядишь машины научатся и программистов заменять )

А самое замечательное, что развернутая модель позволяет обращаться к ней через API и получать нужные прогнозы. Что значительно упрощает интеграцию решений на сайтах и в системах компаний.
Реальный кейс
Ну и, само собой, все новенькое хочется тут же опробовать на реальных данных. Буквально недавно было реализовано решение по прогнозу посещаемости сети кинотеатров. Естественно возникло желание прогнать этот кейс на новом инструменте. Что же у нас получилось?

Система сама разбивает имеющиеся данные на train и test группы. Модель строится на тренинговой группе, а оценка производится на тестовой. А еще как приятный бонус выводится ранжированный список факторов, влияющих на целевой показатель. Целевым показателем, в данном случае, являлось количество посетителей на сеансе.

Итак факторы, влияющие на посещаемость сложились следующим образом: тройка лидеров оказалась день недели, зал (поскольку каждый зал имеет разное количество мест) и час суток.
Корреляция фактических и прогнозных значений оказалась достаточно высокой: 92%. Это учитывая то, что прогнозирование количества посетителей кинотеатров далеко не простая задача.
Общая ошибка на тестовом множестве, представляющем отрезок более чем 2 года, составил всего 4%.
На графике видно насколько совпадают фактические и прогнозные значения на тестовой группе.

Так что новые технологии мы уже взяли на вооружение. Ищем новые интересные проекты, где мы сможем полноценно их применить.

Made on
Tilda