Закрыть [x]

Перейти на мобильную версию

Яндекс открыл доступ к библиотеке машинного обучения CatBoost

19.07.2017

Яндекс представил свой метод машинного обучения. Его назвали CatBoost. Он позволяет эффективно обучать модели на разнородных данных. К примеру, таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost есть в открытом доступе, её могут использовать все желающие. Об этом сообщается в пресс-релизе компании.

CatBoost является наследником метода Матрикcнет, который применяется почти во всех сервисах Яндекса. CatBoost задействует механизм градиентного бустинга: он хорошо подходит для работы с разнородными данными. Однако, в отличие от Матрикснет, обучающего модели на числовых данных, CatBoost учитывает и нечисловые, например, виды облаков или типы зданий. Раньше эти данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь они могут использоваться в первоначальном виде.

Новый метод уже был протестирован в сервисах Яндекса. В рамках эксперимента он применялся:

· для улучшения результатов поиска;

· ранжирования ленты рекомендаций Яндекс. Дзен;

· расчёта прогноза погоды в технологии Метеум.

Для начала работы с CatBoost достаточно установить его на компьютер. Библиотека поддерживает системы Linux, Windows и macOS и доступна на языках программирования Python и R.

Источник: SEOnews

Наши конференции:


Комментарии