Российские ученые представили новый алгоритм итеративной оптимизации, способный существенно улучшить настройку гиперпараметров в системах искусственного интеллекта (ИИ). По информации пресс-службы Сбера, данный алгоритм позволяет сократить количество необходимых шагов для оптимизации работы ИИ-моделей, что является значительным прорывом в этой области, пишет ТАСС.
Алгоритм, получивший название JAGUAR, ориентирован на оптимизацию двухэтапных процедур. На первом этапе он обучает нейронную сеть для извлечения численных представлений данных, что позволяет повысить точность классификации на втором этапе. Это решение также имеет потенциал для использования в процессе дообучения больших языковых моделей.
Разработка была осуществлена группой исследователей из Лаборатории искусственного интеллекта Сбербанка, Московского физико-технического института (МФТИ) и Университета Иннополис под руководством Александра Безносикова. Новый подход призван решать задачи оптимизации в ситуациях, когда отсутствует точная формула для вычисления результатов, и исследователи вынуждены опираться на приближенные методы.
Существующие методы, такие как алгоритм Франк-Вульфа, не всегда дают удовлетворительные результаты, что и стало стимулом для создания JAGUAR. Проверка работы нового алгоритма показала его способность быстро и эффективно подстраивать модели машинного обучения, причем он демонстрирует высокую производительность даже в условиях случайных ошибок.
Данная разработка имеет значительный потенциал для повышения качества и скорости работы систем искусственного интеллекта, что открывает новые возможности для развития технологий в этой сфере. JAGUAR значительно превосходит существующие решения на рынке, что говорит о его высокой перспективности и возможности применения в различных областях.