Компания oneFactor применила процессоры Intel® Xeon® Scalable третьего поколения для ускорения процесса машинного обучения в анклавах Intel® Software Guard Extensions (Intel® SGX) на собственной платформе SmartMachine для конфиденциального совместного машинного обучения на глобальном графе клиентских связей и быстрого создания максимально точных сервисов. В результате было достигнуто ускорение полного цикла обучения в 8-19 раз в зависимости от размера подаваемых на вход данных по сравнению с использованием процессоров Intel предыдущего поколения. Использование решений Intel на платформе SmartMachine позволяет повысить качество рекомендаций сервисов на 20-35%, существенно ускорить цикл создания новых моделей в SGX-анклавах всего до нескольких часов, а также упростить процедуру масштабирования платформы в пиковую нагрузку клиентов.
Так, время, требуемое на одну итерацию обучения, включающую загрузку данных в анклав, их подготовку и преобразование, а также само обучение, при размере обучающей выборки 3,6 Гигабайт составило 787 секунд для SGX1 и 91 секунду для SGX2. При размере обучающей выборки равной 11 Гигабайт данное время составило уже 4320 секунд для SGX1 и 224 секунды для SGX2.
Полученные по результатам тестов показатели демонстрируют, что выигрыш по времени увеличивается при росте размеров обучающей выборки: при 3,6 Гб подаваемых на обучение выигрыш составил 8,6 раз; при 11 Гб подаваемых на обучение выигрыш составил уже 19 раз. Также следует учитывать, что для получения промышленной модели платформа SmartMachine производит в среднем 150 итераций и это даёт значительный выигрыш по времени обучения при использовании новых CPU ICX с поддержкой SGX2.
С помощью технологии Intel SGX решение oneFactor позволяет обрабатывать полностью зашифрованные данные в апаратно-защищенной среде. Технология предоставляет возможность конфиденциально объединять данные разных компаний и индустрий в едином вычислительном облаке, а затем использовать их в рекомендательных сервисах на базе искусственного интеллекта. Особенностью платформы SmartMachine является высокий уровень защиты исходных данных от компрометации на аппаратном уровне, поскольку их «видит» только алгоритм машинного обучения. К данным нет доступа даже у администраторов системы или поставщика облачных сервисов, что подтверждено независимым аудитом с участием компаний, подключивших свои данные к платформе.
Наше партнерство с Intel позволило не только разработать уникальную технологию обучения моделей внутри анклавов SGX, обеспечивающее дополнительную конфиденциальность клиентских данных, но и существенно сократить цикл создания новых моделей на платформе oneFactor всего до нескольких часов. Сокращение Time-to-Market позволяет компаниям, которые выпускают или внедряют новые решения, быть на шаг впереди рынка и получать дополнительную прибыль. Надеемся, что наша разработка промотивирует всех участников рынка к инвестициям в обеспечение защиты данных.
Максим Воеводский, директор по продуктам и аналитике oneFactor