Задача
Компания-разработчик процессоров из США наняла Ауригу для анализа и оптимизации производительности библиотек глубинного и машинного обучения для нового поколения CPU.
Особенности проекта
- Оптимизация производительности библиотек машинного и глубинного обучения: TensorFlow, Caffe, MXNET, scikit-learn, др.
- Низкоуровневый анализ узких мест в базовых математических алгоритмах (умножение векторов/матриц).
- Внедрение функций параллельного счисления.
- Сравнение с текущими эталонными тестами производительности ведущих производителей.
Результаты
- Выявление узких мест в библиотеках нейронных сетей и детальный анализ производительности.
- Оптимизация аппаратного и программного комплекса для максимизации производительности.
- 20-30% улучшение производительности глубинных нейронных сетей на новых CPU по сравнению с конкурентами.