Embedded software

Задача

Компания-разработчик процессоров из США наняла Ауригу для анализа и оптимизации производительности библиотек глубинного и машинного обучения для нового поколения CPU.

Особенности проекта

  • Оптимизация производительности библиотек машинного и глубинного обучения: TensorFlow, Caffe, MXNET, scikit-learn, др.
  • Низкоуровневый анализ узких мест в базовых математических алгоритмах (умножение векторов/матриц).
  • Внедрение функций параллельного счисления.
  • Сравнение с текущими эталонными тестами производительности ведущих производителей.

Результаты

  • Выявление узких мест в библиотеках нейронных сетей и детальный анализ производительности.
  • Оптимизация аппаратного и программного комплекса для максимизации производительности.
  • 20-30% улучшение производительности глубинных нейронных сетей на новых CPU по сравнению с конкурентами.