Курс посвящен углубленному изучению методов ускорения инференса нейронных сетей. Программа ориентирована на специалистов в области машинного обучения, которые стремятся оптимизировать модели для работы на различных вычислительных устройствах: от мощных GPU до мобильных процессоров и одноплатных компьютеров.
Обучение охватывает как фундаментальную теорию, так и практические аспекты оптимизации. Рассматриваются ключевые алгоритмы: дистилляция, прунинг, квантизация, матричные разложения и NAS (Neural Architecture Search). Особое внимание уделяется специфике работы с LLM и особенностям архитектур процессоров (ARM, CPU, GPU, NPU). Участники изучают, как совмещать методы ускорения, сохраняя при этом точность моделей и обеспечивая высокий FPS в условиях ограниченных вычислительных ресурсов.
Отзывов пока нет. Будьте первым!