120 ₽ 1 150 ₽ −90%
Вам нужен инструмент для решения задач принятия решений, где агент обучается на основе проб и ошибок — именно это разбирается через алгоритмы обучения с подкреплением (Reinforcement Learning). Внутри курса вы пошагово пройдете путь от основ до реализации интеллектуальных агентов на языке Python. Вы узнаете, как работает Марковский процесс принятия решений, освоите методы динамического программирования и временных различий (TD), включая Q-Learning. Курс ориентирован на тех, кто хочет углубиться в машинное обучение и построение AI-систем, способных к автономному обучению в динамической среде.
Отзывов пока нет. Будьте первым!