12+
matn

Hajm 150 sahifalar

2024 yil

12+

Усиленное обучение

matn
98 910,55 soʻm
10% chegirma bering
Maslahat bering ushbu kitobni do'stingiz sotib olganidan 9 891,06 soʻm oling.

Kitob haqida

Данное руководство по усиленному обучению (Reinforcement Learning, RL), охватывает теоретические основы, практические применения и современные достижения. В начале дается определение RL, его исторический контекст и ключевые отличия от других видов машинного обучения. Примеры применения RL охватывают игры, робототехнику, финансовые рынки и управление ресурсами. Математические основы включают марковские процессы принятия решений, состояния, действия, награды и политики, а также Беллмановские уравнения и итерацию ценности. Основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента политики, REINFORCE и Actor-Critic, рассматриваются вместе с моделями на основе планирования и глубокого усиленного обучения (DQN, DDPG, A3C). Практическая часть книги включает использование OpenAI Gym и других сред, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.

когда думаешь, что вроде разобрался с темой машинного обучения, а тут еще полно всего,,, просто бесконечность. Но книги определенно помогают хоть немного держаться в теме на плаву. показывают, применяемые сейчас алгоритмы

Из книги узнал много нового, ошибочно думал, что не должно сильно отличаться от других видов обучения, но на практике оказалось совсем иначе. Так что книга оказалась полезной и главное понятной!

Izoh qoldiring

Kirish, kitobni baholash va sharh qoldirish

Kitob tavsifi

Данное руководство по усиленному обучению (Reinforcement Learning, RL), охватывает теоретические основы, практические применения и современные достижения. В начале дается определение RL, его исторический контекст и ключевые отличия от других видов машинного обучения. Примеры применения RL охватывают игры, робототехнику, финансовые рынки и управление ресурсами. Математические основы включают марковские процессы принятия решений, состояния, действия, награды и политики, а также Беллмановские уравнения и итерацию ценности. Основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента политики, REINFORCE и Actor-Critic, рассматриваются вместе с моделями на основе планирования и глубокого усиленного обучения (DQN, DDPG, A3C). Практическая часть книги включает использование OpenAI Gym и других сред, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.

Kitob Джеймса Девиса «Усиленное обучение» — fb2, txt, epub, pdf formatlarida yuklab oling yoki onlayn o'qing. Fikr va sharhlar qoldiring, sevimlilarga ovoz bering.
Yosh cheklamasi:
12+
Litresda chiqarilgan sana:
11 iyun 2024
Yozilgan sana:
2024
Hajm:
150 Sahifa 1 tasvir
Mualliflik huquqi egasi:
Автор
Формат скачивания:
epub, fb2, fb3, ios.epub, mobi, pdf, txt, zip

Ushbu kitob bilan o'qiladi