Алгоритмы обучения с подкреплением на Python

Андреа Лонца

В данный момент этот товар отсутствует в продаже.
Возможно, у нас найдется аналогичный или похожий товар здесь.

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS.
Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие — владение языком Python на рабочем уровне.

Детальная информация
Издательство
ISBN
978-5-97060-855-5
Переплет
твердый переплет
Количество страниц
286
Язык
русский
Дата выхода
2020
Тираж
200 экземпляров
Иллюстрированная
нет
Высота издания
240 мм
Ширина издания
172 мм
Толщина издания
20 мм
Код товара
1699928
Издательство

ДМК Пресс, Россия, все товары

В 1992 году появилась на свет компания «ДМК Пресс», изначально основанная как книготорговая фирма, фокусирующаяся на предоставлении качественной литературы в области компьютерных технологий и радиотехники. С тех пор она прошла долгий путь развития, превратившись в одно из ведущих издательств с широким спектром направлений. Одной из отличительных черт «ДМК Пресс» является постоянное стремление к инновациям и следование современным тенденциям. Это проявляется не только в разнообразии...
Авторы
Отзывы
А
15 декабря 2022
куплен на flip

Книжку А. Лонца "Алгоритмы обучения с подкреплением на Python" можно рассматривать как вводный материал, упрощающий вхождение в тему "обучение с подкреплением". Материал книжки позволяет понять RL через его реализацию. Советую читать вместе более фундаментальной книгой Саттон Р.С., Барто Э.Дж. "Обучение с подкреплением. Введение". Что касается книги А. Лонца, то за последние годы вышло немало подобных книжек. Можно перечислить порядка 4-5 похожих как по содержанию, так и по стилю изложения изданий – похожих друг на друга как братья-близнецы. Выбор достаточно велик. Я сделал свой выбор в пользу этой книги.

5
1 отзыв
1
0
0
0
0
Отзывы могут оставлять только покупатели товара. Чтобы оставить отзыв, перейдите на страницу купленных товаров.
Разделы товара
Информация
Данного товара сейчас нет в наличии
Возможно, у нас найдется аналогичный или похожий товар здесь.