Обучение с подкреплением для реальных задачВ данный момент этот товар отсутствует в продаже. Возможно, у нас найдется аналогичный или похожий товар здесь. Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок — без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга — первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе. |
BHV, Россия, все товары
| Издательская компания BHV специализируется на публикации компьютерной и деловой литературы высокого качества. Наше издательство предлагает широкий ассортимент книг, охватывающий разнообразные темы и аспекты современных компьютерных технологий и бизнеса. Мы гордимся тем, что наши издания предоставляют ценную информацию и практические навыки как для начинающих, так и для опытных профессионалов. Большой опыт и экспертиза в индустрии позволяют нам выбирать только актуальные и интересные темы... |
| Фил Уиндер — междисциплинарный инженер, эксперт и автор онлайн-курсов на платформе O’Reilly. Возглавляет компанию Winder Research, оказывающую консультации в области науки о данных (data science) для облачно-ориентированных приложений. Компания помогает оптимизировать процессы, связанные с обработкой данных, а также обслуживает платформы и продукты, работающие в этой нише. Автор имеет степени PhD и MEng в электротехнике, полученные в Университете Халла. |






























































































































%text%