Справочник от Автор24
Найди эксперта для помощи в учебе
Найти эксперта
+2

Обучение с подкреплением

Предмет Базы данных
👍 Проверено Автор24

класс алгоритмов машинного обучения, при которых прогноз строится на основе закономерностей в данных и, кроме того, продолжает улучшаться по мере поступления новых результатов.

Научные статьи на тему «Обучение с подкреплением»

Оперантное научение в психологии

Основу оперантного научения составляет схема «ситуация-реакция-подкрепление»....
Что касается проблем школьного обучения, то Торндайк определяет их как искусство создавать и задерживать...
Научение – это своеобразный метод обучения, требующий конкретного действия....
; негативное подкрепление – это действия, не несущие в себе удовольствие....
Научение можно рассматривать как форму обучения.

Статья от экспертов

Программный комплекс для реализации обучения с подкреплением

Рассматривается разработанный программный комплекс, который позволяет реализовать алгоритм обучения с подкреплением для того, чтобы обучить искусственную нейронную сеть выполнять поставленные перед ней задачи. Считается, что обучение с подкреплением является частным случаем обучения с учителем, так как учителем нейронной сети является окружающая среда или созданная рабочая область, с которой взаимодействует агент в виде искусственной нейронной сети. Агент взаимодействует со средой и за каждое свое действие получает вознаграждение или наказание. Пытаясь заработать максимальное количество очков в виде суммы всех вознаграждений нейронная сеть учится взаимодействовать со средой, достигая необходимого нам результата. В статье предоставлены примеры использования как нейронных сетей, так и примеров настройки весов сети на основе обучения с подкреплением и достигнутые на их основе результаты. Данные примеры показывают актуальность применения нейронных сетей для решения поставленных задач и ...

Научный журнал

Психология поощрения и наказания

Его используют, как правило, в ситуациях, когда дети в ходе воспитания и обучения не выполняют установленные...
Категория обучение обладает более широким смыслом, который дополнительно включает институты....
Их называют подкреплением....
Особенности положительного и отрицательного подкрепления Положительное подкрепление — это событие, которое...
Наказание приводит к исчезновению реакции, при этом следствие негативного подкрепления представлено обучением

Статья от экспертов

Торговые агенты на основе обучения с подкреплением

В статье рассматриваются различные подходы к созданию торговых агентов обучения с подкреплением на основе Q-обучения. Направление использования обучения с подкреплением не так распространено в задачах управления активами, как прогнозирование цены актива с использованием методов машинного обучения, однако их можно адаптировать под задачи управления активами. В рамках статьи рассматриваются реализации как дискретного Q-обучения, так и метода с использованием нейронных сетей. В рамках экспериментов агенты были обучены на реальных котировках некоторых акций из индекса S&P500 и сравнивались результаты как на обучающих, так и на тестовых периодах. Также была модифицирована функция наград в реализации с нейронными сетями, которая позволила сделать выводы об обучаемости агентов.

Научный журнал

Еще термины по предмету «Базы данных»

Гипертекст (HTML)

метод представления текста, изображения, звука и видео, связанных друг с другом произвольной ассоциативной памятью.

🌟 Рекомендуем тебе
Смотреть больше терминов

Повышай знания с онлайн-тренажером от Автор24!

  1. Напиши термин
  2. Выбери определение из предложенных или загрузи свое
  3. Тренажер от Автор24 поможет тебе выучить термины с помощью удобных и приятных карточек
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot