Обучение с подкреплением

Предмет Базы данных

👍 Проверено Автор24

класс алгоритмов машинного обучения, при которых прогноз строится на основе закономерностей в данных и, кроме того, продолжает улучшаться по мере поступления новых результатов.

Научные статьи на тему «Обучение с подкреплением»

Оперантное научение в психологии

Основу оперантного научения составляет схема «ситуация-реакция-подкрепление»....
Что касается проблем школьного обучения, то Торндайк определяет их как искусство создавать и задерживать...
Научение – это своеобразный метод обучения, требующий конкретного действия....
; негативное подкрепление – это действия, не несущие в себе удовольствие....
Научение можно рассматривать как форму обучения.

Статья от экспертов

Программный комплекс для реализации обучения с подкреплением

Рассматривается разработанный программный комплекс, который позволяет реализовать алгоритм обучения с подкреплением для того, чтобы обучить искусственную нейронную сеть выполнять поставленные перед ней задачи. Считается, что обучение с подкреплением является частным случаем обучения с учителем, так как учителем нейронной сети является окружающая среда или созданная рабочая область, с которой взаимодействует агент в виде искусственной нейронной сети. Агент взаимодействует со средой и за каждое свое действие получает вознаграждение или наказание. Пытаясь заработать максимальное количество очков в виде суммы всех вознаграждений нейронная сеть учится взаимодействовать со средой, достигая необходимого нам результата. В статье предоставлены примеры использования как нейронных сетей, так и примеров настройки весов сети на основе обучения с подкреплением и достигнутые на их основе результаты. Данные примеры показывают актуальность применения нейронных сетей для решения поставленных задач и ...

Creative Commons

Научный журнал

Психология поощрения и наказания

Его используют, как правило, в ситуациях, когда дети в ходе воспитания и обучения не выполняют установленные...
Категория обучение обладает более широким смыслом, который дополнительно включает институты....
Их называют подкреплением....
Особенности положительного и отрицательного подкрепления Положительное подкрепление — это событие, которое...
Наказание приводит к исчезновению реакции, при этом следствие негативного подкрепления представлено обучением

Статья от экспертов

Торговые агенты на основе обучения с подкреплением

В статье рассматриваются различные подходы к созданию торговых агентов обучения с подкреплением на основе Q-обучения. Направление использования обучения с подкреплением не так распространено в задачах управления активами, как прогнозирование цены актива с использованием методов машинного обучения, однако их можно адаптировать под задачи управления активами. В рамках статьи рассматриваются реализации как дискретного Q-обучения, так и метода с использованием нейронных сетей. В рамках экспериментов агенты были обучены на реальных котировках некоторых акций из индекса S&P500 и сравнивались результаты как на обучающих, так и на тестовых периодах. Также была модифицирована функция наград в реализации с нейронными сетями, которая позволила сделать выводы об обучаемости агентов.

Creative Commons

Научный журнал

Еще термины по предмету «Базы данных»

Автоматизированная информационная система (АИС)

это система, реализующая автоматизированный сбор, обработку, манипулирование данными, функционирующая на основе ЭВМ и других технических средств и включающая соответствующее программное обеспечение (ПО) и персонал.

Ассоциативные правила

метод обучения без учителя, обнаруживающий ассоциации среди элементов данных, например товары, которые часто покупают вместе; есть три типичные ассоциативные метрики: поддержка {X} показывает, как часто появляется X; достоверность {X->Y} показывает, как часто Y появляется в присутствии X; лифт {X->Y} показывает то, как часто X и Y появляются вместе, в сравнении с тем, как часто они появляются по отдельности.

Вариативность данных (data variability)

изменения в скорости передачи, формате или структуре, семантике или качестве массива данных.

Смотреть больше терминов

Повышай знания с онлайн-тренажером от Автор24!

Напиши термин
Выбери определение из предложенных или загрузи свое
Тренажер от Автор24 поможет тебе выучить термины с помощью удобных и приятных карточек

Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot