Однослойные сети прямого распространения — это стандартный вид нейронных сетей, у которых связи между нейронами не образуют замкнутые циклы.
Нейронные сети: общие сведения
Нейронные сети являются новой и достаточно перспективной вычислительной технологией, предоставляющей новые методики исследования сложных и плохо поддающихся формализации задач. Изначально такие сети разрабатывались для решения проблемы с распознаванием образов. Сегодня нейронные сети используются при решении достаточно большого круга задач, в частности это:
- Задача распознавания образов и изображений.
- Задача обработки информационных данных, «загрязнённых» шумами (организация фильтрации).
- Проблема сжатия информации.
- Задача классификации и кластеризации информационных данных.
- Проблема ассоциативного поиска.
- Много других задач.
В последнее время технологии нейронных сетей стремительно развиваются, так как в данной сфере сформирована большая теоретическая база и успехи в области электроники дают возможность практической реализации достаточно мощных и не очень дорогих нейрокомпьютеров, которые успешно применяются в разных областях деятельности людей.
Отношения нейронных сетей и компьютерной отрасли достаточно неоднозначные. Можно полагать, что нейрокомпьютеры считаются подклассом параллельных компьютерных систем, постепенно вытесняющих стандартный вариант компьютеров Фон Неймана. Но вместе с тем, технологии нейронных сетей повсеместно применяются в компьютерной инженерии как набор специальных инструментов, в том числе и при формировании компьютерного оборудования.
Модель искусственного нейрона
Биологический, то есть естественный нейрон, имеет в своём составе тело и отростки нервных волокон следующих типов:
- Дендриты. По ним осуществляется приём входных сигналов.
- Аксон. Обеспечивает возможность передачи нейроном импульса другим нейронам.
В нейрон поступают импульсные сигналы с аксонов других нейронов через дендриты, а далее нейрон транслирует импульсы, сгенерированные телом клетки через аксон, разветвляющийся в окончании на волокна. Этот процесс изображён на рисунке ниже:
Рисунок 1. Нейроны. Автор24 — интернет-биржа студенческих работ
На окончаниях волокон расположены специализированные образования, именуемые синапсами, которые оказывают влияние на амплитуду транслируемого импульса.
То есть, нейроны обладают множеством входов (дендритов) и только одним выходом (аксоном). Связь среди нейронов организована в синапсах. Принимаемые синапсами сигнальные импульсы поступают к телу нейрона. Там они подвергаются суммированию, при этом сигналы с одних входов возбуждают нейрон, а другие препятствуют возбуждению. Если суммарная величина сигналов возбуждения в теле нейрона становится выше определённого порога, то происходит возбуждение нейрона, и он пересылает через аксон импульсы возбуждения другим нейронам. Такая функциональная схема имеет множество обобщений, но, при этом, почти все модели искусственного нейрона осуществляют моделирование лишь этих простейших свойств.
Под искусственным или формальным нейроном понимается элементарный процессор, применяемый в узлах нейронных сетей. Структурная схема искусственного нейрона изображена на рисунке ниже:
Рисунок 2. Структурная схема искусственного нейрона. Автор24 — интернет-биржа студенческих работ
Как следует из этой схемы, формальный нейрон состоит из n входных блоков умножения на коэффициенты Wi, одного адаптивного сумматора и выходного блока функционального преобразования. Функция, реализуемая выходным блоком, называется функцией активации. Коэффициенты именуются синаптическими коэффициентами или коэффициентами связи между нейронами. Такие коэффициенты считаются аналогичными синапсам биологического нейрона. Когда величина коэффициента отрицательная, то i-я связь считается тормозящей, в противном случае она считается возбуждающей.
Основные типы архитектуры нейронных сетей
Нейронные сети являются совокупностью искусственных нейронов, которые соединены между собой некоторым образом, а также с внешней средой при посредстве связей, заданных весовыми коэффициентами Wij. Большое количество процессоров, функционирующих в параллельном режиме, гарантируют высокое быстродействие нейронных сетей.
С позиций топологии нейронные сети делятся на следующие главные типы:
- Сети, имеющие прямые связи. Самыми простыми из них считаются однослойные нейронные сети.
- Сети, обладающие обратными связями, в которых информационные данные могут передаваться с последующих слоёв на предыдущие слои.
- Регулярные или конкурирующие сети. Регулярность заключается в том, что все нейроны соединены определённым образом с соседними нейронами.
Однослойные сети прямого распространения
Сети прямого распространения часто применяются в практических программных приложениях и для них характерно то, что по ним сигнальные импульсы перемещаются только в одном (прямом) направлении, а именно от входов к выходам. Вначале появились однослойные сети прямого распространения, именуемые персептрон, а также методики их обучения. Персептрон является однослойной сетью, состоящей из нейронов, которые обладают пороговыми активационными функциями. Этот класс нейронных сетей служит для классификации линейно разделимых классов, где образы разных классов могут быть разделены определённой гиперплоскостью. Персептрон, который состоит только из одного нейрона, способен решить проблему подразделения лишь двух классов. Если увеличивать количество нейронов, то это позволит решить задачу классификации для большего числа классов. На рисунке ниже представлен персептрон, имеющий два входа:
Рисунок 3. Персептрон, имеющий два входа. Автор24 — интернет-биржа студенческих работ
Следует отметить, что функция S может быть применена как решающая функция для осуществления распознавания образов. Но, к сожалению, однослойные нейронные сети могут обрабатывать лишь линейно разделимые классы и не способны решать другие задачи. Для ликвидации данных недостатков были разработаны многослойные нейронные сети с прямым распространением.