Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
1. Определение информационной технологии
Чтобы определить понятие «информационная технология», обратимся к термину «технология», который имеет множество толкований.
В широком смысле под технологией понимают науку о законах производства материальных благ.
Следуя данному определению, в технологии выделяют три аспекта: идеологию, или принципы производства; орудия труда, т. е. станки, машины, агрегаты, и кадры, владеющие профессиональными навыками. Эти аспекты составляют соответственно, информационную, инструментальную и социальную, составляющую.
Информационная составляющая включает описание принципов и методов производства; инструментальная — орудия труда, с помощью которых реализуется производство; социальная — кадры и их организацию.
Для конкретного производства технологию понимают в узком смысле как совокупность приемов и методов, определяющих последовательность действий для реализации производственного процесса.
Поэтому можно говорить о технологии, как совокупности методов обработки, изготовления, изменения состояния, свойств, формы сырья, материала или полуфабриката в процессе производства, например технология получения металлов, химическая технология, технология строительных работ и т.д.
Рассматривая в качестве материалов информацию, над которой производятся определенные действия, изменяющие ее характеристики, приходим к определению информационной технологии.
Информационная технология (ИТ) — совокупность методов и способов получения, обработки, представления информации, направленных на изменение ее состояния, свойств, формы, содержания и осуществляемых в интересах пользователей.
При сопоставлении технологии материального производства и информационной технологии выделим их цели.
Цель технологии материального производства — выпуск продукции, удовлетворяющей потребности человека или системы.
Цель информационной технологии — производство информации для ее анализа человеком и принятия на его основе решения по выполнению какого-либо действия.
Информационные технологии предназначены для снижения трудоемкости процессов использования информационных ресурсов.
Результат применения информационных технологий обособляется в так называемых информационных продуктах.
Информационный продукт - документированная информация, подготовленная в соответствии с потребностями пользователей и представленная в форме товара.
Информационными продуктами являются программные продукты, базы и банки данных и другая информация.
Информационные технологии обеспечивают переход от рутинных к промышленным методам и средствам работы с информацией в различных сферах человеческой деятельности, обеспечивая ее рациональное и эффективное использование.
С современных позиций информационные технологии реализуются с использованием средств компьютерной и оргтехники. Поэтому, в современном понимании под информационными технологиями подразумевается следующее.
Информационная технология — совокупность методов, производственных и программно-технологических средств, объединенных в технологическую цепочку, обеспечивающую сбор, хранение, обработку, вывод и распространение информации.
Последнее определение отражает использование в информационных технологиях принципов современных автоматизированных систем. С учетом их использования, информационная технология может называться автоматизированной информационной технологией (АИТ).
Информационная технология — это системно-организованная последовательность операций, выполняемых над информацией с использованием средств и методов автоматизации.
При этом под операциями понимаются элементарные действия над информацией, которые могут быть объединены в типовые технологические операции (действия) информационной технологи:
• сбор и регистрация информации;
• передача информации;
• ввод информации;
• обработка информации;
• вывод информации;
• хранение информации;
• накопление информации;
• поиск информации;
• анализ информации.
2. Технологии обработки данных. Процедуры обработки данных в зависимости от видов представления данных
Обработка данных представляет собой последовательность операций, производимых над данными. Процедуры обработки данных могут различаться в зависимости от форм и видов представления данных (Рис. 1, Рис. 2).
В экономической деятельности наиболее распространено цифровое и буквенное отображение информации в различных вариантах и сочетаниях: документы, тексты, таблицы, файлы, базы данных и др. В информационных технологиях, применяемых в экономической деятельности, как и в телевидении, кино-, мультимедийных технологиях широко используются также изображения, речь, звуки, сигналы и т.д.
В управлении технологическими процессами и объектами дискретного и непрерывного действия более всего актуальна обработка сигналов, сообщений для управления на низовом, производственном уровне.
Рис. 1. Виды обработки данных
Для среднего и верхнего уровней управления предприятием информация обобщается, группируется, агрегируется, чтобы получить более полную и достоверную картину состояния всего производства при принятии управленческих решений.
Информационные технологии разделяется на классы (инструментарий) по типу обрабатываемой информации (рисунок) и могут объединяться в интегрированные технологии.
Обработка цифровой, символьной, текстовой, табличной информации, в виде баз данных, сигналов, речи, звуков, документов, изображений имеет свои особенности и специфику, реализуется видами инструментария информационных технологий:
1. Текстовые процессоры: Microsoft Word, Word Perfect, Лексикон, Lotus и др.;
2. Электронные таблицы: Microsoft Excel, Lotus 1-2-3, Corel Quattro Pro, Sun Star Office Calc и др.;
3. Программы презентационной графики: Microsoft Power Point, Corel Presentations, Lotus Freelance Graphics, Sun Star Office Impress и др.;
4. WEB-редакторы: Microsoft Front Page, Netscape Composer, Macromedia Free Hand и др.;
5. Почтовые клиенты: Microsoft Outlook, Microsoft Outlook Express, Netscape Messenger, The Bat и др.;
6. Редакторы растровой графики: Adobe Photoshop, Corel Photo-Paint и др.;
7. Редакторы векторной графики: Corel Draw, Adobe Illustrator и др.;
8. Настольные издательские системы: Adobe Page Maker, Quark Xpress, Corel Ventura, Microsoft Publisher и др.;
9. Средства разработки: Borland Delphi, Microsoft Visual Basic, Borland C++ Builder, Microsoft Visual C++ и др.
Рис. 2. Классификация ИТ в зависимости от типа обрабатываемой информации
Кратко охарактеризуем наиболее распространенные виды обработки данных, организуемых современными информационными технологиями.
Технология обработки изображений
В технологии обработки изображений используется анализ, преобразование и трактовка изображений.
Сначала изображения вводятся через видео или другие устройства. В результате сканирования изображений формируется большой объем данных. Данные с изображениями используют специальные графические форматы.
Введенное изображение подвергается различным видам обработки: распознаванию объектов и образов, устранению искажений, что требует высоких скоростей, большой памяти и специальных технологий.
Обработка изображений используется в компьютерной рекламе, в издательском деле, в интегрированных технологиях мультимедиа.
Обработка изображений как направление связано с развитием электронной техники и технологий. При обработке изображений требуются высокие скорости, большие объемы памяти, специализированное техническое и программное оснащение.
Изображения относятся к разного рода объектам, выделению их контуров, перемещению, распознаванию и т.д. Объектами могут быть пользователи, клиенты, прикладные процессы, документы, предметы, явления, которые являются источниками или адресатами информации.
Кроме того, данные могут быть представлены в виде неподвижных или движущихся изображений. Например, использование изображений осуществляется при проведении видеоконференций, в видеосюжетах, в анимации, в создании музыкальных и видеообразов и др.
Видеотехнология
Видеотехнология строится на разработке и демонстрации движущихся изображений, что открыло широкие возможности в возникновении мультисреды.
Видеотехнология применяется для созданий видеосюжетов, фильмов, деловой графики и др. Для этой технологий необходимо сжатие изображений. Оно обеспечивает уменьшение файла в 160—200 раз, после этого данные записываются во внешнюю память.
Технология визуализации - процесс многооконного представлений данных в виде изображений (обратный сжатию).
Визуализация обеспечивает преобразование любого типа данных в разноцветные движущие или неподвижные изображения. Каждый зрительный образ по объем данных соответствует тысячам страниц текста.
Представление информации в виде видеосюжетов позволяет оживлять образы, наблюдать динамику процессов и явлений.
Визуализация широко используется в создании виртуальной реальности (нереальное, воображаемое, объемное представление, создаваемое звуком и изображениями). Технология виртуальной реальности используется в конструкторской, рекламной деятельности, в создании мультипликационных фильмов. Этот процесс именуется мультипликацией.
Обработка текстов
Технология обработки текстов является одним из средств так называемого электронного офиса.
В этой технологии наиболее трудоемким является ввод текста; следующими этапами являются подготовка текста, его оформление и вывод. При работе с текстами пользователь должен иметь разнообразные функции (инструментарий), повышающие эффективность и производительность его деятельности.
Электронные тексты могут сопровождаться изображениями и звуком. Обработка текстов тесно связана с организацией гипертекста и электронной почтой.
Технологии обработки текстов реализуются с помощью программ текстовых редакторов (процессоров) и издательских систем.
Обработка таблиц
Технологии обработки таблиц реализуются с помощью комплекса прикладных программ электронных таблиц в составе электронного офиса и дополняются рядом аналитических возможностей.
Работа с электронной таблицей позволяет вводить и обновлять данные, команды, формулы, определять взаимосвязь и взаимозависимость между клетками, данными в виде функций, аргументами которых являются записи в клетках.
В ячейках таблицы могут размещаться записные книжки, календари, справочники, списки мероприятий.
Обработка текстов и таблиц является главной составляющей, на которой строится обработка текстов.
Технологии гипертекста
Гипертекст формируется в результате представлений текста как ассоциативно связанных блоков информации. Ассоциативная связь - это соединение, сближение представлений, смежных, противоположных, аналогичных и т.д.
Гипертекст значительно отличается от обычного текста. Обычные (линейные) тексты имеют последовательную структуру и предусматривают их чтение слева направо и сверху вниз.
Использование гипертекста позволяет фиксировать отдельные идеи, мысли, факты, а затем связывать их друг с другом, двигаясь в любых направлениях, определяемых ассоциативными связями.
В тех случаях, когда к блокам текста добавляются большое число изображений и запись звука, гипертекст превращается в гиперсреду.
Технологии обработки речи
Технология обработки речи является многоплановой проблемой, охватывающей широкий круг задач. В их перечень прежде всего входят распознавание и синтез речи.
Распознавание речи преобразует ее в текст, открывает возможность использования ее в качестве источника информации.
Обратной распознаванию является задача синтеза речи, т.е. преобразования текста в речь.
Так как речь, представленная дискретными сигналами, характеризуется большим объемом данных, то при ее записи в память или при передаче по сети осуществляется операция сжатия данных.
Обработка речи может использоваться в образовательной, медицинской сферах деятельности, а также для управления объектами при голосовом вводе.
Технологии обработки и преобразования сигналов
Технология обработки и преобразования сигналов выполняется при решении многих информационных задач.
Сигналы обрабатываются различными методами (аналоговыми и дискретными). Обработка сигналов используется в распознавании образов, телеобработке данных и опирается на методологию искусственного интеллекта.
Обработка сигналов, в первую очередь дискретных, используется в управлении производством для таких объектов, как станки, автоматические линии, для мониторинга (контроля и слежения) выпуска изделий, например, в машиностроительных отраслях, медицине, радиолокации и т.д.
Технологии электронной подписи
Технология электронной подписи осуществляется с помощью идентификации пользователя путем сличения реальной подписи с подписью в компьютерной системе, где создается ее электронный шаблон.
Ввод подписей производится при помощи сканера или электронного пера. Электронная подпись, как и отпечатки пальцев, квалифицируются как уникальный показатель личности.
Экспресс-анализ подписи имеет большое значение во множестве задач банковского дела, управления финансами предприятиями.
Технологии электронного офиса
Электронный офис - это технология обработки информации в учреждении электронными средствами, базирующаяся на обработке данных, документов, таблиц, текстов, изображений, графиков.
Наиболее эффективно технология электронного офиса реализуется с помощью интегрированных пакетов прикладных программ, например Microsoft Office.
Технологии формирования документов
Технология формирования документов включает процессы создания и преобразования документов. Их обработка заключается во вводе, классификации, сортировке, преобразовании, размещении, поиске и выдаче информации пользователям в нужном формате.
Обработка документов широко используется в электронных офисах. Особое место в обработке документов занимают электронные таблицы.
При обработке документов приходится решать ряд задач: включение в документ разнородной информации - текста, изображений, подбор необходимых сведений и их ввод, структурирование и объединение информации, передача, внесение изменений и др.
Нейрокомпьютерные технологии
Нейрокомпьютерные технологии используют взаимодействующие друг с другом специальные нейрокомпоненты на базе микропроцессоров. Такой подход основан на моделировании поведения нервных клеток (нейронов).
Нейротехнология применяется в создании искусственного интеллекта для решения сложных задач: распознавание образов, управление кредитными рисками, прогноз фондовых ситуаций, определение стоимости недвижимости с учетом качеству зданий, их состояния, окружающей обстановки и среды, автоматическое распознавание чеков и др.
Компонентами нейротехнологий являются нейронные компьютеры и процессоры, а также нейронные сети, как класс алгоритмов, обеспечивающих решение сложных задач.
Нейросети обладают способностью самообучения, имеют высокое быстродействие, так как обработка информации в них осуществляется многими компонентами, функционирующими параллельно.
3. Организационные формы использования информационных технологий при обработке данных
Поскольку современные информационные технологии являются компьютерными, то организационные формы использования информационных технологий определяются способами доступа и общения пользователей с ЭВМ.
Развитие организационных форм вычислительной техники строится на сочетании централизованной и децентрализованной (смешанной) форм, предпосылкой которой явилось создание сетей ЭВМ на основе различных средств связи.
Сети ЭВМ предполагают объединение в систему с помощью каналов связи вычислительных средств, программных и информационных ресурсов (баз данных, баз знаний). Сетями могут охватываться различные формы использования ЭВМ, причем каждый абонент имеет возможность доступа не только к своим вычислительным ресурсам, но и к ресурсам всех остальных абонентов, что создает ряд преимуществ при эксплуатации вычислительной системы.
В зависимости от степени централизации вычислительных ресурсов роль пользователя и его функции меняются.
Централизованная обработка
Централизованные формы применения средств вычислительной техники, которые существовали до массового использования персональных электронно-вычислительных машин (ПЭВМ), предполагали их сосредоточение в одном месте и организацию информационно-вычислительных центров (ИВЦ) индивидуального и коллективного пользования (ИВЦКП).
Деятельность ИВЦ и ИВЦКП характеризовалась обработкой больших объемов информации, использованием нескольких средних и больших ЭВМ, квалификационным персоналом для обслуживания техники и разработки программного обеспечения. Централизованное применение вычислительных и других технических средств позволяло организовать их надежную работу, планомерную загрузку и квалификационное обслуживание.
При централизованных формах, когда у пользователей нет непосредственного контакта с ЭВМ, его роль сводится к передаче исходных данных на обработку, получению результатов, выявлению и устранению ошибок.
Централизованная обработка информации наряду с рядом положительных сторон (высокая степень загрузки и высокопроизводительное использование оборудования, квалифицированный кадровый состав операторов, программистов, инженеров, проектировщиков вычислительных систем и т.п.) имела ряд отрицательных черт, порожденных прежде всего отрывом конечного пользователя (экономиста, плановика, нормировщика и т.п.) от технологического процесса обработки информации.
Децентрализованная обработка
Децентрализованные формы использования вычислительных ресурсов начали формироваться со второй половины 80-х годов, когда сфера экономики получила возможность перейти к массовому использованию персональных ЭВМ. Децентрализация предусматривает размещение ПЭВМ в местах возникновения и потребления информации, где создаются автономные пункты ее обработки. К ним относятся абонентские пункты и автоматизированные рабочие места (АРМ).
При непосредственном общении пользователя с ЭВМ его функции в информационной технологии расширяются. Он сам вводит данные, формирует информационную базу, решает задачи, получает результаты, оценивает их качество. У пользователя открываются реальные возможности решать задачи с альтернативными вариантами, анализировать и выбирать с помощью системы в конкретных условиях наиболее приемлемый вариант. Все это реализуется в пределах одного рабочего места. От пользователя при этом требуется знание основ применения тех или иных информационных технологий.
4. Технологический процесс обработки данных
Технология электронной обработки информации - человеко-машинный процесс исполнения взаимосвязанных операций, протекающих в установленной последовательности с целью преобразования исходной (первичной) информации в результатную.
Информационные технологии обработки данных предназначены для решения хорошо структурированных задач, по которым имеются необходимые входные данные, известны алгоритмы и другие стандартные процедуры их обработки. Технология обеспечивает выполнение основного объема работ в автоматическом режиме с минимальным участием человека.
Операция представляет собой комплекс совершаемых технологических действий, в результате которых информация преобразуется.
Технологические операции разнообразны по сложности, назначению, технике реализации, выполняются на различном оборудовании, многими исполнителями. В условиях электронной обработки данных преобладают операции, выполняемые автоматически на машинах и устройствах, которые считывают данные, выполняют операции по заданной программе в автоматическом режиме при участии человека или сохраняя за пользователем функции контроля, анализа и регулирования.
Технологический процесс обработки информации — совокупность взаимосвязанных ручных и машинных операций по обработке информации на всех этапах ее прохождения с целью получения результатов обработки в форме, удобной для восприятия.
Технологический процесс обработки данных включает:
■ подготовительный этап, на котором осуществляется подготовка к решению задачи
(создание справочников, введение в память компьютера необходимых постоянных данных и
др);
• начальный этап, связанный с операциями по сбору, регистрации и размещению документов в базовые массивы (возможна обработка документов, заполненных вручную, однако более эффективным является электронное документирование);
• основной, завершающий этап работы, обеспечивающий получение необходимых отчетных форм, когда из компьютерной базы данных извлекаются рабочие массивы, подлежащие группировке по соответствующим ключевым признакам, подсчету по ним итоговых данных с распечаткой в дальнейшем полученных отчетных документов.
Построение технологического процесса определяется следующими факторами:
• особенности обрабатываемой информации;
• ее объемы;
• требования срочности и точности обработки;
• типы, количество и характеристики применяемых технических средств.
Они ложатся в основу организации технологии, которая включает установление перечня, последовательности и способов выполнения операций, порядка работы специалистов и средств автоматизации, организацию рабочих мест, установление временных регламентов взаимодействия и т.п.
Организация технологического процесса должна обеспечить его экономичность, комплексность, надежность функционирования, высокое качество работ. Это достигается использованием системотехнического подхода к проектированию технологии и решения экономических задач. При этом имеет место комплексное взаимосвязанное рассмотрение всех факторов, путей, методов построения технологии, применение элементов типизации и стандартизации, а также унификации схем технологических процессов.
Технология автоматизированной обработки информации строится на следующих принципах интеграции обработки данных и возможности работы пользователей в условиях эксплуатации автоматизированных систем централизованного хранения и коллективного использования данных (банков данных):
• распределение обработки данных на базе развитых систем передачи; рациональное сочетание централизованного и децентрализованного управления и организации вычислительных систем;
• моделирование и формализованное описание данных, процедур их преобразования, функций и рабочих мест исполнителей;
• учет конкретных особенностей объекта, в котором реализуется машинная обработка информации.
Различают два основных типа организации технологических процессов: предметный и пооперационный.
Предметный тип организации технологии предполагает создание параллельно действующих технологических линий, специализирующихся на обработке информации и решении конкретных комплексов задач (учет труда и заработной платы, снабжение и сбыт, финансовые операции и т.п.) и организующих пооперационную обработку данных внутри линии.
Пооперационный (поточный) тип построения технологического процесса предусматривает последовательное преобразование обрабатываемой информации согласно технологии, представленной в виде непрерывной последовательности сменяющих друг друга операций, выполняемых в автоматическом режиме. Такой подход к построению технологии оказался приемлемым при организации работы абонентских пунктов и автоматизированных рабочих мест.
Организация технологии на отдельных ее этапах имеет свои особенности, что дает основание для выделения внемашинной и внутримашинной технологии.
Внемашинная технология (ее нередко именуют предбазовой) объединяет операции сбора и регистрации данных, запись данных на машинные носители с контролем.
Внутримашинная технология связана с организацией вычислительного процесса в ЭВМ, организацией массивов данных в памяти и их структуризацией, что дает основание называть ее еще и внутрибазовой.
Основной этап информационного технологического процесса связан с решением функциональных задач на ЭВМ.
Внутримашинная технология решения задач на ЭВМ, как правило, реализует следующие типовые процессы преобразования экономической информации:
• формирование новых массивов информации;
• упорядочение информационных массивов;
• выборка из массива некоторых частей записи;
• слияние и разделение массивов;
• внесение изменений в массив;
• выполнение арифметических действий над реквизитами в пределах записей, в пределах массивов, над записями нескольких массивов.
Решение каждой отдельной задачи или комплекса задач требует выполнения следующих операций:
• ввод программы машинного решения задачи и размещения ее в памяти ЭВМ;
• ввод исходных данных;
• логический и арифметический контроль введенной информации;
• исправление ошибочных данных;
• компоновка входных массивов и сортировка введенной информации;
• вычисления по заданному алгоритму;
• получение выходных массивов информации;
• редактирование выходных форм;
• вывод информации на экран и машинные носители;
• печать таблиц с выходными данными.
Выбор того или иного варианта технологии определяется прежде всего как объемно-временными особенностями решаемых задач, периодичностью, срочностью, требованиями к быстроте связи пользователя с ЭВМ, так и режимных возможностей технических средств.
5. Технология открытых систем
Открытая система
Управление таким сложным, использующим многочисленную и разнообразную аппаратуру процессом, как передача и обработка данных в разветвленной сети требует формализации и стандартизации процедур:
• выделения и освобождения ресурсов компьютеров и системы телекоммуникации
• установления и разъединения соединений;
• маршрутизации, согласования, преобразования и передачи данных
• контроля правильности передачи;
• исправления ошибок и т. д.
Задача согласования взаимодействия ЭВМ клиентов, серверов, линий связи и других устройств решается путем установления определенных правил, называемых протоколами.
Протокол - это набор правил и методов взаимодействия объектов вычислительной сети, охватывающий основные процедуры, алгоритмы и форматы взаимодействия, обеспечивающие корректность согласования, преобразования и передачи данных в сети.
Международной организацией по стандартизации (ISO - International Organisation for Standardization) разработана система стандартных протоколов, получившая название модели взаимодействия открытых систем (Open System Interconnection - OSI), часто называемая также эталонной семиуровневой логической моделью открытых систем.
Открытая система - система, доступная для взаимодействия с другими системами в соответствии с принятыми стандартами.
Модель OSI представляет собой самые общие рекомендации для построения стандартов совместимых сетевых программных продуктов, она же служит базой для производителей при разработке совместимого сетевого оборудования, то есть эти рекомендации должны быть реализованы как в аппаратуре, так и в программных средствах вычислительных сетей,
В настоящее время модель взаимодействия от крытых систем является наиболее популярной сетевой архитектурной моделью. Модель регламентирует общие функции, а не специальные решения, поэтому реальные сети имеют достаточно пространства для маневра. Кратко поясним назначение протоколов OSI.
Прикладной уровень
Прикладной уровень (application) - управление терминалами сети и прикладными процессами, которые являются источниками и потребителями информации, передаваемой в сети. Данный уровень ведает запуском программ пользователя, их выпoлнeниeм, вводом-выводом данных, управлением терминалами, административным управлением сетью.
На прикладном уровне обеспечивается предоставление пользователям различных услуг, связанных с запуском его программ, начиная от простой передачи данных и до формирования технологии виртуальной реальности. На этом уровне функционируют технологии, являющиеся как бы надстройкой над инфраструктурой собственно передачи данных: электронной почты, теле- и видеоконференций удаленного доступа к ресурсам, работы в среде Internet и т. д.
Уровень представления
Уровень представления (presentation) - интерпретация и преобразование передаваемых в сети данных к виду, удобному для прикладных процессов.
Уровень обеспечивает представление данных в согласованных форматах и синтаксисе, трансляцию и интерпретацию программ с разных языков, шифрование данных. На практике многие функции этого уровня задействованы на прикладном уровне, поэтому протоколы уровня представлений не получили развития и во многих сетях практически не используются.
Сеансовый уровень
Сеансовый уровень (session) - организация и проведение сеансов связи между прикладными процессами.
Многие функции этого уровня в части установления соединения и поддержания упорядоченного обмена данными на практике реализуются на транспортном уровне, поэтому протоколы сеансового уровня имеют ограниченное применение.
Транспортный уровень
Транспортный уровень (transport) - управление сегментированием данных9 и сквозной передачей (транспортировкой) данных от источника к потребителю. Уровень осуществляет обмен управляющей информацией и установление между абонентами логического канала, обеспечение качества передачи данных.
На этом уровне оптимизируется использование услуг, предоставляемых на сетевом уровне, в части обеспечения максимальной пропускной способности при минимальных затратах.
Протоколы транспортного уровня развиты очень широко и интенсивно используются на практике. Большое внимание на этом уровне уделено контролю достоверности передаваемой информации.
Сетевой уровень
Сетевой уровень (network) - управление логическим каналом передачи данных в сети. Уровень обеспечивает адресацию и маршрутизацию данных, коммутацию (каналов, сообщений, пакетов) и мультиплексирование.
На этом уровне реализуется главная телекоммуникационная функция сетей - обеспечение связи ее пользователей. Каждый пользователь сети обязательно использует протоколы этого уровня и имеет свой уникальный сетевой адрес, используемый протоколами сетевого уровня. На этом уровне выполняется структуризация данных10 - разбивка их на пакеты и присвоение пакетам сетевых адресов.
Сегмент — блок данных транспортного уровня. Пакет — блок данных сетевого уровня.
Канальный уровень
Канальный уровень (data—link) - формирование и управление физическим каналом передачи данных между объектами сетевого уровня (установление, поддержание и разъединение логических каналов), обеспечение прозрачности физических соединений, контроля и исправления ошибок передачи).
Протоколы этого уровня весьма многочисленны и существенно отличаются друг от друга своими функциональными возможностями. На этом уровне действуют, например, протоколы доступа к моноканалу. Управление выполняется на уровне кадров11.
Физический уровень
Физический уровень (physical) - установление, поддержание и расторжение соединений с физическим каналом сети (обеспечение нужными физическими реквизитами подключения к физическому каналу). Управление выполняется на уровне битов цифровых (импульсы, их амплитуда, форма) и аналоговых (амплитуда, частота, фаза непрерывного сигнала).
Блоки информации, передаваемые между уровнями, имеют стандартный формат: заголовок (header), служебная информация, данные, концевик. Каждый уровень при передаче блока информации нижестоящему уровню снабжает его своим заголовком. Заголовок вышестоящего уровня воспринимается нижестоящим как передаваемые данные.
Стандартизация распространяется на логический уровень передаваемой информации.
Прежде всего — это стандарт на форму передаваемых документов. Например, в банковской системе распространен стандарт SWIFT (Society for Worldwide Interbank Financial Telecommunication). Он определяет расположение и назначение полей документа. Принципиальным моментом при использовании этого и других компьютерных стандартов на документацию является официальное признание (де-юре) передаваемого по каналам связи документа юридически полноценным.
Каждый уровень решает свои задачи и обеспечивает сервисом расположенный над ним уровень.
Правила взаимодействия разных систем одного уровня называют протоколом, правила взаимодействия соседних уровней в одной системе — интерфейсом.
Каждый протокол должен быть прозрачным для соседних уровней. Прозрачность — свойство передачи информации, закодированной любым способом, быть понятным взаимодействующим уровням.
6. Нейросетевые технологии
Одним из наиболее интересных приложений нейронных сетей в последние годы стали именно задачи финансовой деятельности. На рынке появляется огромное количество как универсальных нейро-пакетов, которые зачастую используются для решения задач технического анализа, так и специализированных экспертных систем и нейропакетов для решения многих других, более сложных и трудно формализуемых задач из финансовой области. В настоящее время российском рынке появились компьютеры и программное обеспечение нейропакетов и нейрокомпьютеров, предназначенных для решения финансовых задач. Те банки и крупные финансовые организации, которые уже используют нейронные сети для решения своих задач, понимают, насколько эффективным средством могут быть нейронные сети для задач с хорошей статистической базой, например при наличии достаточно длинных временных рядов, в том числе и многомерных.
Нейросетевые технологии оперируют биологическими терминами, а методы обработки данных получили название генетических алгоритмов, реализованных в ряде версий нейропакетов, известных в России. Это профессиональные нейропакеты Brain Maker Professional v.3.11 и Neurofo-rester v.5.1, в которых генетический алгоритм управляет процессом общения на некотором множестве примеров, а также стабильно распознает и прогнозирует новые ситуации с высокой степенью точности даже при появлении противоречивых или неполных знаний. Обучение сводится к работе алгоритма подбора весовых коэффициентов который реализуется автоматически без участия пользователя-аналитика. Все результаты обработки представляются в графическом виде удобном для анализа и принятия решений.
Использование нейросетевых технологий как инструментальных средств перспективно в решении множества плохо формализуемых задач, в частности при анализе финансовой и банковской деятельности, биржевых, фондовых и валютных рынков, связанных с высокими рисками моделей поведения клиентов, и т.д. Точность прогноза, устойчиво достигаемая нейросетевыми технологиями при решении реальных задач, уже превысила 95%. На мировом рынке нейросетевые технологии представлены широко — от дорогих систем на суперкомпьютерах до ПК, делая их доступными для приложений практически любого уровня.
К основным преимуществам нейронных сетей можно отнести:
• способность обучаться на множестве примеров в тех случаях, когда неизвестны закономерности развития ситуации и функции зависимости между входными и выходными данными. В таких случаях (к ним можно отнести до 80% задач финансового анализа) неприменимы традиционные математические методы;
• способность успешно решать задачи, опираясь на неполную, искаженную и внутренне противоречивую входную информацию;
• возможность эксплуатации обученной нейронной сети любыми пользователями;
• возможность исключительно легко подключать нейросете-вые пакеты к базам данных, электронной почте и автоматизировать процесс ввода и первичной обработки данных;
• внутренний параллелизм, присущий нейронным сетям, позволяющий практически безгранично наращивать мощность нейросистемы, т.е. сверхвысокое быстродействие за счет использования массового параллелизма обработки информации;
• толерантность к ошибкам — работоспособность сохраняется при повреждении значительного числа нейронов;
• способность к обучению — программирование вычислительной системы заменяется обучением;
• способность к распознаванию образов в условиях сильных помех и искажений.
Появление столь мощных и эффективных средств не исключают использования традиционных математических и эконометрических методов технического анализа или высококлассных экспертов. В качестве нового эффективного средства для решения самых различных задач нейронные сети просто создаются и используются людьми, помогая им решать многие профессиональные проблемы. Не обязательно насаждать нейронные сети или пытаться доказать их неэффективность путем выделения присущих им особенностей и недостатков — нужно просто относиться к ним как к неизбежному следствию развития вычислительной математики, информационных технологий и современной элементной базы.
Под нейрокомпьютером здесь понимается любое вычислительное устройство, реализующее работу нейронных сетей, будь то специальный нейровычислитель или эмулятор нейронных сетей на персональном компьютере. Под нейронной сетью (НС) понимается вид вычислительной структуры, основанной на использовании нейро-математики — нового направления, находящегося на стыке теории управления, численных методов и задач классификации, распознавания образов. Для решения конкретных задач используются пакеты прикладных программ-эмуляторов работы нейронных сетей — нейропакеты нейросетевые и гибридные экспертные системы специализированные параллельные вычислители на базе нейрочипов. Модели НС могут быть программного и аппаратного исполнения.
Несмотря на существенные различия, отдельные типы НС обладают несколькими общими чертами.
Основу каждой НС составляют относительно простые, в большинстве случаев — однотипные, элементы (ячейки), имитирующие работу нейронов мозга. Далее под нейроном и будет подразумеваться искусственный нейрон, т.е. ячейка НС. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов — однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон — выходную связь данного нейрона, с которой сигнал (возбуждения или торможения) поступает на синапсы следующих нейронов.
Общий вид нейрона приведен на рис.1. Каждый синапс характеризуется величиной синаптической связи или ее весом, который по физическому смыслу эквивалентен электрической проводимости
Рисунок 1. Искусственный нейрон
Текущее состояние нейрона определяется как взвешенная сумма его входов.
В зависимости от функций, выполняемых нейронами в сети, можно выделить три типа нейронов:
• входные, на которые подается вектор, кодирующий входное воздействие или образ внешней среды; в них обычно не осуществляется вычислительных процедур, а информация передается с входа на выход путем изменения их активации;
• выходные, значения которых представляют выходы нейросети;
• промежуточные, составляющие основу нейронных сетей.
В большинстве нейронных моделей тип нейрона связан с его расположением в сети. Если нейрон имеет только выходные связи, то это входной нейрон, если наоборот — выходной нейрон. В процессе функционирования сети осуществляется преобразование входного вектора в выходной, переработка информации.
Каждый нейрон распознает и посылает сигнал об одном простом событии, он не посылает много сигналов и не распознает много событий. Синапс позволяет единственному сигналу оказывать разные воздействия на связанные с ним нейроны. Распознавание более сложных событий есть работа группы взаимосвязанных нейронов (НС), и несколько биологических нейронных сетей функционируют взаимосвязано для обработки все более сложной информации.
Нейронная сеть состоит из слоев нейронов, которые соединены друг с другом. Детали того, как нейроны соединены между собой, заставляют задуматься над вопросом проектирования НС. Некоторые нейроны будут использоваться для связи с внешним миром, другие нейроны — только с нейронами. Они называются скрытыми нейронами.
Современные возможности аппаратной реализации НС можно обобщенно оценить следующим образом:
• число моделируемых нейронов — до 5 млн;
• число моделируемых связей — до 5 млн;
• скорость моделирования — до 500 млн переключений связей в секунду.
Для аппаратной реализации НС в настоящее время широко используются процессорные СБИС (сверхбольшие интегральные схемы), обладающие максимальными коммуникационными возможностями и ориентированные на быстрое выполнение векторных операций. К таким СБИС относятся транспьютеры фирмы INMOS (Т414, Т800, А100), сигнальные процессоры фирм Texas Instruments (IMS 320С40, IMS 320C80), Motorola, Analog Device. Отечественная элементная база представлена нейрочипами на базе БМК «Исполин — 60Т».
Нейрокомпьютеры бывают:
• универсальные (позволяют реализовывать большое число моделей нейронных сетей и могут применяться для решения разнообразных задач);
• специализированные (предназначены для решения узкого, заранее заданного класса задач).
Для любого алгоритма существует нейронная сеть, которая его реализует, т.е. нейронные сети являются универсальными вычислительными устройствами. Однако существует очень много практических задач, которые могут быть эффективно решены на серийных компьютерах. Поэтому в настоящее время основное внимание уделяется разработке специализированных нейронных компьютеров.
Существует несколько классификаций известных нейросетей.
По типам структур нейронов:
• гомогенные сети (однородные) — состоят из нейронов одного типа с единой функцией активации;
• гетерогенные сети — входят нейроны с разными функциями активации.
По типу оперируемых сигналов:
• бинарные — оперируют только двоичными сигналами, и выход каждого нейрона может принимать значение либо логического нуля (заторможенное состояние), либо логической единицы (возбужденное состояние);
• аналоговые.
По переменам состояний:
• синхронные — в каждый момент времени лишь один нейрон меняет свое состояние;
• асинхронные — состояние меняется сразу у группы нейронов, как правило, у всего слоя. Алгоритмически ход времени в нейронных сетях задается итерационным выполнением однотипных действий над нейронами.
По возможностям обучения:
• предварительно обученные (неадаптивные);
• самообучающиеся (адаптивные). По архитектуре:
• полносвязные;
• многослойные или слоистые;
• слабосвязные (с локальными связями).
В полносвязных нейросетях каждый нейрон передает свой выходной сигнал остальным нейронам, в том числе и самому себе. Все входные сигналы подаются всем нейронам. Выходными сигналами сети могут быть все или некоторые выходные сигналы нейронов после нескольких тактов функционирования сети.
В многослойных нейронных сетях нейроны объединяются в слои. Слой содержит совокупность нейронов с едиными входными сигналами. Число нейронов в слое может быть любым и не зависит от числа нейронов в других слоях. В общем случае сеть состоит из Q слоев, пронумерованных слева направо. Внешние входные сигналы подаются на входы нейронов входного слоя (его часто нумеруют как нулевой), а выходами сети являются выходные сигналы последнего слоя. Кроме входного и выходного слоев в многослойной нейронной сети есть один или несколько скрытых слоев. Связи от выходов нейронов некоторого слоя q к входам нейронов следующего слоя (q+1) называются последовательными а между нейронами одного слоя называются латеральными (боковыми)
7. Алгоритм решения задач в нейросети.
Любая работа с нейросетью начинается с определения задач, которые она должна решать, т.е. с определения функций выходов с привлечением квалифицированных экспертов. Это первый этап алгоритма.
В общем случае сеть может решать задачи как классификации (дискретные выходы), так и предсказания (непрерывные выходы). Рассмотрим процесс обучения нейросети на примере прогнозирования трейдером различных показателей.
При выборе функции выхода необходимо всегда проводить предварительный анализ и оценивать возможность его предсказания. Примером может быть исследование прогнозирования цен High, Low, Close для российского рынка акций на день вперед. Цена Close прогнозируется наихудшим образом и имеет наибольшую ошибку. А цены High и Low прогнозируются с переменным успехом для разных акций. Вывод о худшем прогнозировании цены Close можно обосновать тем, что в конце торгов последние сделки делают крупные операторы рынка и их поведение не поддается формализации.
Построение сети происходит в два этапа:
• выбор архитектуры сети (числа входов, передаточных функций; способа соединения входов между собой, входов и выходов сети);
• подбор весов (обучение) сети.
Каждая группа моделей нейронных сетей может быть использована для решения лишь некоторого ограниченного класса практических задач. Так, многослойные и полносвязные нейронные сети с сигмоидальными передаточными функциями используются для распознавания образов и адаптивного управления; нейронные сети с локальными связями — для обработки изображений и некоторых других частных задач. Для решения задач линейной алгебры используются многослойные сети с особыми передаточными функциями.
Выбор оптимальной архитектуры сети в настоящее время не имеет математического решения и проводится на основании опыта и знаний.
Большой размер нейросети приводит к затруднению обучения (для сети с 50 входами и 20 нейронами это задача оптимизации в 1000-мерном пространстве). Также уменьшаются обобщающие свойства сети, она начинает просто запоминать обучающую выборку. Такая сеть будет отлично «прогнозировать» на обучающей выборке, но на новых данных прогноз будет плохим. Чтобы избежать эффекта запоминания, объем данных должен быть достаточно большим. Например, для прогнозирования российских акций на день вперед минимальный рекомендуемый размер выборки — около 200—250 дней.
Выбор структуры НС осуществляется в соответствии с особенностями и сложностью задачи. Для решения некоторых отдельных типов задач уже существуют оптимальные на сегодняшний день конфигурации. Если же задача не может быть сведена ни к одному из известных типов, разработчику приходится синтезировать новую конфигурацию. При этом он руководствуется несколькими основополагающими принципами: возможности сети возрастают с увеличением числа ее ячеек, плотности связей между ними и числом выделенных слоев; сложность алгоритмов функционирования сети (в том числе, например, введение нескольких типов синапсов — возбуждающих, тормозящих и др.) также способствует усилению мощи НС. Вопрос о необходимых и достаточных свойствах сети для решения того или иного рода задач представляет собой целое направление нейрокомпьютерной науки. Так как проблема синтеза НС сильно зависит от решаемой задачи, дать общие подробные рекомендации затруднительно. В большинстве случаев оптимальный вариант выбирается интуитивно.
Очевидно, что процесс функционирования НС, т.е. сущность действий, которые она способна выполнять, зависит от величин синаптических связей, поэтому, задавшись определенной структурой НС, отвечающей какой-либо задаче, разработчик сети должен найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными).
Этот этап называется обучением НС, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время эксплуатации. На этапе обучения кроме параметра качества подбора весов важную роль играет время обучения. Как правило, эти два параметра связаны обратной зависимостью и их приходится выбирать на основе компромисса.
Обучение НС может вестись с учителем или без него. В первом случае сети предъявляются значения как входных, так и желательных выходных сигналов, и по некоторому внутреннему алгоритму система подстраивает веса своих синаптических связей. Во втором случае выходы НС формируются самостоятельно, а веса изменяются по алгоритму, учитывающему только входные и производные от них сигналы.
Существует великое множество различных алгоритмов обучения, которые делятся на два больших класса: детерминистские и стохастические. В первом из них подстройка весов представляет собой жесткую последовательность действий, во втором она проводится на основе действий, подчиняющихся некоторому случайному процессу.
Среди различных конфигураций искусственных нейронных сетей встречаются такие, при классификации которых по принципу обучения, строго говоря, не подходит обучение ни с учителем, ни без него. В таких сетях весовые коэффициенты синапсов рассчитываются только единожды, перед началом функционирования сети на основе информации об обрабатываемых данных, и все обучение сети сводится именно к этому расчету. С одной стороны, предъявление априорной информации можно расценивать как помощь учителя, но с другой — сеть фактически просто запоминает образцы до того, как на ее вход поступают реальные данные, и не может изменять свое поведение, поэтому говорить о звене обратной связи с «миром» (учителем) не приходится. Из сетей с подобной логикой работы наиболее известны сеть Хопфилда и сеть Хэмминга которые обычно используются для организации ассоциативной памяти.
Задача, решаемая данной сетью в качестве ассоциативной памяти, как правило, формулируется следующим образом. Известен некоторый набор двоичных сигналов (изображений, звуковых оцифровок, прочих данных, описывающих некие объекты или характеристики процессов), которые считаются образцовыми. Сеть должна уметь из произвольного неидеального сигнала, поданного на ее вход, выделить («вспомнить» по частичной информации) соответствующий ему образец (если такой есть) или «дать заключение» о том, что входные данные не соответствуют ни одному из образцов.
Сети Хопфилда, Хэмминга позволяют просто и эффективно решить задачу воссоздания образов по неполной и искаженной информации. Невысокая емкость сетей (число запоминаемых образов) объясняется тем, что сети не просто запоминают образы, а позволяют проводить их обобщение; например, с помощью сети Хэмминга возможна классификация по критерию максимального правдоподобия. Вместе с тем легкость построения программных и аппаратных моделей делает эти сети привлекательными для многих применений.
На втором, наиболее важном этапе проводится определение состава входов. Нейросеть умеет отсеивать незначимые входы, но каждый «лишний» вход утяжеляет сеть, затрудняет обучение, а главное — снижает качество прогноза. При большом числе «лишних» входов нейросеть чаще всего делает прогноз «сегодня будет, как вчера, завтра будет, как сегодня». Поэтому необходимо очень аккуратно подходить к добавлению новых входов. Вообще, на входы нейросетей можно подавать самую разнообразную информацию, как дискретную (различные события) так и непрерывную (цены, индексы, индикаторы). Состав входов обычно является наиболее «сокровенной» тайной разработчика нейросети и держится в секрете. Наиболее значимыми входами являются индикаторы технического анализа и различные фондовые индексы.
При правильном обучении НС все основные ее ошибки связанны с недостатком входной информации и глобальным изменением состояния объекта прогнозирования. Например, прогноз максимальной цены на день вперед для НК ЛУКойл дает наибольшие ошибки прогноза в дни выхода каких-либо новостей, которые сильно влияли на российский рынок акций. НС не может прогнозировать такие события, как отставки премьер-министров, начало войны, итоги собраний акционеров и другие фундаментальные факторы. Но и в этих случаях нейросеть будет полезной, если заранее получить два варианта прогнозов: без переломного события и с ним — тогда у трейдера уже будут ценовые уровни при разных сценариях развития событий. И в зависимости от ситуации на рынке выбирается необходимый прогноз.
На третьем этапе проводится выбор типа нейросетевой технологии и метода ее обучения. Для решения практических задач часто требуются обучающие выборки большого объема, поэтому в ряде нейропакетов предусмотрены средства, облегчающие процесс формирования и использования обучающих примеров. Однако в настоящее время отсутствует универсальная методика построения обучающих выборок, и набор обучающих примеров, как правило, формируется индивидуально для каждой решаемой задачи.
Оказывается, что после многократного предъявления примеров веса сети стабилизируются, причем сеть дает правильные ответы на (почти) все примеры из базы данных. В таком случае говорят, что «сеть натренирована». В программных реализациях можно видеть, что в процессе обучения величина ошибки (сумма квадратов ошибок по всем выходам) постепенно уменьшается. Когда величина ошибки достигает нуля или приемлемого малого уровня, тренировку останавливают, а полученную сеть считают натренированной и готовой к применению на новых данных.
Вся информация, которую сеть имеет о задаче, содержится в наборе примеров. Считается, что для полноценной тренировки требуется хотя бы несколько десятков-сотен примеров. Обучение сети — сложный и наукоемкий процесс.
Четвертый этап — подготовка данных. В последние годы конъюнктура финансовых рынков претерпела значительные изменения, вследствие которых стала динамичнее. В связи с этим возникла необходимость использования специальных механизмов обучения (неравномерной выборки данных), при которых больший вес имеют более новые данные. Кроме этого, при подготовке данных необходимо руководствоваться следующим правилом: исходные данные должны быть непротиворечивы. Для решения этой проблемы, возможно, потребуется увеличить число входов.
В процессе работы периодически по мере изменения рынка и его перехода на новые уровни (минимум или максимум) необходимо проводить переобучение нейросетей на новых данных.
Обучение нейросетей — процесс простой, но длительный и требующий мониторинга. Для ускорения обучения обычно используют нейроплаты — нейроускорители, генетические, модифицированные алгоритмы обучения, как, например, пакетная обработка и пр.
На последних этапах проводят тестирование нейросети и ее запуск для получения прогнозов и оценки результатов. Для проверки правильности обучения построенной нейронной сети в ней-роимитаторах предусмотрены специальные средства тестирования. В сеть вводится сигнал, который, как правило, не совпадает ни с одним из входных сигналов примеров обучающей выборки. Далее анализируется получившийся выходной сигнал сети.
Тестирование обученной сети может проводиться либо на одиночных входных сигналах, либо на тестовой выборке, которая имеет структуру, аналогичную обучающей выборке, и также состоит из пар («вход», «требуемый выход»). Обычно обучающая и тестовая выборки не пересекаются. Тестовая выборка строится индивидуально для каждой решаемой задачи. Если результаты тестирования не удовлетворяют, то просматривается набор входных данных, изменяют некоторые учебные программы или перестраивают сеть.
Выходные данные могут быть представлены как числовыми данными, так и текстовыми, преобразованными в уникальный набор чисел в зависимости от класса выполняемой задачи.
Различают два типа выходных сигналов.
1. Дискретные. Такие выходные сигналы используются для решения задач распознавания и классификации как имеющихся объектов, так и вновь вводимых, ранее неизвестных. Данные для обучения и классы классифицируемых объектов могут быть самой разной природы, условием построения хорошей модели будет лишь наличие корреляции между ними, в самой неявной и неформали-зуемой форме. Примером выходных классификаций может быть обычная гистограмма определения состоятельности предприятия.
2. Непрерывные выходные сигналы используются для задач аппроксимации и экстраполяции величин, имеющих абсолютные значения, и для построения прогнозов и функциональных зависимостей для различной информации сразу по нескольким переменным (критериям оценки).
Главная ценность нейронных технологий состоит в том, что они позволяют прогнозировать будущее. Но качество прогнозов определяется прежде всего уровнем профессионализма пользователя.
Перечислим основные классы задач, возникающих в финансовой области, которые эффективно решаются с помощью нейронных сетей:
• прогнозирование временных рядов на основе нейросетевых методов обработки;
• страховая деятельность банков;
• прогнозирование банкротств на основе нейросетевой системы распознавания;
• определение курсов облигаций и акций предприятий с целью инвестирования;
• применение нейронных сетей к задачам биржевой деятельности;
• прогнозирование экономической эффективности финансирования инновационных проектов;
• предсказание результатов займов;
• оценка платежеспособности клиентов;
• оценка недвижимости;
• составление рейтинга;
• общие приложения нейронных сетей и пр.
8. Информационная технология экспертных систем.
Экспертные системы (ЭС) возникли как теоретический и практический результат применения и развития методов искусственного интеллекта с использованием ЭВМ. Это набор программ, выполняющий функции эксперта при решении задач из некоторой предметной области. ЭС выдают советы, проводят анализ, дают консультации, ставят диагноз. Практическое применение ЭС на предприятиях способствует повышению эффективности работы и квалификации специалистов.
Экспертные системы дают возможность специалисту получать необходимую информацию для принятия решений по любым проблемам при наличии необходимой базы знаний.
Экспертные системы имеют непосредственное отношение к области «искусственного интеллекта». Но сюда относится также и создание роботов, систем, моделирующих интеллектуальные способности человека.
Главным достоинством ЭС является возможность накопления знаний и их долгосрочное сохранение. В отличие от человека к любой информации экспертные системы подходят объективно, что улучшает качество проводимой экспертизы. При решении задач, требующих обработки большого объема знаний, возможность возникновения ошибки при переборе очень мала.
Основным отличием ЭС от других программных продуктов является использование не только данных, но и знаний, а также специального механизма вывода решений и новых знаний на основе имеющихся. Знания в ЭС представляются в такой форме, которая может быть легко обработана на ЭВМ. В ЭС известен алгоритм обработки знаний, а не решения задачи. Поэтому при решении конкретной задачи применение алгоритма обработки знаний может привести к получению такого результата, который не был предусмотрен. Более того, алгоритм обработки знаний заранее неизвестен, и строится по ходу решения задачи на основании эвристических правил. Решение задачи в ЭС сопровождается понятными пользователю объяснениями, качеств о получаемых решений обычно не хуже, а иногда и лучше достигаемого специалистами. в системах, основанных на знаниях, правила, по которым решаются проблемы в конкретной предметной области, хранятся в базе знаний. Проблемы ставятся перед системой в виде совокупности фактов.
Качество ЭС определяется размером и качеством базы знании (правил или эвристик), Система функционирует в следующем циклическом режиме: выбор (запрос) данных или результатов анализов, наблюдения, интерпретация результатов, усвоение новой информации, выдвижение с помощью правил временных гипотез и затем выбор следующей порции данных или результатов анализов. Процесс продолжается до тех пор, пока не поступит информация, достаточная для окончательного заключения.
9. Классификация экспертных систем по решаемой задаче
Существуют различные подходы к классификации экспертных систем, т. к. класс ЭС сегодня объединяет несколько тысяч различных программных комплексов, которые можно классифицировать по десятку критериев. Рассмотрим некоторые варианты классификации.
Рис. 4. Классификация экспертных систем
Классификация ЭС по решаемой задаче.
Традиционно ЭС решают следующие классы задач:
• Интерпретация данных. Это одна из традиционных задач для экспертных систем. Например, обнаружение и идентификация различных типов океанских судов по результатам аэрокосмического сканирования — SIAP; определение основных свойств личности по результатам психодиагностического тестирования в системах АВТАНТЕСТ и МИКРОЛЮШЕР и др.
• Диагностика. Под диагностикой понимается процесс соотнесения объекта с некоторым классом объектов и/или обнаружение неисправности в некоторой системе. Неисправность — это отклонение от нормы. Например: диагностика и терапия сужения коронарных сосудов — ANGY; диагностика ошибок в аппаратуре и математическом обеспечении ЭВМ — система CRIB и др.
• Мониторинг. Основная задача мониторинга — непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы. Например: контроль за работой электростанций, помощь диспетчерам атомного реактора; контроль аварийных датчиков на химическом заводе и др.
• Проектирование. Проектирование состоит в подготовке спецификаций на создание "объектов" с заранее определенными свойствами. Например: проектирование конфигураций ЭВМ, проектирование БИС; синтез электрических цепей и др.
• Прогнозирование. Прогнозирование позволяет предсказывать последствия некоторых событий или явлений на основании анализа имеющихся данных. Например: предсказание погоды; оценки будущего урожая; прогнозы в экономике и др.
• Планирование. Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции. Например: планирование поведения робота; планирование промышленных заказов; планирование эксперимента и др.
• Обучение. Под обучением понимается использование компьютера для обучения какой-то дисциплине или предмету. Например: обучение языку программирования LISP в системе "Учитель LISP"; система обучения языку Паскаль и др.
• Управление. Под управлением понимается функция организованной системы, поддерживающая определенный режим деятельности. Например: помощь в управлении газовой котельной; управление системой календарного планирования Project Assistant и др.
• Поддержка принятия решений. Поддержка принятия решения — это совокупность процедур, обеспечивающая принимающего решения индивидуума необходимой информацией и рекомендациями, облегчающими процесс принятия решения. Например: выбор стратегии выхода фирмы из кризисной ситуации; помощь в выборе страховой компании или инвестора и др.
В общем случае все системы, основанные на знаниях, можно подразделить на системы, решающие задачи анализа и на системы, решающие задачи синтеза. Основное отличие задач анализа от задач синтеза заключается в том, что если в задачах анализа множество решений может быть перечислено и включено в систему, то в задачах синтеза множество решений потенциально не ограничено и строится из решений компонентов или подпроблем. Задачами анализа являются: интерпретация данных, диагностика, поддержка принятия решения; к задачам синтеза относятся проектирование, планирование, управление. Комбинированные: обучение, мониторинг, прогнозирование.
10. Классификация по связи с реальным временем, по типу ЭВМ, по степени интеграции с другими программами
По связи с реальным временем:
• Статические ЭС разрабатываются в предметных областях, в которых база знаний и интерпретируемые данные не меняются во времени. Они стабильны. Пример: диагностика неисправностей в автомобиле
• Квазидинамические ЭС интерпретируют ситуацию, которая меняется с некоторым фиксированным интервалом времени.
Пример: микробиологические ЭС, в которых снимаются лабораторные измерения с технологического процесса один раз в 4—5 часов (производство лизина, например) и анализируется динамика полученных показателей по отношению к предыдущему измерению.
• Динамические ЭС работают в сопряжении с датчиками объектов в режиме реального времени с непрерывной интерпретацией поступающих в систему данных.
Пример: управление гибкими производственными комплексами, мониторинг в реанимационных палатах.
По типу ЭВМ:
На сегодняшний день существуют:
• ЭС для уникальных стратегически важных задач на суперЭВМ (Эльбрус, CRAY, CONVEX и др.);
• ЭС на ЭВМ средней производительности (mainframe);
• ЭС на символьных процессорах и рабочих станциях (SUN, Silicon Graphics, APOLLO);
• ЭС на персональных компьютерах (IBM-совместимые, Macintosh).
По степени интеграции с другими программами
• Автономные ЭС работают непосредственно в режиме консультаций с пользователем для специфически "экспертных" задач, для решения которых не требуется привлекать традиционные методы обработки данных (расчеты, моделирование и т. д.).
• Гибридные ЭС представляют программный комплекс, агрегирующий стандартные пакеты прикладных программ (например, математическую статистику, линейное программирование или системы управления базами данных) и средства манипулирования знаниями. Это может быть интеллектуальная надстройка над ППП (пакетами прикладных программ) или интегрированная среда для решения сложной задачи с элементами экспертных знаний. Разработка таких систем представляет собой задачу на порядок более сложную, чем разработка автономной ЭС. Стыковка не просто разных пакетов, а различных методологий (что происходит в гибридных системах) порождает целый комплекс теоретических и практических трудностей.
11. Поколения экспертных систем
В любой момент времени в системе существует три типа знаний:
1) структурированные — статистические знания о предметной области. После того как эти знания выявлены, они уже не изменяются;
2) структурированные динамические — изменяемые знания о предметной области. Они обновляются по мере выявления новой информации;
3) рабочие — знания, применяемые для решения конкретной задачи или проведения консультации.
Эти знания хранятся в базе знаний. Для ее построения требуется провести опрос специалистов, являющихся экспертами в конкретной предметной области, а затем систематизировать, организовать и снабдить эти знания указателями, чтобы впоследствии их можно было легко извлечь из базы знаний.
Системы, основанные на знаниях, строятся по модульному принципу, что позволяет постепенно наращивать их базы знаний.
Компьютерные системы, которые могут лишь повторить логический вывод эксперта, принято относить к ЭС первого поколения. Однако специалисту, решающему интеллектуально сложную задачу, явно недостаточно возможностей системы, которая лишь имитирует деятельность человека. Ему нужно, чтобы ЭС выполняла функции полноценного помощника и советчика, способного проводить анализ нечисловых данных, выдвигать и отбрасывать гипотезы, оценивать достоверность фактов, самостоятельно пополнять свои знания, контролировать их непротиворечивость, делать заключения на основе прецедентов и может быть даже порождать решение новых ранее не рассматриваемых задач. Наличие таких возможностей характерно для ЭС второго поколения, концепцию которых начали разрабатывать 9—10 лет назад. Экспертные системы, относящиеся ко второму поколению, называют партнерскими, или усилителями интеллектуальных способностей человека. Их общими отличительными чертами является умение обучаться и развиваться, т.е. эволюционировать.
В экспертных системах первого поколения знания представлены следующим образом:
1) знаниями системы являются только знания эксперта, опыт накопления знаний не предусматривается;
2) методы представления знаний позволяют описывать лишь статические предметные области;
3) модели представления знаний ориентированы на простые области.
Представление знаний в экспертных системах второго поколения следующее:
1) используются не поверхностные знания, а более глубинные, возможно дополнение предметной области;
2) ЭС может решать задачи динамической базы данных предметной области.
12. Целесообразность и преимущества применения ЭС
Существует ряд прикладных задач, которые решаются с помощью систем, основанных на знаниях, более успешно, чем любыми другими средствами. При определении целесообразности применения таких систем нужно руководствоваться следующими критериями.
1. Данные и знания надежны и не меняются со временем.
2. Пространство возможных решений относительно невелико.
3. В процессе решения задачи должны использоваться формальные рассуждения. Существуют системы, основанные на знаниях, пока еще не пригодные для решения задач методами проведения аналогий или абстрагирования (человеческий мозг справляется с этим лучше). Традиционные компьютерные программы оказываются эффективнее систем, основанных на знаниях, в тех случаях, когда решение задачи связано с применением процедурного анализа. Системы, основанные на знаниях, более подходят для решения задач, где требуются формальные рассуждения.
4. Должен быть по крайней мере один эксперт, который способен явно формулировать свои знания и объяснять методы применения этих знаний для решения задач.
В целом ЭС не рекомендуется применять для решения следующих типов задач:
• математических, решаемых обычным путем формальных преобразований и процедурного анализа;
• задач распознавания, поскольку в общем случае они решаются численными методами;
• задач, знания о методах решения которых отсутствуют (невозможно построить базу знаний).
Системы, основанные на знаниях, имеют определенные преимущества перед человеком-экспертом.
1. У них нет предубеждений.
2. Они не делают поспешных выводов.
3. Эти системы работают систематизированно, рассматривая все детали, часто выбирая наилучшую альтернативу из всех возможных.
4. База знаний может быть очень и очень большой. Будучи введены в машину один раз, знания сохраняются навсегда. Человек же имеет ограниченную базу знаний, и если данные долгое время не используются, то они забываются и навсегда теряются.
5. Системы, основанные на знаниях, устойчивы к «помехам». Эксперт пользуется побочными знаниями и легко поддается влиянию внешних факторов, которые непосредственно не связаны с решаемой задачей. ЭС, не обремененные знаниями из других областей, по своей природе менее подвержены «шумам». Со временем системы, основанные на знаниях, могут рассматриваться пользователями как разновидность тиражирования — новый способ записи и распространения знаний. Подобно другим видам компьютерных программ они не могут заменить человека в решении задач, а скорее напоминают орудия труда которые дают ему возможность решать задачи быстрее и эффективнее.
6. Эти системы не заменяют специалиста, а являются инструментом в его руках.
При создании ЭС возникает ряд затруднений. Это связано прежде всего с тем, что заказчик не всегда может достаточно точно сформулировать свои требования к разрабатываемой системе. Также возможно возникновение трудностей чисто психологического характера: при создании базы знаний системы эксперт может препятствовать передаче своих знаний, опасаясь, что впоследствии его заменят «машиной». Но эти страхи не обоснованы, так как ЭС не способны обучаться, они не обладают здравым смыслом, интуицией. Но в настоящее время ведутся разработки экспертных систем, реализующих идею самообучения. Также ЭС неприменимы в больших предметных областях и в тех областях где отсутствуют эксперты.
Экспертная система состоит из базы знаний (части системы, в которой содержатся факты), подсистемы вывода (множества правил, по которым осуществляется решение задачи), подсистемы объяснения, подсистемы приобретения знаний и диалогового процессора.
База знаний — это совокупность моделей, правил и факторов, данных, порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области.
Сегодня создается целый спектр баз знаний — от небольших по объему до мощных, предназначенных для профессионалов, эксплуатирующих сложные, технически оснащенные ЭВМ. Совершенствование создаваемых баз знаний делает их доступными для массового пользователя с превращением их в коммерческий продукт.