Формальные модели представления знаний – основа интеллектуальных систем
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Основы искусственного интеллекта (зм)
Лекция 1
Формальные модели представления знаний –
основа интеллектуальных систем
В настоящее время тематика искусственного интеллекта (ИИ) охватывает огромный
перечень научных направлений, начиная с таких задач общего характера, как обучение и
восприятие, и заканчивая такими специальными задачами, как игра в шахматы,
доказательство математических теорем, сочинение музыкальных произведений и
диагностика заболеваний. В ИИ систематизируются и автоматизируются интеллектуальные
задачи и поэтому эта область касается любой сферы интеллектуальной деятельности
человека.
Существует множество определений ИИ. Эти определения можно классифицировать по
двум основным категориям:
- Системы, которые думают и действуют подобно людям («Наука о том, как научить
компьютеры делать то, в чем люди в настоящее время их превосходят»);
- Системы, которые думают и действуют рационально («Наука о проектировании
интеллектуальных агентов»);
К первой категории относят определения ИИ, в которых успех измеряется в терминах
достоверного воспроизведения способностей человека. Ко второй категории относятся
определения, характеризующие достижения той области, которая трактует
интеллектуальность в терминах рационального действия. Система является рациональной,
если она «все действия выполняет правильно», при условии, что система обладает знаниями
о том, что является правильным.
Решение задач создания систем с ИИ в первую очередь сталкивается с проблемой
формализации знаний об объекте, среде его функционирования, целях функционирования
и т.д. Одной из важнейших задач, которые необходимо решить при формализации знаний,
является их классификация. Можно выделить несколько классификаций знаний,
построенных на основе разных признаков:
По жесткости.
«жесткие» знания (позволяют получать однозначные четкие решения
рекомендации при заданных начальных условиях);
«мягкие» знания (допускают несколько решений, нечеткие решения и т.п.).
и
По типам. В настоящее время принято выделять восемь типов знаний:
1) базовые элементы – объекты реального мира, которые связаны с непосредственным
восприятием, не требуют обсуждения, вводятся в базу знаний как факты в том виде, в
котором они получены;
2) утверждения и определения – базовые элементы, являющиеся их продуктами и
заранее рассматривающиеся как достоверные;
3) концепции – перегруппировки и обобщения, представляющие собой продукты
базовых объектов, получаемые на основе примеров, частных случаев и т.д.;
4) отношения – элементарные свойства, которые представляют собой атрибуты
базовых элементов или отношения между концепциями, т.е. как атрибуты продуктов;
5) теоремы и правила перезаписи – частный случай продукционных правил с вполне
определенными свойствами;
Основы искусственного интеллекта (зм)
6) алгоритмы, необходимые для выполнения определенных задач. Связаны со
знаниями особого типа, поскольку определяемая ими последовательность действий
оформляется в блок в строго необходимом порядке, в отличие от других типов знаний, где
элементы могут появляться и располагаться без связи друг с другом;
7) стратегии и эвристики – врожденные или приобретенные правила поведения,
позволяющие в конкретной ситуации принять решение о необходимых действиях. При
формализации используют информацию в порядке, обратном тому, в котором она была
получена изначально. Например, вначале была информация: какое-либо действие приводит
к такому-то желаемому результату в такой-то ситуации (знание типа 4). Из этого следует,
что если необходимо в этой ситуации получить желаемый результат, то можно
использовать известное из первой информации действие (знание типа 7);
8) метазнания – знания о знаниях всех уровней. Определяют коэффициент доверия к
каждому знанию и важность каждой элементарной информации по отношению ко всему
множеству знаний, вопросы организации каждого типа знаний и указания, когда и как они
могут быть использованы.
По уровню «теоретичности» знаний о предметной области (ПрО).
Уровень 1. Знания о конкретных сущностях и фактах. Эти знания обычно называют
данными, они хранятся в БД и в терминах реляционной модели называются кортежами,
например, множество эмпирических замеров двух величин, представляемых таблично. С
накопления фактов или данных начинается любая система знаний.
Уровень 2. Описания классов в виде правил. По мере обобщения и анализа данных
выявляются эмпирические зависимости и корреляции, которые позволяют разбить
множество кортежей (фактов) на классы и каждому классу поставить в соответствие
содержательное описание зависимостей и корреляций, выражаемых в виде правил вида
«ЕСЛИ класс N, ТО …». Например, «ЕСЛИ у больного повышена температура, ТО вероятен
воспалительный процесс».
Уровень 3. Формулы, отношения, алгоритмы. Дальнейшее обобщение и
формализация позволяют построить и описать единой формулой зависимость между
переменными (например, написать «y=f(x)» для таблицы эмпирических замеров x и y).
Формулы могут выражаться в виде алгоритмов вычисления одних величин по известным
значениям других величин. Там, где нет формулы, применяется известная в реляционной
модели данных схема отношения.
Уровень 4. Теория, позволяющая вывести все формулы и алгоритмы уровня 3,
правила уровня 2 и описать все факты уровня 1, в том числе и неизвестные. Теория обычно
выражается совокупностью утверждений (аксиом) и правил вывода. Теория является
законченным компактным описанием проблемной области, позволяющим решать в ней
практические задачи.
Взаимодействие уровней модели происходит следующим образом. Решение
практической задачи требует знаний уровня 3, поскольку на основе теории строятся
конкретные процедуры решения, в которые уже подставляются исходные данные задачи, и
производятся необходимые вычисления, после которых уже получается результат – факт
уровня 1.
В качестве иллюстрации оперирования уровнями модели знаний можно привести
школьников и решаемые ими задачи. Двоечник помнит только отдельные факты (уровень
1) и новые задачи решить не может. Троечник помнит несколько правил (уровень 2) и
пытается подогнать их под новую задачу. «Хорошист» быстро вспоминает «сценарий»,
определяет тип задачи, получает алгоритм решения, подставляет в него исходные данные и
вычисляет ответ. Это особенно ярко видно на задачах по физике, где сначала требуется
Основы искусственного интеллекта (зм)
вывести формулу (получить алгоритм), а затем произвести по ней вычисления. При этом
физические законы играют роль «теории», а вводимая формула является процедурой
уровня 3.
Компетентность специалиста определяет владение в полной мере теорией, выраженной
множеством эффективных сценариев. Они позволяют при минимальных вычислениях
получить нужный алгоритм и произвести действия. Отличник способен решить задачу, для
которой у него нет готового сценария. Этот сценарий он выводит из теории.
Обучение специалистов происходит по схеме восхождения от уровня 1 до уровня 4. При
этом, даже если теория в данной области отсутствует и нет четких процедур уровня 3, у
экспертов формируется совокупность правил уровня 2 – набор сценариев для решения
классов задач (например, диагностики). Значительной долей компетенции эксперта
зачастую является множество сценариев и правил, которые он формирует и применяет
подсознательно, интуитивно и неспособен четко сформулировать или объяснить.
Предположительно правила вида «ЕСЛИ … ТО» появляются только при попытке
вербализации знаний, при объяснении и обосновании своих действий. Здесь язык мозга и
язык модели знаний могут существенно различаться. Знания уровня 4 называют
декларативными. Декларативные знания сами по себе мертвы, они актуализируются только
при выводе из них алгоритма решения конкретных задач, т.е. при дедуктивном спуске с
уровня 4.
В ИИ способ представления знаний характеризуется моделью представления, выбор
которой осуществляется инженером по знаниям на этапе построения формализованного
представления. Все многообразие моделей представления знаний, используемых в
современной теории ИИ, можно разбить на два типа (рис. 1.1): логические (в основе их
лежит понятие формальной системы) и эвристические (сетевые, продукционные, фреймы,
нейросетевые).
Рис.1.1 Классификация моделей представления знаний.
В логических моделях отношения, существующие между отдельными единицами
знаний, выражаются только с помощью тех средств, которые представляются
синтаксическими правилами, используемыми формальной системой. В отличие от
формальных эвристические модели имеют разнообразный набор средств, передающих
специфические особенности той или иной ПрО.
Основы искусственного интеллекта (зм)
Продукционная модель позволяет осуществлять эвристические методы вывода на
правилах и может обрабатывать неопределенности в виде условных вероятностей или
коэффициентов уверенности, а также выполнять монотонный или немонотонный вывод.
Семантическая сеть отображает разнообразные отношения объектов.
Фреймовая модель как частный случай семантической сети использует для реализации
операционного знания присоединенные процедуры. Объектно-ориентированная модель как
развитие фреймовой, реализуя обмен сообщениями между объектами, в большей степени
ориентирована на решение динамических задач и отражение поведенческой модели.
Логическая модель предполагает унифицированное описание объектов и действий в
виде предикатов первого порядка. Под предикатом понимается логическая функция на Nаргументах (признаках), которая принимает истинное или ложное значение в зависимости
от значений аргументов. Отличие заключается в том, что для объектов соответствующие
реляционные отношения задаются явно в виде фактов, а действия описываются как
правила, определяющие логическую формулу вывода фактов из других фактов. Механизм
вывода осуществляет дедуктивный перебор фактов, относящихся к правилу по принципу
«сверху вниз», «слева направо» или обратный вывод методом поиска в глубину.
Продукционные модели используются для решения более сложных задач, которые
основаны на применении эвристических методов представления знаний, позволяющих
настраивать механизм вывода на особенности ПрО и учитывать неопределенность знаний.
Для обработки неопределенностей знаний продукционная модель использует, как
правило, либо методы обработки условных вероятностей (байесовский подход), либо
методы нечеткой логики.
Различия между естественным и искусственным интеллектами
Задача моделирования естественного интеллекта (ЕИ) в рамках ИИ ставится с учетом
существенных ограничений, обусловленных как неполнотой наших знаний о том, как
устроен и функционирует ЕИ, так и ограниченными возможностями вычислительной
техники. Рассмотрение этого вопроса следует начать с уточнения ряда терминов. Для
любой науки разработка понятийно-терминологического аппарата является приоритетным
направлением. В нашем случае необходимо определить такие понятия, как интеллект,
разум, сознание, понимание в контексте разработки искусственно создаваемых объектов.
Интеллект (от лат. intellectus – понимание, познание) –
способность к мышлению, рациональному познанию, общие
способности к познанию, пониманию и разрешению проблем. Согласно
определению академика Н.Н.Моисеева, интеллект – это прежде всего
целеполагание, планирование ресурсов и построение стратегии
достижения цели.
Разум – высшая ступень познавательной деятельности человека,
способность логически и творчески мыслить, обобщать результаты
познания; продукт деятельности мозга, выражающейся в речи.
Понимание – способность постичь смысл и значение каких-либо целенаправленных
действий и достигнутый благодаря этому результат.
Основы искусственного интеллекта (зм)
Если не брать в расчет гипотезу божественного происхождения человека, то следует
признать, что способностью мыслить человек обязан процессу эволюции органической
материи. Человеческий разум является продуктом
деятельности высокоорганизованной материи – мозга.
Поскольку основным инструментом моделирования ЕИ
является компьютер, возникает ряд вопросов, связанных с
принципиальной
возможностью
воспроизвести
интеллектуальные способности человека с помощью
вычислительной техники.
Известный английский ученый
Р. Пенроуз сформулировал ряд вопросов, относящихся к проблеме
создания искусственного разума [1]. Может ли наш мозг выполнять
какие-то действия, которые вообще невозможно описать через
вычисление? Каким образом можно смоделировать на компьютере
нашу способность к осмысленному осознанию счастья, боли, любви,
какого-либо эстети ческого переживания, желания, понимания и т.п.?
Обладает ли наука достаточной компетентностью для того, чтобы
рассматривать вопросы, относящиеся к сознанию человека?
В отношении поставленных вопросов весь спектр мнений условно можно свести к
четырем крайним точкам зрения:
1. Всякое мышление есть вычисление. В частности, ощущение осмысленного
осознания есть не что иное, как результат выполнения соответствующего вычисления.
2. Осознание представляет собой характерное проявление физической активности
мозга. Несмотря на то что любую физическую активность можно моделировать
посредством той или иной совокупности вычислений, численное моделирование как
таковое не способно вызвать осознание.
3. Осознание является результатом соответствующей физической активности мозга,
однако эту физическую активность невозможно должным образом смоделировать
вычислительными средствами.
4. Осознание невозможно объяснить в физических, математических и вообще научных
терминах.
Последняя точка зрения, рассматривающая разум как нечто абсолютно неподвластное
языку науки и свойственная для религиозного мировоззрения, не может быть отправной
точкой для решения задач создания ИИ.
Первую точку зрения разделяют сторонники так
называемого «сильного» ИИ. По их мнению, любого
управляемого компьютером робота, который после
достаточно большого количества заданных ему вопросов
ведет себя так, словно он обладает сознанием, следует
фактически считать обладающим сознанием. В этом состоит
суть так называемого теста Тьюринга.
Согласно второй точке зрения робот вполне может вести себя точно так же, как
обладающий сознанием человек, при этом реально не имея и малой доли этого внутреннего
качества. ИИ, рассматриваемый с этой позиции, еще называют «слабым».
Наличие или отсутствие сознания очень сильно зависит от того, какой именно
физический объект «осуществляет мышление» и какие физические действия он при этом
совершает. То есть активность биологического мозга может вызвать осознание, а вот его
точная электронная модель может оказаться на это не способной. При этом сторонники
Основы искусственного интеллекта (зм)
первых двух точек зрения сходятся в том, что управляемый компьютером робот может
вести себя так, как ведет себя человек, обладающий сознанием.
Третья точка зрения, напротив, не допускает и малейшей возможности того, что когдалибо может быть реализована эффективная модель обладающего сознанием человека в виде
управляемого компьютером робота. Согласно ей после некоторого достаточно большого
количества вопросов реальное отсутствие сознания у робота так или иначе проявится.
Специалисты, стоящие на этой позиции, согласны с тем, что разум возникает в результате
проявления активности тех или иных физических объектов (например, мозга). При этом
утверждается, что не всякую физическую активность можно должным образом
смоделировать вычислительными методами. Иначе говоря, современная наука еще не
обладает нужной методологией для объяснения феномена сознания.
Сформулированные четыре точки зрения являются полярными позициями, которых
может придерживаться тот или иной специалист. Между ними можно разместить
множество различных промежуточных точек зрения или их комбинаций.
Таким образом, между ЕИ и его моделью – ИИ существует принципиальное различие.
Для понимания этого различия следует еще раз обратить внимание на используемую
терминологию, особенно в отношении таких понятий, как «понимание», «сознание» и
«интеллект».
Можно опираться на многочисленные формальные определения этих терминов. Можно
до некоторой степени положиться на интуитивное восприятие действительного смысла
этих слов. Мы действительно интуитивно знаем, чем на самом деле является сознание.
Такое понятие существует, причем за понятием стоит реально существующий феномен,
который допускает его научное описание. В соответствии с этой терминологией «от
здравого смысла» осознание непременно должно быть существенным компонентом
понимания, а понимание являться неотъемлемой частью любого подлинного интеллекта.
Термин «понимание», по мнению Р. Пенроуза, безусловно подразумевает, что истинное
обладание этим свойством требует некоторого элемента осознания. Не осознав сути того
или иного суждения, мы не можем претендовать на истинное понимание этого самого
суждения. При этом некоторые разработчики ИИ полагают, что управляемый компьютером
робот «понимает», в чем заключаются его инструкции, однако при этом никто и не
заикается о том, что робот свои инструкции действительно «осознает».
Термин ЕИ следует употреблять исключительно в связи с пониманием. Некоторые же
теоретики ИИ утверждают, что их робот вполне может обладать искусственным
интеллектом, не испытывая при этом никакой необходимости в действительном
«понимании» чего-либо. Термин ИИ предполагает возможность осуществления разумной
вычислительной деятельности, которая замечательно обойдется без подлинного понимания
и, как следствие, осознания. Частичное моделирование ЕИ без какого бы то ни было
реального понимания оказывается до определенной степени возможным. В основной массе
разработок ИИ всего лишь моделируется интеллект – такая модель не требует
действительного понимания или осознания.
Какая составляющая разума отсутствует в компьютере? Почему человек с первого
взгляда, в долю секунды, отличает кота от собаки, а для компьютера эта задача представляет
большую сложность?
Основы искусственного интеллекта (зм)
Фундаментальные принципы работы компьютера
и функционирования человеческого разума в корне
различны. В первом случае основой является
программирование,
во
втором
–
процесс
самообучения. Компьютер, которым управляет
центральный микропроцессор, предназначен для
максимально точного исполнения заданных функций,
а живой ум, у которого отсутствует единый центр
контроля, наделен гибкостью и устойчивостью к возможным неудачам. Список различий
далеко не исчерпывается указанными особенностями.
Различие во взглядах на ИИ можно проследить на примере двух мысленных
экспериментов, которые сформулировали в свое время Алан Тьюринг и Джон Серл. Это так
называемые «тест Тьюринга» и «китайская комната».
Тьюринг нашел оригинальный способ проверки наличия интеллекта. Его метод,
впоследствии получивший название теста Тьюринга, состоял в следующем: если
компьютер сможет обмануть человека, который будет задавать ему различного рода
вопросы, так, чтобы последний воспринимал отвечающего не как
машину, а как другого человека, то компьютер может считаться
разумным.
По иронии судьбы программисты достаточно быстро смогли
создать программу, которая была очень близка к тому, чтобы
пройти тест Тьюринга. Программа, разработанная Джозефом
Вейзенбаумом из Массачусетского технологического института,
называлась «Элиза» и копировала поведение врача-психотерапевта
при первичном опросе пациента. Например, если девушка вводит
предложение: «Я и мой парень больше не разговариваем», то
«Элиза» спросит: «А расскажи-ка мне побольше о своем парне» или: «Как по-твоему,
почему ты и твой парень больше не общаетесь?» Несмотря на то что автор программы
заявил, что изобрел пародию на поведение психотерапевта, предназначенную лишь для
исследования иллюзии понимания, которая часто возникает в разговоре между людьми,
некоторых людей «Элиза» приводила в изумление.
Практическое использование теста по Тьюрингу широко практикуется при авторизации
пользователей на сайтах в форме так называемой «капчи» (от англ. CAPTCHA –
Completely Automated Public Turing test to tell Computers and Humans Apart – полностью
автоматизированный публичный тест Тьюринга для различения компьютеров и людей).
Это компьютерный тест, используемый для того, чтобы определить, кем является
пользователь:
человеком
или
компьютерной программой. Термин
появился примерно в 2000 г. Основная
его идея состоит в том, чтобы
предложить пользователю такую задачу,
которая
с
лёгкостью
решается
человеком, но крайне сложна и
трудоёмка для компьютера.
Основы искусственного интеллекта (зм)
Джон Серл, один из наиболее именитых преподавателей
философии Калифорнийского университета (Беркли), утверждал,
что у компьютера разума нет и быть не может. В доказательство
своих взглядов в 1980 г. он предложил мысленный эксперимент,
который назвал «китайской комнатой». Эксперимент состоял в
следующем. Представьте комнату с щелью в стене. За столом в
комнате сидит человек, который владеет исключительно
английским языком. На столе перед ним лежат карандаши,
большой учебник и стопка листов бумаги. Учебник представляет
собой написанное на английском языке руководство, подробно разъясняющее, как писать,
различать и сравнивать китайские иероглифы. Значения иероглифов не приводятся, речь
идет лишь о правилах воспроизведения символов.
Другой человек находится вне описанной комнаты. Время от времени он просовывает
сквозь щель в стене записки. На них по-китайски написан рассказ и вопросы к нему.
Испытуемый, не имеющий никакого представления о китайском языке, по условиям
эксперимента должен взять руководство к действию и поработать над полученными
записками. Он четко выполняет инструкции из книги. Иногда в инструкциях стоит указание
написать определенные символы на листке бумаги, иногда он должен переставить или
убрать символы. Шаг за шагом, неуклонно
следуя инструкциям, человек пишет одни
иероглифы, убирает или переставляет другие,
пока не выполнит задание до конца. Так
создается целая страница новых символов,
которые являются ответами на вопросы,
заданные на китайском языке. Разумеется, сам
автор страницы этого не осознает. В книге
содержится указание отдать исписанный
листок бумаги сквозь щель в стене. Участник
эксперимента так и делает, недоумевая, в чем
же суть столь странного задания.
Полученный от испытуемого лист с иероглифами дают прочитать китайцу, который
отмечает, что все ответы верны, а некоторые из них впечатляют своей
глубокомысленностью. Если мы спросим у китайца, считает ли он, что ответы написал
разумный человек, который понял прочитанный рассказ, он ответит утвердительно. Так кто
понял рассказ? Однозначно, не человек, сидящий в комнате, ведь он не знает китайского, а
значит, не имеет ни малейшего представления, о чем шла речь в исходной записке. Так на
какой стадии было достигнуто понимание? Ответ автора этого мысленного эксперимента:
ни на какой. Все, что происходило в комнате, – это бездумное листание страниц и
рисование. Проведем параллель: «китайская комната» – это аналог цифрового компьютера,
руководство по написанию иероглифов есть не что иное, как «компьютерная программа»,
соответственно ее авторы – «программисты». Участник эксперимента подобно компьютеру
манипулирует символами, но не может придать им какой бы то ни было смысл.
Следовательно, заключил Д. Серл, машина или физическая система, способная выполнять
определенные функции, не может стать разумной и действовать осознанно. Д. Серл
отмечал, что он затрудняется дать определение понятию разума, однако полон уверенности,
что, независимо от определения, компьютеры разумом не обладают и обладать не могут. В
эксперименте под названием «китайская комната» налицо лишь манипуляция символами,
но не истинное понимание.
Основы искусственного интеллекта (зм)
Формирование научного базиса, определившего основные направления
развития искусственного интеллекта
Идея создания искусственного подобия человека зародилась еще в древнейшие
времена. Окончательное оформление этого направления как науки, связанной с
моделированием человеческого разума произошло только после создания цифровых
вычислительных машин в середине XX в. Общепризнано, что оригинальный термин
«Artificial Intelligence» (AI) был предложен в 1956 г. на семинаре с аналогичным названием
в Дapтсмудском колледже (США), посвященном решению логических задач.
Рис. 2.1 Инициативная группа ученых – организаторов семинара «Artificial Intelligence»
В переводе на русский язык этот термин получил современное звучание –
«искусственный интеллект» (ИИ). Необходимо отметить, что в английском языке данное
словосочетание не имеет той фантастической окраски, которую оно приобрело в неудачном
русском переводе. Слово Intelligence может иметь ряд значений (ум, умственные
способности, разумность, рациональность, сообразительность, а также информация,
разведка и т.д.) и не обязательно трактуется как интеллект. Многие авторы справедливо
утверждают, что в данном случае под термином Intelligence следует понимать «умение
рассуждать разумно», а не «интеллект», для которого существует англоязычный термин
Intellect, буквально означающий «ум», «интеллект». Таким образом, изначально задача
конструирования ИИ не предполагала создания некоего могущественного искусственного
разума, а сводилась к моделированию ряда способностей, свойственных человеческой
умственной деятельности.
Научные дисциплины, образующие фундамент ИИ
Искусственный интеллект, как и любое направление современной науки, имеет богатую
предысторию. Научный фундамент ИИ был заложен учеными, работавшими в разное время
в различных областях человеческого знания. Краткий исторический обзор научных
дисциплин, идей и конкретных методов позволяет лучше понять смысл того или иного
подхода к созданию интеллектуальных систем.
Философия заложила основы ИИ, сформулировав предположение, что мозг в
определенных отношениях напоминает машину и оперирует знаниями, закодированными
на внутреннем языке.
Основы искусственного интеллекта (зм)
Аристотель (384-322 гг. до н.э.) впервые сформулировал точный
свод законов, руководящих рациональной частью мышления. Он
разработал систему силлогизмов, предназначенную для проведения
правильных рассуждений, которая позволяла любому вырабатывать
логические заключения механически при наличии начальных
предпосылок.
Раймунд Луллий (1235-1315) выдвинул идею о том, что полезные
рассуждения можно фактически проводить с помощью механического
устройства. Предложенное им устройство представляло своего рода механическую
экспертную систему.
Томас Гоббс (1588-1679) предположил, что рассуждения
аналогичны числовым расчетам и что "в наших неслышимых мыслях
мы поневоле складываем и вычитаем". Разумное поведение стало
рассматриваться в виде операций, выполняемых мозгом в
соответствии с законами физики. Предположение о том, что
знаниями манипулирует физический разум, привело к
необходимости найти источник знаний.
Так, например, Дэвид Юм (1711-1776) предложил метод, известный
теперь под названием принципа индукции, который состоит в том, что общие
правила вырабатываются путем изучения повторяющихся ассоциаций между
элементами, содержащимися в этих правилах.
Математика
предоставила
инструментальные
средства
для
манипулирования
высказываниями,
обладающими
логической
достоверностью и недостоверными вероятностными высказываниями, а также разработала
теорию вычислений и сформировала понятие алгоритма.
Становление формальной логики фактически началась с трудов
Джорджа Буля (1815-1864), который детально разработал логику
высказываний (булеву логику).
Готтлиб Фреге (1848-1925) расширил ее,
создав логику первого порядка, которая в
настоящее время является фундаментальной системой представления
знаний. Томас Байес (1702-1761) предложил правило обновления
вероятностей с учетом новых фактов. Байесовский анализ лежит в
основе большинства современных подходов к проведению
рассуждений с учетом неопределенности в системах ИИ.
Основы теории алгоритмов были заложены в Средней Азии в IX в.
персидским математиком Мухаммадом аль-Хорезми, благодаря работам которого Европа
познакомилась с арабскими цифрами и алгеброй.
Алан Тьюринг (1912-1954) предложил модель алгоритма в виде
гипотетического автомата с бесконечной памятью и показал, что
существуют некоторые функции, которые не могут быть вычислены. Иначе
говоря, ни одна машина Тьюринга не способна определить, возвратит ли ее
программа ответ на конкретные входные данные или будет работать до
бесконечности.
Основы искусственного интеллекта (зм)
Курт Гёдель в 1931 г. показал, что существуют реальные пределы
вычислимости, сформулировав теорему о неполноте. Большое влияние
на развитие ИИ оказало понимание различия между полиномиальным
и экспоненциальным ростом сложности задачи. Экспоненциальный
рост означает, что варианты задачи даже умеренной размерности не
могут быть решены за какое-либо приемлемое время.
Экономика формализовала проблему принятия
решений, максимизирующих ожидаемый выигрыш для лица,
принимающего решение.
Адам Смит (1723-1790) выдвинул идею о том, что любую экономику
можно рассматривать в виде совокупности отдельных агентов,
стремящихся максимизировать свое собственное экономическое
благосостояние.
Леон Валрас (1834-1910) дал математическую трактовку понятия полезности или
"предпочтительного результата".
Герберт Саймон (1916-2001) показал, что лучшее описание
фактического поведения человека дают модели, основанные на принятии
решений, являющихся "достаточно приемлемыми", а не модели,
предусматривающие трудоемкий расчет оптимального решения. В общем
виде теория принятия решений объединяет в себе теорию вероятностей и
теорию полезности, предоставляет формальный инструмент для принятия
решений в условиях неопределенности.
Психологи подтвердили идею, что люди и животные могут рассматриваться как
машины обработки информации.
Лингвисты показали, что процессы использования естественного языка укладываются
в эту модель.
Уильям Джеймс (1842-1910) и другие представители когнитивной
психологии рассматривали мозг как устройство обработки
информации. В дальнейшем были определены такие термины, как
убеждения и цели, а также обозначены следующие три этапа
деятельности агента, основанного на знаниях: во-первых,
действующий стимул преобразуется во внутреннее представление, вовторых, с этим представлением выполняются манипуляции с помощью
познавательных процессов для выработки новых внутренних
представлений, в-третьих, они, в свою очередь, снова преобразуются в
действия.
Работы в области компьютерного моделирования привели к созданию
такого научного направления, как когнитология. Ноам Хомский
обосновал истоки творческой деятельности, осуществляемой с помощью
языка. Современная лингвистика в части вычислительной лингвистики и
обработки естественного языка исходит из того, что для понимания языка
требуется понимание предмета и контекста речи, а не только анализ
структуры предложений.
Неврология как наука, посвященная изучению нервной системы, дала
понимание процессов обработки информации в мозге.
Основы искусственного интеллекта (зм)
Камилло Гольджи (1843-1926) сумел разработать надежный метод
наблюдения за отдельными нейронами. Работы в области неврологии
позволяют сделать заключение о том, что совместная работа простых
клеток может приводить к появлению мышления, действия и сознания
или, другими словами, что мозг порождает разум. На основе
функционального магнитного резонанса были получены подробные
изображения активности мозга и проведены измерения характеристик
физиологических
процессов,
связанных
с
происходящими
познавательными процессами. Несмотря на успехи ученые еще очень
далеки от понимания того, как действительно осуществляется любой из познавательных
процессов.
Теория управления и кибернетика сформировали математический аппарат для
проектирования устройств, функционирующих на основе обратной связи со средой.
Норберт Винер (1894-1964) дал определение кибернетики как
науки об управлении. Изучение биологических и механических систем
управления и их связи с познанием привело к пониманию того, что
целенаправленное поведение обусловлено действием регуляторного
механизма, пытающегося минимизировать "ошибку", т.е. различие
между текущим и целевым состоянием.
Вычислительная техника предоставила устройства, благодаря
которым стало возможным создание приложений ИИ.
Блез Паскаль (1623-1662) в 1642 г. построил вычислительную
машину, известную как «паскалина». Паскаль писал, что
"арифметическая машина производит эффект, который кажется
более близким к мышлению по сравнению с любыми действиями
животных".
Готфрид Вильгельм Лейбниц (1646-1716) создал механическое
устройство, предназначенное для выполнения операций над понятиями,
а не над числами, но область его действия была довольно ограниченной.
Чарльз Бэббидж (1792-1871) разработал две машины, но ни одну из
них не успел закончить. В них были предусмотрены адресуемая память,
хранимые программы и условные переходы. Коллега Бэббиджа, Ада
Лавлейс, дочь поэта Байрона, писала
программы
для
незаконченной
вычислительной машины. В ее честь
назван язык программирования Ada.
Основы искусственного интеллекта (зм)
Современный цифровой электронный компьютер был
изобретен независимо и почти одновременно учеными трех
стран. Наибольшее влияние на развитие современных
компьютеров оказал компьютер ENIAC, разработанный в
составе секретного военного проекта в Пенсильванском
университете. Обычно программы ИИ имеют большие размеры
и не могли бы работать без тех значительных успехов в
повышении быстродействия и объема памяти, которые были
достигнуты в компьютерной индустрии.
Из истории развития ИИ
Первые попытки создания ИИ (середина 1940 – 1955 гг.)
Первое
исследование,
имеющее
отношение к современному ИИ, было
проведено Уорреном Мак-Каллоком и
Уолтером Питтсом.
Работа основывалась на знаниях о
строении мозга, логике высказываний и
теории вычислений Тьюринга. Авторы
предложили
модель,
состоящую
из
искусственных нейронов, в которой каждый нейрон находился либо в
"возбужденном", либо в "невозбужденном" состоянии. Переход в возбужденное состояние
происходил в ответ на стимуляцию достаточного количества соседних нейронов.
Исследования показали, что любая вычислимая функция может быть реализована с
помощью сети из нейронов, а все логические связки ("И", "ИЛИ", "НЕ" и т.д.) – с помощью
простых сетевых структур. Также У. Мак-Каллок и У. Питтс выдвинули предположение,
что нейронные сети, структурированные соответствующим образом,
способны к обучению.
Впоследствии Дональд Хебб продемонстрировал простое правило
модификации соединений между нейронами (хеббовское обучение).
Алан Тьюринг в 1950 г. впервые сформулировал представление об ИИ
в статье «Computing Machinery and Intelligence», в которой описал тест
на интеллектуальность (тест Тьюринга) и принципы машинного
обучения.
Этап 1 (середина 1950 - середина 1960-х гг.)
На этом этапе развития ИИ были достигнуты определенные успехи, хотя и достаточно
скромные. Разработана программа общего решателя задач (General Problem Solver – GPS)
на принципах эвристическоrо программирования, предназначенная для моделирования
процедуры решения задач в рамках ограниченного класса головоломок. Порядок, в котором
она рассматривала промежуточные цели и возможные действия, был аналогичен тому
подходу, который применяется людьми для решения подобных проблем. Программа
Geometry Theorem Prover (программа автоматического доказательства геометрических
теорем) была способна доказывать такие теоремы, которые показались бы весьма
сложными многим студентам-математикам. Было введено определение нового языка
высокого уровня – LISP, ставшего доминирующим языком программирования для ИИ.
Основы искусственного интеллекта (зм)
Начались разработки программ для игры в шашки, в которых
реализовывался принцип самообучения. Артур Самюэл (с 1952 года)
написал ряд программ для игры в шашки,
которые в конечном итоге научились играть
на
уровне
хорошо
подготовленного
любителя. В конечном итоге был достигнут
уровень хорошо подготовленного любителя.
Возникло новое направление, связанное с
разработкой первых шахматных программ. Созданная в ВЦ АН
СССР шахматная программа КАИССА (М.В.Донской и В.Л.
Арлазаров), выиграла чемпионат мира среди подобных программ.
Развивались исследования по созданию нейронных сетей. Ф. Розенблатт создал
функционирующие модели нейронных сетей – персептронов и предложил алгоритм
обучения персептрона.
Этап 2 (середина 1960 - середина 1980-х гг.)
Первые положительные результаты в области ИИ были получены при решении
относительно простых задач. При попытке решения более трудных задач исследователи
столкнулись с рядом сложностей.
Сложности первого рода были связаны с тем, что основная часть ранних программ не
содержала знаний или имела лишь небольшой объем знаний о своей предметной области.
Это проявилось, например, в задачах машинного перевода текстов на естественном языке.
Ранее считалось, что для сохранения точного смысла предложений достаточно провести
простые синтаксические преобразования, основанные на грамматиках языков, и замену
слов с использованием электронного словаря. Но чтобы устранить неоднозначность и
определить смысл предложения в процессе перевода, необходимо обладать общими
знаниями о предметной области. До сих пор программы машинного перевода остаются
несовершенными.
Сложности второго рода были связаны с принципиальной неразрешимостью многих
проблем с помощью ИИ. В большинстве ранних программ ИИ решение задач
осуществлялось по принципу проверки различных комбинаций возможных шагов, которая
проводилась до тех пор, пока не будет найдено решение. Неспособность справиться с
"комбинаторным взрывом" – стремительным увеличением сложности задачи – означала,
что даже если программа в принципе может найти решение, то это не дает оснований
утверждать, что она действительно найдет его за приемлемое время.
Сложности третьего рода возникли в связи с некоторыми фундаментальными
ограничениями базовых структур, которые использовались для выработки
интеллектуального поведения. Например, было доказано, что нейронные сети в виде
персептронов могут продемонстрировать способность обучиться всему, что можно
представить с их помощью, но, к сожалению, они позволяют представить лишь очень
немногое.
Вместе с тем в этот период был осуществлен ряд успешных разработок в области
экспертных систем (ЭС). Например, ЭС MYCIN для диагностики инфекционных
заболеваний кровеносной системы, содержащая примерно 450 правил, приобрела
способность работать на уровне некоторых врачей-экспертов. В правилах MYCIN
приходилось учитывать ту степень неопределенности, которой характеризуются знания в
области медицины. Для этого применялось исчисление неопределенностей на основе
коэффициентов уверенности.
Основы искусственного интеллекта (зм)
Была разработана фреймовая модель представления знаний, а в 1973 г. – язык
логического программирования ПРОЛОГ. Возникло новое направление – «общение с ЭВМ
на естественном языке», для которого были востребованы прикладная и структурная
лингвистика. В НИИ «Восход» была разработана уникальная отечественная система
общения с базами данных (БД) экономического типа на естественном языке (система
ПОЭТ). Объявлен японский проект ЭВМ пятого поколения, основанный на знаниях.
Этап 3 (с середины 1980-х гг.)
Разработки в области ИИ начинают широко внедряться в промышленности в виде ЭС,
интеллектуальных САПР, инструментальных средств программирования на языках ИИ.
Параллельно происходит бурный рост научных исследований в этой сфере.
Наука ИИ. С точки зрения методологии этот этап характеризуется переходом на
научные методы. В области нейронных сетей четыре разные группы заново открыли
алгоритм обучения путем обратного распространения ошибки, впервые предложенный в
1969 г. Этот алгоритм был применен для решения задач обучения в компьютерных науках.
Нейронные сети стали мощным инструментом в области распознавания образов и
машинного обучения. В результате этих разработок была создана так называемая
технология анализа скрытых закономерностей в данных (data mining). Для обеспечения
эффективного представления неопределенных знаний и проведения на их основе строгих
рассуждений разработаны формальные средства байесовских сетей.
Сформулирован новый технологический подход, названный инженерией знаний. В его
основе лежат исследования, связанные с тем, как извлекать знания из разных источников,
как структурировать и формализовать знания, как манипулировать ими (осуществлять
вывод на знаниях, объяснение на знаниях) и т.д. Наблюдается рост интереса к ИИ как к
наиболее перспективному направлению информатики (computer science), во многих странах
создаются национальные ассоциации ИИ (в СССР – в 1989 г.). В методическом плане для
объединения разрозненных областей исследований формируется единый взгляд на ИИ как
на науку проектирования рациональных агентов.
Индустрия ИИ. Первая успешно действующая коммерческая экспертная система R1
появилась в компании DEC (Digital Equipment Corporation). Эта программа помогала
составлять конфигурации для выполнения заказов на новые компьютерные системы. К 1988
г. группой ИИ компании DEC было развернуто 40 экспертных систем. К этому времени
почти в каждой крупной корпорации США либо была создана собственная группа ИИ, либо
применялись экспертные системы, либо проводились их исследования. Созданы
промышленные статические и динамические ЭС для различных классов
неформализованных задач и слабоструктурированных предметных областей, появились
промышленные системы обработки текстов на естественном языке и речи,
интеллектуальные САПР. Происходит мощная интеграция индустрии традиционного
программирования с интеллектуальными системами и технологиями, создаются
универсальные и специализированные инструментальные средства различного назначения
для промышленной разработки интеллектуальных систем (LOOPS, КЕЕ, CENTAUR,
Knowledge Craft, CLIPS, G2 и др.).
Современные направления разработок в области ИИ
В области ИИ существует ряд направлений, в рамках которых выполняется много
исследований. В качестве примеров можно перечислить лишь некоторые, наиболее важные
направления.
Интеллектуальные системы, основанные на знаниях. Направление связано с
разработкой моделей представления знаний, созданием баз знаний, образующих ядро
экспертных систем. Например, медицинские экспертные диагностические программы,
Основы искусственного интеллекта (зм)
основанные на вероятностном анализе, сумели достичь уровня опытного врача в
нескольких областях медицины. В последнее время большое внимание уделяется
гибридным системам, в которых наряду с технологиями ЭС используются нейросетевые
технологии.
Нейросетевые и нейрокомпьютерные технологии. Искусственные нейронные сети и
нейрокомпьютеры в значительной мере заимствуют принципы работы головного мозга.
Знания в них не отделены от процессора, а распределены и существуют неявно в виде
синаптических связей. Такие знания не закладываются изначально, а приобретаются в
процессе обучения.
Распознавание образов. К распознаванию образов в ИИ относят широкий круг
проблем: распознавание изображений, символов, текстов, запахов, звуков, шумов и т.п.
Интеллектуальное планирование и составление расписаний. Примером может
служить работающая на удалении в сотни миллионов километров от Земли программа
Remote Agent агентства NASA – первая бортовая автономная программа планирования,
предназначенная для управления процессами составления расписания операций для
космического аппарата.
Игры. Традиционно ИИ включает в себя задачи, решаемые при игре в шахматы, шашки
и т.п. В основе этого направления лежит один из ранних подходов – лабиринтная модель и
эвристики. Кроме того, в современных программах-игроках наиболее полно удалось
реализовать основную идею ИИ – обучение, самообучение и самоорганизацию. Программа
Deep Blue компании IBM стала первой компьютерной программой, которой удалось
победить чемпиона мира Гарри Каспарова в показательном шахматном матче со счетом
3,5:2,5. В широком смысле слова под игрой понимается некая конфликтная ситуация,
участники которой своими действиями не только достигают личных целей, но и влияют на
достижимость целей другими участниками игры. Под такую трактовку игры подпадают
многие экономические, политические и военные конфликты.
Компьютерная лингвистика. Машинный перевод текстов с одного языка на другой
является
актуальной
задачей
начиная
с
1950-х
гг.
и по настоящее время. Для ее решения используются сложные структуры естественноязыковых интерфейсов, которые включают морфологический, синтаксический,
семантический, прагматический разбор текста с помощью соответствующих баз знаний.
Примером задачи на понимание естественного языка может служить задача составления и
решения кроссвордов. Известна программа Proverb, которая решает кроссворды намного
лучше, чем большинство людей. В ней используются ограничения, определяющие состав
слов, база данных ранее встречавшихся кроссвордов, а также множество различных
источников информации, включая словари и оперативные БД. Другой проблемой
компьютерной лингвистики является разработка естественно-языкового интерфейса между
человеком и машиной.
Интеллектуальное автоматическое управление (роботы). Роботы – это технические
устройства, предназначенные для автоматизации человеческого труда. В промышленности
применяется огромное количество роботов-манипуляторов, работающих по жесткой схеме
управления. В отличие от них интеллектуальные роботы обладают способностью
самообучаться и самоорганизовываться, адаптироваться к изменяющейся окружающей
обстановке. Например, в хирургии используют роботов-ассистентов. В робототехнической
системе HipNav используются методы компьютерного зрения для создания трехмерной
модели анатомии внутренних органов пациента, а затем применяется робототехническое
управление для руководства процессом вставки протеза, заменяющего тазобедренный
сустав. Известен пример интеллектуальной системы Alvinn, обучающей вождению
автомобиля в определенной полосе движения. Система размещалась в микроавтобусе,
управляемом компьютером, и использовалась для проезда по дорогам США. Микроавтобус
проехал 4586,6 км, причем система Alvinn обеспечивала автоматическое управление в
течение 98% времени.
Основы искусственного интеллекта (зм)
Компьютерные вирусы. Последние поколения вирусов обладают всеми атрибутами
систем ИИ. Они перемещаются по компьютерным сетям, мутируют и размножаются,
обучаются, меняют свои параметры и структуру.