Основные понятия инженерии знания
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ИНТЕЛЛЕКТУАЛЬНЫЕ
ИНФОРМАЦИОННЫЕ СИСТЕМЫ
Тема 2. Модели представления знаний
Лекция 2
Преподаватель: к.ф.н.,
доцент кафедры АСУ,
Муртазина М.Ш.
1
2020
ПЛАН
1.
2.
3.
4.
5.
6.
7.
Основные понятия инженерии знания
Классификация моделей представления
знаний
Продукционная модель представления
знаний
Фреймовая модель представления знаний
Сетевые модели представления знаний
Сценарии
Логические модели
2
1. ОСНОВНЫЕ ПОНЯТИЯ
ИНЖЕНЕРИИ ЗНАНИЯ
3
ИНЖЕНЕРИЯ ЗНАНИЙ
Термин «инженерия знаний»
(knowledge engineering) ввел в
научный оборот в конце 1970-
х гг. Э.А. Фейгенбаум.
Эдвард Альберт Фейгенбаум
20 января 1936
4
ИНЖЕНЕРИЯ ЗНАНИЙ
Инженерия знаний – это
«искусство использования
принципов и инструментов
исследования искусственного
интеллекта для решения
сложных задач, требующих
знаний экспертов» .
Feigenbaum E. A. The art of artificial intelligence: Themes
and casestudies of knowledge engineering. STAN-CS-77621 Department of Computer Science, Stanford University.
– 1977.
5
ИНЖЕНЕРИЯ ЗНАНИЙ
Инженерия
знаний представляет собой
совокупность моделей, методов и
технических приемов, нацеленных на
создание систем, которые предназначены
для решения проблем с использованием
знаний.
Инженерия знаний охватывает методы
добычи, анализа, представления и
обработки знаний экспертов.
6
ПРЕДМЕТ ИНЖЕНЕРИИ ЗНАНИЙ
Представление знаний,
обработка знаний
и использование знаний,
рассматриваемые применительно к конкретной
прикладной области.
7
ЗНАНИЯ
Знания в области искусственного интеллекта – это
комплексные отношения объектов, представленные
посредством интенсионального описания объектов
(интенсиональное значение).
Исследования в области баз данных обеспечивают
эффективный доступ к большим массивам
экземпляров типа объекта (экстенсиональное
значение).
8
ПРОЦЕСС ИНЖЕНЕРИИ ЗНАНИЙ
На высоком уровне,
процесс инженерии знаний
состоит из двух:
1. Извлечение знаний –
преобразование «сырых
знаний» в организованные.
2. Внедрение знаний –
преобразование
организованных знаний в
реализованные.
9
ПРОЦЕСС ИНЖЕНЕРИИ ЗНАНИЙ
Процесс извлечения знаний – это длительная и
трудоемкая процедура, в которой инженеру по
знаниям, вооруженному специальными знаниями по
когнитивной психологии, системному анализу,
математической логике и пр., необходимо воссоздать
модель предметной области, которой пользуются
эксперты для принятия решения.
10
ОСНОВНЫЕ АСПЕКТЫ ИЗВЛЕЧЕНИЯ
ЗНАНИЙ
Можно выделить три
основных аспекта
извлечения знаний:
психологический,
лингвистический и
гносеологический.
Из них психологический
аспект является ведущим,
так как он определяет эффективность
взаимодействия инженера по знаниям и
эксперта.
11
БАЗЫ ЗНАНИЙ
База
знаний (БЗ; англ. knowledge
base, KB) — база данных, содержащая
правила вывода и информацию о
человеческом опыте и знаниях в
некоторой предметной области.
База
знаний
является
основным
компонентом систем Искусственного
интеллекта и Экспертных систем.
12
ЗАДАЧИ ИНЖЕНЕРИИ ЗНАНИЙ
Анализ предметной и проблемной областей.
Приобретение знаний.
Выявление источников знаний.
Автоматизация процесса сбора знаний.
Представление знаний.
Модели представления знаний.
Выбор способа представления знаний.
Поиск и хранение знаний.
13
2. КЛАССИФИКАЦИЯ МОДЕЛЕЙ
ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
14
МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
Модель представления знаний - это
совокупность средств структурирования и обработки
единиц знаний.
Модели представления знаний различаются
характером
представления
объектного,
функционального, поведенческого видов знаний и
реализацией неопределенностей, т.е. ориентацией на
определение структуры объектов или действий над
ними, детерминированность или неопределенность,
статику или динамику проблемной области.
15
16
ЭМПИРИЧЕСКИЙ И ТЕОРЕТИЧЕСКИЙ
ПОДХОДЫ
Эмпирический
подход
основан
на
изучении
принципов организации человеческой памяти и
моделировании
механизмов
решения
задач
человеком.
Эмпирические
модели
подвержены
изменениям и зачастую носят нестрогий характер.
Теоретический подход использует формализмы,
гарантирующие правильность решений. Он в основном
представлен моделями, основанными на формальной
логике
(исчисление
высказываний,
исчисление
предикатов),
формальных
грамматиках,
комбинаторными моделями, в частности моделями
конечных проективных геометрий, теории графов,
тензорными и алгебраическими моделями.
17
ПРОДУКЦИОННАЯ МОДЕЛЬ
Продукционная модель позволяет осуществлять
эвристические методы вывода на правилах и
может обрабатывать неопределенности в виде
условных вероятностей или коэффициентов
уверенности, а также выполнять монотонный или
немонотонный вывод
18
ПРОДУКЦИОННАЯ МОДЕЛЬ
Продукционные правила - наиболее простой способ,
представления знаний. Он основан на представлении знаний
в форме правил, структурированных в соответствии с образцом
«ЕСЛИ - ТО». Часть правила «ЕСЛИ» называется посылкой, а
«ТО» - выводом или действием. Правило в общем виде
записывается так:
ЕСЛИ A1, A2, ...,An, ТО В.
Такая запись означает, что «если все условия от A1 до Аn
являются истинными, то В также истинно» или «когда все
условия от А1 до Аn выполняются, то следует выполнить
действие В».
Рассмотрим правило
ЕСЛИ (1)
у является отцом х
(2)
z является братом у
19
ТО
z является дядей х
ПРОДУКЦИОННАЯ МОДЕЛЬ
Положим, что в базе знаний вместе с описанным выше правилом
содержатся и такие знания:
ЕСЛИ (1)
z является отцом х
(2)
z является отцом у
(3)
х и у не являются одним и тем же человеком
ТО
х и у являются братьями
Иван является отцом Сергея
Иван является отцом Павла
Сергей является отцом Николая
Следовательно Павел является дядей Николая
20
ПРОДУКЦИОННАЯ МОДЕЛЬ
Антецедент представляет собой посылку правила
(условную часть) и состоит из элементарных
предложений, соединенных логическими связками
И, ИЛИ.
Консеквент (заключение) включает одно или
несколько предложений, которые выражают либо
некоторый факт, либо указание на определенное
действие, подлежащее исполнению.
АНТЕЦЕДЕНТ → КОНСЕКВЕНТ
21
ПРОДУКЦИОННАЯ МОДЕЛЬ
Продукции удачно моделируют человеческий способ
рассуждений при решении проблем. Поэтому продукции широко
используются во многих действующих ЭС.
Продукционные системы впервые изобретены американским
логиком Эмилем Постом в 1941г.
Продукция в системе Э.Поста имеет следующую схему:
где t1 ,t2 ,...,tn называются посылками, а t заключением
продукции.
22
ПРОДУКЦИОННАЯ МОДЕЛЬ
В рамках этой модели продукция определяется четверкой:
P = < L, C, N, A >,
где L – метка;
С – условие применимости;
N – ядро продукции;
А – постдействие.
23
ПРОДУКЦИОННАЯ МОДЕЛЬ
Следующий пример демонстрирует полную продукцию:
МЕТКА: R26 Использование зонтика
УСЛОВИЕ: ЕСЛИ (идет дождь)
ДЕЙСТВИЕ (ЯДРО ПРОДУКЦИИ): ТО (возьмите зонтик)
ОБЪЯСНЕНИЕ (ПОСТДЕЙСТВИЕ): (зонтик предохраняет от
дождя)
24
ПРОДУКЦИОННАЯ МОДЕЛЬ
25
ПРОДУКЦИОННАЯ МОДЕЛЬ
26
ПРОДУКЦИОННАЯ МОДЕЛЬ
Можно указать следующие достоинства представления знаний
в виде продукционных правил:
1. Универсальность метода представления знаний. Это
позволяет создавать проблемно-ориентированные
экспертные системы.
2. Модульная организации знаний, что обеспечивает
независимость правил.
3. Использование предусловий применения правил позволяет
использовать наиболее рациональную стратегию вывода,
существенно сокращая перебор правил.
27
4. ФРЕЙМОВАЯ МОДЕЛЬ
ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
28
ФРЕЙМЫ
Фреймовая система имеет все свойства, присущие
языку представления знаний, и одновременно
являет собой новый способ обработки информации.
Фрейм является единицей представления знаний об
объекте, которую можно описать некоторой
совокупностью понятий и сущностей.
Фрейм имеет определенную внутреннюю структуру,
состоящую из множества элементов, называемых
слотами.
Каждый слот, в свою очередь, представляется
определенной структурой данных, процедурой, или
может быть связан с другим фреймом.
29
ФРЕЙМЫ
Фрейм: человек
Класс
Структурный элемент
Рост
Масса
Хвост
Фрейм аналогии
:
:
Животное
Голова, шея, руки, ноги,...
:
:
:
:
30-220 см
1 - 200 кг
Нет
Обезьяна
30
ФРЕЙМЫ
Модель фрейма является достаточно
универсальной, поскольку позволяет отобразить
все многообразие знаний о мире, используя:
фреймы-структуры, применяемые для
обозначения объектов и понятий (заем, залог,
вексель);
фреймы-роли (менеджер, кассир, клиент);
фреймы-сценарии (банкротство, собрание
акционеров, празднование именин);
фреймы-ситуации (тревога, авария, рабочий
режим) и др.
31
ФРЕЙМЫ
32
ФРЕЙМЫ
33
ФРЕЙМЫ
Существуют два способа организации
фреймовых знаний:
Целевые структуры – это ролевые фреймы, в
которых в качестве имен слотов выступают
вопросительные слова, ответы на которые
являются значениями слотов.
Сценарий – это формализованное описание
стандартной последовательности
взаимосвязанных фактов, определяющих
типичную ситуацию в проблемной области.
34
5. СЕТЕВЫЕ МОДЕЛИ
ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
35
СЕТЕВЫЕ МОДЕЛИ ПРЕДСТАВЛЕНИЯ
ЗНАНИЙ
Данная модель представления знаний была
предложена американским психологом Россом
Куиллианом в 1968 году.
В основе моделей этого типа лежит конструкция,
названная семантической сетью.
Семантический подход к построению систем
искусственного интеллекта находит
применение в системах понимания
естественного языка, в вопросно-ответных
системах, в различных предметноориентированных системах.
36
СЕМАНТИЧЕСКИЕ СЕТИ
Семантическая сеть - иной подход к представлению
знаний, который основан на изображении понятий
(сущностей) с помощью точек (узлов) и отношений
между ними с помощью дуг на плоскости.
Семантические сети способны отображать структуру
знаний во всей сложности их взаимосвязей, увязать
в единое целое объекты и их свойства.
37
СЕМАНТИЧЕСКИЕ СЕТИ
38
СЕМАНТИЧЕСКИЕ СЕТИ
39
СЕМАНТИЧЕСКИЕ СЕТИ
40
6. СЦЕНАРИИ
41
СЦЕНАРИИ
Сценарий – это структурированное
представление, описывающее стереотипную
последовательность событий в частном
контексте.
Сценарии используются в системах понимания
естественного языка для организации базы
знаний в терминах ситуаций, которые система
должна понимать.
42
СЦЕНАРИИ
Объекты в этих сетях связаны единственным
отношением строгого или нестрогого порядка с
различной семантикой (например, «причинаследствие», «цель-подцель», «часть-целое»).
Каждая последовательность действий в сценах
обладает свойством каузальных цепочек: всякое
предшествующее действие создает условия для
совершения последующего действия.
43
СЦЕНАРИИ
44
СЦЕНАРИИ
Сценарий включает следующие компоненты.
Начальные условия, которые должны быть истинными при
вызове сценария.
Результаты или факты, которые являются истинными, когда
сценарий завершается.
Предположения, которые поддерживают контекст сценария.
Множество предположений описывают принятые по умолчанию
условия реализации сценария.
Роли являются действиями, которые совершают отдельные
участники.
Сцены. Сценарий состоит из последовательности сцен, каждая из
которых представляет временные аспекты сценария.
45
СЦЕНАРИИ
Сценарий включает следующие компоненты.
Начальные условия, которые должны быть истинными при
вызове сценария.
Результаты или факты, которые являются истинными, когда
сценарий завершается.
Предположения, которые поддерживают контекст сценария.
Множество предположений описывают принятые по умолчанию
условия реализации сценария.
Роли являются действиями, которые совершают отдельные
участники.
Сцены. Сценарий состоит из последовательности сцен, каждая из
которых представляет временные аспекты сценария.
46
7. ЛОГИЧЕСКИЕ МОДЕЛИ
47
ЛОГИЧЕСКАЯ МОДЕЛЬ
Логическая модель представления знаний создается с
использованием свойств логики предикатов.
Достоинства логических моделей представления знаний:
В качестве «фундамента» здесь используется классический
аппарат математической логики.
Существуют достаточно эффективные процедуры вывода, в том
числе реализованные в языке логического программирования
Пролог, использующие механизмы автоматического
доказательства теорем для поиска и логически осмысленного
вывода информации
В базах знаний можно хранить лишь множество аксиом, а все
остальные знания получать из них по правилам вывода, а
48
также Данные, факты и другие сведения о людях, предметах,
событиях и процессах.
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
В логике высказываний атомарным
выражением законченной мысли является
непосредственно высказывание,
рассматриваемое как единое (нераздельное)
целое. Ни структура высказывания, ни его
содержание не затрагиваются.
Логика предикатов разбивает элементарное
высказывание на субъект (подлежащее или
дополнение) и предикат (сказуемое или
определение).
Субъект – это то, о чем что-то утверждается в
высказывании, предикат – это то, что
утверждается о субъекте.
49
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
«7 - простое число»,
«7» - субъект,
«простое число» - предикат.
50
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Высказывательная
форма:
«x – простое число»
При одних значениях x (напр., x=13, x=17) она
дает истинные высказывания, а при других x
(напр., x=10, x=18) эта форма дает ложные
высказывания.
51
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Высказывательная форма определяет
функцию одной переменной x, определенную
на множестве натуральных чисел N и
принимающую значения из множества {1,0}.
Здесь предикат становится функцией субъекта
и выражает свойство субъекта.
52
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Логические символы (пропозициональные
связки):
– отрицание;
– логическое И (конъюнкция, логическое
умножение);
– логическое ИЛИ (дизъюнкция, логическое
сложение);
() – импликация (если - то);
() – эквивалентность;
кванторы переменных:
– квантор существования;
– квантор всеобщности;
53
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
A
B
A
AB
AB
AB
A B
AB
(A B) (A B)
И
И
Л
И
И
И
И
И
Л
Л
Л
И
Л
Л
Л
И
И
Л
И
И
Л
Л
Л
И
Л
Л
И
И
54
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
XY любит(Х, Y) – любой Х любит хотя бы одного Y;
YX любит(Х, Y) – каждого Y любит хотя бы один Х;
XY любит(Х, Y) – существует такой Х, который любит
всех;
YX любит(Х, Y) – существует такой Y, которого любят
все;
XY любит(Х, Y) и YХ любит(Х, Y) – все любят
всех;
XY любит(Х, Y) – существует такой X, который любит
хотя бы одного из Y;
YХ любит(Х, Y) – существует такой Y, которого любит
55
хотя бы один X.
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
человек(X) смертен(X)
X = «Я», «Вася», «Петя»
Наиболее известным языком логического
программирования, реализующим
модифицированную логику предикатов
первого порядка, является Пролог (Prolog PROgramming LOGig, логическое
программирование). Для записи формул в
Прологе используются т.н. фразы Хорна
56
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Идея логического программирования в двух
метафорических равенствах:
программа = множество аксиом;
вычисление = конструктивный вывод
целевого утверждения из программы.
57
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Логическое программирование (в широком
смысле) представляет собой семейство таких
методов решения проблем, в которых
используются приемы логического вывода для
манипулирования знаниями,
представленными в декларативной форме.
В узком же смысле логическое
программирование понимается как
использование исчисления предикатов первого
порядка в качестве основы для описания
предметной области и осуществления
логического вывода и называется
хорновским, революционным или
«прологообразным» программированием.
58
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
программист(Сергей)
Это выражение можно прочесть как Сергей —
программист.
59
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Правило — иная форма реализации фразы
Хорна, показывающая зависимость одного
факта от других.
знать_пролог(Сергей) :программист(Сергей)
можно интерпретировать так: Сергей знает
Пролог, если он программист.
60
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
знать_пролог(X):-программист(X)
Это выражение можно прочитать следующим
образом: Если X — программист, то он знает
Пролог.
А можно и так: Все программисты знают
Пролог.
Внимание: Данное выражение, безупречное с
точки зрения синтаксиса Пролога, неверно
отражает знания о предметной области.
61
ОСНОВЫ ЛОГИКИ ПРЕДИКАТОВ ПЕРВОГО
ПОРЯДКА
Достоинства логики предикатов первого порядка:
в качестве «фундамента» используется классический
аппарат математической логики, методы которой
достаточно хорошо изучены и формально обоснованы;
в базах знаний можно хранить лишь множество аксиом,
а все остальные знания получать из них по правилам
вывода.
Недостатки логики предикатов первого порядка:
требуется адекватное описание предметной области, т.е.
в базе знаний должна быть представлена вся
информация, необходимая для решения задачи;
невозможность применения в качестве термов
62
(параметров) предикатов других предикатов, т.е.
невозможность формулирования знаний о знаниях.
ПРИМЕР
Никакой торговец подержанными автомобилями не
покупает автомобиль для своей семьи. Некоторые люди,
которые покупают авто для своих семей, абсолютно
нечестные люди. Доказать, что некоторые абсолютно
нечестные люди не являются торговцами подержанных
авто.
63
ПРИМЕР
Введем следующие обозначения:
предикат P(x) означает что х – торговец подержанными
авто;
предикат Q(x) – х купил подержанное авто для своей
семьи;
предикат R(x) – х абсолютно нечестен.
Тогда имеются формулы:
В1: {∀x} (P(x) → ¬Q(x))
В2: {∃x} (Q(x) ∧ R(x))
Доказать, что А: {∃x} (R(x) ∧ ¬P(x)) является истинной
формулой.
64
ПРИМЕР
Предположим, что В1 и В2 истинны в интерпретации I с
областью D.
Так как В2 истинна в I, то {∃x} ∈ D такой, что х = а и
формула Q(a)∧R(a) истинна в I.
Следовательно, Q(a) истинна в I, т.е. ¬Q(a) ложна в I.
Формулу В1 можно записать так: {∀x} (¬P(x) ∨ ¬Q(x)). Так
как В1 истинна в I, а ¬Q(x) ложна в I, то (¬P(a) должна
быть истинна в I. Отсюда следует, что формула R(a)∧¬P(a)
является истинной в I.
Таким образом А, т.е. формула {∃x}(R(x)∧¬P(x)), истинна в
I. Следовательно формула А является логическим
следствием формул В1 и В2.
65
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
ПО ТЕМЕ:
1.
2.
Тоискин В.С. Интеллектуальные
информационные системы: Учебное пособие.
– Часть 2. – Ставрополь: Изд-во СГПИ, 2010.
– 188 с.
Тельнов Ю.Ф. Интеллектуальные
информационные системы. / Московский
международный институт эконометрики,
информатики, финансов и права. - М.,2004. 82 с.
66