Справочник от Автор24
Поделись лекцией за скидку на Автор24

Обзорные темы по алгебре

  • ⌛ 2012 год
  • 👀 418 просмотров
  • 📌 354 загрузки
  • 🏢️ Камчатский государственный университет им. Витуса Беринга
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Обзорные темы по алгебре» pdf
Министерство образования и науки Российской Федерации Камчатский государственный университет имени Витуса Беринга А.П. ГОРЮШКИН Петропавловск-Камчатский 2012 УДК 512 ББК 20.14 Г 71 Горюшкин А.П. Г 71 ОБЗОРНЫЕ ЛЕКЦИИ ПО АЛГЕБРЕ / Петропавловск-Камчатский : КамГУ им. Витуса Беринга, 2012. – 328 с. В основу учебного пособия положен курс обзорных лекций по алгебре, читавшийся автором в течение более двадцати лет для студентов различных специальностей физико-математического факультета Камчатского государственного университета имени Витуса Беринга. Пособие предназначено для студентов физико-математических, экономических и гуманитарных специальностей, имеющих в государственном образовательном стандарте дисциплину «Математика». Представляет интерес для студентов физико-математических факультетов, а также для учителей и учащихся средних школ, гимназий и лицеев. Рецензенты: И.А. Р Ы Ч К А , кандидат физико-математических наук, доцент кафедры «Информационные системы» КамчатГТУ; И.А. ИЛЬИН, кандидат физико-математических наук, профессор кафедры математики и физики КамГУ им. В. Беринга Научный редактор – Д. И. МОЛДАВАНСКИЙ, доктор физико-математических наук, профессор, заведующий кафедрой алгебры и математической логики Ивановского государственного университета  Горюшкин А. П., 2012  КамГУ им. Витуса Беринга, 2012 2 СОДЕРЖАНИЕ Введение ...................................................................................................................... 5 1. Высказывания, предикаты и операции над ними. Законы логики высказываний. Математическое доказательство................................................... 13 2. Бинарные отношения. Отношение эквивалентности и разбиение на классы, фактормножество...................................................................................................... 44 3. Операции над множествами. Элементы комбинаторики.................................. 78 4. Поле. Свойства полей. Числовые поля. Поле рациональных чисел как минимальное полевое расширение кольца целых чисел. Представление рациональных чисел обыкновенными и десятичными дробями ......................... 92 5. Система действительных чисел. Непрерывность ............................................. 99 6. Поле комплексных чисел. Многочлены над полем комплексных чисел. Алгебраическая замкнутость поля комплексных чисел ..................................... 110 7. Векторные пространства, примеры, свойства, размерность. Линейная зависимость и независимость векторов................................................................ 134 8. базис и размерность конечномерных векторных пространств. Пространство решений однородной системы линейных уравнений. Изоморфизм векторных пространств равных размерностей........................................................................ 140 9. Определитель квадратной матрицы, его свойства, способы вычисления. Решение систем линейных уравнений по правилу Крамера .............................. 146 10. Матрицы и действия над ними. Вычисление обратной матрицы. Решение системы линейных уравнений в матричной форме............................................. 158 11. Ранг матрицы, его вычисление. Системы линейных уравнений. Критерий совместности системы линейных уравнений. Решение системы методом Гаусса ........................................................................ 166 12. Системы линейных неравенств ....................................................................... 180 13. Линейные отображения, матрица линейного оператора. Инвариантные подмножества линейных пространств. Собственные векторы и собственные значения линейного оператора и их нахождение .............................................. 187 3 14. Евклидовы пространства. Ортогональные дополнения к подпространству. Строение конечномерных евклидовых пространств........................................... 194 15. Группы и подгруппы. Гомоморфизмы и нормальные делители. Теорема о гомоморфизмах групп ............................................................................................ 200 16. Сравнения. Системы вычетов. Теоремы Эйлера и Ферма. Кольцо классов вычетов. Линейные сравнения. Диофантовы уравнения первой степени......... 212 17. Арифметические приложения сравнений: решение неопределенных уравнений, вычисление остатка от деления, признаки делимости, длина периода систематической дроби .......................................................................................... 224 18. Кольца главных идеалов, евклидовы и гауссовы кольца. Теорема о гомоморфизмах колец ............................................................................................ 236 19. Кольцо многочленов от одной и нескольких переменных. Подкольцо симметрических многочленов и его порождающие............................................ 249 20. Многочлены над полем действительных чисел; сопряженность корней и неприводимые множители в кольце R[x]. Отделение действительных корней многочлена .............................................................................................................. 261 21. Многочлены над полем рациональных чисел и рациональные корни многочлена. Критерий неприводимости Эйзенштейна ...................................... 270 22. Строение простого алгебраического расширения. Освобождение от алгебраической иррациональности в знаменателе дроби. Конечные поля....... 276 23 .Условия разрешимости уравнения третьей степени в квадратных радикалах. Примеры геометрических задач, сводящихся к уравнениям, неразрешимым в квадратных радикалах ............................................................................................ 295 24. Система целых неотрицательных чисел. Неполнота арифметики............... 306 4 ВВЕДЕНИЕ Объектом изучения математики являются множества с операциями и отношениями. Множество с операциями и отношениями называют алгебраической системой. Если на множестве заданы только одни операции, то систему принято называть алгеброй, а если только одни отношения — моделью. Понятие алгебраической системы носит общий, можно сказать, философский характер. Любая другая наука Изучаемый объект алгебры (и математика, в частности) изучает только алгебраические системы. Особенность алгебры в том, что алгебра (наука) не имеет своим объектом изучения единственную алгебру или единственную систему. Отличие алгебрынауки от других наук (в том числе математических) заключается в том, что алгебра изучает целые классы алгебр и алгебраических систем. Ответ на вопрос «Что изучает алгебра?» выглядит как игра слов: «объектом изучения алгебры являются алгебры». В этом предложении первое слово «алгебры» означает алгебры-науки, а второе — алгебры-множества с операциями1. Обычно множество A и алгебру, определенную на A, обозначают одним и тем же символом. Если f1, f2, ... fn набор операций (различных местностей) на множестве A, то алгебру A обычно записывают в виде A = < A; f1, f2, ... fn >. 1 Таким образом, предложение «Алгебре — алгебры» аналогично лозунгу: «Миру — мир». 5 Кроме операций, на A могут быть определены и отношения (тоже различных местностей) R1, R2, ... Rm. Тогда A = < A; f1, f2, ... fn, R1, R2, ... Rm > является алгебраической системой1. Например, множество натуральных чисел с операциями сложения и умножения образует алгебру N = < N; +, ⋅ > натуральных чисел. Эта алгебра с отношениями порядка и делимости превращается в систему натуральных чисел N = < N; +, ⋅ ; ≤, >. Именно эту систему часто называют арифметикой. Символы операций и отношений алгебраической системы называют сигнатурой, а их местности — типом. Например, сигнатура алгебраической системы < N; +, ⋅ ; ≤, > – это { +, ⋅ ; ≤, }, а ее типом является (2, 2; 2, 2). Операции — это частные случаи отношений. Поэтому и алгебры, и алгебраические системы являются частными случаями моделей. Некоторые, различные с виду математические системы по существу одинаковы. Что значит по существу? Из-за разных обстоятельств и элементы, и операции, и отношения математической системы могут иметь различные названия и обозначения. 1 От греческого слова συστηµα — состоящее из частей. 6 Пусть A1= < A1; o > и A2= < A2; • > — две алгебры с одной двухместной операцией каждая, а ϕ — взаимно однозначное отображение множества A1 на A2. Отображение ϕ сохраняет операцию, если для каждых элементов x, y из множестваA1 ϕ (x o y) = ϕ (x) • ϕ (y). Аналогично определяется сохранение операций меньших и больших местностей. Например, если g — одноместная операция в алгебрах A1 и A2, то сохранение операции и отображении ϕ означает, что для каждых x из A1 ϕ (g(x)) = g(ϕ (x)). Если g — это n-одноместная операция в алгебрах A1 и A2, то отображение ϕ сохраняет g — это значит, что для каждых x1, x2, ..., xn, из A1 ϕ (g (x1, x2, ..., xn)) = g (ϕ (x1), ϕ (x2), ..., ϕ (xn)). Отображение, сохраняющее все операции алгебры, называют гомоморфизмом. Пусть M1 = < M1; R > и M2 = < M2; R > — две модели с одним двухместным отношением R, а ϕ — отображение множества M1 на M2. Отображение ϕ является гомоморфизмом моделей, если ϕ сохраняет отношение (для каждых элементов x, y из M1): из истинности предложения xRy следует истинность ϕ (x) R ϕ (y): x R y ⇒ ϕ (x) R ϕ (y). 7 В случае изоморфизма моделей для сохранения отношения требуется более жесткое правило (для каждых элементов x, y из M1): x R y ⇔ ϕ(x) R ϕ (y). Аналогично определяется сохранение отношений других местностей. Гомоморфизм — частный случай отображения, поэтому он может инъективным, сюръективным или биективным. Множества A1 и A2 могут совпадать, и тогда получатся гомоморфизмы в себя. Соответствующие названия приведены в следующей таблице. Вид морфизма Свойства отображения Вид отображения Гомоморфизм Отображение, сохраняющее Произвольное отображение операции одного множества в другое Мономорфизм Эпиморфизм Изоморфизм Взаимно однозначный гомоморфизм в Гомоморфизм на Мономорфизм и эпиморфизм одновременно Инъекция Сюръекция Биекция Эндоморфизм Гомоморфизм в себя Отображение в себя Автоморфизм Изоморфизм на себя Биекция на себя (подстановка) При сохранении операций имеют в виду главные операции алгебры, занесенные в сигнатуру. Некоторые операции алгебры могут определяться в аксиомах (как, например, нульместная операция «нейтральный элемент» или одноместная — «взятие обратного элемента»). 8 Неглавные операции алгебры тоже сохраняются при гомоморфизме на, т. е. эпиморфизм переводит нейтральный элемент в нейтральный, поглощающий — в поглощающий, обратный — в обратный, противоположный — в противоположный. Свойство алгебр или алгебраических систем называют абстрактным, если оно сохраняется при изоморфизме. Точнее говоря, свойство абстрактно, если из того, что им обладает некоторая алгебраическая система, следует, что этим свойством обладают и все системы, с ней изоморфные. Изоморфные алгебры обладают одинаковыми свойствами – любое утверждение, доказанное для одной алгебры, автоматически выполняется для любой алгебры, ей изоморфной. Науку алгебру называют общей (или абстрактной) потому, что она изучает лишь абстрактные свойства. Пусть A — алгебра, f — одна из ее операций, а H — непустое подмножество множества A. Подмножество H замкнуто относительно f, если для любых элементов a1, a2, ..., an из H элемент f (a1, a2, ..., an) снова принадлежит H. Например, если o – двухместная операция в алгебре, то замкнутость H относительно этой операции означает, что a ∈ H, b ∈ H ⇒ a o b ∈ H. Если H является алгеброй того же типа и удовлетворяет тем же аксиомам, что и алгебра A, то H называют подалгеброй алгебры A. Для того чтобы подчеркнуть, что H — не просто подмножество множества A (H ⊂ A), но и подалгебра, используют символику H < A, где знак < , похожий на строгое числовое неравенство, используется так же, как и знак ⊂ , т. е. не обязательно в строгом смысле (H может и совпадать с A). 9 Множество подалгебр упорядочено отношением включения. Наибольшим элементом в таком порядке является множество — носитель самой алгебры. Наименьшего элемента, т. е. подалгебры, содержащейся в каждой подалгебре, может и не существовать. Отношение «быть подалгеброй» является отношением частичного порядка. В любой алгебре пересечение любой совокупности подалгебр или пусто, или является подалгеброй. Объединение возрастающей цепочки подалгебр A1 < A2 < ... < An < ... алгебры A является подалгеброй. Дело в том, что в операции алгебры участвует конечное число элементов, поэтому все они находятся в некотором звене этой цепи, а значит, и результат операции, примененной к этим элементам, лежит там же. Пусть M — непустое подмножество алгебры A. Рассмотрим пересечение всех подалгебр, алгебры A, содержащих множество M. Пересечение всех подалгебр алгебры A, содержащих множество M, является наименьшей подалгеброй, содержащей M. Наименьшая подалгебра, содержащая M, называется подалгеброй, порожденной множеством M. Эту алгебру обозначают в разных ситуациях символом gp (M) или алг (M), или просто (M) — буквы «алг» в конкретных случаях заменяются сокращенными названиями изучаемых алгебр. Случайно этой подалгеброй может оказаться вся алгебра A. Если у алгебры найдется конечное порождающие множество, то алгебру называют конечно-порожденной. Если алгебра Aконечно-порождена, то каждая возрастающая цепочка подалгебр A1 < A2 < ... < An < ... 10 алгебры A обрывается на конечном шаге. Для некоторого класса алгебр возникает естественная проблема: как узнать для произвольного набора элементов a, a2, ..., am и произвольного элемента b, принадлежит элемент b подалгебре gp (M) или нет. В случае, когда существует алгоритм для решения такой задачи, то говорят, что проблема вхождения в классе этих алгебр алгоритмически разрешима. Алгебры классифицируются по числу и свойствам операций. Важнейшими алгебрами с одной операцией являются группы (и их обобщения – полугруппы и моноиды), а важнейшие алгебры с двумя операциями – это кольца (и частные случаи колец – поля и тела). Любой реальный или идеальный объект фактически является алгебраической системой (или алгеброй). Поэтому сущность алгебры (как науки) состоит в выборе объекта изучения, а в методе исследования алгебраической системы. Изучение алгебры A алгебраическим методом состоит в исследовании внутреннего устройства алгебры A и ее внешних связей. Изучение внутреннего устройства алгебры - это исследование свойств решетки (или полурешетки) L(A) подалгебр алгебры A. Решетка L(A) подалгебр алгебры A лишена жизни. Ее можно оживить, рассмотрев автоморфизмы алгебры. Тогда множество L(A) будет отображаться в себя (может быть, на себя). Более точно, некоторые элементы решетки подалгебр будут перемещаться при автоморфизмах, некоторые переходят сами в себя, а другие вообще остаются неподвижными. Это значит, что с исследованием алгебры A связано изучение ее группы автоморфизмов Aut(A). Полугруппа эндоморфизмов End(A) алгебры A тоже может много сказать о ее внутренних свойствах. 11 Таким образом, понятия решетки, группы, полугруппы действительно являются важнейшими - эти алгебры сопутствуют изучению любой другой алгебры (или алгебраической системы) Кроме внутреннего устройства алгебры A представляют интерес и ее внешние связи, т.е. все гомоморфизмы на однотипные алгебры. Практически эта задача снова сводится к внутреннему устройству алгебры A, так как гомоморфное отображение A полностью определяется отношением конгруэнции на A, и описание гомоморфизмов (с точностью до изоморфизма) сводится к описанию конгруэнций исследуемой алгебры. Итак, изучить алгебру (алгебраическую систему) A – это означает, в первую очередь, найти и исследовать сопутствующие структуры для A: 1) решетку L(A) подалгебр алгебры A; 2) группу Aut(A) автоморфизмов алгебры A; 3) полугруппу End(A) эндоморфизмов алгебры A; 4) конгруэнции алгебры A. Особое значение для всей математики в целом имеют логические алгебры – алгебра высказываний и алгебра предикатов. 12 1. ВЫСКАЗЫВАНИЯ, ПРЕДИКАТЫ И ОПЕРАЦИИ НАД НИМИ. ЗАКОНЫ ЛОГИКИ ВЫСКАЗЫВАНИЙ. МАТЕМАТИЧЕСКОЕ ДОКАЗАТЕЛЬСТВО Основные понятия: алгебра, алгебраическая система, булева решетка, булево кольцо, булева функция, высказывание логические операции, закон логики, предикат, квантор, интерпретация и модель, выполнимость и общезначимость формулы, аксиоматическая теория, доказательство, прямое и косвенное доказательство. Основные факты: множество классов равносильных формул алгебры высказываний с отношением логического следствия и операциями конъюнкция, дизъюнкция и отрицание образует булеву решетку; проблема общезначимости разрешима лишь для отдельных классов формул алгебры предикатов. ВЫСКАЗЫВАНИЯ И ЛОГИЧЕСКИЕ ОПЕРАЦИИ. Под словом «высказывание» имеется в виду повествовательное предложение, относительно которого известно, истинно (И или 1) оно или ложно (Л или 0). Алгебра высказываний – это множество высказываний с логическими операциями над ними. Пусть A, B – два высказывания, соединив их союзом и, получим новое высказывание «A и B». Такое соединение высказываний принято называть конъюнкцией,1 а вместо русского слова и писать символ2 &. Соединение высказываний союзом или называют дизъюнкцией3. Вместо русского слова или пишут символ ∨. Высказывание «если A, то B» называют импликацией4 и пишут коротко: A → B. От латинского conjunctio - соединение. Символ & – искаженное английское слово and. 3 От латинского disjunctio - разъединение. 4 От латинского implico – тесная связь. 1 2 13 Высказывание «не A» (или: «неверно, что A») называют отрицанием A. ~ Для записи отрицания используют символ A (или ¬ A , или A ). Так как высказывание может принимать всего лишь два значения, логические операции можно полностью задать с помощью таблиц (эти таблицы принято называть таблицами истинности): A B A&B A∨B A→B A↔B A И И И И И И Л И Л Л И Л Л Л Л И Л И И Л И Л Л Л Л И И И После введения логических операций можно уточнить само понятие высказывания. Элементами алгебры высказываний являются все высказывания, полученные из простейших (атомарных высказываний A, B, C, ... X, Y, Z, … ) и кон- стант (И, Л) с помощью логических операций. Такое сложное высказывание принято называть формулой алгебры высказываний, а точнее, правильно построенной формулой (ППФ). Дадим точнее определение ППФ: 1) простейшее высказывание и константа (И или Л) является ППФ; 2) если A и B - ППФ, то (A)&(B), (A)∨(B) (A)→(B), (A)↔(B), ( A ),- тоже ППФ; 3) других ППФ, кроме указанных в пунктах 1) и 2), нет. Итак, множество-носитель алгебры высказываний - это множество всех ППФ (которые, впрочем, принято называть коротко: «высказываниями»). Алгебру высказываний обычно обозначают символом АВ. Таким образом, АВ = < {ППФ}; &, ∨, 14 , →, ↔ >. Роль равенства в алгебре высказываний играет отношение логической равносильности. Это отношение тесно связано с другим, не менее важным – отношением логического следствия. ЛОГИЧЕСКОЕ СЛЕДСТВИЕ И ЛОГИЧЕСКАЯ РАВНОСИЛЬНОСТЬ. Говорят, что высказывание B является логическим следствием высказывания A, если при любом наборе значений переменных, входящих в A и B, каждый раз, когда истинно A, истинно и B. Пишут в таком случае: A ⇒ B. Рефлексивное, транзитивное и симметричное отношение на множестве M называют отношением эквивалентности. Эквивалентность разбивает множество M на смежные классы, состоящие из эквивалентных элементов. Рефлексивное, транзитивное и антисимметричное отношение является отношением порядка. Если отношение только рефлексивно и транзитивно, то оно называется предпорядком. Множество с отношением предпорядка называют предупорядоченным. Пусть множество M предупорядочено отношением p . Отношение ~ на M, введенное по правилу: x~y опр ⇔ x p y и y p x. называют отношением ассоциированности на M. Отношение ~ согласовано с предупорядоченностью, причем множество смежных классов ставится уже упорядоченным. Отношение логического следствия ⇒ рефлексивно и транзитивно, т. е. является отношением предпорядка. Логическая равносильность ⇔ – это ассоциированность для логического следствия: A ⇔ B тогда и только тогда, когда A ⇒ B и B ⇒ A. 15 Как и любая ассоциированность, отношение равносильности ⇔ рефлексивно, симметрично, транзитивно и согласовано с логическими с отношением ⇒ , т. е. логическое следствие переносится на классы равносильных формул, причем множество классов становится уже упорядоченным. Мало того, отношение ⇔ к тому же согласовано и с логическими операциями, т. е. является конгруэнцией. Таким образом, множеством-носителем алгебры высказываний являются не отдельные ППФ, а классы равносильных ППФ (фактормножество исходного множества формул). Логические операции производятся над этими классами с помощью представителей классов1. Фактормножество множества высказываний по отношению «логическая равносильность» принято называть так же, как и раньше: «алгеброй высказываний» и обозначать тем же символом (АВ). Элементы АВ называют так же, как и раньше: правильно построенные формулы (ППФ). ПРИОРИТЕТНОСТЬ ЛОГИЧЕСКИХ ОПЕРАЦИЙ. Арифметические операции в числовых системах упорядочены по приоритетности выполнения. Эта упорядоченность позволяет не расставлять все скобки в числовых выражениях. В это упорядочение входят и отношения равенства и порядка (по умолчанию они имеют наименьшую приоритетность, поэтому левую и правую часть уравнений и неравенств можно не окружать скобками). Аналогичные договоры есть и для алгебры высказываний. Отношения (равносильности и логического следствия) имеют низшую приоритетность, поэтому формулы, находящиеся в этих отношениях, скобками не окружают, т. е. вместо (A) ⇔ (B) и (A) ⇒ (B) пишут A ⇔ B и A ⇒ B. Аналогичная ситуация возникает, например, при изучении системы рациональных чисел. Рациональное число, представленное обыкновенной дробью – это класс равных (эквивалентных) дробей. Арифметические операции определены на множестве классов дробей, но осуществляются они с помощью представителей этих классов. 1 16 Если отрицание относится к одному символу (говорят: тесное отрицание), то оно выполняется самым первым (подобно тому, как первым выполняется взятие противоположного или обратного элемента). Затем (если нет скобок) по приоритетности выполняются следующие операции: отрицание, конъюнкция, дизъюнкция, импликация, эквиваленция. Алгебра высказываний состоит из формул. А точнее, из классов равносильных формул, логические операции и отношение логического следствия выполняются на множестве классов с помощью представителей. Некоторые формулы алгебры высказываний имеют особое значение. Эти особые формулы принято назвать законами логики алгебры высказываний. ЗАКОНЫ ЛОГИКИ ВЫСКАЗЫВАНИЙ. Формула алгебры высказываний назы- вается тождественно истинной или законом логики, если при любых истинностных значениях, входящих в нее переменных, она принимает значение «истина». Например, формула A↔ A тождественно истинна, т. е. является законом логики. Этот закон называют законом двойного отрицания. Тождественно истинную формулу A∨ A называют законом исключенного третьего, а формула A& A ↔ Л 17 называется законом противоречия. Примеры законов логики, содержащих импликацию. Правило силлогизма1): [(A → B) & (B → C)] → (A → C); правило отделения: ( A & ( A → B) ) → B; закон доказательства методом от противного: (A → ( B & B )) → A ; закон контрапозиции: ( A → B ) ↔ (B → A ). ; закон полной индукции (разбор случаев): [(A → C) & (B → C)] → [(A ∨ B) → C)]. Если формула F закон логики, то пишут: = F. Формула F является логическим следствием формулы G, если = G → F. Формулы F и G логически равносильны, если = G ↔ F. 1 От греческого syllogismos – умозаключение. 18 Изучить какую-либо алгебру - это означает, в частности, найти ее определяющие тождества. Определяющими называют такие тождества, из которых как следствия можно получить вообще все тождества этой алгебры. В алгебре высказываний роль равенства играет равносильность, т. е. тождество имеет вид: F ⇔ G, где F, G - формулы алгебры высказываний от простых высказываний A, B, C, ... . В тождества могут входить и константы И, Л. Так как импликацию и эквиваленцию можно выразить через остальные логические операции, ( A → B ) ↔ (A ∨ B ) ; ( A ↔ B ) ↔ (( A & B ) ∨ (A & B )) ; определяющие равносильности можно искать только для трех операций: конъюнкции, дизъюнкции и отрицания. Рассмотрим сначала свойства конъюнкции, затем свойства дизъюнкции, а затеме свойства всех операций вместе. ДВА ИЗОМОРФНЫХ МОНОИДА. Конъюнкция удовлетворяет следующим законам (для любых формул A, B, C): 1) закон ассоциативности A & (B & C) ↔ (A & B) & C; 2) закон коммутативности A & B ↔ B & A; 3) закон идемпотентности 19 A & A ↔ A; 4) закон существования нейтрального элемента A & И ↔ A; 5) закон существования поглощающего элемента A & Л ↔ Л. Алгебра с одной ассоциативной операцией называется полугруппой. Полугруппу, имеющую нейтральный элемент называют моноидом. Поглощающий элемент моноида принято называть нулем. Таким образом, алгебра А1 = < {ППФ}; & > – э т о к о м м у т а т и в н ы й , идемпотентный моноид с нулем. Алгебра А2 = < {ППФ}; ∨ > тоже образует коммутативный, идемпотентный моноид с нулем. Это значит, что д и з ъ ю н к ц и я т а к ж е а с с о ц и а т и в н а , к о м м у т а тивна, идемпотентна, обладает нейтральным элементом, обладает поглощающим элементом. Алгебры A1 и A2 обладают одинаковыми свойствами, но они не просто очень похожи; они изоморфны. Действительно, отображение, переводящее каждое высказывание в его отрицание, взаимно однозначно отображает множество A1 на множество A2 и сохраняет операцию, A& B ↔ A ∨ B . 20 Эту формулу в честь автора называют законом де Моргана1. Отобразить можно и алгебру A2 на A1. Тогда появляется второй закон де Моргана: A∨ B ↔ A & B . Кроме того, для операций конъюнкции и дизъюнкции выполняются законы поглощения: A&(A∨B) ↔ A, A∨(A&B) ↔ A; и законы дистрибутивности: A&(B∨C) ↔ (A&B)∨ (A&C), A∨(B&C) ↔ (A∨B)&(A∨C). Итак, алгебра (а, если быть точным, алгебраическая система) высказываний принимает вид: АВ = < {ППФ}; &, ∨, ; ⇒ >. В ней три операции и одно отношение – логического следствия. Главным, можно сказать определяющим среди них является именно отношение. Этим отношением множество АВ упорядочено, а точнее, решёточно упорядочено. РЕШЁТКА ВЫСКАЗЫВАНИЙ. Формулы Августус де Морган (De Morgan) (1806–1871) - шотландский математик и логик; основы логики высказываний изложены им в работе 1847 года «Формальная логика». 1 21 (A & B) → A и (A & B) → B являются законами логики, и поэтому A&B – нижняя грань для A и B. Закон введения конъюнкции ((C → A) & (C→B)) → (C → (A & B)) означает, что A & B – точная нижняя грань для A и B. Аналогично, тождественная истинность формул A → (A∨ B) и B → (A ∨ B) и закон полной индукции означает, что A ∨ B –– точная верхняя грань для формул A и B. Таким образом, алгебра высказываний с операциями конъюнкция и дизъюнкция является решеткой. Наибольшим элементов в этой решетке является константа И, а наименьшим – Л. Эта решетка дистрибутивна, а закон противоречия и закон исключенного третьего означают, что в этой решетке отрицание играет роль дополнения. Дистрибутивная решётка с дополнениями называется булевой решёткой1. Алгебра высказываний образует булеву решетку. БУЛЕВЫ КОЛЬЦА. ТЕОРЕМА СТОУНА. Ненулевое, ассоциативное, идемпотентное кольцо с единицей называют булевым кольцом. В честь английского математика Джорджа Буля (Boole) (1815–1864), основоположника математической логики, первым (независимо от А. де Моргана) построившим логику в виде «алгебры» (опубликовано в работе 1854 года «Исследование законов мышления»). 1 22 Например, кольцо Z2 классов вычетов по модулю 2 является булевым кольцом (и одновременно полем1). Булево кольцо коммутативно и имеет характеристику 2, т. е. для любых элементов x, y из булева кольца xy = yx и x + x = 0. Отношение ≤, введенное в булевом кольце по правилу: x ≤ y ⇔ x = x⋅y, является отношением частичного порядка. Из идемпотентности умножения следует рефлективность отношения ≤, а из ассоциативности – транзитивность этого отношения. Если x = x ⋅ y и y = x⋅y, то x = y, т. е. отношение ≤ антисимметрично. Положив (для всех x, y из B): x ∨ y = x + y + x ⋅ y, x ∧ y = x ⋅ y, x = x + 1, мы превратим кольцо B в решётку, и решётка эта будет булевой. Если B = < B; ∨, ∧ > - булева решётка, то множество B с операциями, заданными тождествами: x + y = (x ∧ y)∨ (x ∧ y ) , Так как в поле содержится только два идемпотентных элемента (0 и 1), любое другое булево кольцо полем уже не будет. 1 23 x⋅y=x∧y превращается в булево кольцо. Итак, каждая булева решетка может быть превращена в булево кольцо на том же множестве; и, наоборот, любое булево кольцо можно превратить в булеву решетку. Эта связь между булевыми кольцами и булевыми решетками была обнаружена в 30-х годах прошлого века американским математиком Стоуном1. Алгебра высказываний оказалась булевой решёткой, и, следовательно, по теореме Стоуна образует булево кольцо. При изучении алгебры логики как булева кольца каждый класс равносильных формул представляют одной функций f(x1, x2, …, xn), определенной на множестве {0, 1}, и принимающей значение в этом же множестве. Такие функции называют булевыми. Вместо отношения равносильности тогда появляется обычное отношение равенства. В символике «0, 1» вместо «И, Л» конъюнкция – это обычное умножение, а отрицание эквиваленции A ↔ B – сложение (+) по модулю 2: x y x&y x↔y x+y 1 1 1 1 1 1 1 1 1 С этими операциями множество высказываний и образует булево кольцо. Маршалл Харви Стоун (Stone) (1903–1989) – американский математик, профессор Чикагского (1946–1968) и Массачусетского (с 1968) университетов. Связь между булевыми решетками и булевыми кольцами установлена Стоуном в двух работах 1935 г. и 1936 г. (в работе 1936 г. М. Стоун впервые ввел термин «булево кольцо»). 1 24 Ради исторической справедливости следует отметить, что первым исследователем, представившим алгебру логики в виде булева кольца, был вовсе не американец Стоун, а русский математик И.И. Жегалкин1. Сделал это Жегалкин почти на десять лет раньше Стоуна. Иван Иванович первым начал использовать символы 0 и 1 вместо Л, И (или для англоговорящих – f, t). После раскрытия скобок и приведения подобных членов каждая булева функция f(x1, xn, ..., xn) от n переменных может быть представлена, и единственным образом, в виде многочлена от n переменных, a α α δ δ δ f(x1, xn, ..., xn) = A1 x1 1 x2 2 ...xn n + ... + Ak x1 1 x2 2 ...xn n , который называется полиномом Жегалкина. Функцию f(x1, x2 , ... , xn) над полем называют полиномиальной, если ее можно представить некоторым многочленом (от n переменных). Таким образом, в с е ф у н к ц и и н а д п о л е м Z 2 п о л и н о м и н а л ь н ы 2. ПРЕДИКАТЫ. Высказывание категорично: оно только истинно или только ложно. В реальной жизни, в том числе и при описании математических объектов, чаще встречаются некатегоричные высказывания, высказывания с переменной (или переменными), от значения которых зависит истинность высказывания. Значения переменных - это не «истина» или «ложь», а конкретные элементы некоторого множества. Высказывание с переменной называют высказывательной формой или предикатом.3 Иван Иванович Жегалкин (1869–1947) – русский математик; с 1902 г. – профессор Московского университета. Построение алгебры логики как кольца со сложением по модулю 2 изложено им в работе 1927 года «О технике вычислений предложений в символической логике». 2 В действительности не только над двухэлементным, но и вообще над любым конечным полем все функции полиноминальны. 3 От латинского рraedicatum - сказанное. 1 25 Число переменных в предикате может больше или меньше одного (говорят: P(x1, x2, ..., xn) - n-местный предикат). В частности, если n = 0, то получаем нульместный предикат, т. е. просто высказывание. Конкретное множество с отношением такой же местности, что и предикат P , называют интерпретацией предиката. Подставив в предикат вместо переменных конкретные элементы интерпретации, мы превратим его в высказывание; поэтому над предикатами можно производить все логические операции, которые производятся над высказываниями. Множество TP всех n-ок, на которых интерпретированный предикат P(x1, x2, ... , xn), превращается в истинное высказывание, называют множеством истинности1 предиката: TP = {(x1, x2, ... , xn) ∈ MnP(x1, x2, ... , xn) = И}. В частности, множество истинности одноместного предиката P(x) - это подмножество множества M, заданное характеристическим свойством P(x): TP = {x∈MP(x)}. Самые распространенные предикаты школьного и вузовского курсов математики - это уравнения и неравенства (а также их системы и совокупности). Множество истинности предиката, имеющего вид уравнения f(x) = 0, называют множеством решений уравнения. КВАНТОРЫ. Если множество истинности предиката P(x), заданного на множестве M, не пусто, то предложение «существует x из M такой, что P(x)» - истинно, а если это множество совпадает со всей моделью, то истинно высказывание «для всех x из M P(x)». Вместо русского слова «существует» пишут международный символ ∃. 26 Формула (∃x)[P(x)] читается: «существует x, что P(x)» (или «для некоторого x P(x)». Это высказывание о конкретной математической системе. Истинность этого высказывания определяется по правилу: (∃x)[P(x)] – истинно ⇔ TP ≠ ∅. Символ ∃ называют квантором существования2. Вместо русских слов «для всех» пишут символ ∀, называемый квантором общности3 (или квантором всеобщности); т. е. формула (∀x)[P(x)] читается: «для всех x P(x)» (или «для каждого x P(x)»). Это тоже высказывание, связанное с конкретным множеством, на котором определен предикат P(x). Истинность высказывания (∀x)[P(x)] на множестве M определяется следующим образом: (∀x)[P(x)] – истинно ⇔ TP = M. Присоединение квантора к предикатной формуле называют навешиванием квантора. Навешивание квантора - логическая операция. Как и конкретизация, она уменьшает число мест в предикате, а если предикат – одноместный, то превращает его в высказывание. Пока на переменную не навешен квантор, она входит в формулу свободно. После навешивания квантора переменная связана. Формулы без свободных переменных, называют замкнутыми, а формулы, содержащие свободные переменные, - открытыми. Замкнутая формула является высказыванием, а открытая – n-местным предикатом, где n – число свободных переменных. T - первая буква английского слова true - истинный. Слово «квантор» - от латинского quantum - сколько. Понятие квантора введено американским математиком Чарльзом Пирсом (1839–1914) в 1885 году. Символ ∃ - это повернутая на 180° первая буква английского слова Exist - существовать. 3 Символ ∀ - это повернутая на 180° первая буква английского слова All – все. 1 2 27 Рассмотрим для примера строение формулы алгебры предикатов (P(x) – символ некоторого одноместного предиката, а S(x) – функция следования) [P(0) & (∀x )[P(x ) → P(S (x ))] ] → (∀x )(P(x )) Область действия первого квантора общности окружена квадратными скобками. Как только закончилось действие квантора, навешенного не переменную x, эта переменная может появляться в формуле снова, причем с любым квантором. Она и появляется, область действия второго квантора общности отмечена круглыми скобками. Эта формула замкнутая, свободных переменных в ней нет. Число свободных переменных в предикатной формуле – это местность формулы как предиката. Таким образом, к логическим операциям, применимым и к высказываниям, добавились еще две - навешивание кванторов общности и существования. Алгебра высказываний расширилась до алгебраической системы, множеством-носителем которой являются все предикатные формулы, а к логическим операциям добавились еще две (частичные) операции: навешивание квантора общности и навешивание квантора существования. Обозначим множество всех предикатных формул символом АП. Тогда алгебра предикатов АП = < AП; &, ∨, ,→, ↔, ∃, ∀ >. 28 Алгебры предикатов и предикатных формул уже достаточно для описания многих объектов и фактов и математики, и других наук, и реальной жизни.1 ИНТЕРПРЕТАЦИИ И МОДЕЛИ. Пусть M – алгебраическая система с опера- циями f1, f2, ..., fm различных местностей и отношениями P1, P2, ... , Pk тоже различных местностей, M = < M; f1, f2, ..., fm; P1, P2, ... , Pk >. Набор символов операций и отношений алгебраической системы называется сигнатурой, а совокупность чисел-местностей операций и отношений – типом системы. Сигнатурой принято называть также множество предикатных и функциональных символов формулы, а их местности так же – типом формулы. Алгебраическая система, имеющая точно такой же тип что формула (или множество формул) называется интерпретацией формулы (множества формул). Изменив, если требуется символику формулы или системы, можно считать, что формула и алгебраическая система имеют одну и ту же сигнатуру. Формула алгебры логики называется выполнимой, если при некоторой интерпретации она окажется истинной. В таком случае говорят, что интерпретация является моделью для формулы. Любая формула алгебры предикатов имеет интерпретацию – всегда найдется система того же типа, что и эта формула. Например, формула (∀x)(∀y) [f(x, y) = f(y, x)], Если навешивать кванторы не только на предметные, но и на предикатные переменные, то можно выразить вообще всё, что сказано человечеством за время его существования. 1 29 где f – функциональный символ, может быть интерпретирована на любой системе, содержащей двуместную операцию. Интерпретация будет моделью для этой формулы лишь в том случае, если операция в алгебраической системе коммутативна. Эта формула имеет модель. Например, интерпретируя x, y как элементы из Z, а символ f как символ сложения целых чисел, получаем модель < Z; + > для такой формулы. Отметим, что система < Z; – > тоже является интерпретацией для этой же формулы, но не является моделью, так как вычитание некоммутативная операция. Итак, не каждая интерпретация является моделью; более того, может случиться, что у формулы вообще нет модели; тогда говорят, что формула невыполнима. Если же модель для формулы найдется, то формулу называют выполнимой. Для открытой формулы выполнимость означает, что она превращается в верное высказывание при некоторой подстановке элементов вместо свободных переменных. Это значит, что при решении вопроса о выполнимости для открытой формулы на все свободные переменные можно навестить кванторы существования. Алгебраическая система, на которой истинны все формулы, играющие роль аксиом теории, называется моделью теории. На модели автоматически выполняются все следствия аксиом. Если формула истинна при любой интерпретации, то формулу называют общезначимой (или законом логики предикатов). Для общезначимой формулы любая интерпретация – модель. При решении вопроса об общезначимости для открытой формулы на все свободные переменные можно навестить кванторы общности. Так как на конкретном множестве не может выполняться одновременно предложение и его отрицание, ф о р м у л а л о г и к и п р е д и к а т о в т о г д а и 30 только тогда является общезначимой, когда ее отрицание невыполнимо. ЛОГИЧЕСКОЕ СЛЕДСТВИЕ И РАВНОСИЛЬНОСТЬ ДЛЯ ПРЕДИКАТОВ. Две формулы алгебры предикатов F и G называют логически равносильными, если формула F ↔ G – общезначимая. Пишут в таком случае F ⇔ G. Говорят, что формула G логически следует из G, и пишут: F ⇒ G, если формула F → G – общезначима. Равносильность формул алгебры предикатов - это отношение ассоциированности для логического следствия. Отношение логической равносильности является конгруэнцией на множестве АП, т. е. логическая равносильность рефлексивна, симметрична, транзитивна и согласована со всеми логическими операциями (в том числе и с навешиванием кванторов). Так же, как и для высказываний, множеством алгебры предикатов, по существу, являются не отдельные предикатные формулы, а классы равносильных формул. Отношение логического следствия связывает две формулы A и B, A ⇒ B. Если формула A имеет вид конъюнкции, A = A1 & A2 & ... & An., то говорят, что формула B логически следует из формул A1, A2, ..., An. Чаще всего такую ситуацию изображают не символикой A1, A2, ..., An ⇒ B, а в виде дроби, в числителе которой расположены формулы A1, A2, ..., An, а в знаменателе – B: A1 , A2 , ..., An . B Получение формулы B из формулы A (или из формул A1, A2, ..., An) принято называть умозаключением. Алгебра предикатов, обогащенная отношением логического следствия, превратилась в математическую систему 31 АП = < AП; &, ∨, ,→ , ↔, ∃, ∀, ⇒ >. ПРИМЕРЫ ОБЩЕЗНАЧИМЫХ ФОРМУЛ. Полное изучение этой системы оз- начает нахождение всех ее определяющих тождеств (законов логики, т. е. общезначимых формул). Отношение равносильности в алгебре предикатов продолжает равносильность алгебры высказываний. Это значит, что все законы логики алгебры высказываний, установленные ранее, переносятся без всяких изменений на алгебру предикатов. В закон логики алгебры высказываний можно подставить любые формулы алгебры предикатов – в результате получится закон логики предикатов. В частности, из любой пары равносильных формул алгебры высказываний простой подстановкой вместо входящих в нее символов предикатных формул можно получить равносильные формулы алгебры предикатов. В новой – существенно расширенной – алгебре есть и существенно новые равносильности. Такие формулы содержат кванторы и n-местные предикаты, где местность n ≥ 1. Самые простые, непосредственно вытекающие из определения области действия квантора, равносильности: (∀x)P(x) ⇔ (∀y)P(y); (∀x)P(x) ⇔ (∀y)P(y). Пусть M – алгебраическая система с одним одноместным отношением P, т. е. M = < M; P >. 32 Формула (∀x)[P(x)] выражает тот факт, что все элементы из M обладают свойством P. Если множество M – конечно, то эту формулу можно записать, не используя квантора общности. Пусть, например, M = {a, b}, тогда предложение (∀x)[P(x)] равносильно P(a) & P(b). Если множество состоит из n элементов, то формула станет конъюнкцией с n членами. Навешивание квантора общности – это обобщение конъюнкции. Формула (∃x)[P(x)] означает, что, по крайней мере, один элемент из M обладает свойством P. Снова для конечного множества M такую формулу можно записать, не используя квантора существования. Для M = {a, b} формула (∀x)[P(x)] равносильна P(a) ∨ P(b). Для n-элементного множества формула (∀x)[P(x)] станет дизъюнкцией с n членами. Навешивание квантора существования – это обобщение дизъюнкции. Конъюнкция, дизъюнкция и отрицание связаны законами де Моргана. В этих законах число членов может быть любым натуральным числом. Используя квантификацию как обобщение соответствующих операций, получаем обобщенные законы де Моргана: (∀x )P(x ) ↔ (∃x )P (x ), (∃x )P(x ) ↔ (∀x )P (x ) . 33 Обобщенные законы де Моргана позволяют выразить квантор существования через квантор общности, и наоборот квантор общности – через квантор существования. ПРОБЛЕМА ОБЩЕЗНАЧИМОСТИ. В алгебре высказываний с помощью таб- лицы истинности можно выяснить, является ли произвольная формула законом логики. Другими словами, существует алгоритм, позволяющий в конечное число шагов выяснить, является ли произвольная формула АВ законом логики или нет. В алгебре предикатов такого алгоритма не существует. ТЕОРЕМА (А.Чёрч1). Н е с у щ е с т в у е т а л г о р и т м а д л я у з н а в а н и я , является ли формула алгебры предикатов общезначимой. Это значит, что нет, и никогда не будет никакого вычислительного устройства, которому можно было поручить узнавание для произвольной формулы алгебры предикатов, является эта формула общезначимой или нет. Алгоритмическая неразрешимость проблемы общезначимости означает и одновременно неразрешимость проблемы выполнимости: не существует алгоритма для узнавания, является ли формула алгебры предикатов выполнимой. Неразрешимость проблемы общезначимости и выполнимости в общем случае делает особо ценными те частные случаи, когда такие алгоритмы существуют. Например, если замкнутая формула, содержащая n одноместных предикатов и не содержащая ни предикатов большей местности, ни функциональных символв, истинна при любой интерпретации на множестве из 2n элементов, то эта формула общезначима. Для проверки истинности формулы при любой интерпретации на конечном множестве из конечного числа элементов достаточно записать эту формулу без 1 Американский математик Алонзо Чёрч (Church, 1903–1995) доказал это в 1936 году. 34 кванторов, заменяя квантор общности конъюнкцией, а квантор существования – дизъюнкцией. Если получившаяся после такой замены формула окажется тождественно истинной формулой алгебры высказываний, то исходная формула алгебры предикатов будет истинна на этом множестве при любой интерпретации. Это значит, что для формулы, содержащей только одноместные предикаты, проблему общезначимости (или проблему выполнимости) можно решить, заменив формулу алгебры предикатов на формулу алгебры высказываний. Еще для двух классов формул решение проблемы общезначимости сводится к конечным моделям и, следовательно, к формулам алгебры высказываний. Проблема общезначимости алгоритмически разрешима для множеств формул вида (∀x1) (∀x2) ... (∀xn)[P(x1, x2, ... , xn)], (1) (∃x1)(∃x2) ... (∃xn)[P(x1, x2, ... , xn)], (2) где P(x1, x2, ... , xn) – бескванторная формула без функциональных символов. Отрицанием формулы вида (1) является формула вида (2), и поэтому если формула (1) опровержима, то это «опровержение» выполняется на некотором n-элементом множестве. Выполнимость формулы вида (1) на любом множестве из n элементов при любой интерпретации, означает, что эта формула истинна на множестве из любого числа элементов и тоже при любой интерпретации, т. е. общезначима. Аналогично, если формула вида (2) истинна при любой интерпретации на множестве из одного элемента, т. е. она общезначима. Решить проблему общезначимости для произвольной формулы АП путем сведения ее к формуле АВ не удастся (и не только потому что, иначе теорема Чёрча оказалось бы неверной). 35 Существуют формулы алгебры предикатов имеющих бесконечную модель, но ложные на любом конечном множестве. Таковой будет, например, формула, утверждающая, что предикат P(x, y) является отношением строго порядка, не имеющим максимальных элементов. АКСИОМАТИЧЕСКИЙ МЕТОД. Построение аксиоматической теории состоит из следующих основных этапов: 1) задание основных понятий (объектов теории), 2) задание основных отношений между основными объектами, 3) задание основных предложений об основных отношениях. Основные понятия и отношения является неопределяемыми, их свойства раскрываются в основных предложениях. Основные предложения принято называть аксиомами. Все логические следствия аксиом называют теоремами. Совокупность всех теорем и называют аксиоматической теорией. Математическая система является моделью аксиоматической теории, если для этой системы выполняются все аксиомы. Из выполнимости аксиом уже автоматически следует выполнимость на модели всех следствий этих аксиом, т. е. теорем. Аксиоматический метод позволяет изучать алгебраическую систему чисто логически, соприкоснувшись с ней ненадолго лишь в начале исследования, в момент проверки выполнимости аксиом. Какими свойствами может обладать (или не обладать) аксиоматическая теория? Первое, и самое главное свойство для хорошей системы аксиом – непротиворечивость. Аксиоматическая теория называется противоречивой, если она содержит некоторое предложение вместе со своим отрицанием. Противоречивая теория не имеет модели; и, наоборот, если теория непротиворечива, то она имеет мо36 дель. Непротиворечивая теория может иметь более одной модели. В математике изоморфные модели не считаются различными, «имеет две модели» – имеется в виду – «две неизоморфные модели». Теория категорична, если она имеет единственную модель, т. е. все ее модели изоморфны. Чтобы убедиться в некатегоричности теории, достаточно указать две ее модели и предложение в терминах теории, которое выполняется на одной модели и не выполняется на второй. Теория полна, если любое предложение в терминах этой теории можно доказать или опровергнуть («опровергнуть» – это значит доказать отрицание предложения). Неполнота теории означает, что список ее аксиом слишком мал. Но среди аксиом могут оказаться и лишние, тогда некоторые аксиомы могут быть получены из остальных в виде следствий, т. е. как теоремы. В этом случае система аксиом зависима. Для доказательства того, что предложение не выводимо из аксиом теории, достаточно привести модель теории, на которой не выполняется это предложение. Если, например, теория задается тремя аксиомами A1, A2, A3 и найдется модель для предложений A1, A2, A1, то это означает, что A1 не выводится из аксиом A2, A3. Действительно, в противном случае на этой модели (конкретном множестве с конкретными отношениями) выполнялось бы предложение A1 и его отрицание A1. Такой способ доказательства невыводимости одного предложения из других получил название «метода интерпретаций». 37 Именно методом интерпретаций была доказана независимость знаменитого пятого постулата от остальных аксиом евклидовой геометрии1. Теория называется полной, если любое утверждение в терминах этой теории можно вывести из аксиом или опровергнуть, т. е. доказать отрицание этого предложения. Если теория некатегорична, т. е. существует предложение, которое выполняяется для одной модели теории и не выполняется на другой модели, то это предложение нельзя не доказать, не опровергнуть. Некатегоричная теория не полна. Непротиворечивая теория полна в узком смысле (смысле Поста), если добавление к аксиомам любого предложения (в терминах теории), не являющегося теоремой, делает теорию противоречивой. Теория разрешима, если существует алгоритм, для проверки любого предложения в терминах этой теории, является он теоремой теории или нет. Например, законы логики алгебры высказываний можно описать аксиоматически (такое описание называют исчислением высказываний), и в этой теории теоремами будут в точности все тождественно истинные формулы: исчисление высказываний – разрешимая теория. С другой стороны, теорема Чёрча означает, что исчисление предикатов – теория неразрешимая. Теорию называют элементарной, если аксиомы этой теории можно записать формулами алгебры предикатов, навешивая кванторы только на предметные переменные. Если среди аксиом теории содержатся предложения, содержащие внутри фразы «для каждого предиката P ...» или «существует такой предикат P ...», то эта теория не элементарна. Однако первооткрыватели неевклидовой геометрии: Николай Иванович Лобачевский (1792–1856) и Карл Фридрих Гаусс (1777–1855) доказать непротиворечивость новой геометрии не смогли; метод интерпретаций остался ими незамеченным. 1 38 Может оказаться, что среди аксиом теории есть предложения, не являющиеся элементарными, однако возможно замена этого предложения другими, уже элементарными. Одна и та же теория может задаваться различными системами аксиом, и в различных аксиоматиках будут различны не только аксиомы, но даже и основные понятия (то, что является неопределяемым понятием в одной аксиоматике, окажется определяемым в другой; аксиомы одной теории в другой аксиоматике превращаются в теоремы). Кроме того, неэлементарная, но конечно аксиоматизируемая теория может быть представлена как элементарная, но с бесконечным числом аксиом. МАТЕМАТИЧЕСКОЕ ДОКАЗАТЕЛЬСТВО. Доказательством (или выводом) предложения B называют конечную цепочку предложений A1 , A2 , ... , An −1 , An , в которой каждое предложение Ai является либо аксиомой, либо получено из предыдущих Aj этой цепочки с помощью логических правил вывода. Последняя предложение цепочки формула An - это в точности формула B. Классическими правилами вывода являются: правило отделения и правило обобщения. Аксиомы – это частные случаи теорем (с самыми короткими доказательствами). Аксиоматическая теория В зависимости от вида примененных законов логики различают прямые и косвенные доказательства. Прямое доказательство - это доказательство, не использующее закона исключенного третьего. Примером прямого шага в доказательстве является правило отделения: если формула A & (A→B) является теоремой, то и формула B – тоже теорема. Символически это можно изобразить так: 39 Правило обобщение состоит в навешивании квантора общности на свободную переменную: Под словом «вывод» (или доказательство) понимается конечная цепочка предложений A1, A2, ... , An−1, An, в которой каждая Ai является либо аксиомой, либо получена из предыдущих Aj из этой цепочки с помощью правил вывода. Последняя формула цепочки An - это в точности формула B. Если каждое предложение в доказательстве изобразить одной точкой и провести отрезки согласно правилом вывода, то получившаяся картинка будет иметь вид родословного дерева формулы. Дерево это так же, как и генеалогическое дерево субъекта, «растет» сверху вниз. Высшие точки этого дерева (висячие вершины графа) являются или аксиомами, или данными формулами Ci; соединение двух ветвей в одну означает применение правила отделения, а продолжение ветви, но уже с квантором общности – применение правила обобщения. В каждом случае рождается новое предложение, а самая нижняя точка (корень дерева) – это и есть доказываемая теорема. Кром еосновыных правил вывода, можно применять производные правила. Например, таким является правило силлогизма: если A → B и B → C – теоремы, то A → C – тоже теорема. Применение силлогизма тоже прямой шаг. К прямым шагам относится и метод полной индукции (разбор случаев). Формула (A ∨ B) → C является следствием формул A → C и B → C. В этой 40 формуле два случая (A и B). В общем виде правило полной индукции принимает вид: если (A1 → B), (A2 → B), ..., (An → B) – теоремы теории, то (A1 ∨ A2 ∨ ... ∨ An) → B – тоже теорема этой теории. Аксиома полной индукции означает, что если множество M является объединением множеств Mi, то вместо предложения (∀x)[P(x)] об элементах всего множества M можно доказать n утверждений (∀x∈Mi)[P(x)] о меньших множествах. Не прямое доказательство является косвенным. Косвенное доказательство явно или скрыто опирается на закон исключенного третьего. Наиболее распространенный вид такого доказательства – это доказательство от противного. Доказательство этим методом использует тот факт, что формула A является следствием формул ( A → B ) и ( A → B ) : (A → B ) & (A → B ) ⇒ A . Косвенным доказательством является и применения закона контрапозиции. По закону контрапозиции формулы A → B и B → A равносильны: A→ B ⇔ B → A, эту равносильность (а не исходную тожественно истинную формулу) обычно и называют аконом контрапозиции. 41 Остановимся чуть подробнее на законе контрапозиции1. Типичная математическая теорема имеет вид высказывания A → B. Предложение A принято называть условием (или посылкой) теоремы, а предложение B – заключением. Предложения A → B и B → A называют взаимно обратными. Таким образом, если A→B - прямая теорема, то B → A – обратная теорема. Предложение A → B в такой ситуации называют противоположной теоv ремой, а, B → A , полученное из прямой теоремы сначала обращением, а затем переходом к противоположной – теоремой, противоположной обратной. Закон контрапозиции означает, что п р я м а я т е о р е м а и т е о р е м а противоположная обратной выполняются или не выполняются одновременно. Заметим, что теорема – это всегда истинное утверждение, ложных теорем не бывает, а замечание о равносильности теорем означает, что когда доказана (т.е. действительно истинна) прямая теорема, то теорема, противоположная обратной в доказательстве уже не нуждается. Итак, пусть A → B теорема. Прочесть это высказывание можно по-разному. «Если A, то B», «A влечет B», «B тогда, когда A», «для B достаточно A», «A – достаточное условие для B» – все эти предложения означают одно и то же: A → B. Предложение B → A , означает, что если нет B, то нет и A; или, другими словами, для получения A невозможно обойти B. Или еще короче: B – необходимое условие для A. v По закону контрапозиции предложения B → A и A→B выполняются или не выполняются одновременно (они равносильны). Таким образом, и в утверждении A → B высказывание B является необходимым условием для A. Тем более, что в гуманитарной среде применение закона контрапозиции обычно вызывает затруднения. Например, апологетами христианства считается, что христианско-библейское: «кто не против нас, тот с нами» значительно мягче сурового большевистского – «кто не с нами, тот против нас». Однако по закону контрапозиции эти два предложения логически равносильны. 1 42 Итак, п о с ы л к а т е о р е м ы – д о с т а т о ч н о е у с л о в и е д л я е е з а ключения, а заключение теоремы – это необходимое условие для ее посылки. Может случиться, что выполняется и прямая (A → B) и обратная (B → A) теоремы. Тогда каждое из условий является необходимым и достаточным для другого, а теорему можно записать в виде A ↔ B. Теорему вида A ↔ B («для A необходимо и достаточно B» или «A тогда и только тогда, когда B») в математике принято называть критерием1. 1 от греческого κριτεριον - средство суждения. 43 2. БИНАРНЫЕ ОТНОШЕНИЯ. ФУНКЦИОНАЛЬНОЕ ОТНОШЕНИЕ И ОТНОШЕНИЕ ПОРЯДКА. ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ И РАЗБИЕНИЕ НА КЛАССЫ, ФАКТОРМНОЖЕСТВО Основные понятия: бинарное отношение, композиция отношений, обратное отношение, рефлексивность, транзитивность, симметричность, антисимметричность, связность, функциональность, функция, порядок предпорядок, ассоциированность, эквивалентность, разбиение на смежные классы, фактормножество. Основные факты: отношение порядка можно изоморфно представить отношением включения для множеств; отношение эквивалентности задает разбиение множества на классы; разбиение на классы определяет разбиение множества на классы. ДЕКАРТОВО ПРОИЗВЕДЕНИЕ. Декартовым произведением А × В называют множество, состоящее из всевозможных пар (a, b), где a - элемент множества А, а b - элемент множества В: А × В = {(a, b)  a ∈ A, b ∈ B}. Множества А и В могут и совпадать, А = В; тогда говорят о декартовом квадрате множества А: А×А = А2 = {(a, b)  a, b ∈ A}. Наглядно декартово произведение кругами Эйлера не изображается. Рассмотрим графическое изображение декартова произведения на примере небольших конечных множеств. Пусть А = {a, b, c, d, e}, и B = {x, y, z, t}. 44 Изобразим каждый элемент множества A в виде вертикального отрезка, а затем на этом же представлении множества A изобразим горизонтальными отрезками элементы множества В. Точки пересечения отрезков - это и есть наглядное представление элементов декартова произведения A × B. В математике чрезвычайно важную роль игра- Декартово произведение ет декартов квадрат R × R множества действительных чисел. Именно этот случай и рассматривался автором1, фамилия которого присутствует в названии понятия. В изображении декартова квадрата R × R вместо отрезков берутся вертикальные и горизонтальные прямые. Эти прямые сплошь и в два слоя покроют всю плоскость. На каждой вертикальной прямой отмечают по одной точке и эти точки, сливаясь в прямую, образуют ось абсцисс. Представители горизонтальных прямых сливаются в ось ординат. В отличие от конечного множества невозможно пометить все элементы из R. Однако если выделить на вертикальной и горизонтальных осях точки, соответствующие единицам, то появляется возможность, указать местоположение всех остальных действительных чисел. Такое изображение декартова квадрата R × R называют декартовыми прямоугольными координатами. ОТНОШЕНИЯ. Подмножество декартова квадрата M × M множества M называют бинарным (т. е. двухместным) отношением на множестве M. Если два элемента x и y из множества M находятся в бинарном отношении Т, то пишут: x T y. Рене Декарт (Descartes, 1596–1650) – французский философ и математик. Метод координат, понятие переменной величины, алгебраической кривой впервые появились в его книге «Геометрия» (1637 г.). 1 45 Подмножество S декартова куба множества M, S ⊂ M 3 = M × M × M = { (a1 , a2 , a3 ) a1 , a2 , a3 ∈ M } , образует трехместное отношение на M, и вообще подмножество n-ой декартовой степени S ⊂ M n = M × M ×...× M = 144244 3 { (a1, a2 , ... , an ) a1 , a2 , ... , an ∈ M } n является n-местным отношением на множестве M. Наименьшее значение n равно единице. Одноместное отношение - это просто подмножество множества M. Отношения: равенства (х = y), неравенства (х ≠ y), больше (х > y), меньше (х < y), не больше (х ≤ y), не меньше (x ≥ y) на множестве чисел; параллельности (x y ), перпендикулярности ( x ⊥ y ) на множестве прямых и плоскостей; вклю- чения (X ⊂ Y), пересекаемости (X ∩ Y ≠ ∅), непересекаемости (X ∩ Y = ∅), дополняемости (X ∩ Y = ∅ и X ∪ Y = U ) на некотором множестве U; логического следования, Р(х) ⇒ Q(x), и логической равносильности, Р(х) ⇔ Q(x) на множестве предикатов (в частности следования и равносильности на множестве уравнений и неравенств и их систем); делимости ( x y ) равенства остатков при делении на число m на множестве целых чисел – это еще далеко не полный список бинарных отношений курса математики. Все двуместные операции (сложение, умножение, вычитание, нахождение остатка от деления, нахождение наибольшего общего делителя, нахождение наименьшего общего кратного и т.п.) являются трехместными отношениями. Например, равенство типа: x + y = z является утверждением о трехместном отношении: для некоторых троек (x, y, z) это равенство верно, а для некоторых 46 нет. Трехместным является отношение «лежать между» для трех точек на одной прямой. Теорема о делении с остатком связывает четыре числа (делимое a, делитель b, неполное частное q и остаток r) в четырехместном отношении: a = b ⋅ q + r. Подмножество декартова произведения A × B называют соответствием между элементами множеств A и B. Наглядно соответствие (и в частности, бинарное отношение) можно представить в виде графа или в виде графика. ГРАФ И ГРАФИК СООТВЕТСТВИЯ. Пусть S - соответствие между множествами А и В. Изобразим элементы множества А и В точками и соединим точки, находящиеся в соответствии S стрелками, а именно: если u S w, то проведем стрелку из точки u в точку w: Заметим, что «стрелка» – это вовсе не обязательно отрезок прямой – она может петлять и самопересекаться, но важно лишь то, что «стрелка» начинается в u и заканчивается в w. Получившаяся в результате картинка называется графом соответствия S. Рассмотрим пример соответствия на небольших множествах. Пусть даны два множества A и B и соответствие S между элементами этих множеств, А = {a, b, c, d, e}, B = {x, y, z, t}, S = {(a, x), (a, t), (b, t), (c, x), (e, t)}. 47 Граф соответствия S имеет вид: Если на графическом изображении декартова произведения выделить цветом точки, попавшие в соответствие S. то получим график соответствия: Число выделенных точек на графике равно числу стрелок на графе (и равно числу элементов соответствия). ОПЕРАЦИИ НАД БИНАРНЫМИ ОТНОШЕНИЯМИ. Отношения – это всего лишь подмножества особого типа; поэтому над ними могут производиться обычные теоретико-множественные операции: объединение, пересечение и дополнение. Эти операции могут использоваться и при задании самих бинарных отношений. Если предикаты P(x, y) и Q(x, y) задают отношения T и S на множестве M, то объединение T∪S этих отношений задается предикатом или Q(x, y)», T ∪ S = { ( x, y ) ∈ M × M P( x, y ) ∨ Q( x, y )} 48 «P(x, y) а пересечение T ∩ S - предикатом «P(x, y) и Q(x, y)», T ∩ S = { ( x, y ) ∈ M × M P( x, y ) & Q( x, y )}. Например, если T на множестве действительных чисел R задается предикатом «x > y», а S - предикатом «x = y», то объединение отношений T и S задается дизъюнкцией: «x > y или x = y»: T ∪ S = { ( x, y ) ∈ R × R x > y ∨ x = y}. Вместо записи «x > y или x = y» пишут: x ≥ y. Пересечение T ∩ S этих же бинарных отношений является пустым (предикаты «x = y» и «x > y» - несовместны), множество T ∩ S = { ( x, y ) ∈ R × R x > y & x = y} не содержит ни одного элемента: ни одна пара чисел не связана отношением T ∩ S , предикат «x > y и x = y» всегда ложный, а соответствующее множество пусто. Если отношение S задается предикатом Q(x, y), то S , дополнение отношения S, задается предикатом Q ( x, y ) , S= { ( x, y ) ∈ M × M } Q (x ) . Например, если S, как и раньше, отношение равенства на множестве R, S = { ( x, y ) ∈ R × R x = y}. 49 то S - отношение неравенства, S = { ( x, y ) ∈ R × R x ≠ y}. Обратное отношение задается изменением порядка мест в исходном предикате. Если отношение T задается предикатом P(x, y), T = { ( x, y ) ∈ M × M P( x, y )}, то обратное к T отношение T – 1 задается предикатом Р(y, x): T −1 = { ( x, y ) ∈ M × M P( y, x )}. Например, если T = { ( x, y ) ∈ R × R x < y}, то T −1 = { ( x, y ) ∈ R × R x > y}. Композиция T o S отношений T и S соединяет эти отношения через среднее, промежуточное место: x (T o S) z тогда и только, когда найдется элемент y такой, что x T y и y S z. Таким образом, множество-носитель алгебры бинарных отношений на множестве M – это булеан P(M × M ) , а основных операций в это алгебре пять: пересечение, объединение, дополнение, обращение и композиция. Иногда операции обращения и композиции не дают новых отношений. Например, если S – отношение равенства, то S −1 = S и S o S = S . При построении графа бинарного отношения, как правило, нет необходимости брать два экземпляра исходного множества. 50 Например, пусть S ={(a, b), (a, a), (b, c), (d, c), (d, d)} – бинарное отношение на множестве {a, b, c, d}. Это отношение можно представить двумя графами. Графы отношения S Два отношения S и T могут совпадать (как множества) или включаться одно в другое. Если отношения S включается в отношение T, S ⊂ T , то говорят, что T – следствие (или продолжение) отношения S (а S – ограничение отношение T). СВОЙСТВА БИНАРНЫХ ОТНОШЕНИЙ. Отношение T на множестве M называют рефлексивным1 если x T x для всех элементов x из M. Отношение T рефлексивно, если оно содержит диагональ, I⊂T. Отношение T транзитивно2, если из x T y и y T z следует x T z. Отношение T симметрично, если из x T y следует y T x. Отношение T антисимметрично, если из x T y и y T x следует x = y. Отношение T называют связным, если любые два элемента множества связаны этим отношением (для каждых x, y): x T y или y T x. Отношение T называется иррефлексивным, если ни один из элементов множества не находится в отношении T сам с собой. Иррефлексивность T равносильна рефлексивности T . 1 2 От латинского слова reflex — отражение. От латинского tranzit — передача. 51 Отношение T называется асимметричным, если x T y и y T x не выполняются одновременно для любых x, y: из x T y следует, что y, x не находятся в отношении T. На графе рефлексивного отношения каждый элемент имеет стрелку, острие которой упирается в начало (петлю). Отношение рефлексивно тогда и только тогда, когда оно содержит диагональ I = {( a, a ) a ∈ M}. График иррефлексивного отношения имеет с диагональю пустое пересечение. Отношение T транзитивно, если T o T ⊂ T . Если на графе транзитивного отношения три точки x, y, z связаны стрелками, то непременно должна быть и третья стрела, соединяющая элементы x и z. Транзитивность отношения T означает, что если два элемента связаны композицией этого отношения, то они тоже находятся в этом же отношении, T o T ⊂ T. Рассмотрим особенности графика транзитивного отношения T. Пусть точка A соответствует паре (a, b), а точка C — паре (b, c). Если a T b и b T c, то точки A, B принадлежат графику и точка D(a, c) тоже является точкой графика. Точка B(b, b), находится на диагонали и является четвертой точкой прямоугольника ABCD. Если a, b, c заданы, т. е. определены точки A, B, C, то ч е т в е р т а я вершина D попадет в график тогда и только тогда, когда отношение T транзитивно. 52 Отношение T симметрично, если T −1 ⊂ T . Симметричность отношения означает, что если на его графе есть стрелка, идущая в одном направлении, то обязательно есть вторая стрелка, идущая в противоположном направлении. Точки (a, b) и (b, a) графика отношения лежат относительно диагонали I, следовательно, г р а ф и к симметрично симметричного о т н о ш е н и я с и м м е т р и ч е н о т н о с и т е л ь н о д и а г о н а л и . Отношение T симметрично, если T = T–1, т. е. график симметричного отношения не изменится, если его симметрично отразить в диагонали. Если отношение антисимметрично и на его графе из точки x идет стрелка в точку y, то обратного пути из y в x уже нет. На графике антисимметричного отношения нет ни одной пары различных точек, симметричных относительно диагонали. Одновременное выполнение x T y и y T x означает, что элементы x, y связаны отношением T ∩ T −1. Для асимметричного отношения это пересечение пусто, T ∩ T − 1 = ∅ , а для антисимметричного отношения T ∩ T −1 ⊂ I , т. е., в частности, может быть и пустым (если T — иррефлексивно). 53 Связность отношения T означает, что объединение отношения и его обратного совпадает со всем декартовым квадратом: T ∪ T −1 = M × M . Рефлексивное, транзитивное и симметричное отношение называют отношением эквивалентности. Рефлексивное, транзитивное и антисимметричное отношение называют отношением порядка. Рефлексивное и транзитивное отношение называют отношением предпорядка. Рефлексивное и симметричное отношение называется толерантностью. Отношение F называют функциональным (функцией), если (x, y1) ∈ F и (x, y1) ∈ F ⇒ y2 = y2. Отношение является функциональным, если F −1 o F ⊂ I . Основные виды бинарных отношений: ф у н к ц и я , э к в и в а л е н т н о с т ь , порядок. ФУНКЦИЯ. Рассмотрим соответствие S между элементами множеств A и B: S ⊂ A × B . Обозначим символом S(a) множество всех элементов из B, находящихся в соответствии S с элементом a из A: 54 S (a ) = {b ∈ B aSb}. Множество S(a) называют полным образом элемента a; любой элемент из S(a) называется образом элемента a в B. Полный образ элемента может быть пустым множеством, но может состоять из нескольких элементов. На графе соответствия S образ элемента a – это все точки в множестве B, в которые упираются острия стрел, выходящих из точки a. Пусть b – элемент из множества B. Любой элемент из A,находящийся в соответствии S с элементом b, принято называть прообразом элемента b в A. Множество всех прообразов образует полный прообраз элемента b. Полный прообраз обозначают символом S–1(b): S −1(a) = { a ∈ A aSb}. На графе отношения S полный прообраз элемента b – это все точки выхода стрел с остриями в B. Соответствие между элементами множеств A и B является функциональным (или функцией, или отображением из A в B), если длякаждогоэлемента a из A полный образ F(a) состоит не более чем из одного элемента. Это означает, что для каждых элементов x из A и y1, y2 из B x F y1 и x F y2 ⇒ y1 = y2. Функциональностьсоответствия F между элементами множеств A и B означает, что каждый элемент из A имеет н е б о л е е о д н о г о о б р а з а в B. 55 По существующей традиции для функционального соответствия F принято изменять порядок символов в записи x F y, окружать символ x круглыми скобками, а перед символом F ставить знак равенства. Иначе говоря, для функционального соответствия F вместо x F y пишут: y = F(x). Элемент x в такой ситуации принято называть аргументом, а элемент y — функцией x. Таким образом, слово «функция» двусмысленно – во-первых, это само отображение F, во-вторых, результат отображения F(x) элемента x. ГРАФ И ГРАФИК ФУНКЦИИ. Функциональность соответствия F подчеркива- ют особой записью, в которой участвуют и множества A и B. Запись F : A → B означает, что F — функция, определенная в множестве A со значениями в множестве B. На графе функции из каждой точки a множества A выходит не более одной стрелки, а на вертикалях графика функции находится не более одной отмеченной точки. Множество действительных чисел можно изобразить в виде числовых прямых. На этом изображении можно поместить граф функции. Если провести все стрелки, то плоскость окажется полностью заштрихованной ими. Однако граф функции можно представить наглядно с помощью графика этой функции. Дело в том, стрелки на графе функции — это не обязательно отрезки прямых. Стрелкой может быть любая линия, например, ломаная из двух звеньев. Это свойство дает возможность увидеть на графике числовой функции ее граф. Проведя стрелки графа в виде ломаных (состоящих их двух звеньев: одно параллельно оси абсцисс, а второе параллельно оси ординат) и отмечая на плоскости лишь точку излома стрелки, мы получим график функции. По этому графику можно восстановить любую стрелку графа. Можно считать, что мы видим граф (замаскированный) и график (явный) функции одновременно. 56 Граф функции Граф (график) фунции Важным случаем функции является алгебраическая операция. АЛГЕБРАИЧЕСКАЯ ОПЕРАЦИЯ И ТАБЛИЦА КЭЛИ. Алгебраической операцией на множестве M называют отображение f декартовой n-й декартовой степени Mn множества M в себя f : M n → M . Число n называется местностью, или арностью операции. Наиболее распространены двухместные (бинарные) и одноместные (унарные) операции. Символом f (x1, x2, ..., xn) обозначают образ элемента (x1, x2, ..., xn) из Mn. Для конкретных элементов (a1, a2, ..., an) из M элемент f (a1, a2, ..., an) принадлежит множеству M. При алгебраической операции каждый элемент из Mn должен иметь образ. Иначе говоря, отображение f является всюду определенным. Если областью определения f является не все множество Mn, то говорят, что f – частичная операция на M. Одноместная операция f — это просто отображение множества M в себя. Двухместная операция - это отображение декартова квадрата M × M в множество M. Такая операция отображает каждую пару элементов (a, b) в элемент f(a, b). 57 Пусть на множестве M задана операция. Обозначим эту операцию символом o , т. е. каждому элементу (a, b) из декартова произведения M × M соответствует элемент a o b из M. Представив элементы M в виде вертикальных и горизонтальных полос, получим наглядное представление декартова произведения M × M в виде квадрата, расчерченного на эти полосы. Элемент (a, b) Двухместная операция изображается пересечением a-горизонтали и b-вертикали. Операция f отображает квадратик (a, b) в a o b. Это наглядное теоретическое изображение можно сделать удобным и для практического использования, если поместить элемент a o b непосредственно в квадратик (a, b). Полученную таблицу действия операции f называют по имени автора1 таблицей Кэли. Таблица умножения, изображаемая на обложках школьных тетрадей и ошибочно называемая «таблица Пифагора», представляет собой начальный фрагмент бесконечной таблицы Кэли для опеТаблица Кэли рации умножения на множестве натуральных чисел. Пусть A = < A; ∗ > - алгебра с одной двуместной операцией, обозначенной символом ∗. Это значит, что любой паре элементов a, b из множества A соответствует в точности один элемент a ∗ b из того же множества A. Операция ∗ ассоциативна, если для любых элементов a, b, c из A выполняется равенство 1 Артур Кэли (1821–1895) - английский математик, с 1963 г. профессор Кембриджского университета. 58 (a ∗ b) ∗ с = a ∗ (b ∗ с). Например, сложение и умножение чисел – ассоциативные операции, а возведение в степень и вычитание – не ассоциативные. Операция ∗ коммутативна, если для любых элементов a, b из A a ∗ b = b ∗ a. Например, сложение и умножение целых чисел – коммутативные операции, а возведение в степень и вычитание - не коммутативные. Элемент e из A называется нейтральным (или единицей) для операции ∗, если для любого элемента a из A a ∗ e = e ∗ a = a. Например, числовая единица является нейтральным элементом для умножения, а числовой нуль – нейтральный элемент для сложения чисел. Может случиться, что элемент действует нейтрально лишь с одной стороны. Элемент e из A называется правым нейтральным (правой единицей) для операции ∗, если для любого элемента a из A a ∗ e = a, и соответственно левым нейтральным (левой единицей), если e ∗ a = a. Например, числовая единица является правым нейтральным элементом 59 для операции «возведение в степень» и не является левым нейтральным для той же операции. Аналогично, число нуль – правый (но не левый) нейтральный элемент для операции «вычитание». Элемент o из A называют поглощающим (или нулем, или аннулятором) для операции ∗, если для любого элемента a из A a ∗ o = o ∗ a = o. Например, числовой нуль – это поглощающий элемент для умножения чисел. Как и в случае с единицей, с нулем может случиться то же самое: он поглощает любой элемент лишь при умножении с одной стороны. Элемент o из A называется правым поглощающим (правым нулем) для операции ∗, если для любого элемента a из A a ∗ o = o, и соответственно левым поглощающим (левым нулем), если o ∗ a = o. Например, числовая единица является левым поглощающим элементом (левым нулем) для операции «возведение в степень» и не является правым нулем для той же операции. Наиболее интересная, полезная и достаточно тесная связь между двумя двухместными операциями — это дистрибутивный закон. Пусть одна операция в алгебре называется «сложение» и обозначается символом +, а вторая «умножение», и обозначается, как обычно, точкой (или ничем). 60 Тогда дистрибутивный закон означает, что для любых элементов для каждых элементов a, b, c из A a ⋅ (b + c)= (a ⋅ b) + (a ⋅ c), (b + c) ⋅ a = (b ⋅ a) + (c ⋅ a). Чаще всего операция, играющая роль умножения, коммутативна, и двойная запись дистрибутивного закона не требуется. Операции сложения и умножения (или операции, играющие эти роли) могут иметь самое различное происхождения и выполняться на разных множествах. Однако всегда договариваются о приоритетности умножения перед сложением; и, таким образом, отпадает необходимость в расстановке скобок в выражении справа. Дистрибутивный закон принимает вид: a (b + c) = ab + ac, (b + c) a = ba + ca. ОТНОШЕНИЕ ПОРЯДКА. Отношение T – порядок (точнее, частичный порядок) на множестве M, если T: – рефлексивно ( T ⊃ I ); – транзитивно ( T o T ⊂ T ); – антисимметрично ( T ∩ T −1 ⊂ I ). Множество M в таком случае называют частично упорядоченным. Связный порядок называют линейным (а линейно упорядоченное множество называется цепью). Упорядоченные множества, изоморфные как модели, называют упорядоченными по одному типу. 61 Упорядоченным является множество подмножеств данного множества, и, более того, любой тип упорядочения множества M можно представить отношением включения на подмножестве множества P(M). На графе отношения порядка принято не ставить стрелки, не выделять петлеобразные стрелки, соответствующие рефлексивности, и не проводить линии, являющие следствием транзитивности. Произвольный порядок (и частичный и линейный) часто обозначают символом p. Символ, изображающий конкретное отношение порядка, обычно не симметричен: например, ≥ – «не меньше», ≤ – «не больше», ⊂ – «включается» , ⇒ – «влечет» и т.п. Элемент m из упорядоченного множества < M; ≤ > называется наибольшим, если для любого элемента x выполняется x ≤ m. Аналогичным образом определяется наименьший элемент в M: m называется наименьшим, если для любого элемента x выполняется m ≤ x. Элемент m называют максимальным, если в множестве M не существует такого элемента x, что m < x. Элемент m называют минимальным, если в множестве M не существует такого элемента x, что x < m. Для частичного порядка понятия максимального и наибольшего (равно, как и минимального и наименьшего) не совпадают. Например, в множестве собственных (т. е.отличных от единицы и самого числа) делителей числа 60, упорядоченном отношением делимости, нет наибольшего элемента, но есть три максимальных {12, 20, 30}. Нет там и наименьшего элемента, но зато есть три минимальных { 2, 3, 5 }. Если элемент является наибольшим, то он будет максимальным. Обратное утверждение, как показывает приведенный пример, неверно. Точно также, 62 наименьший элемент — минимальный, а обратное утверждение неверно. Однако если множество упорядочено линейно, то максимальный элемент будет и наибольшим (а минимальный — наименьшим). Иначе говоря, для линейного порядка понятия максимального и наибольшего (минимального и наименьшего) элементов совпадают. Линейно упорядоченное множество называют вполне упорядоченным, если в нем каждое непустое подмножество имеет наименьший элемент. В 1904 г. Э. Цермело1 доказал, что любое множество можно вполне упорядочить. Доказательство опирается на аксиому выбора и, более того, из теоремы Цермело следует аксиома выбора, т. е. аксиома выбора и теорема Цермело равносильны. Доказательство Цермело носит косвенный характер, и пока никому не удалось привести хотя бы один пример вполне упорядочения множества R действительных чисел. Аксиома выбора имеет и другую, равносильную формулировку, вошедшую в историю как лемма Цорна1: если каждая цепь частично упорядоченного множества имеет верхнюю грань, то каждый элемент множества не превышает некоторого максимального элемента из этого же множества. В частности, лемма Цорна означает, что при таком свойстве цепей в множестве непременно должен быть максимальный элемент. Для доказательства существования максимальной подалгебры с заданными свойствами, базиса бесконечномерного пространства и т.п. приходится использовать аксиому выбора в виде леммы Цорна. РЕШЁТКИ. Во введении уже упоминалась алгебра, которая связана с изучением любой алгебры или алгебраической системы. Такой алгеброй является решётка. Дадим сейчас точное определение этого объекта. Эрнст Цермело (Zermelo, 1871–1953) — немецкий математик, один из создателей аксиоматической теории множеств. 1 63 Пусть M – множество, упорядоченное отношением ≤, и a, b – два элемента из M. Любой элемент, который больше и a, и b, называют верхней гранью этих элементов. Наименьшая верхняя грань называется точной верхней гранью. Аналогично определяется точная нижняя грань как наибольший элемент из нижних граней. Множество называется решёточно упорядоченным (или решёткой), если для каждой пары его элементов существует точная верхняя и точная нижняя грани. Наглядно ситуацию можно представить с помощью графа отношения порядка. На этом графе точная верхняя грань элементов a, b располагается над этими элементами, и ближе к этим элементам приблизиться сверху нельзя. Аналогично, предельно близко снизу к этим элементам располагается точная нижняя грань. Граф отношения решёточного порядка будет, вообще говоря, состоять из фрагментов, указанных на рисунке. Слова «вообще говоря» относится к тому, что в частных случаях элементы a, b могут оказаться сравнимыми, т.е. один элемент будет больше (или меньше) другого, и тогда ромб превратится в отрезок. Точные грани, если они существуют, единственны; поэтому можно считать, что «взятие точной грани» и «взятие точной нижней грани» — это две двухместные операции решетки. Обычно верхнюю грань обозначают символом ∨, а нижнюю — символом ∧: Может встретиться ситуация, когда точные верхние грани двух элементов существуют, а нижние — нет. Тогда говорят соответственно о верхней (и Макс А́вгуст Цорн (Zorn, 1906 —1993) – немецкий математик (с 1934 г. в США). Кроме леммы Цорна (1935 г.), Макс Цорн известен рядом работ в области алгебры (преимущественно теории групп) и численного анализа. 1 64 аналогично, нижней) полурешетке. Если грани существуют не только для двух, но и для любого множества элементов, то решетку называют полной. Непосредственно из определения граней следует, что операции решетки ассоциативны, коммутативны, идемпотентны и связаны законами поглощения. Наименьший элемент решетки называют нулем; нуль решетки является поглощающим элементом для взятия точной нижней грани и нейтральным для взятия точной верхней грани. Наибольший элемент решетки называют единицей. Единица решетки является поглощающим элементом для взятия точной верхней грани и нейтральным для взятия точной нижней грани. Решетку подалгебр алгебры A обозначают символом1 L(A) и называют структурой, сопутствующей алгебре A. В общей ситуации множество подалгебр может и не оказаться решеткой (точнее, будет лишь частичной решеткой, т. е. операции объединения и (или) пересечения будут выполнимы не всегда). Тогда под символом L(A) понимается частичная решетка. Например, множество подполугрупп полугруппы может оказаться лишь верхней полурешеткой. Для групп, колец, полей множества соответствующих подалгебр образуют полноценные решетки. Более того, множество подгрупп группы, множество подколец кольца, множество подполей поля являются решетками с единицей и нулем. Исследование алгебры (алгебраической системы) состоит, в частности, в изучении решетки ее подалгебр (подсистем). Иногда с помощью решеток подалгебр можно установить неизоморфнность объектов, так как если алгебры A1 и A2 изоморфны, то решетки L (A1) и L (A2) тоже изоморфны. Правда, изоморфизм решеток алгебр является необходимым, но недостаточным условием изоморфизма самих алгебр. 1 Буква L — первая буква английского Lattice — решетка. 65 Алгебры с изоморфными решетками могут оказаться неизоморфными. Например, две группы простых и различных порядков неизоморфны, но имеют изоморфные решетки подгрупп, состоящие только из тривиальных подгрупп. Решетка L= < L; ∧, ∨ > называется дистрибутивной, если операции ∧ и ∨ связаны законами дистрибутивности: x ∧ (y ∨ z) = (x ∧ y) ∨ (x ∧ z); x ∨ (y ∧ z) = (x ∨ y) ∧ (x ∨ z). Множество подмножеств некоторого множества с операциями «пересечение» и «объединение», операциями множество «дизъюнкция» классов и равносильных «конъюнкция», высказываний множество с целых неотрицательных чисел с операциями «наибольший общий делитель» и «наименьшее общее кратное», множество событий с операциями «и», «или» являются дистрибутивными решетками. Таким образом, объектами изучения теории множеств, математической логики, теории чисел и теории вероятностей являются дистрибутивные решетки. Для групп, колец и поле решетка подалгебр может оказаться случайно и дистрибутивной, но в общем случае это не так. Например, решетка подгруппг симметрической группы S3 уже не дистрибутивна. Дистрибутивная решетка является частным случаем решетки модулярной. Решетка L называется модулярной (или дедекиндовой1), если в ней выполняется тождество x ∧ ((x ∧ y) ∨ z) = (x ∧ y) ∨ (x ∧ z). 66 Из тождества дистрибутивности следует тождество модулярности: x∧((x∧y)∨z) = (x∧(x∧z))∨(x∧z) = (x∧y)∨(x∧z), поэтому каждая дистрибутивная решетка — модулярна. Обратное утверждение неверно, например, решетка нормальных подгрупп всегда модулярна, но не всегда дистрибутивна. ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ. Рефлексивное, транзитивное и симмет- ричное отношение называют эквивалентностью2. Отношение T – эквивалентность на множестве M, если T: 1) рефлексивно ( T ⊃ I ); 2) транзитивно ( T o T ⊂ T ); 3) симметрично ( T −1 ⊂ T ). Эти условия можно заменить одним: бинарное отношение R на множестве M является эквивалентностью тогда и только тогда, когда (R o R )∪ I = R . −1 Эквивалентность часто обозначают символом ~, то есть ~ – эквивалентность на M, если для любых x, y, z из M 1. x~x; 2. x ~ y ⇒ y ~ x ; 3. x ~ y, y ~ z ⇒ x ~ z . Конкретные эквивалентности (например, равенство, подобие фигур, паРихард Юлиус Вильгельм Дедекинд (Dedekind, 1831–1916) — немецкий математик, ученик К. Гаусса, профессор высшей технической школы в Брауншвейге (1862–1912). 2 От латинских: aequus – равный и valentis – имеющий силу, значение, цену; т.е. эквивалентный означает равносильный, равнозначный, равноценный. 1 67 раллельность прямых, равносильность предикатов, равномощность множеств и т.п.) имеют и свои личные обозначения. Эти обозначения обычно симметричны (= , ≅, , ⇔, ≡ и т. п.). Пересечение эквивалентностей снова является эквивалентностью, и поэтому каждое бинарное отношение содержится в некоторой наименьшей эквивалентности. Отношение, обратное отношению эквивалентности, само является эквивалентностью. Произведение R1 o R2 двух эквивалентностей R1 и R2 тогда и только тогда является эквивалентностью, когда R1 и R2 перестановочны: R1 o R2 = R2 o R1. Произведение R o S двух перестановочных эквивалентностей является наименьшей эквивалентностью, содержащей R и S. Граф отношения эквивалентности распадается на отдельные, не связанные между собой части, а в каждой части отношение является полным. ЭКВИВАЛЕНТНОСТЬ И РАЗБИЕНИЕ МНОЖЕСТВА НА СМЕЖНЫЕ КЛАССЫ. Рассмотрим сначала на примере особенности графа и графика отношения эквивалентности. Зададим на множестве M = {a, b, c, d, e, f} отношение эквивалентности T. Множество M конечно, поэтому T просто перечисляем: T = {(a, a), (a, b), (a, c), (b, a), (с, a), (b, c), (c, b), (b, b), (c, c), (d, d), (d, e), (e, d), (e, e), (f, f)}. Можно непосредственно убедиться, что T - рефлексивно, транзитивно и симметрично, т.е. является отношением эквивалентности на множестве M. Впрочем, все перечисленные свойства еще лучше видны на графе и графике отношения T. 68 Бросается в глаза следующая особенность этого графа: граф распадается на отдельные острова, причем ни один остров никак не связан ни с каким другим, внутри же каждого острова проведены все, какие только можно, стрелки (ограничение отношения T на каждом острове является полным отношением). Особые свойства графика отношения эквивалентности T тоже видны невооруженным глазом: этот график распадается на отдельные квадраты, диагонали которых лежат на диагонали I декартова квадрата множества M. График представляет собой серию квадратов, нанизанных на диагональ. В один квадрат на графике эквивалентности попадают элементы одного острова из графа этой эквивалентности. Различные квадраты графика не имеют общих точек. Рассмотрим теперь общую ситуацию, дав предварительно точное определение системе «островов», возникших на графе эквивалентности (заодно будет раскрыта и тайна черных квадратов на графике эквивалентности). Систему непустых подмножеств M1, M2, ..., Mn (здесь n не обязательно конечное число) множества M называют разбиением M на смежные классы, если: 1) объединение1 множеств Mi совпадает со всем множеством M, M1 ∪ M2 ∪ ... ∪ Mn = M; 1 Для объединения смежных классов часто используется вместо символа ∪ символ . 69 2) различные множества Mi, Mj не пересекаются, если Mi ≠ Mj, то Mi ∩ Mj = ∅. На рисунке изображено множество M, разбитое на смежные классы M1, M2, ..., Mn, причем в каждом классе указан представитель своего класса Множество x1, x2, ..., xn образует полную систему представителей. Слово «система» означает, что порядок элементов – существенен. Картинка может быть и другой, более лаконичной. Изобразим отношение включения для множеств, подразумевая, по умолчанию, что пустое пересечение не изображается. В быту обычно используется гибрид этих схем, т.е. на графе отношения включения вместо точек кругами или прямоугольниками изображены смежные классы и здесь же названия этих классов. На множестве M, разбитом на смежные классы, введем бинарное отношение T по правилу: x T y ⇔ x, y принадлежат одному классу. Отношение «быть одноклассником» рефлексивно, транзитивно и симметрично, иначе говоря, T - эквивалентность. Разбиение множества на классы определяет отношение эквивалентности на этом множестве. 70 Выполняется и обратное утверждение: э к в и валентность на множестве M определяет разбиение этого множества на классы. Пусть ~ – эквивалентность на множестве M и x элемент из M. Рассмотрим множество [x] всех элементов из M, эквивалентных элементу x. Множество [x] называют смежным классом по эквиваz ∈ [x] ∩ [y] лентности ~ с представителем x. Заметим что для любых x, y из M x ~ y ⇔ [x] = [y]. Так как отношение ∼ рефлексивно, каждый элемент x принадлежит множеству [x]. Отсюда следует: во-первых, каждое такое множество не пусто, вовторых, объединение всех подмножеств – это все множество M. Если пересечение двух классов [x] и [y] не пусто, то существует такой элемент z, который принадлежит одновременно каждому из них. Тогда имеем: [x] = [z] и [y] = [z], откуда [x] = [y]. Следовательно, классы, имеющие общий элемент, совпадают. Но это и означает, что если классы не совпадают, то они не имеют общих элементов. Итак, р а з б и е н и е м н о ж е с т в а н а к л а с с ы о п р е д е л я е т э к в и в а лентность на этом множестве и, наоборот, эквивалентность на множестве разбивает это множество на смежные классы. 71 Граф любого отношения эквивалентности распадается на отдельные «острова». Внутри каждого острова проведены все возможные стрелки, а между отдельными островами этого архипелага нет никаких связей. Система представителей для разбиения - это множество элементов, выбранных по одному из каждого смежного класса. График эквивалентности Множество всех смежных классов множества M по эквивалентности ∼ называют фактормноже- ством и обозначают символом M M ~ ~ : = {[x] x ∈ M}. Если множество M упорядочено так, что сначала все элементы первого смежного класса, затем второго и так далее, то график отношения эквивалентности будет представлять систему черных непересекающихся квадратов, нанизанных на диагональ. Наименьшая эквивалентность – это равенство, его график состоит из диагонали, т. е. из квадратов, выродившихся в точки. Наибольшая эквивалентность (полное отношение) имеет своим графиком большой черный квадрат (Казимир Малевич1 мог бы назвать свою знаменитую картину «Полная эквивалентность»). Отображение ε множества M на фактормножество M ~ , переводящее каж- дый элемент в смежный класс, в котором он лежит, Малевич Казимир Северинович (1878–1935), российский художник. На выставке «О,10» в конце 1915 г. показал 39 полотен под общим названием «Супрематизм живописи», в том числе самое знаменитое свое произведение — «Черный квадрат (Черный квадрат на белом фоне)». Рыночная цена «квадрата» в настоящее время более 20 миллионов долларов США. 1 72 ε(x) = [x], называют естественным отображением множества M на свое фактормножество. Переход от множества M к фактормножеству M ~ называется факториза- цией (или классификацией) множества M. Обычно под классификацией понимают несколько эквивалентностей на одном множестве, причем каждая из эквивалентностей является продолжением другой: смежный класс по одной эквивалентности (более высокого уровня) распадается на смежные классы по другой эквивалентности (более низкого уровня). Все эквивалентности, Классификация уровня выше первого, являются частичными отношениями. Граф отношения включения для смежных классов по таким эквивалентностям и принято называть классификацией или иерархией1. ОТ ПРЕДПОРЯДКА ЧЕРЕЗ ЭКВИВАЛЕНТНОСТЬ К ПОРЯДКУЮ. Рефлексивное и транзитивное отношение называют предпорядком. Предпорядок может не быть ни эквивалентностью, ни порядком. Например, отношение делимости на множестве целых чисел, отношение следствия для уравнений и систем уравнений, отношение логического следствия для высказываний или для предикатов – все это отношения предпорядка, не являющиеся ни порядком, ни эквивалентностью. Пусть p – некоторый предпорядок на множестве M (говорят, что множеОт греческих hieros - священный и arche - власть. Под словом «иерархия» обычно имеются в виду уровни рассматриваемых эквивалентностей. 1 73 ство M предупорядочено). Отношение ~ на M, заданное правилом: x ~ y ⇔ x p y и y p x, называют отношением ассоциированности. Ассоциированность является эквивалентностью, и более того, она связана с исходным отношением предпорядка следующим образом: x ~ x1 и y ~ y1, то x p y ⇔ x1 p y1. Ассоциированность, как и каждая эквивалентность, разбивает множество на смежные классы, а связь ассоциативности и p позволяет корректно определить отношения между смежными классами, полагая [x] p [y] ⇔ x p y. Фактормножество по ассоциированности является уже упорядоченным: предпорядок превратился в порядок. Например, отношение делимости, являющееся всего лишь предпорядком на множестве целых чисел, образует порядок на множестве классов ассоциированных элементов, в качестве представителей которых можно выбрать элементы из Z0. Отношение логического следствия – предпорядок, а логическая эквивалентность – ассоциированность для этого предпорядка, причем фактормножество уже упорядочено. СВЯЗЬ ЭКВИВАЛЕНТНОСТИ С ДРУГИМИ ОТНОШЕНИЯМИ. Пусть на множестве M задана двуместная операция o и отношение эквивалентности ~. 74 Говорят, что эквивалентность согласована (или совместима) с операцией, если для всех элементов x, x1, y, y1 из M x ~ x1, y ~ y1 ⇒ x o y ~ x1 o y1. Если эквивалентность согласована с операцией, то операцию на M можно перенести на фактормножество M ~ , положив по определению: [x] o [y] = [x o y]. Это определение корректно, т. е. не зависит от выбора представителей в классах [x], [y]. Поясняющая схема показана на рисунке. Аналогичным образом эквивалентность может согласовываться с операцией любой местно- Согласованность с операцией сти. Эквивалентность может быть согласованной не только с операцией алгебраической системы, но и с любым другим отношением на этой системе (в частности с отношением порядка). Эквивалентность ~ согласована с n-местным отношением S, если для каждых a1, a2, ..., an, b1, b2, ... bn из a1~b1, a2~b2, ... an~an следует равносильность S(a1, a2, ..., an) ⇔ S(b1, b2, ..., bn). Эквивалентность, согласованная со всеми операциями и отношениями алгебраической системы, называется конгруэнцией1. 1 От латинского congruentia– согласие, соответствие. 75 ПРОБЛЕМА УПРОЩЕНИЯ. Для множества M с отношением эквивалентности ~ какая-либо из систем представителей может оказаться привлекательнее остальных. Привлекательность чаще всего связана с простотой, понимаемой в том или ином смысле. Простейшая система и будет самой хорошей. Говорят, что для эквивалентности ~ и системы представителей x1, x2, ...,xn алгоритмически разрешима проблема упрощения, если существует алгоритм, позволяющий для любого элемента x из M указать простейший представитель xi для смежного класса [x]. Проблема упрощения разрешима далеко не всегда даже на множестве натуральных чисел. Для эквивалентности, имеющей всего два смежных класса, проблема упрощения равносильна проблеме вхождения в некоторое подмножество. Произвольное непустое собственное подмножество H множеств M разбивает множество M на два класса: H и его дополнение – H Выберем в качестве представителей любую пару элементов a, b, один из которых, например, a принадлежит H, а другой — нет, b ∉ H. Тогда получаем формулировку проблемы упрощения в следующем виде. Найти алгоритм, позволяющий узнавать для любого элемента x из M, с каким из двух элементов (a или b) элемент x лежит в одном смежном классе? Иначе говоря, требуется алгоритм для узнавания, входит элемент x в подмножество H или нет. Существуют множества натуральных чисел, которые можно задать перечисляющим алгоритмом (так называемые рекурсивно перечислимые множества), но имеющие неразрешимую проблему вхождения. Для такого множества проблема упрощения неразрешима. Для вычислительной математики проблемой упрощения, следующая. 76 типичная ситауция, связанная с Решение уравнения (или системы уравнений) состоит в поиске наиболее простого представителя класса равносильных уравнений, т. е. такого уравнения, которое уже и решать не надо — оно само выглядит как ответ. Например, для системы уравнений с n неизвестнымиx1, x2, ..., xn , имеющий в точности одно решение, такими представителями будут системы уравнений = a1,  x1  x2 = a2 ,   . . . . . . .   xn = an . Если все уравнения системы линейные, то проблема упрощения имеет решение: система, имеющая единственное решение, приводится к такому виду в конечное число шагов с помощью элементарных преобразований. 77 3. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ Основные понятия: Объединение, пересечение, дополнение, разность симметрическая разность, частичный порядок, точная верхняя грань, точная нижняя грань, булева решетка, булево кольцо, комбинаторная конфигурация, правило суммы, правило произведение, правило включенияисключения, размещения, перестановки и сочетания, бином Ньютона и треугольник Паскаля, число Стирлинга второго рода. Основные факты: множество подмножеств данного множества с операциями пересечения, объединения и дополнения образует булеву решетку; основные правила подсчета элементов конечного множества - правило суммы и правило произведения ОПЕРАЦИИ НАД МНОЖЕСТВАМИ. Если U – произвольное множество, то симолом P(U) обозначают булеан множества U. Элементами булеана P(U) являются подмножества множества U. Теоретико-множественные операции пересечения, объединения, дополнения и симметрической разности, примененные к элементам из P(U), не выводят за пределы P(U), поэтому можно говорить об алгебре множеств < P(U); ∩, ∪, >. Алгебра < P(U); ∩, ∪, > является булевой решеткой, а < P(U); ⊕, ∩ > – булевым кольцом. Эти две алгебры еще раз иллюстрируют теорему Стоуна о связи между булевыми кольцами и булевыми решетками. Роль сложения в булевом кольце множеств играет симметрическая разность. Эта связь между решетками и кольцами дает возможность вместо опре78 деляющих тождеств решетки < P(U); ∩, ∪, > искать определяющие тождества кольца < P(U); ⊕, ∩ >. Если множество U – конечно и состоит из n элементов, то кольцо < P(U); ⊕, ∩ > изоморфно кольцу прямой степени кольца Z2. КОМБИНАТОРНЫЕ КОНФИГУРАЦИИ. Каждая конструкция из элементов конечного множества называется комбинаторной конфигурацией. Примерами комбинаторных конфигураций школьного курса математики являются размещения, сочетания, перестановки. В основе всех формул для подсчета числа комбинаторных конфигураций лежат всего два правила: правило суммы и правило произведения. ПРАВИЛО СУММЫ. Если A, B – конечны, и имеют число элементов A и B соответственно, а пересечение A ∩ B = ∅, то A∪B = A+B. Это равенство называют комбинаторным правилом суммы. Правило суммы является определением сложения конечных мощностей. Правило суммы распространяется на любое конечное число попарно непересекающихся множеств, n n 1 1 U Ai = ∑ Ai . Индукцией по n устанавливается, что для любых конечных множеств A1, A2, ... , An: n n UAi =∑ Ai − ∑ i=1 i=1 1≤i< j≤n Ai ∩Aj + ...+(−1) m−1 ∑ Ai ∩⋅⋅⋅ ∩Ai 1 1≤i1 n. , то не существует ни одной биекции A в B. Таким образом, 0, если m > n, Anm =  n (n − 1)(n − 2) ... (n − m + 1), если m ≤ n. 1 Буква A - первая буква латинского слова Arrangement - размещение, расположение. 81 Число, равное произведению всех натуральных чисел, не превышающих натурального числа n, принято обозначать символом n! и называть факториалом1 (n ! читается: «эн факториал»). С таким обозначением Anm = n! . (n − m ) ! Пусть множества A и B состоят из одинакового числа элементов, а одно из них является начальным отрезком натурального ряда. Например, B = {1, 2, 3, ..., n} В таком случае биекция A на B означает присваивание элементам из A порядковых номеров. Расположив элементы из A по возрастанию номеров, мы получим перестановку множества A. Число всевозможных перестановок n-элементного множества обозначают2 символом Pn. Число перестановок Pn множества из n элементов равно n!. Каждая перестановка множества задает линейное упорядочение этого множества. Это значит, что число различных линейных упорядочений n-элементного множества равно n!. Взаимно однозначное отображение множества на себя принято называть подстановкой. Число различных подстановок n-элементного множества равно числу его перестановок и равно n!. Пусть множество A состоит из n элементов, и m ≤ n. Подмножество из A называют сочетанием, а число всех m-элементных подмножеств множества из От латинского слова factor - множитель. Термин применяется с 1800 года, а символ n! рекомендован Советом Лондонского математического общества в 1916 году. 2 Буква P - первая буква латинского слова Permutation - перестановка. 1 82 n  n элементов обозначают1 символом Cnm или  ; читается «число сочетаний  m из n по m» Для некоторых значений m о значении Cnm = 1 нетрудно догадаться. Например, в каждом множестве содержится всего лишь одно пустое множество, одно множество, совпадающее со всем A, и n одноэлементных подмножеств: C1n = 1 , Cnn = 1, C1n = n. Чтобы найти значение Cnm в общем случае, достаточно заметить связь между числами Pm, Cnm и Anm : Pm ⋅ Cnm = Anm . Эта связь позволяет вычислить число m-элементных подмножеств множества из n элементов. C nm = n (n − 1) ... (n − m + 1) . m! Формула для числа сочетаний играет основную роль при подсчте коэффициентов разложения степени двучлена. КОМБИНАТОРНЫЕ ТОЖДЕСТВА И БИНОМ НЬЮТОНА. Опираясь на определение подмножества, непосредственным вычислением устанавливаются следующие свойства числа сочетаний. Для любых натуральных n, m (m ≤ n) выполняются равенства: 1 Буква C - первая буква латинского слова Сombination - сочетание. 83 n  n  ; а)   =  m n − m     n   n   n + 1 ;  +   =  б)   m − 1  m   m   n   n + 1  m + 2   n + m   n + m + 1  +   + ... +   =  . в)   +  m m 1 2           Сложив все числа Cnm , где m принимает все значения от нуля до n, мы получим общее число всех подмножеств множества из n элементов : Cn0 + C1n + C n2 + ... + C nn −1 + C nn = 2 n. Число 2 = 1 + 1, и это равенство означает, что (1 + 1)n = Cn0 + C1n + Cn2 + ... + Cnn−1 + Cnn . Этот факт является частным случаем более общей формулы (для любых действительных чисел a, b и любого натурального n): (a + b )n = Cn0 a n + C1n a n−1b + Cn2 a n−2b 2 +...+ Cnn−1ab n−1 + Cnn b n . Двучлен a + b называется биномом, а формулу для вычисления разложения степени бинома в сумму называют биномом Ньютона1. Используя знак суммирования Σ, можно записать бином Ньютона короче. Эта формула была известна задолго до Исаака Ньютона, но Ньютон в 1665 г. указал возможность ее обобщения для отрицательного или дробного n: в этом случае разложение степени бинома превращается в бесконечный (биноминальный) ряд. 1 84 (a + b ) n n n = ∑   a i b n −i . i i =0   Тождество n   n   n + 1  ,   +   =  m − 1 m m       или в другой символике Cnm −1 + Cnm = Cnm+1, означает, что, отправляясь от коэффициентов разложения (a+b)0 = 1 с помощью сложения можно последовательно получить все биноминальные коэффициенты. Ситуацию можно представить наглядно. Рассмотрим треугольную таблицу, заполненную числами, у которой первый и последний элемент каждой строки единица, а каждый другой элемент строки получается суммированием двух чисел, стоящих над ним. В честь автора эта таблица называется треугольником Паскаля1. Блез Паскаль (Pascal, 1623-1662) - французский философ, писатель, математик и физик. Числовой треугольник появился в его работе «Трактат об арифметическом треугольнике» (написанной в 1654 г. и опубликованной уже после смерти автора в 1665 г.). Там же впервые явно сформулирован и применен метод математической индукции. 1 85 Значения коэффициентов бинома Ньютона n-ой степени являются элементами (n+1)-ой строки треугольника Паскаля. СЮРЪЕКЦИИ И ЧИСЛА СТИРЛИНГА ВТОРОГО РОДА. Число сюръекций множества M на A связано с числом разбиений множества M на непересекающиеся подмножества. Число всех разбиений n-элементного множества на k смежных классов обозначают символом S(n, k) и называют числом Стирлинга второго рода. Полагают S(0, 0) = 1. Непосредственно из определения следует, что если n>0, то S(n, 0) = 0, S(n, 1) = 1, S(n, n) = 1 и S(n, k) = 0, если k > n. Для каждого n>0 выполняются равенства n S(n, 2) = 2 n −1 − 1, S(n, n) = 1, S(n, n-1) =   . 2 Если n > 0 и k > 0, то S(n, k) = k ⋅ S(n – 1, k) + S(n – 1, k – 1). 86 Отсюда S(n, k) = n −( k −1) n − 1   n −1  n − 1   S (n − m, k − 1) = ∑   S (i, k − 1). m − 1 i     m =1 i = k −1 ∑ Число сюръекций множества из n элементов на k-элементное множество равно k ! ⋅ S(n, k). Если множество M состоит из n, а множество A – из k элементов (n ≥ k), то существует k −1 ik  i =0   ∑ (− 1)  i (k − i ) n сюръекций множества M на A. Обозначим символом E(n) число эквивалентностей на множестве из n элементов, причем положим E(0) = 1. Так как каждая эквивалентность однозначно задает разбиение множества на классы, E(n) равно числу всех разбиений n-элементного множества. Непосредственно видно, что E(1)=1 и E(2)=2. Используя число Стирлинга второго рода, можно получить явные выражения для E(n): n E (n ) = ∑ S (n,k ), k =0  n − 1  E (i ) . i i =0   n −1 E(n) = ∑  a a   , и полагая n − m = i, получаем: Используя равенство   =  b   a − b 87  n − 1  E (i ). E(n) = ∑  i i =0   n −1 Рекуррентное соотношение для числа Стирлинга второго рода и предыдущие равенства доставляют алгоритм для последовательного вычисления S(n, k). Выделение одноэлементного подмножества X и рассмотрение отдельно, разбиений содержащих X, а затем разбиений, не содержащих X, позволило получить рекуррентные формулы, в которых вычисление S(n, k) сводится к вычислению S(n – 1, k) и S(n – 1, k – 1). Если H – m-элементное подмножество n-элементного множества M, то число разбиений множества M на k классов, содержащих H как класс, равно S(n – m, k – 1). Кроме того, если M= n, a ∈ M, то число m-элементных подмножеств, со n −1   . держащих элемент a, равно   m − 1 Пусть теперь число m принимает последовательно значения 1, 2, ..., k - 1. Для каждого m число разбиений известно; следовательно, n − ( k −1) S(n, k) =  n −1    S (n − m,k − 1). m − 1  m =1  ∑ a Используя связь между числами   и b  a    , и переобозначив для краa − b соты n – m символом i, получаем рекуррентную формулу дял вычисления чисел Стирлинга второго рода 88 n −1 S(n, k) =  n − 1   S (i,k − 1). i  i = k −1  ∑ Кстати, числом s(n, k) Стирлинга первого рода называют коэффициент при степени xk в многочлене x (x – 1) (x – 2) ... [(x – (n – 1)], Другими словами, n x (x – 1) (x – 2) ... (x – n + 1)= ∑ s ( n, k ) x k k =0 ПОЛИНОМИАЛЬНАЯ ФОРМУЛА. Пусть X ={x1, x2, ..., xn} и Y ={a1, a2, ..., ak} - два конечных множества, причем n = m1 + m2 + ... + mk. Рассмотрим все такие сюръективные отображения f множества A на множество B, что полный прообраз элемента ai состоит из .mi элементов, f−1(ai)= mi, i = 1, 2, ..., k. Число всех таких отображений обозначают символом P(m1, m2, ..., mk). Отображение описанного вида можно единственным образом представить в виде n-ки (z1, z2, ..., zn), где zi ∈ M, причем символ ai входит mi раз. Такую n-ку принято называть перестановкой с повторениями состава m1, m2, . . . , mk из символов a1, a2, ..., ak. Число P(m1, m2, ..., mk) различных перестановок с повторениями из n элементов, в которых элементы a1, a2, ..., ak повторяются соответственно m1, m2, ..., mk раз, равно (m1 + m2 + ... + mk ) ! . m1!⋅m2!⋅... ⋅ mk ! Используя понятие перестановки с повторениями, можно записать форму89 лу, обобщающую бином Ньютона, а именно: для любых действительных ai (i=1, 2, ..., n) и любого натурального n выполняется равенство (называемое полиномиальной формулой) (a1 + a2 + ... + ak ) n = ∑ P(m1 , m2 , ..., mk ) ⋅ a1 1 a2 2 ...ak k . m m m m1 + m2 +...+ mk = n ПРОИЗВОДЯЩИЕ ФУНКЦИИ. Если ряд a0 + a1 x + a2 x 2 + ... + an x n + ... сходится в некоторой области, и равен функции f(x), то эту функцию называют производящей для последовательности a0 , a1 , a2 , ... , an , ... . Например, (1 + x )n n является производящей функцией для чисел   , i=0, 1, 2, …, n, i  (1 + x ) n а функция x 1− x − x2 x 1− x − x 90 2 n n = ∑   x n −i , i i =0   в окрестности нуля производит числа Фибоначчи: = x + x2 + 2 x3 + 3 x4+ 5 x5+ 8 x6+ 13 x7+ 21 x8 + 34 x9 + … Числами Фибоначчи1 называют элементы множества {1, 1, 2, 3, 5, 8, 13, ..., a, b, a + b, ...}, в котором каждый элемент, начиная с третьего, является суммой двух предыдущих. Леонардо Пизанский, Фибоначчи (Fibonacci, 1180–1240) – итальянский математик, впервые рассмотрел эту последовательность (связанную с задачей о размножении кроликов) в 1228 году; n-ое 1 n число Фибоначчи равно 1+ 5      − 1− 5   2   2      5 n . 91 4. ПОЛЕ. СВОЙСТВА ПОЛЕЙ. ЧИСЛОВЫЕ ПОЛЯ. ПОЛЕ РАЦИОНАЛЬНЫХ ЧИСЕЛ КАК МИНИМАЛЬНОЕ ПОЛЕВОЕ РАСШИРЕНИЕ КОЛЬЦА ЦЕЛЫХ ЧИСЕЛ. ПРЕДСТАВЛЕНИЕ РАЦИОНАЛЬНЫХ ЧИСЕЛ ОБЫКНОВЕННЫМИ И ДЕСЯТИЧНЫМИ ДРОБЯМИ Основные понятия: Поле, подполе, числовое поле, простое поле, упорядоченное поле, изоморфизм, счётность, континуальность, характеристика поля, изоморфизм, мономорфизм, поле частных. десятичная дробь, периодическая десятичная дробь. Основные факты: поле рациональных чисел существует, если существует кольцо целых чисел; поле частных целостного кольца единственно с точностью до изоморфизма; каждое поле нулевой характеристики является расширением поля рациональных чисел. ПОЛЕ. Кольцо называется полем, если < K \ {0}; ⋅ > - абелева группа. Поле состоит не менее чем из двух элементов, умножение в поле ассоциативно и коммутативно и в поле нет делителей нуля, поэтому поле – это частный случай целостного кольца. Кольцо называется телом, если < K \ {0}; ⋅ > – группа. Таким образом, п о л е – э т о к о м м у т а т и в н о е т е л о . Кстати указать конечное целостное кольцо, не являющееся полем, не удастся: американский математик Веддербёрн1 обнаружил, что в любом конечном целостном кольце каждый ненулевой элемент обратим, т. е. каждое конечное целостное кольцо образует поле. Не удастся указать и конечного тела, не являющегося полем – умножение Джозеф Генри Маклаган Веддербёрн (Wedderburn, 1882–1948) – американский математик. В 1905 г. работал в Эдинбургском университете, в 1905-1945 гг. – в Принстонском университете. Член Лондонского Королевского общества (с 1933). 1 92 в любом конечном теле коммутативно. Характеристика тела (и в частности, поля) поля равна нулю или простому числу. СВОЙСТВА ПОЛЕЙ. Простейшие свойства поля аналогичны простейшим свойствам колец. Деление дистрибутивно относительно сложения и вычитания. Для любых элементов a, b из поля выполняется правило знаков: −a a a = =− . b −b b Каждый кольцевой гомоморфизм с точностью до изоморфизма задается своим ядром, а ядро гомоморфизма является идеалом в кольце. Поле не имеет нетривиальных идеалов (отличных от нулевого и единичного), поэтому поле не имеет гомоморфизмов, отличных от изоморфизмов. Обратное тоже верно: если целостное кольцо K не имеет ненулевых гомоморфизмов, отличных от изоморфизмов, то K образует поле. Кольцо, не имеющее нетривиальных идеалов, называется простым. В ненулевом ассоциативно-коммутативном кольце множество делителей нуля образует идеал. Следовательно, ассоциативно-коммутативное кольцо с единицей является полем тогда и только тогда, когда оно просто. Каждое целостное кольцо изоморфно вложимо в некоторое поле. Наименьшее поле K , содержащее целостное кольцо K называется полем частных кольца K. Поле частных K целостного кольца K единственно с точностью до изоморфизма. ЧИСЛОВЫЕ ПОЛЯ. Числовым полем называют любое подполе поля ком- плексных чисел. Непустое подмножество множества комплексных чисел образует числовое поле тогда и только тогда, когда оно состоит не из одного нуля и замкнуто относительно сложения, вычитания, умножения и деления на не нуль. 93 Пересечение любого числа числовых полей снова является числовым полем. Наименьшее числовое поле – это поле рациональных чисел, каждое числовое поле – это расширение поля Q. Наименьшее поле, содержащее поле P и элемент a обозначают символом P(a) и называют простым расширением поля P. Расширение P(a) является полевым расширением. Кольцевым простым расширением называется наименьшее кольцо P[a], содержащее кольцо K и элемент а. Простое расширение Q ( p ) поля Q, полученное присоединением корня многочлена x 2 − p , где p не является квадратом рационального числа, состоит из всех чисел вида a+b p , где a, b - рациональные числа. Например, Q(i) = {a+bi  a,b∈Q }. Поле Q ( p ) является полем частных кольца Z[ p ]; например, поле Q(i) – это поле частных кольца целых гауссовых чисел Z[i]. Если множество M - счётно, то и поле, порожденное множеством M, тоже счётно. В частности, счетными являются все простые расширения счетного поля. Так как поле действительных чисел несчетно, оно содержит не меньше континуума различных числовых полей. При изоморфизме числовых полей поле рациональных чисел остается неподвижным. Поэтому если p и q – различные простые числа, то поля Q Q ( p) и ( q ) не изоморфны. Отсюда следует, что множество попарно неизоморфных числовых полей не менее чем счётно. ПОЛЕ РАЦИОНАЛЬНЫХ ЧИСЕЛ. Системой рациональных чисел Q называют 94 наименьшее поле, содержащее систему натуральных чисел. Иначе говоря, Q – это поле частных кольца Z целых чисел, Q= Z . Построение поля Q следует той же схеме, что и доказательство существования поля частных произвольного целостного кольца. Предположим сначала, что поле рациональных чисел существует, т. е. сделаем анализ задачи на построение алгебраической системы с определенными свойствами. Если поле рациональных чисел существует, то каждый его элемент можно представить в виде отношения a целых чисел a, b (b ≠ 0), причем для любых b целых чисел a, b, c, d, (b ≠ 0, d ≠ 0): a c = ⇔ a ⋅ d = b ⋅ c, b d a c ad + bc + = , b d bd a c a⋅c ⋅ = , b d b⋅d a c ad − bc − = , b d bd a c a⋅d : = , где b d b⋅c c ≠ 0. Теперь с помощью декартова произведения M = Z × (Z \ {0}), соответствующей эквивалентности на M и операций, определенных в соответствии с результатами анализа, можно построить поле Q. Если существует кольцо целых чисел, то существует поле рациональных чисел. Поле рациональных чисел единственно с точностью до изоморфизма. Это 95 значит, что если аксиоматическая теория целых неотрицательных чисел категорична, то и аксиоматическая теория рациональных чисел тоже категорична. Если T – произвольное тело нулевой характеристики, то подкольцо K, порожденное единицей, будет изоморфно кольцу целых чисел. Поле частных кольца K будет содержаться в теле T. Следовательно, к а ж д о е т е л о н у л е в о й х а р а к т е р и с т и к и с о д е р жит в точности одно подполе, изоморфное полю рациональных чисел и в точности одно подкольцо, изоморфное кольцу целых чисел. Множеством-носителем поля Q, построенного в соответствии с проведенным анализом, является множество классов эквивалентных дробей a  b  , где a, b ∈ Z, b ≠ 0, и c a ∈ ⇔ ad = bc. d  b  Представитель класса (обыкновенная дробь) выбирается из этого же смежного класса, однако существуют и другие представления рациональных чисел. ПРЕДСТАВЛЕНИЕ РАЦИОНАЛЬНЫХ ЧИСЕЛ ДЕСЯТИЧНЫМИ ДРОБЯМИ. Каж- дое рациональное число можно представить в виде бесконечной десятичной периодической дроби. Это представление не однозначно. Число 9 в периоде дроби можно заменить нулем в периоде, увеличив последнюю цифру допериодической части на единицу. Правда, при обращении обыкновенной дроби в десятичную никогда не возникнет числа 9 в периоде. Каждая периодическая десятичная дробь (кроме дробей с числом 9 в периоде) равна некоторой обыкновенной дроби. После обращения обыкновенной дроби в десятичную длина периода деся96 тичной дроби, равной a , где a, b -взаимно просты, а b взаимно прост с 10, b равна порядку числа 10 по модулю b. Отметим, что множество конечных десятичных дробей образует подкольцо в кольце Q. Аналогичным образом можно построить континуум различных подколей в Q. УПОРЯДОЧЕНИЕ ПОЛЯ РАЦИОНАЛЬНЫХ ЧИСЕЛ. В алгебрах N и Z, кроме арифметических операций, можно ввести бинарное отношение порядка, причем так, что порядок на множестве Z продолжает порядок на N. Этот порядок продолжается и дальше, на множество Q. Иначе говоря, в Q можно указать такой конус положительности Q+ , что Q + ∩ Z = Z + . Опреде- лим Q+ следующим образом: a ∈ Q+ ⇔ a ⋅ b > 0 . b Теперь определим бинарное отношение > («больше») по правилу (для любых x, y из множества Q): опр x > y ⇔ x − y > 0. Отношение эквивалентности на множестве обыкновенных дробей согласовано с отношением «быть положительным»: если две дроби эквивалентны: a c ~ , b d то 97 a c ∈ Q + ⇔ ∈Q+. b d Кроме того, отношение эквивалентности на множестве обыкновенных дробей согласовано с операцией вычитания. Поэтому бинарное отношение > на Q самом деле является отношением между смежными классами эквивалентных дробей (т. е. рациональными числами). Множество Q + замкнуто относительно сложения и умножения и удовлетворяет условию трихотомии (Q распадается на смежные классы: Q + , − Q + , {0}), т. е. Q + действительно является конусом положительности. Поле рациональных чисел линейно упорядочено. Если x, y – рациональные числа и x < y, то в виду монотонности сложения: x< x+ y < y. 2 Это значит, что порядок в поле рациональных чисел плотный. Если x, y принадлежат Q и x > 0, то для натурального n > y выполняется неравенство x nx > y . Порядок в поле рациональных чисел является архимедовым. 98 5. СИСТЕМА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ. НЕПРЕРЫВНОСТЬ Основные понятия: Поле, подполе, изоморфизм, мономорфизм, упорядоченность, конус положительности, сечение Дедекинда, непрерывность, счетность, несчетность, континуум. Основные факты: Поле действительных чисел существует, если существует поле рациональных чисел; поле действительных чисел единственно с точностью до изоморфизма. ПОНЯТИЕ НЕПРЕРЫВНОСТИ. Одна из аксиом геометрии утверждает непрерывность прямой. Что означают слова «прямая непрерывна»? Интуитивно ситуация описывается следующим образом: когда мы чертим прямую пером на бумаге, то перо не отрывается от листа ни на миг. Это образное описание нужно теперь заменить точным определением. Для этого сначала обсудим, что такое разрыв, нарушение непрерывности. Сделаем это с помощью множества рациональных чисел. Возьмем рациональную числовую ось и выбросим из нее одну точку, например, нулевую. В результате мы получим разрыв нашего множества. Разрывность в одной точке означает, что слева и справа мы можем, как угодно близко приближаться к этой точке. Если число a > 0,то всегда найдется новое число b, расположенное к нулю еще ближе, чем число a: 0 < b < a. Аналогично обстоит дело со стороной, расположенной слева от выброшенной точки. Это означает, что во множестве {x∈Q x<0} нет наибольшего элемента, а во множестве {x∈Q x>0} нет наименьшего элемента. Множество Q разорвалось в этой точке, образовалась щель. 99 Правда, в нашем примере разрыв устроен искусственно: выброшенное число нуль – это тоже элемент из Q. На прямой подобных разрывов (то есть точечных щелей) нет. Сейчас определим возможность (и невозможность) разрыва линейно упорядоченного множества более точно. Сначала рассмотрим множество точек прямой. Расположим прямую a вертикально и упорядочим ее отношением «лежать выше». Это отношение иррефлексивно, транзитивно, антисимметрично и связно, т.е. является отношение строгого линейного порядка. Разобьем эту прямую на два непустых подмножества M1 и M2 так, чтобы каждая точка из M2 находилась выше любой точки из M1. Пересечение мноСечение прямой жеств M1 и M2 будет тогда пустым, и поэтому M1, M2 образуют смежные классы разбиения. Такое разбиение прямой называют сечением (или по имени автора сечением Дедекинда1). Множество M2 - это верхний, а M1 – нижний класс сечения. Обозначают сечение символом (M1M2). Наибольший элемент в нижнем классе и наименьший элемент из верхнего класса (если они существуют) называют рубежом сечения. Теоретически возникают следующие четыре возможности: 1) сечение имеет один рубеж, который принадлежит верхнему классу (говорят: «сечение с рубежом»); 2) сечение имеет один рубеж, который принадлежит нижнему классу (говорят: «сечение с рубежом»); Р. Дедекинд в работах «Непрерывность и иррациональные числа» (опубликовано в 1872 г., и является изложением лекций 1858 года) и «Что такое числа и для чего они служат» (1887 г.) впервые строго обосновал теорию действительных чисел. 1 100 3) сечение имеет два рубежа; один рубеж лежит в верхнем классе, а второй в нижнем (говорят: «сечение со скачком»). 4) сечение не имеет рубежа ни в верхнем, ни в нижнем классе (говорят: «сечение со щелью»). Слова «прямая непрерывна» означают, что на прямой нет ни скачков, ни щелей – все сечения с рубежами. То, что сечение построено на прямой, не принципиально. Для построения было нужно только линейное упорядочение множества, и поэтому сечение Дедекинда можно построить в любом линейно упорядоченном множестве . Например, если a - произвольный не наименьший и не наибольший элемент из M, то ({x ∈ Mx < a}{x ∈ Mx ≥ a}); ({x ∈ Mx ≤ a}{x ∈ Mx > a}) – два сечения в M, и оба с рубежами. Утверждение о существовании в точности одного рубежа у каждого сечения на множестве M называют аксиомой Дедекинда. Если для линейно упорядоченного множества M выполняется аксиома Дедекинда, то порядок на M называется непрерывным. Для прямой, точки которой линейно упорядочены по высоте, аксиома Дедекинда выполняется, поэтому прямая непрерывна. Опираясь на непрерывность прямой (или отрезка, или интервала), можно обнаружить, что для измерения длин всех отрезков рациональных чисел далеко недостаточно. ТОЧЕК НА ПРЯМОЙ БОЛЬШЕ, ЧЕМ РАЦИОНАЛЬНЫХ ЧИСЕЛ. Выберем на прямой отрезок AB в качестве единичного и попробуем измерять длины отрез101 ков, меньших AB. Ясно, что целых чисел для решения этой задачи потребуется немного – всего два - нуль и единица. А хватит ли для этого рациональных чисел? Отрезков, длина которых меньше длины AB, бесконечно много и множество неотрицательных рациональных чисел, меньше единицы тоже бесконечно. Однако рациональных чисел для решения поставленной задачи недостаточно. И дело даже не в том, что при традиционном понимании длины только отрезки, соизмеримые с AB, имеют рациональную длину; а существуют и несоизмеримые с AB отрезки. Если бы причина неудачи была только в этом, то можно было еще надеяться, каким-то особым способом определить длину, что и все отрезки, несоизмеримые с отрезком AB получат своё. Надежды эти несбыточны: отрезков, длины которых меньше длины отрезка AB, гораздо больше чем рациональных чисел. Точнее говоря, множество рациональных чисел счётно, а множество M таких отрезков – несчётно. Это значит, что как бы мы не пытались определить длину (естественно так, чтобы разным числам соответствовали различные отрезки - а различным отрезкам – различные числа), ничего не выйдет: несчётное число отрезков всегда останутся без длины. Итак, покажем, что множество M - несчётно. Допустим, что M – счётно, и AB1, AB2, ..., ABn, ... все отрезки, лежащие внутри отрезка AB и меньшие AB. Разделим отрезок AB на три равные части. Найдется хотя бы одна часть, не содержащая точку B1. Возьмем эту часть и разделим ее на три равные части. Одна из них наверняка не содержит точку B2. Продолжим процесс далее таким же образом. В результате получится последовательность, вложенных друг в друга отрезков: 102 X1Y1 ⊃ X2Y2 ⊃...⊃ XnYn ⊃... причем отрезок XnYn не содержит ни одну из точек B1, B2, ... , Bn. Рассмотрим сечение на множестве AB. Включим в нижний класс все точки Xi и все те точки, что лежат левее Xi, а в верхний класс поместим все остальные точки. В верхнем классе окажутся все точки Yi и все те, что правее Yi. Так как отрезок является непрерывным множеством, каждое сечение должно иметь рубеж. Все точки отрезка по нашему предположению исчерпываются точками Bi, поэтому и рубежом может быть только одна из этих точек. Предположим, что Bk – точка рубежа. По построению отрезок XkYk и все последующие отрезки не содержат точки Bk. Если точка Bk находится левее точки Xk, то найдутся точки из нижнего сечения, расположенные правее сечения, что невозможно. Если же точка Bk расположена правее точки Yk, то найдутся точки из верхнего класса, расположенные левее сечения, что также невозможно. Полученное противоречие означает, что множество точек отрезка несчётно. Множество рациональных чисел упорядочено, но упорядочено не так, как упорядочены точки на прямой. Прямая непрерывна, а множество рациональных чисел – нет. Непрерывно упорядоченное множество имеет мощность, не меньше континуума, а множество рациональных чисел всего лишь счётно. Отсюда следует, что множество рациональных чисел нельзя непрерывно упорядочить. Заведомо не является непрерывным уже полученное упорядочение рациональных чисел. Впрочем, несложно и непосредственно показать, что имеющийся порядок не непрерывен, т.е. указать сечения без рубежа. Например, пара множеств (AB), где B = {x∈Q+ x2>2}, A = Q\B 103 образует сечение без рубежа на множестве рациональных чисел. Итак, нужна система, являющаяся полем, содержащая как подсистему рациональные числа, да к тому же непрерывно упорядоченная. Такая система есть. СУЩЕСТВОВАНИЕ ПОЛЯ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ. Системой действи- тельных чисел R называют наименьшее непрерывное поле, содержащее поле рациональных чисел в качестве подполя. Для доказательства существования поля R предположим сначала, что такое поле действительно чисел существует, т. е. проведем сначала анализ задачи. Если поле действительных чисел R существует, то каждый элемент из R можно представить в виде сечения на множестве Q. Исходя из этого анализа, можно построить поле R, положив в качестве элементов R сечения на множестве Q. Сечения с рубежом (например, в нижнем классе сечения) будут изображать рациональные числа, а сечения со щелью – иррациональные. Отношение порядка на таком R определяется с помощью отношения включения для нижних (или верхних) классов. Бинарное отношение ≤ на множестве R, представленном сечениями в Q, является линейным плотным порядком. При этом упорядочении, в частности, R разделится на отрицательные и неотрицательные действительные числа. Операцию сложения сечений можно определить с помощью классов, а умножение определить сначала на положительной части, а затем, используя правило знаков, распространить на все множество R. Сумма действительных чисел в множестве R, представленном сечениями в Q, всегда существует и единственна. Произведение действительных чисел в множестве R, представленном сечениями в Q, всегда существует и единственно. Множество R, представленное сечениями в Q, с операциями сложения и 104 умножения образует линейно упорядоченное поле. Поле R, представленное сечениями в поле Q, содержит подполе рациональных чисел Множество R, представленное сечениями в Q, непрерывно упорядочено. Множество R, представленное сечениями в Q, является наименьшим непрерывно упорядоченным полем, содержащим Q как подполе. Таким образом, е с л и с у щ е с т в у е т п о л е р а ц и о н а л ь н ы х ч и с е л ; то существует поле действительных чисел. С логической точки зрения это означает, что если аксиоматическая теория рациональных чисел непротиворечива, то и аксиоматическая теория действительных чисел непротиворечива. Однако рациональные числа строятся на основе целых, а те, в свою очередь, - целых неотрицательных. Таким образом, е с л и с у щ е с т в у е т с и с т е ма целых неотрицательных чисел, то существует и поле действительных чисел. ЕДИНСТВЕННОСТЬ ПОЛЯ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ. Если R1 и R2 образуют поля действительных чисел, то элементы в каждом из них являются сечениями на множестве рациональных чисел. Отсюда следует, что поле действительных чисел единственно с точностью до изоморфизма. Другими словами, если аксиоматическая теория рациональных чисел категорична, то и аксиоматическая теория действительных чисел категорична. Построение поля рациональных чисел основано, в конце концов, на системе целых неотрицательных чисел. Поэтому е с л и а к с и о м а т и ч е с к а я т е о р и я ц е л ы х н е о т р и ц а тельных чисел категорична, то и аксиоматическая теория действительных чисел категорична. РАЗЛИЧНЫЕ ОПРЕДЕЛЕНИЯ НЕПРЕРЫВНОСТИ. Множество действительных 105 чисел (например, представленных моделью Дедекинда) находится во взаимно однозначном соответствии с точками прямой. Это позволяет ввести геометрическую интерпретацию действительных чисел в виде координатной прямой. Непрерывность прямой описывается аксиомой Дедекинда (D) – к а ж д о е с е ч е н и е и м е е т р у б е ж , но есть и другие подходы к определению непрерывности. АКСИОМА A (Архимед). Пусть AB и CD - произвольные отрезки. Тогда на прямой B найдется n различных точек A1, A2, ..., An − 1, An таких, что каждый из отрезков AA1, A1A2, A2A3, ..., An − 1An равен отрезку CD, причем точка B лежит между An – 1 и An. Для линейно упорядоченного поля P аксиома Архимеда означает, что д л я каждых элементов a, b из P, если b > 0, то существует та- кое натуральное n, что nb > a. Каждое действительное число с любой точностью может быть представлено рациональными числами по недостатку и по избытку. Это значит, что все вложенные друг в друга отрезки, длины которых стремятся к нулю, имеют одну общую точку. Это утверждение (следствие из аксиомы Дедекинда) можно использовать и как аксиому; в честь автора оно называется аксиомой Кантора (или принципом вложенных отрезков). АКСИОМА C1 (Кантор). С у щ е с т в у е т прямая a, обладающая следующим свойством: если A1B2, A2B2, A3B3, ... - такая последовательность отрезков на прямой a, что каждый после- дующий отрезок, начиная со второго, содержится в предыдущем, то на прямой a существует точка, общая для всех отрезков. Непрерывность порядка на множестве с операцией сложения можно определить одной аксиомой Дедекинда или двумя аксиомами Архимеда и Кантора 106 (D ⇔ A&C1). Говорят, что последовательность a, a2 ..., an, ... действительных чисел фундаментальная (или обладает условием Коши), если для каждого ε>0 найдется такой номер n, что ai − a j < ε для каждых i, j>n. АКСИОМА C2 (Коши). К а ж д а я фундаментальная последова- тельность имеет предел. Аксиома Коши слабее аксиомы Дедекинда, только в совокупности с аксиомой Архимеда аксиома Коши равносильна аксиоме Дедекинда (D ⇔ A & C2). Пусть a, a2, ..., an, ... – монотонно К определению непрерывности возрастающая, ограниченная сверху последовательность действительных чисел. Устроим сечение на множестве действительных чисел, включив в нижний класс все числа, не превосходящие ai, а в верхний класс – все остальные. Непрерывность поля R означает, что это сечение имеет рубеж, и, используя определение предела, получаем следующее утверждение. Каждая монотонная и ограниченная последовательность действительных чисел имеет предел. Это утверждение называют теоремой Вейерштрасса. Непрерывность множества действительных чисел можно определить и по Вейерштрассу, взяв теорему Вейерштрасса в качестве аксиомы. АКСИОМА W (Вейерштрасс). К а ж д а я м о н о т о н н а я и о г р а н и ч е н ная последовательность действительных чисел имеет предел. 107 Аксиома Вейерштрасса также слабее аксиомы Дедекинда, только вместе с аксиомой Архимеда аксиома Вейерштрасса равносильна аксиоме Дедекинда D ⇔ A & W. Таким образом, из определений непрерывности определение Дедекинда самое экономное - оно обходится одной аксиомой и не требует дополнительно операции сложения на множестве. Кроме того, определение непрерывности по Дедекинду - и самое естественное. Если a рубеж сечения (M1 M2), то нижний класс M1,- это все приближения элемента a с недостатком, а верхний класс все приближения a с избытком. ПРЕДСТАВЛЕНИЕ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ ДЕСЯТИЧНЫМИ ДРОБЯМИ. В школьном курсе математики действительные числа не представляются классами рациональных приближений (по недостатку - и избытку), школьная модель по духу ближе как раз к любому другому определению непрерывности (Коши, Кантора или Вейерштрасса). Школьная модель устроена намного сложнее модели Дедекинда. Сложнее устроено ее множество-носитель, сложнее определить и операции, и отношение порядка, а главное гораздо труднее провести строгое доказательство, что эта модель удовлетворяет аксиомам системы действительных чисел. Однако в школьном курсе математики нет точного определения системы R, и, естественно, нет там и строгих доказательств. Каждое действительное число, представленное сечением Дедекинда, можно представить в виде бесконечной десятичной дроби. Каждое непрерывно упорядоченное множество несчётно, поэтому и множество действительных чисел несчётно. Каждая непериодическая десятичная дробь изображает иррациональное число, и, наоборот, каждое иррациональное число можно представить беско108 нечной непериодической десятичной дробью. Множество иррациональных чисел несчётно. Множество алгебраических чисел счетно и, следовательно, множество трансцендентных чисел несчет- но.Таким образом, почти все действительные числа являются иррациональными и, более того, – трансцендентными. 109 6. ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ. МНОГОЧЛЕНЫ НАД ПОЛЕМ КОМПЛЕКСНЫХ ЧИСЕЛ. АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ КОМПЛЕКСНЫХ ЧИСЕЛ Основные понятия: Поле, подполе, изоморфизм, мономорфизм, расширение поля, числовое поле, действительная и мнимая части, алгебраическая форма комплексного числа, комплексная плоскость, модуль и аргумент комплексного числа, тригонометрическая форма комплексного числа, неупорядочиваемость, простое трансцендентное расширение поля, алгебраическая замкнутость, евклидовость, гауссовость, приводимые и неприводимые многочлены. Основные факты: Поле комплексных чисел существует, если существует поле действительных чисел; поле комплексных чисел неупорядочиваемо; каждое комплексное число является корнем многочлена с действительными коэффициентами; поле комплексных чисел алгебраически замкнуто. ОПРЕДЕЛЕНИЕ ПОЛЯ КОМПЛЕКСНЫХ ЧИСЕЛ. В кольце целых чисел разрешимы не все уравнения первой степени, т. е. уравнения вида ax + b = 0, где a ≠ 0. Однако в поле рациональных чисел все такие уравнения уже разрешимы. Можно сказать, что поле рациональных чисел получилось присоединением к кольцу целых чисел всех корней многочленов первой степени. Расширение поля Q до поля R действительных чисел, решая задачи, связанные с измерением, и тем самым, присоединяя к рациональным числам корни многих алгебраических уравнений, не решает задачу с уравнениями полностью - и над полем действительных чисел остаются квадратные уравнения, не имеющие решений в поле R. Простейшим примером такого уравнения будет x2 + 1 = 0. Наименьшее поле, которое содержит подполе действительные чисел и ре110 шение уравнения x2 + 1 = 0 называют полем комплексных чисел. Одно из решений уравнения x2 + 1 = 0 обозначают буквой i и называют мнимой единицей (второе решение – это −i). Поле комплексных чисел обозначают символом C. СУЩЕСТВОВАНИЕ ПОЛЯ КОМПЛЕКСНЫХ ЧИСЕЛ. Доказательство существования поля C можно провести конструктивно, т. е. просто построить поле C, исходя из поля R и элемента i. Подобно тому, как в геометрии решаются задачи на построение, можно сначала провести анализ, т. е. предположить, что поле C существует, и посмотреть, что из этого следует. Если поле комплексных чисел существует, то среди них должны содержаться и все числа вида a + bi, где a, b - действительные числа и i2 + 1 = 0. Такое представление числа будет единственным (в противном случае i окажется действительным числом, а это не так). Единственность, в частности, означает, что если a + bi = 0, то a = b = 0. Если z1 = a + bi, z2 = c + di – два комплексных числа, то непосредственно из аксиом поля следует, что z1 + z2 = (a + bi) + (c + di) = (a + c) + (b + d)i, z1⋅z2 = (a + bi) ⋅ (c + di) = (ac - bd) + (ad + bc),. Таким образом, множество M, состоящее из чисел вида a + bi , где a, b ∈ R, i2 = –1, замкнуто относительно сложен6ия и умножения. Замкнуто M и относительно вычитания: (a + bi) – (c + di) = (a – c) + (b – d)i, и относительно деления на ненулевой элемент, 111 a + bi (a + bi )(c − di ) (ac + bd ) + (bc − ad ) i ac − bd bc − ad = = = 2 + i. c + di (c + di )(c − di ) c2 + d 2 c + d 2 c2 + d 2 Таким образом, множество M само является полем, и это поле содержит R и i. Так как C минимальное, M = C. Итак, если поле комплексных чисел существует, то каждое комплексное число имеет вид a + bi, где a, b – действительные числа и i2 = –1. Анализ закончен. Теперь, исходя из анализа, можно построить поле C, взяв в качестве его множества декартов квадрат R × R, и определив арифметические операции так, как подсказывает анализ задачи. Таким образом, если существует поле действительных чисел, то существует и поле комплексных чисел. Разумеется, после построения (описания множества-носителя и операций на нем) следует провести доказательство того, что построено именно то, что и хотели. Кроме того, как и в геометрии, не лишен смысла вопрос о числе решений этой задачи, т. е. о вопрос, сколько существует различных полей комплексных чисел? Конечно, как обычно в алгебре, изоморфные поля не считаются различными. И снова анализ помогает ответить и на этот вопрос. С у щ е с т в у е т е д и н с т в е н н о е п о л е к о м п л е к с н ы х ч и с е л . И увидеть это можно с помощью алгебраической формы комплексного числа. АЛГЕБРАИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА. Представление ком- плексного числа z в виде z = a + bi, где a, b - действительные числа и i2 = –1, называют алгебраической формой комплексного числа. Мнимая единица не действительное число, и поэтому к а ж д о е к о м плексное число имеет единственную алгебраическую форму. 112 Отсюда следует, что если R1 и R2 – две изоморфные копии поля действительных чисел, то и их расширения С1 и С2 до поля комплексных чисел тоже будут изоморфны. Поле комплексных чисел единственно с точностью до изоморфизма. Первое слагаемое алгебраической формы принято называть действительной частью, а действительный множитель второго слагаемого называют мнимой частью числа. Для них приняты обозначения a=Re z, b=Im z, то есть z = Re z + Im z ⋅ Множество действительных чисел R наглядно изображается в виде числовой прямой. Множество комплексных чисел находится во взаимно однозначном соответсвии с декартовым квадратом множества R. Декартов квадрат R × R множества R наглядно изображается координированной плоскостью. Таким образом, каждое комплексное число можно представить точкой на плоскости с декартовыми прямоугольными координатами. На оси абсцисс комплексной плоскости находятся действительные части комплексных чисел, поэтому ее называют иногда действительной осью, а ось ординат соответственно - мнимой осью. Каждая точка плоскости изображает одно комплексное число и, наоборот, – число изображается одной точкой. Можно соединить начало координат с этой точкой и, таким образом, каждое комплексное число будет изображено радиусвектором. 113 Двумерные векторы над полем действительных чисел так же, как и комплексное числа, представляются парами действительных чисел, и сложение векторов происходит также - покомпонентно (первая координата складывается с первой, а вторая - со второй). Сложение комплексных чисел происходит тоже покомпонентно (если компонентами назвать действительные и мнимую части). Это значит, что при сложении комплексных чисел, вектора их изображающие складываются по правилу параллелограмма. И в векторах с операциями сложения, и в комплексных числах с той же операцией есть нечто общее – обе эти системы являются прямыми суммами двух групп < R; + >. Итак, аддитивная группа комплексных чисел является прямой суммой аддитивных групп действительных чисел: C = R ⊕ R. У поля действительных чисел нет ни одного нетривиального автоморфизма. Геометрическая иллюстрация поля C подсказывает, что, по крайней мере, один неединичный автоморфизм в уполя C есть. 114 СОПРЯЖЕННЫЕ ЧИСЛА. Геометрические соображения следующие: осевая симметрия в действительной оси является взаимно однозначным отображением комплексной плоскости на себя и явно сохраняет операцию сложения. Остаётся проверить только сохранение умножения. Сначала введем более точное определение. Пусть z = x + yi произвольное комплексное число. Число x - yi называют сопряженным с z, и обозначают символом z . Из определения видно, что отображение z a z является взаимно однозначным; и z =z тогда и только тогда, когда z – действительное число. Кроме того, непосредственным вычислением проверяется, что z1 + z 2 = z1 + z 2 , z1 ⋅ z 2 = z1 ⋅ z 2 . Все это вместе означает, что отображение, переводящее число в комплексно сопряженное является автоморфизмом поля комплексных чисел, оставляющее поле действительных чисел неподвижным. Если числа z и z - сопряженные, то z + z и z⋅ z принадлежат R. Поэтому если z ≠ z , то эти числа являются корнями одного и того же неприводимого многочлена второй степени с действительными коэффициентами. Впрочем, про многочлены с действительными коэффициентами любой положительной степени можно сказать больше. Если число z ⋅является корнем многочлена f(z) с действительными коэффициентами, то и z - тоже корень этого многочлена. Геометрически это означает, что если на комплексной плоскости изобразить корни многочлена с действительными коэффициентами, то полученное множество всегда симметрично относительно действительной оси. В поле действительных чисел аддитивная группа изоморфна мультипликативной группе положительных действительных чисел. Точного аналога этому факту в поле комплексных чисел нет по простой 115 причине: поле комплексных чисел не упорядочиваемо (и поэтому нет понятия «положительный» и «отрицательный»). Действительно, если бы конус положительности C+ существовал, то любое из предположений i ∈ C+ или –i ∈ C+ ведет к противоречию. ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА. Зададим на ком- плексной плоскости полярные координаты, положив началом координат точку O, а полярной осью выберем положительное направление действительной оси. Полярный радиус – расстояние r от точки z до начала координат называют модулем числа z. Обозначается модуль так же, как модуль действительного числа z. Если комплексное число z = a+bi, то z= a 2 + b 2 . Полярный угол ϕ точки z (угол, на который надо повернуть полярную ось до совмещения ее с направлением на точку z) принято называть аргументом числа z. Аргумент обозначается символом Arg z. Обычно используют главное значение аргумента, ϕ = arg z, задаваемое дополнительным условием: π < arg z ≤ π. Аргумент для нуля не определен, но нулевое число полностью задается своим модулем. Если же ненулевое число z = a + bi задано в алгебраической форме, то модуль z≠ 0, а аргумент можно вычислить, и таким образом, перейти от декартовой системы координат к полярной системе: sin arg z = 116 b a2 + b2 , cos arg z = a a +b 2 2 . Эти два равенства определяют arg z однозначно с точностью до сравнимости по модулю 2π. Точнее, если ϕ1 и ϕ2 два решения системы уравнений cos ϕ = c,  sin ϕ = d , то ϕ1 ≡ ϕ2(mod 2π), т. е. ϕ1 – ϕ2 = 2πk, где k – целое число. Пусть, наоборот, заданы полярные координаты комплексного (ненулевого) числа z, z=r, arg z= ϕ. Тогда алгебраическую форму a+bi числа z можно найти по формулам: a=r cos ϕ, b=rsin ϕ. Подставим вместо a, b эти значения, и получим выражение для z: z = r (cos ϕ + i sin ϕ). Такое представление комплексного числа называют тригонометрической формой. Тригонометрическая формула одновременно представляет число z и в декартовых координатах (достаточно раскрыть скобки), и в полярных (в ней участвуют и модуль, и аргумент числа). Используя единственность алгебраической форме и равенство cos2 ϕ + sin2 ϕ = 1, получаем утверждение о е д и н с т в е н н о с т и т р и г о н о м е т р и ч е с к о й ф о р м ы : если r1(cos ϕ + i sin ϕ) и r2(cos ψ + i sin ψ) две тригонометрические формы одного и того же комплексного числа, то r1=r2, и ϕ ≡ ψ(mod 2π). 117 Алгебраическую форму комплексное числа можно было взять произвольно – каждая пара действительных чисел a, b однозначно задает комплексное число. То же самое (при естественных ограничениях) верно и для тригонометрической формы. Для каждого действительного числа r > 0, и каждых действительных α, β таких, что α2 + β2=1, существует единственное комплексное число z, имеющее тригонометрическую форму z = r(cos ϕ + isin ϕ), где cos ϕ=α, sin ϕ=β. Модуль комплексного числа, как и модуль действительного, – это расстояние от точки, изображающей число, до начала координат. Если в представлении z = x + yi число y = 0, т. е. число z – действительное, то новый модуль (комплексного числа) в точности совпадает со старым (модулем действительного числа). Переносятся в комплексную область и другие свойства модуля действительных чисел. Например, модуль произведения действительных чисел равен произведению модулей. Это свойство распространяется на все комплексные числа: модуль п р о и з ведения комплексных чисел равен произведению модулей сомножителей. Последнее утверждение можно проверить непосредственным вычислением, а можно воспользоваться тождеством z= z ⋅ z . Кстати, зная, как выглядит выражение для модуля, из равенства α ⋅ β=α⋅β, где α и β – произвольные комплексные числа можно получить чисто арифметический факт: произведение двух сумм двух квадратов целых чисел само является суммой двух квадратов. Кроме свойства α ⋅ β=α⋅β, для любых действительных чисел α, β 118 выполняется еще правило знаков: (−α)β = α (−β) = −α β и (−α) (−β) = αβ. Знак действительного числа – это множитель, равный 1 или -1. В случае комплексных чисел знак превращается в комплексное число, модуль которого равен единице, а правило знаков принимает вид: для любых комплексных чисел α, β: Arg (α⋅β) = Arg α +Arg β. при умножении комплексных чисел их модули перемножаются, а аргументы складываются. Для действительных чисел аргумент принимает лишь два значения: 0 или π. В первом случае знак равен 1, а во втором −1. Образно говоря, если число α представлено радиус-вектором α, то умножение α на число β означает, что вектор α поворачивается на угол arg β, а модуль вектора α⋅ растягивается (или сжимается) в β раз. Если β=1, то умножение на число β сводится лишь к повороту вектора α⋅ на некоторый угол. Правило знаков для действительных чисел означает, что мультипликативная группа ненулевых действительных чисел является прямым произведением мультипликативной группы положительных действительных чисел и группы, состоящей из действительных чисел, модуль которых равен единице. Перечисленные свойства модуля и аргумента комплексных чисел означают, что это свойство буквально переносится на мультипликативную группу комплексных чисел (только множество комплексных чисел, модуль которых равен единице - теперь зна119 чительно большее множество): Мультипликативная группа ненулевых комплексных чисел является прямым произведением мультипликативной группы положительных действительных чисел и группы, состоящей из комплексных чисел, модуль которых равен единице. На рисунке черным цветом выделены прямые множители мультипликативной группы ненулевых комплексных чисел. Пересечение окружности единичного радиуса с действительной осью и как раз и дает соответствующий прямой множитель группы действительных чисел. Деление (на ненулевое число) является операцией, обратной умножению, поэтому для любых комплексных чисел α, β (β ≠ 0): α α = β β α и Arg   = Arg α − Arg β. β Если число β ≠ 0, то β–1=β–1, Arg β–1 = –Arg β. Последнее замечание означает, что геометрически число β–1 получается из числа β композицией осевой симметрии в оси абсцисс и инверсии в окружности единичного радиуса с центром в начале координат. 120 На рисунке изображено соответствующее построение. ЭКСПОНЕНЦИАЛЬНАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА. Разложим функции ex, cos x и sin x в ряды Тейлора: x xn e = 1 + + ... + + ... , 1! n! x sin x = x − x3 x 2n +1 + ... + (− 1)n + ... , (2n + 1)! 3! 2n x2 n x cos x = 1 − + ... + (− 1) + ... . (2n )! 2! Если теперь ряд для sin x умножить на i, isin x = ix − i x3 x 2n +1 + ... + i (− 1)n + ... , (2n + 1)! 3! и затем сложить с рядом для cos x, то получим ряд для eix: e ix = 1 + ix x 2 xn − + ... + i n + ... . 1! 2! n! Таким образом (для любого x): eix = cos x + isin x . Последнее тождество называют формулой Эйлера. Из формулы Эйлера следует, что re iϕ = r (cos ϕ + i sin ϕ ) . 121 Если r > 0. то выражение справа – это тригонометрическая форма комплексного числа. Выражение слева называют экспоненциальной (показательной) формой комплексного числа. Этой же форме можно придать другой вид. Для любого действительного числа a число ea – положительно, поэтому любое ненулевое комплексное число можно представить в виде: e a +bi = e a (cos b + isin b ) . Умножение и деление в экспоненциальной форме подтверждают свойства модуля и аргумента, полученные ранее с помощью тригонометрической формы: iα iβ i (α +β ) r1e ⋅ r2 e = r1r2e ; r1eiα r = 1 ei (α −β ). r2eiβ r2 Отметим, что для для x = π формула Эйлера принимает вид e i π = −1. Перенесем –1 в левую часть равенства, и в результате получим тесную и загадочную связь между всеми важнейшими константами математи- ки (e, π, i, 1, 0): e i π + 1 = 0. ФОМУЛА МУАВРА. Используя индукцию по n, для равных множителей получаем следующее равенство (для каждого натурального числа n): 122 [r(cos ϕ + i sin ϕ)]n = rn(cos nϕ + i sin nϕ). В честь автора эту формулу называют формулой Муавра1. Возвести комплексное число в натуральную степень n можно и с помощью бинома Ньютона. Используя для возведения степень числа z = cos ϕ + i sin ϕ формулу Му- авра и бином Ньютона, с помощью единственности алгебраической формы комплексного числа можно получить все школьные формулы, выражающие cos 2ϕ, sin 2ϕ, cos 3ϕ, sin 3ϕ через cos ϕ и sin ϕ. Впрочем, с помощью бинома Ньютона можно получить сразу общее выражение (для любого натурального n): 2 4 cosnx = cos n x −   cos n − 2 x sin 2 x +   cos n − 4 x sin 4 x − ... n n 3  5  sinnx = n cos n −1 x sin x −   cos n −3 x sin 3 x +   cos n −5 x sin 5 x − ... n n ИЗВЛЕЧЕНИЕ КОРНЕЙ В ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ. Своему происхождению поле комплексных чисел обязано невозможности извлечения корня квадратного из отрицательного числа в поле действительных чисел. Само поле C по такой причине расширять не придется - в поле комплексных чисел извлекается корень любой степени из любого числа. Используя формулу Муавра и единственность тригонометрической формы комплексного числа (более точно единственность аргумента по модулю 2π), получаем формулу для нахождения корня n-ой степени из любого комплексно- 1 Абрахам де Муавр (Moivre, 1667–1754) – английский математик французского происхождения. 123 го числа α (эту формулу также называют формулой Муавра1). Если комплексное число α = r(cos ϕ + i sin ϕ) отлично от нуля, то уравнение z n = α имеет в точности n различных решений z0, z1, ... , zn − 1, которые можно найти по формуле ϕ + 2kπ ϕ + 2kπ  z k = n r  cos + isin n n   ,  где k=0, 1, ... , n − 1. Заметим, что все эти zk имеют один и тот же модуль, и поэтому находятся на окружности, радиуса n r и с центром в начале координат. Более того, каж- дый новый корень можно получить из предыдущего умножением на число 2π 2π 2π   + isin  , т. е. поворотом на угол .  cos n n  n  Таким образом, если комплексное число α отлично от нуля, то все корни n-ой степени из α расположены в вершинах правильного n-угольника, вписанного в окружность радиуса n α и с центром в начале координат. При решении уравнения z 2 = α , где α - положительное действительное число, получается два значения. Одно из них числа α,. второе получается умножением α арифметический корень из α на –1. Если бы взяли сначала ко- рень - α , то снова умножением на 1 и –1 получаем все корни этого уравнения. Числа 1 и –1 - это решения уравнения z2 = 1, т. е. корни второй степени из единицы. В поле комплексных чисел эта идея (получить все корни из одного умножением на корни из единицы) получает естественное обобщение с помошью корней n–ой степени из единицы.. Эти формулы были получены А. де Муавром в 1707 году, современная запись предложена Л. Эйлером в 1748 году. 1 124 КОРНИ ИЗ ЕДИНИЦЫ. Решение уравнения zn = 1 называют корнем n-ой степени из единицы. Обычно корни из единицы обозначают символ εk. Все свойства произвольных корней из ненулевого комплексного числа, разумеется, переносятся и на корни из единицы. С учетом того, что все εk имеют модуль 1, получаем, что корни n-ой степени из единицы имеют вид: ε k =cos 2kπ 2kπ + i sin , n n где k = 0, 1, 2, ..., n - 1. Для каждого натурального числа n существует n различных корней n-ой степени из единицы. Корни n-ой степени из единицы расположены в вершинах правильного n-угольника, вписанного в окружность единичного радиуса с центром в начале координат. Пусть M – множество всех корней n-ой степени из единицы. Единица принадлежит M, кроме того, M замкнуто относительно умножения и взятия обратного. Короче говоря, м н о ж е с т в о к о р н е й n - о й с т е п е н и и з е д и н и ц ы образует мультипликативную группу. Обычно слово «мультипликативную» в этом случае лишь подразумевают и говорят просто о группе корней n-ой степени из единицы. В отличие от общей ситуации, многоугольник корней n-ой степени из единицы легко изобразить – одна из вершин этого n-угольника. Непосредственно из формул для корней видно, что εk = ε1k , а это значит, что все корни n-ой степени из единицы можно получить из корня ε1 =cos 2π 2π + i sin n n 125 с помощью возведения его в степень. Группа корней n-ой степени из единицы порождается одн и м э л е м е н т о м ; эта группа – циклическая. Элемент, порождающий группу корней n-ой степени из единицы, называют первообразным корнем. Иначе говоря, комплексное число ε называют первообразным корнем n-ой степени из единицы, если любой корень n-ой степени из единицы получается из числа ε возведением в некоторую степень с целым показателем. Кроме ε1, в группе корней n-ой степени из единицы могут оказаться и другие корни, обладающие тем же свойством. Если два целых числа взаимно просты, то существуют целые u, v такие, что au + bv = 1. Используя это свойство, получаем: число ε k =cos 2kπ 2kπ +isin n n является первообразным корнем n-ой степени из единицы тогда и только тогда, когда НОД(n, k)=1. Отметим дополнительно, что если m= n , НОД(n, k ) то число ε k =cos 2kπ 2kπ +isin n n является первообразным корнем m-ой степени из единицы. 126 Если β – какое-нибудь решение уравнения z n = α, а ε0, ε1, ... , εn - 1 – корни n-ой степени из единицы, то {βε0, βε1, ... , βεn-1} – это всё множество решений этого уравнения. Используя обычную формулу для суммы членов геометрической прогрессии, получаем, что сумма всех корней n-ой степени из единицы равна нулю. МНОГОЧЛЕНЫ НАД ПОЛЕМ КОМПЛЕКСНЫХ ЧИСЕЛ. Как и для любого кольца многочленов над полем, кольцо C [x] – евклидово, а поэтому образует кольцо главных идеалов, и, следовательно, гауссово. Гауссовость означает, что каждый многочлен положительной степени из C[x] можно представить в виде произведения неприводимых множителей и, и такое представление единственно с точностью до ассоциированности и порядка множителей. Особенностью кольца C[x] является то, что неприводимыми многочленами в нем являются только многочлены первой степени. Таким свойством обладают только кольца многочленов над алгебраически замкнутыми полями. ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ. Поле P называется алгебраически замкну- тым, если оно содержит корни всех многочленов положительной степени с коэффиицентами из поля P. П о л е к о м п л е к с н ы х ч и с е л а л г е б р а и ч е с к и з а м к н у т о . Этот факт вошел в историю науки под названием «основная теорема алгебры». Первое безупречное доказательство «основной теоремы» было получено К. Гауссом, поэтому иногда ее называют теоремой Гаусса. Для доказательства «основной теоремы» заметим сначала, что многочлен второй степени с комплексными коэффициентами имеет, по крайней мере, один комплексный корень. Далее покажем, что каждый многочлен нечетной степени с действительными коэффициентами всегда имеет корень (может быть, комплексный). 127 Пусть f(x)=a0xn + a1xn-1 + ... + an-1x + an – многочлен с действительными коэффициентами, и a0≠0. Тогда  a a  a a f ( x) = x n  a0 + 1 + 2 ... + n −1 + n  , x x2 x n −1 x n   и при x, стремящимся к бесконечности, все слагаемые внутри скобок, кроме a0, стремятся к нулю. Это значит, что функция y = f(x) при достаточно больших (и достаточно малых) значениях переменного x почти неотличима от функции y = a0xn. Множество корней ненулевого многочлена с коэффициентами из поля конечно. Это значит, что все корни находятся внутри некоторого круга с центром в начале координат. Радиус этого круга можно оценить (правда, весьма грубо) с помощью коэффициентов многочлена. Пусть M = max (a1, …, an-1, an) тогда если x > M, то xn > a1xn – 1 + … + an – 1x+ an. Это значит, что в н е к р у г а с ц е н т р о м в н а ч а л е к о о р д и н а т и радиуса M корней у многочлена нет. Это утверждение принято называть леммой о модуле старшего члена. В частности, если n – нечетное, то на концах некоторого интервала (a, b) функция y = f(x) имеет разные знаки. Целая рациональная функция – непрерывна, и поэтому многочлен нечетной степени с действительными коэффициента128 ми имеет, по крайней мере, один действительный корень, расположенный между a и b. По теореме Кронекера д л я к а ж д о г о п о л я P и к а ж д о г о м н о г о члена f(x) положительной степени n с коэффициентами из P найдется поле P1, содержащее P и, по крайней мере, один корень многочлена f(x). Отсюда следует, что, что любой многочлен n-ой степени с комплексными коэффициентами имеет n корней x1, x2, … xn, лежащих в некотором расширении P поля C. Теперь индукцией по степени двойки - числу m в степени n = 2ms многочлена f(x) с помощью основной теоремы о симметрических многочленах, используя вспомогательный многочлен g(x) = ∏ (x − yij (c )), 1≤i < j < n где yij(с) = cxixj + xi + xj, a∈R, устанавливается, что f(x) имеет, по крайней мере, один комплексный корень. Пусть f(x) = xn + a1xn – 1 + ... + an – 1x + an – многочлен с комплексными коэффициентами. Рассмотрим второй многочлен: f1(x) = x n + a0 x n −1 + ... + an −1 x + a0 , коэффициенты которого комплексно сопряжены с коэффициентами многочлена f(x). Многочлен 129 (xn + a1xn – 1 + ... + an – 1x + an)( x n + a0 x n −1 + ... + an −1x + a0 ) имеет действительные коэффициенты. Так как отображение, переводящее каждое комплексное число в сопряженное, является автоморфизмом поля комплексных чисел, оставляющим поле действительных чисел неподвижным, f1 ( x1 ) = f ( x1 ) , и, следовательно, f ( x1 ) = 0. Таким образом, к а ж д ы й м н о г о ч л е н п о л о ж и т е л ь н о й с т е п е н и с комплексными коэффицентами имеет, по крайней мере, один комплексный корень. Как и для любого алгебраически замкнутого поля, над полем комплексных чисел неприводимыми являются только многочлены первой степени. Пусть теперь f (z) = a0zn + a1zn – 1 + ... + an – 1z+ an многочлен n-й степени с комплексными коэффициентами, т. е. ak = uk + vk i для k = 0, 1, …, n и uk , vk ∈ R. Если комплексное число z имеет вид z = x + yi, где x, y— действительные числа, то, подставив в многочлен f (x) вместо коэффициентов ak и переменного z их выражения в алгебраической форме, после раскрытия скобок и группировки получим алгебраическую форму для f (z): f (z) = U(x, y) + V(x, y)⋅i, где U(x, y), V(x, y) — многочлены с действительными коэффициентами от переменных x и y. Многочлены U(x, y), V(x, y) являются непрерывными функциями от двух действительных переменных x, y. Непрерывной функцией будет и функция — модуль многочлена 130 f ( z ) = U 2 ( x, y ) + V 2 ( x, y ) . Функция w = f(z) обращается в нуль одновременно с функцией w = f(z). Последняя является действительной функцией от двух переменных, и ее можно переставить наглядно в виде графика. Основная теорема алгебры имеет наглядную геометрическую интерпретацию; она означает, что если многочлен степени n не имеет кратных корней, то график модуля этого многочлена соприкасается с координатной плоскостью в точности в n точках. Например, на рисунке изображен фрагмент графика функции w = 0, 1z 4 − 0,2i ⋅ z + 1 . По свисающим вниз четырем выпуклостям графика, касающихся координатной плоскости, видно местонахождение корней многочлена Кстати, корни многочлена 0,1z 4 – 0,2iz + 1 приближенно равны: z1 = 1,410526327 + 1,262336581i; z2 = –1,410526327 + 1,262336581i; z3 = –1,094259005 – 1,262336581i; z4 = 1,094259005 – 1,262336581i. 131 Лемма о модуле старшего члена многочлена означает, что для каждого положительного числа M существует положительное r такое, что z > r ⇒ f (z)> M. Это значит, что если провести плоскость через точку M на оси Ow параллельно плоскости Im z O Re z, то эта плоскость рассечет график w = f (z) на две части, причем часть, расположенная вне круга с центром в начале координат и радиусом r, целиком находится выше этой плоскости (и поэтому вне круга уж точно не будет касаться координатной плоскости). То, что оценка эта слишком груба, показывает приведенный графический пример. Все корни рассматриваемого многочлена находятся внутри квадрата –2 < Re z < 2, –2 < Im z < 2, и поэтому вне круга с центром в начале координат и радиусом 2 2 корней у многочлена нет. «Ловушка для корней», полученная с помощью леммы о модуле старшего члена, значительно больше, — это круг радиус, которого больше числа M = max(–0,2: 0,1, 1: 0,1) + 1 = max(2, 10) + 1 =11. АЛГЕБРАИЧЕСКОЕ ЗАМЫКАНИЕ ПОЛЯ. Поле комплексных чисел не является наименьшим алгебраически замкнутым полем. Каждое поле P можно вложить в алгебраически замкнутое поле P , причем если P – счетно, то и P существует счётное. По имени автора этот факт называют теоремой Штейница1. Для доказательства теоремы Штейница в случае счётного поля P можно опираться лишь на теорему Кронекера о существовании простого алгебраического расширения, а для несчётного P придется воспользоваться аксиомой выбора в виде леммы Цорна. 1 Эрнст Штейниц (Steinitz) (1871–1928) – немецкий математик. 132 В частности, из теоремы Штейница следует, что поле рациональных чисел Q изоморфно вложимо в счётное алгебраически замкнутое поле Q . 133 7. ВЕКТОРНЫЕ ПРОСТРАНСТВА, ПРИМЕРЫ, СВОЙСТВА, РАЗМЕРНОСТЬ. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И НЕЗАВИСИМОСТЬ ВЕКТОРОВ Основные понятия: Внешняя и внутренняя операции, арифметическое векторное пространство, линейная зависимость и независимость, максимальная подсистема и ранг системы векторов, система линейных уравнений, система однородных линейных уравнений. Основные факты: конечномерное векторное пространство изоморфно арифметическому векторному пространству; ранги эквивалентных систем векторов совпадают. ВЕКТОРНЫЕ ПРОСТРАНСТВА. Векторным пространством над полем P называют алгебру L с двумя операциями, внутренней (сложением) и внешней (умножением на скаляр), причем алгебра < L; + > является абелевой группой, и для каждых α,β из L, и каждых a, b из P: 1) a(α+β)=aα+aβ; 2) (a+b)α=aα+bα; 3) a(bα)=(ab)α; 4) 1α=α. Элементы из L называют векторами, а элементы из P - скалярами. Символом 1 здесь обозначен единичный элемент поля P (отметим, что поле P – не обязательно числовое). Векторное пространство над полем действительных чисел принято называть действительным векторным пространством. Если на операцию умножения на скаляр смотреть как на одноместную (т. е. каждому элементу из P соответствует одна одноместная операция), то на L определена одна двуместная операция сложение и P одноместных операций: L = . 134 Векторное пространство L называется конечномерным, если L конечно порождено, т. е. найдется конечное множество α1, α2, ..., αn из L такое, что любой элемент из L получается из αi с помощью сложения и умножения на скаляр. Вектор k1α1 + k2α2 + ... + knαn называют линейной комбинацией векторов α1, α2, ... αn (скаляры ki - коэффициенты линейной комбинации). Если L порождено элементами α1, α2, ..., αn, то L состоит из всевозможных линейных комбинаций элементов αi: L={k1α1 + k2α2 + ... + knαn  ki ∈P}. Само поле P можно рассматривать как векторное пространство над P, считая умножение в поле умножением на скаляр. Ситуацию можно обобщить. Если поле P - является подкольцом кольца P1, то P1 - векторное пространство над полем P. АРИФМЕТИЧЕСКОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО. Декартова степень Pm превращается в векторное пространство над P, если в Pm определить операции сложения и умножения на скаляр по правилам (для каждых ai, bi, k из P): (a1, опр a2, ..., am ) + (b1, b2 , ..., bm ) = (a1 + b1, a2 + b2 , ..., am + bm ) , опр k (a1, a2, ..., am ) = (k a1, ka2, ..., kam ) . Элементы декартова произведения можно записать не только в виде строк, но и в виде столбцов, или в виде прямоугольной таблицы. Если элементы из Pm изображаются в виде строк, то пишут: P1 × m. Если речь идет Pm, представлен135 ном, как множество столбцов, то пишут: Pm × 1. Если же пришлось каждый вектор из Pm разломать на части и сложить из них прямоугольник из k строк и n столбцов, то пользуются символикой Pk × n. Пространство Pm, называют арифметическим m-мерным векторным пространством над полем P. Если поле P состоит из p элементов, то пространство Pn содержит pn элементов. Например, на конечное булево кольцо < B; + , ⋅ > можно смотреть как на векторное пространство над полем Z2, полагая (для любого x из B): 1x=x, 0x=0. Отсюда следует, что порядок конечного булева кольца равен 2n . Если L – векторное пространство над полем P, то элементы вида ε1 = (1, 0, 0, ..., 0, 0), ε2 = (0, 1, 0, ..., 0, 0), . . . . . . . . εn = (0, 0, 0, ..., 0, 1), порождают P n . Арифметическое векторное пространство P n - конечномерно. Геометрические векторы (т. е. направленные отрезки или классы равных и одинаково направленных отрезков) с обычными операциями сложения и умножения на скаляр образуют конечномерное векторное пространство. СВОЙСТВА ВЕКТОРНЫХ ПРОСТРАНСТВ. Для любого элемента α из векторного пространства L и любого скаляра k из поля P выполняются следующие свойства (θ - нулевой вектор; 0 - нулевой, а 1 - единичный элемент поля): k⋅θ = θ; 0⋅α = θ; если k⋅α = θ, то k = 0 или α = θ; (−1) ⋅α = −α. 136 Для любых элементов α1, α2, ... , αn из векторного пространства L и любых скаляров s, k1, k2, .... , kn из поля P s ⋅ (k1 α1 + k2 α2 + ... + kn αn) = (s k1)α1 + (s k2)α2 + ... + (s kn)αn. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ И НЕЗАВИСИМОСТЬ. Система векторов S называется линейно независимой, если любая линейная комбинация ее элементов, содержащая хотя бы один ненулевой коэффициент, отлична от нулевого вектора. Система S может быть конечной или бесконечной (любой мощности), хотя в комбинации всегда участвуют лишь конечное число векторов из S. Если вектор β является линейной комбинацией векторов α1, α2, ..., αn, β = k1α1 + k2α2 + ... + knαn, то говорят, что β линейно выражается через векторы α1, α2, ..., αn. Система векторов линейно зависима тогда и только тогда, когда один из векторов линейно выражается через остальные. Система векторов линейно независима тогда и только тогда, когда ни один из векторов не выражается линейно через остальные. Упорядоченная конечная система векторов линейно независима тогда и только тогда, когда ни один из векторов не выражается линейно через предыдущие векторы этой системы. Пусть α1, α2, ..., αn - элементы n-мерного арифметического пространства Pm. Эта система линейно зависима тогда и только тогда, когда уравнение x1α1 + x2α2 + ... + xnαn = θ 137 с неизвестными скалярами x1, x2, ..., xn имеет только нулевое решение. Запишем элементы αi, в виде столбцов. Тогда векторное уравнение превратится в систему линейных уравнений a11 x1 + a12 x2 + ... + a1n xn = 0, a x + a x + ... + a x = 0,  21 1 22 2 2n n   . . . . . . . . am1 x2 + am 2 x2 + ... + amn xn = 0, и задача о линейной зависимости сведется к вопросу об определенности системы однородных линейных уравнений. С помощью системы линейных уравнений можно выяснить, выражается вектор β через векторы α1, α2, ... , αn или нет. Векторное уравнение x1α1+x2α2 +...+xnαn=β в арифметическом m-мерном векторном пространстве превращается в систему линейных уравнений a11 x1 + a12 x2 + ... + a1n xn = b1 , a x + a x + ... + a x = b ,  21 1 22 2 2n n 2   . . . . . . . . . am1 x2 + am 2 x2 + ... + amn xn = bm, где β - столбец свободных членов. Вектор β линейно выражается через αi тогда и только тогда, когда эта система линейных уравнений имеет решение. Система из m однородных линейных уравнений от n неизвестных всегда имеет ненулевое решение, если n > m. Отсюда следует, что система, состоящая из n элементов арифметического m-мерного векторного пространства Pm, линейно зависима, если n > m. Линейно независимая система порождающих векторного пространства на138 зывается базисом этого пространства. Базис пространства L – это максимальная (в смысле теоретико-множественного включения) линейно независимая система векторов из L. Максимальность системы S означает, что для любого α, не принадлежащего S, система S ∪ {α} – линейно зависима. Если пространство L конечно порождено, то упорядочив систему порождающих и удалив из этой системы те векторы, которые выражаются через предыдущие, получим базис пространства L. Чтобы доказать существование базиса бесконечномерного векторного пространства, придется использовать аксиому выбора (например, в виде леммы Цорна). Теоретико-множественное объединение множества цепи линейно независимых систем векторов само является линейно независимым. Следовательно, по лемме Цорна среди множества линейно независимых систем найдется максимальная; эта максимальная и есть базис. ОСНОВНАЯ ТЕОРЕМА О ЛИНЕЙНОЙ ЗАВИСИМОСТИ. Главным фактом о ли- нейной зависимости (и независимости) векторов является основная теорема о линейной зависимости (теорема Штейница о замене): е с л и к а ж д ы й в е к тор системы α1, α2, ..., αn ры β1, β2, ..., βm и линейно выражается через векто- n>m, то система α1, α2, ..., αn линейно зависима. Теорема Штейница в виде теоремы, противоположной обратной, означает, что если каждый вектор α1, α2, ..., αn линейно независимой системы выражается через векторы β1, β2, ..., βm, то m ≤ n. Две системы векторов называют эквивалентными, если каждый вектор одной системы линейно выражаются через векторы другой. Из теоремы Штейница следует, что э к в и в а л е н т н ы е л и н е й н о н е з а висимые системы векторов состоят из одинакового числа элементов. 139 8. БАЗИС И РАЗМЕРНОСТЬ КОНЕЧНОМЕРНЫХ ВЕКТОРНЫХ ПРОСТРАНСТВ. ПРОСТРАНСТВО РЕШЕНИЙ ОДНОРОДНОЙ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ИЗОМОРФИЗМ ВЕКТОРНЫХ ПРОСТРАНСТВ РАВНЫХ РАЗМЕРНОСТЕЙ Основные понятия: Порождающая система, базис, размерность, эквивалентность системы векторов, координаты вектора, система однородных линейных уравнений, множество решений, фундаментальный набор решений, изоморфизм. Основные факты: базисы конечнопорожденного векторного пространства равномощны; два векторных пространства изоморфны тогда и только тогда, когда размерности их совпадают; множество решений системы однородных линейных уравнений является подпространством в арифметическом векторном пространстве. БАЗИС И РАЗМЕРНОСТЬ КОНЕЧНОМЕРНЫХ ВЕКТОРНЫХ ПРОСТРАНСТВ. Ба- зис векторного пространства – это линейно независимая система порождающих, и он же – максимальная линейно независимая система векторов этого пространства. Все базисы конечномерного векторного пространства эквивалентны, и поэтому по теореме Штейница состоят из одного и того же числа векторов. Число элементов в базисе векторного пространства L над полем P называют размерностью пространства L и обозначают символом dimP L. Если в рассматриваемых задачах поле скаляров не меняется, то пишут просто dim L. Подалгебра векторного пространства называется подпространством. Для того чтобы непустое подмножество H было подпространством пространства L необходимо и достаточно, чтобы H было замкнуто относительно сложения и умножения на скаляр. Как обычно для подалгебр, можно определить подпространство, порожденное множеством S. Множество всех линейных комбинаций элементов из 140 подмножества S образует наименьшее подпространство пр(S), содержащее S. Это подпространство называют подпространством, порожденным S (или линейной оболочкой множества S). Число элементов в максимальной линейно независимой подсистеме векторов данной системы S называют рангом системы S. Размерность пространства, порожденного множеством S, равна рангу системы S: dim пр(S) = ранг S. Если H – подпространство конечномерного пространства L, то каждый элемент базиса H линейно выражается через базис L, и поэтому согласно теореме Штейница dim H ≤ dim L. Это, в частности, означает, что к а ж д о е п о д п р о с т р а н с т в о к о н е ч номерного пространства само конечномерно. Каждую линейно независимую систему векторов конечномерного векторного пространства можно дополнить до базиса пространства. Таким образом, если H – подпространство конечномерного пространства L, и dim H = dimP L, то H = L. С помощью этого замечания можно решить проблему вхождения для конечномерных векторных пространств. Вектор β тогда и только тогда принадлежит подпространству, порожденному векторами α1, α2, ... αn, когда dim пр(α1, α2, ... αn) = dim пр(α1, α2, ... αn, β). Таким образом, проблема вхождения для конечномерных пространств сводится к вычислению ранга системы векторов. Если матрицы A и B – невырождены, то A−1B - тоже невырождена, и поэтому является произведением элементарных матриц. Так как A ⋅ A−1B = B , любой базис конечномерного пространства можно получить из данного базиса с помощью цепочки элементарных преоб141 разований. Если α1, α2, ..., αn – базис пространства L, а x - произвольный вектор этого пространства, то x имеет единственное представление в виде x = x1α1 + x2α2 + ... + xnαn. Строку x1, x2, ..., xn .называют координатной строкой вектора .x (а коэффициенты xi – координатами). Координатную строку (x1, x2, ..., xn) вектора x изображают символом [x]. Координатная строка является элементом арифметического векторного пространства Pn. О т о б р а ж е н и е L → P n , с о п о с т а в л я ю щ е е к а ж д о м у вектору его координатную строку (при фиксированном базисе) является биекцией. ПОДПРОСТРАНСТВО УРАВНЕНИЙ. РЕШЕНИЙ СИСТЕМЫ ОДНОРОДНЫХ ЛИНЕЙНЫХ Множество решений системы однородных линейных уравнений замкнуто относительно сложения и умножения на скаляр, и поэтому. является подпространством пространства Pn. Пусть система однородных линейных уравнений с n неизвестными имеет ранг r. Преобразуем систему к трапецеидальному виду, и получим n − r свободных неизвестных. Множество решений M системы имеет вид M = { ( f1 ( xr +1 , ... , xn ) , ... , f r ( xr +1 , ... , xn ) , xr , ... , xn ) xr +1 , ... , xn ∈ P } , где fi(xr+1, ..., xn) – однородные линейные функции от свободных переменных xr+1, ..., xn. Но это значит, что каждое решение системы можно представить в виде линейной комбинации n − r линейно независимых решений: (f1(1, 0, ..., 0, 0), ..., fr(1, 0, ..., 0, 0), 1, 0, ..., 0, 0), 142 (f1(0, 1, 0, ..., 0), ..., fr(0, 1, 0, ..., 0), 0, 1, 0, ..., 0), . . . . . . . . . . . . (f1(0, 0, ..., 0, 1), ..., fr(0, 0, ..., 0, 1), 0, 0, ..., 0, 1). По традиции решения, образующие базис пространства решений системы однородных линейных уравнений, называют фундаментальным набором решений. Фундаментальный набор решений системы однородных линейных уравнений от n переменных состоит из n−r элементов, где r – ранг матрицы системы. Число элементов в фундаментальном наборе решений равно размерности пространства решений системы однородных линейных уравнений. Размерность пространства решений системы не зависит от способа ее решения, поэтому число свободных (и несвободных) переменных системы линейных уравнений зависит не от способа решения этой системы, а только от самой системы. Каждое подпространство арифметического n-мерного векторного пространства является множеством решений некоторой системы однородных линейных уравнений. ЛИНЕЙНОЕ МНОГООБРАЗИЕ РЕШЕНИЙ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. Множество решений произвольной системы линейных уравнений (s) образует линейное многообразие H+γ, где H – подпространство решений, сопутствующей для (s) однородной системы, а γ – произвольное решение системы (s). Размерность подпространства H называют размерностью многообразия H + γ. Если γ1, γ2, ...,γk - базис сопутствующей однородной системы для системы (s), а γ - произвольное решение системы (s), то множество решений (s) имеет вид: 143 {t1γ1+t2γ2+...+tkγk+γ  t1, t2, ..., tk ∈ P}. Таким образом, свободные переменные системы линейных уравнений - это коэффициенты ti в представлении элементов подпространства решений сопутствующей системы через фундаментальный набор решений. Каждое линейное многообразие арифметического векторного пространства является множеством решений некоторой системы линейных уравнений. Линейное многообразие размерности n − 1 называют гиперплоскостью. Множество решений одного линейного уравнения, в котором не все коэффициенты равны нулю, является гиперплоскостью в пространстве Pn. Множество решений системы линейных уравнений представляет собой пересечение множеств решений отдельных уравнений. Система из m линейных уравнений от n неизвестных равносильна системе, состоящей не более чем из n уравнений. Отсюда следует, что каждое линейное многообразие арифметического n-мерного векторного пространства является пересечением не более чем n гиперплоскостей. ИЗОМОРФИЗМ ВЕКТОРНЫХ ПРОСТРАНСТВ ОДИНАКОВОЙ РАЗМЕРНОСТИ. Два векторных пространства L1 и L2 над одним и тем же полем P изоморфны, если существует взаимно однозначное соответствие f: L1 → L2, сохраняющее операции: f(α + β) = f(α) + f(β), f(kα) = kf(α) для всех α, β из L1 и для всех k из P. При фиксированном базисе отображение x a [x] является взаимно однозначным соответствием между элементами пространств L и Pn, сохраняющим 144 операции. Это значит, что к а ж д о е в е к т о р н о е п р о с т р а н с т в о р а з м е р ности n изоморфно n-мерному арифметическому векторному пространству. Благодаря этому изоморфизму факт о линейной зависимости системы из n векторов из m-мерного арифметического векторного пространства переносится на любое пространство: е с л и d i m L = m , т о л ю б а я с и с т е м а в е к т о р о в из L, состоящая более чем из m векторов, линейно зависима. Утверждение о многообразиях и гиперплоскостях теперь тоже относится ко всем конечномерным векторным пространствам: к а ж д о е л и н е й н о е многообразие n-мерного векторного пространства является пересечением не более чем n гиперплоскостей. Отношение изоморфности транзитивно и симметрично, поэтому в е к т о р ные пространства одинаковой размерности изоморфны. Пространства различных размерностей не изоморфны, и, таким образом, два векторных пространства L1 и L2 над одним и тем же полем P изоморфны тогда и только тогда, когда dimP L1 = dimP L2. 145 9. ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ, ЕГО СВОЙСТВА, СПОСОБЫ ВЫЧИСЛЕНИЯ. РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ ПО ПРАВИЛУ КРАМЕРА Основные понятия: Симметрическая и знакопеременная группы, определитель, транспонирование, минор, ранг матрицы, элементарные матрицы, дополнительный минор, алгебраическое дополнение, обратная матрица, формулы Крамера. Основные факты: при элементарном преобразовании первого типа определитель умножается на элемент из поля; при элементарном преобразовании второго типа определитель не изменяется; определитель произведения матриц равен произведению определителей; вычисление определителя n-го порядка можно свести к вычислению определителя (n-1)-го порядка; крамеровская система имеет единственное решение, которое можно найти по формулам Крамера. СИММЕТРИЧЕСКАЯ И ЗНАКОПЕРЕМЕННАЯ ГРУППЫ. Взаимно однозначное отображение множества M = {1, 2, …, n} на себя называют подстановкой степени n. Подстановку σ на множестве M можно задать табличным способом. Соответствующая таблица имеет вид 2×n-матрицы. В верхней строке располагаются элементы x из M, а в точности под каждым x находится σ (x): 2 ... n  1  . σ =   σ(1) σ( 2) ... σ( n)  Число всех подстановок множества из n символов равно числу Pn перестановок n символов и равно n! Произведением подстановок называют последовательное их выполнение. Например, 146 1 2 3 4  1 2 3 4  1 2 3 4   ⋅   =   . 3 4 1 2 4 3 2 1 2 1 4 3       Это умножение можно представить наглядно в виде графа. Подстановка, переводящая каждый элемент из M сам в себя, играет роль единичного элемента при умножении, а подстановка  σ(1) σ(2) ... σ( n )   σ −1 =  2 ... n  1 является обратной для подстановки σ. Произведение любых отображений ассоциативно, а это значит, что множество всех подстановок образует группу. Эта группа называется симметрической группой степени n и обозначается символом Sn. Подстановка, меняющая местами два элемента i, j, а остальные оставляющая на месте, называется транспозицией и обозначается транспозиция символом (i j). Каждую подстановку можно представить в виде произведения транспозиций. Например, представим в таком виде подстановку 1 2 3 4  ⋅ α =  2 3 4 1   147 Это разложение можно увидеть, например, на графе подстановки: проведем горизонтальные прямые по графу подстановки таким образом, что между каждой парой прямых оказалось в точности одно пересечение стрелок. Каждое такое пересечение изображает одну транспозицию, участвующую в разложении подстановки на множители. С помощью линий, построенных на рисунке, получается разложение α: α = (3 4) (2 3) (1 2). Представить подстановку в виде произведения транспозиций можно различными способами, но если число транспозиций в каком-нибудь представлении окажется числом четным, то и любое другое представление этой подстановки будет иметь четное число транспозиций-множителей. Подстановку называют четной, если ее можно представить в виде четного числа подстановок, и нечетной – в противном случае. Функция sgn σ, заданная правилом (для каждой σ из Sn):  1, если σ − четная, sgn σ =   − 1, если σ − нечетная, называется знаком подстановки. Отображение σ a sgn σ, ставящее каждой подстановке σ в соответствие ее знак sgn σ, является гомоморфизмом симметрической группы Sn в мультипли148 кативную группу <{1, −1}; ⋅ >, а подгруппа An является ядром этого гомоморфизма. ОПРЕДЕЛИТЕЛЬ КВАДРАТНОЙ МАТРИЦЫ. Каждой квадратной матрице A над полем P  a11  a A =  21 .   an1 a12 a22 . an2 ... ... . ... a1n   a 2n  .   ann  поставим в соответствие элемент A из P по правилу: a11 a12 ... a1n a21 a 22 ... a2n = ∑ sgn σ⋅ a1σ (1) ⋅ a 2σ ( 2) ⋅ ... ⋅ an σ ( n) . . . . . σ∈S n an1 an 2 ... a nn По записи видно, что круглые скобки матрицы опускаются внутри символа определителя. Обычно, допуская вольность речи, опускают слова «квадратной матрицы», и говорят об определителе порядка n, строках и столбцах определителя и т.п. Например, если A – квадратная матрица второго порядка, то ее определитель (говорят: «определитель второго порядка»): a11 a12 = a11 ⋅ a22 – a12 ⋅ a21. a21 a22 149 На схеме отрезками соединены элементы, которые надо перемножить, чтобы получить член определителя; внизу знак, с которым этот член входит в определитель. Схема вычисления определителя второго порядка Определитель третьего порядка имеет вид: a11 a12 a21 a22 a31 a32 a13 a23 = a11 ⋅ a22 ⋅ a33 + a12 ⋅ a23 ⋅ a31 + a13 ⋅ a21 ⋅ a32 – a33 − a13 ⋅ a22 ⋅ a31 − a12 ⋅ a21 ⋅ a33 − a11 ⋅ a23 ⋅ a32. На схеме, называемой правилом Саррюса1, отрезками одинакового цвета соединены группы по три элемента, которые надо перемножить, чтобы получить член определителя третьего порядка. Знак, с которым член входит в определитель, указан снизу. Схема вычисления определителя третьего порядка Фредерик П. Саррюс (Sarrus, XVIII – XIX в. в.) – профессор математики из Страсбурга. Одна из его последних статей (посвященная применениям определенного интеграла) датирована 1848 г. 1 150 Определитель четвертого порядка содержит 24 члена, в определитель порядка 5 входит уже 120 слагаемых и далее с возрастанием порядка определителя число его членов n! быстро покидает пределы разумного. Поэтому схем, подобных правилу Саррюса, для определителей порядков, больших 3, указать невозможно. Однако вычисление определителей порядка n можно свести к вычислению определителя порядка n – 1. Такой переход можно осуществить благодаря свойствам определителей. СВОЙСТВА ОПРЕДЕЛИТЕЛЯ. Замену строк соответствующими столбцами в матрице называют транспонированием матрицы. Если A=(aij) - данная матрица, то ее транспонированная AT=(aji). { Если G – группа, то множество G −1 = g −1 g ∈ G } совпадает с G. Отсюда следует, что определитель не изменяется при транспонировании его матрицы. Основные свойства определителя связаны с изменением его матрицы. Выясним, что происходит с определителем при элементарных преобразованиях его матрицы. При умножении строки матрицы на элемент из P на этот элемент умножается и определитель матрицы. Если G – группа, то множество Gx = { gx g ∈ G } совпадает с G. Отсюда следует, что если в матрице поменять местами две строки, то ее определитель изменит знак. Если поле P имеет характеристику, отличную от двух, то для каждого элемента x из P из равенства x = -x следует x=0. Поэтому для такого поля P определитель матрицы, содержащей две равные строки, равен нулю (для поля характеристики 2 это предложение тоже верно). Определитель матрицы, содержащей две пропорциональные строки, равен нулю. Если каждый элемент i-ой строки определителя ∆ можно представить в 151 виде суммы двух слагаемых: a1 + b1, a2 + b2, ..., an + bn, то ∆ равен сумме двух определителей ∆1 и ∆2, у которых все строки, кроме i-той, такие же, как у ∆, а iая строка у ∆1 – a1, a2, ... , an, а у ∆2 – b1, b2, ... , bn. Если к одной строке матрицы прибавить числа, пропорциональные элементам другой строки, то определитель этой матрицы не изменится. Определитель элементарной матрицы (k −1) Eii + E равен k. Определитель элементарной матрицы kЕij + E (где i ≠ j) равен 1. ГЕОМЕТРИЧЕСКИЙ ПОРЯДКОВ. Определитель СМЫСЛ ОПРЕДЕЛИТЕЛЕЙ ВТОРОГО И ТРЕТЬЕГО диагональной матрицы a 0   b   равен произведению ее диагональных элементов. Если строки определителя считать двумерными векторами α = (a, 0) и β = (0, b), то в этом случае абсолютная величина определителя равна площади параллелограмма, построенного на этих векторах. На рисунке значения a и b выбраны положительными, менять знак определителя придется в случае различных знаков у чисел a и b. В этом частном случае параллелограмм на самом деле является прямоугольником, но оказывается, что и в общем случае ситуация не меняется: абсолютная величина определителя 152 a11 a12 a21 a22 равна площади параллелограмма, построенного на векторах α = (a11, a12) и β = (a21, a22). В частности, площадь параллелограмма будут равна нулю тогда и только когда, когда векторы линейно зависимы, т. е. в данном случае находятся на одной прямой (коллинеарны). Ситуация не меняется и при выходе в трехмерное пространство. Свойство, очевидное для определителя диагональной матрицы, переносится на общий случай: абсолютная величина определителя a11 a21 a31 a12 a22 a32 a13 a23 a33 равна объему параллелепипеда, построенного на векторах: α = (a11, a12, a13), β = (a21, a22, a23), γ = (a31, a32, a33). Нулевой объем этого параллелепипеда сигнализирует нам, что векторы линейно зависимы, они находятся в одной плоскости (компланарны). 153 ОПРЕДЕЛИТЕЛЬ ПРОИЗВЕДЕНИЯ МАТРИЦ. В вырожденной матрице строки (столбцы) линейно зависимы. Если одна из матриц A или B - вырождена, то и произведение AB - вырождено. Определитель вырожденной матрицы равен нулю. Если одна из матриц A или B – вырождена, то AB = A ⋅ B . Невырожденная матрица является произведением элементарных матриц. Если матрица A равна произведению элементарных матриц Si, A=S1⋅ S2⋅ ⋅⋅⋅ ⋅ Sm, то определитель матрицы A равен произведению определителей сомножителей: A=S1⋅S2⋅ ⋅⋅⋅ ⋅Sm. Отсюда следует, что определитель произведения матриц всегда равен произведению определителей. Из этого свойства определителя следует, в частности, что если матрица A обратима, то A −1 = A 154 −1 . НЕОБХОДИМЫЕ НУЛЮ. И ДОСТАТОЧНЫЕ УСЛОВИЯ РАВЕНСТВА ОПРЕДЕЛИТЕЛЯ Строки (столбцы) матрицы A линейно независимы тогда и только то- гда, когда с помощью элементарных преобразований матрицу A можно преобразовать в единичную - E. Отсюда следует, что определитель квадратной матрицы равен нулю тогда и только тогда, когда ее строки (столбцы) линейно зависимы. Это условие можно сформулировать в других (равносильных) вариантах. Определитель квадратной матрицы равен нулю тогда и только тогда, когда эта матрица необратима. Определитель квадратной матрицы порядка n равен нулю тогда и только тогда, когда ранг матрицы не равен n. Определитель квадратной матрицы равен нулю тогда и только тогда, когда эта матрица является делителем нуля. ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЕЙ. Пусть B - прямоугольная m×n-матрица и число k – такое, что k ≤ m, k ≤ n. Выделим в матрице B k строк и k столбцов. Часть элементов будет выделена дважды (это те элементы, которые находятся в выделенной строке и в выделенном столбце одновременно). Выбросим из матрицы B, все элементы, кроме выделенных дважды. Останется матрица B1 - подматрица матрицы B. Определитель B1 называют минором k-того порядка матрицы B. Пусть A - квадратная матрица порядка n. Выделим в ней элемент aij и вычеркнем в ней i-тую строку и j-тый столбец. Определитель оставшейся (n-1)×(n-1)-матрицы называют дополнительным минором элемента и обозначают символом Mij. Дополнительный минор элемента aij, взятый со знаком (-1)i+j, называют алгебраическим дополнением элемента aij и обозначают символом Aij, т. е. Aij = (-1)i+jMij. Сумма произведений элементов строки определителя на 155 их алгебраические дополнения равна определителю. Сумма произведений элементов строки определителя на алгебраические дополнения соответствующих элементов д р у г о й с т р о к и р а в н а н у л ю . С помощью элементарных преобразований строк (или столбцов) мы можем в любой строке (столбце) сделать все элементы, кроме одного, нулевыми. Разложение определителя по этой строке (столбцу) сводит к вычислению определителя n-го порядка к вычислению определителя (n − 1) -го порядка. ОБРАТНАЯ МАТРИЦА. Используя разложения определителя по элементам строк со своими или чужими дополнениями, получаем, что если матрица A обратима, то A −1  A11  1  A12 =  A .   A1n A21 ... An1   A22 ... An 2  . . . .   A2 n ... Ann  ПРАВИЛО КРАМЕРА. Запишем систему из n линейных уравнений от n неизвестных в матричном виде: AX = B. Если матрица A – невырождена, то она обратима, и X = A-1B. С помощью формулы для обратной матрицы, получается формула для решения системы из n линейных уравнений от n неизвестных. Если определитель системы линейных уравнений: a11 x1 + a12 x2 +...+ a1n xn = b1 , a x + a x +...+a x = b ,  21 1 22 2 2n n 2  . . . . . . . . . . . an1 x1+ an1 x2 +...+ann xn = bn , отличен от нуля, то система имеет единственное решение 156 ∆   ∆1 ∆ 2  , , ... , n , ∆  ∆ ∆ где ∆ - определитель матрицы, составленной из коэффициентов уравнений системы, а ∆i получен из ∆ заменой i-того столбца столбцом свободных членов. По имени автора эти формулы называют правилом Крамера1. Система из n линейных уравнений от n неизвестных с невырожденной основной матрицей называется крамеровской системой. Крамеровская система имеет решение, причем в точности одно, при любом столбце свободных членов. Габриель Крамер (Cramer, 1704–1752) швейцарский математик. Правило решения определенной системы из n линейных уравнений с n неизвестными Крамер опубликовал в 1750 г. 1 157 10. МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ. ВЫЧИСЛЕНИЕ ОБРАТНОЙ МАТРИЦЫ. РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В МАТРИЧНОЙ ФОРМЕ Основные понятия: матрица, кольцо, векторное пространство, линейная алгебра, обратимый элемент кольца, мультипликативная группа кольца, ранг матрицы, элементарные матрицы, порождающие элементы группы. Основные факты: множество квадратных матриц с операциями сложения и умножения образуют кольцо; линейная алгебра квадратных матриц проста; матрица обратима тогда и только тогда, когда ее определитель отличен от нуля; матричное уравнение AX=B, где A – квадратная матрица, имеет единственное решение тогда и только тогда, когда матрица A – обратима. ОПЕРАЦИИ НАД МАТРИЦАМИ. Двумерный массив, заполненный элементами из кольца K, называют матрицей над кольцом K. Обычно матрицу заключают в скобки (круглые или квадратные, или даже двойные квадратные) и обозначают каким-то одним символом. Матрицу, состоящую из m строк и n столбцов, принято называть m×n-матрицей. Размеры матрицы (число строк и число столбцов) называют еще типом матрицы. Две матрицы однотипны, если их размеры совпадают. Если размеры матриц зафиксированы, то можно условно обозначить матрицу видом типичного элемента, например, запись A= (aij), B= (bij), означает, что матрицы A, B одного типа (i, j пробегают одни и те же множества индексов), типичным элементом первой матрицы является aij , а второй - bij. Если число строк матрицы равно числу столбцов и равно n, то матрицу называют квадратной матрицей порядка n. Зафиксируем числа m, n. Тогда множество m×n-матриц можно рассматривать как элементы mn-мерного арифметического векторного пространства Pmn. Множество однотипных матриц над полем P является векторным про158 странством над полем P. Сложение и умножение на скаляр в этом пространстве Pmn задаются обычными правилами (для каждых A= (aij), B= (bij) из Pmn и каждого k из P): A+B = (aij+bij), kA = (kaij). На множестве всех матриц определим частичную операцию умножения. Эта операция будет применима лишь к матрицам особого размера, а именно если A - m×n-матрица, а B n×k –матрица  a11  a A =  21 .   am1 a12 a22 . am 2 ... ... . ... a1n   b11   a2 n   b21 , B =  . .    amn   bn1 b12 b22 . bn 2 ... ... . ... b1k   b2 k  . .   bnk  Тогда произведением AB будет m×k-матрица  c11  c C =  21 .   cm1 c12 c22 . cm 2 ... ... . ... c1k   c2 k  , .   cmk  элементы которой имеют вид: cij = ai1b1j+ai2b2j+...+ainbnj, или в сокращенной записи: 159 n cij = ∑ aik bkj . k =1 Таким образом, для существования произведения AB матриц A и B необходимо и достаточно, чтобы длина строки матрицы A была равна длине столбца матрицы B. Умножение прямоугольных матриц ассоциативно. Так как умножение матриц – частичная операция, то утверждение об ассоциативности понимается следующим образом. Произведения (AB)C и A(BC) определены или не определены одновременно, а в случае существования этого произведения выполняется равенство (AB)C = A(BC). Умножение прямоугольных матриц дистрибутивно относительно сложения. Это значит, что если A – m×n- матрица, а B, C – n×k-матрицы, то A (B + C) и A B + A C определены одновременно, и A (B + C) = A B + A C. Для m×n-матриц существует левый и правый, нейтральные при умножении элементы. Роли нейтральных элементов играют квадратные матрицы соответствующего размера, у которых на диагонали стоят только единицы, а на остальных местах – нули. Множество квадратных n×n-матриц над полем P обозначают символом Mn(P). Как и для прямоугольных матриц одного типа, множество Mn(P) с операциями сложения и умножения на скаляр образует векторное пространство < Mn(P); +, P >. В этом пространстве операция умножения матриц является уже не частичной, а всюду определенной. Множество Mn(P) квадратных матриц над полем P с операциями сложения, умножения и умножения на скаляр является линейной алгеброй над P. 160 Множество Mn(K) квадратных матриц над целостным кольцом с операциями сложения и умножения является кольцом. Матричное кольцо ассоциативно и с единицей. Роль единицы в матричном кольце играет квадратная матрица 1  0 E =.  0 0  1 . ... . ... ... ... . 1 0  0 ..  0 1  Если n > 1, то это кольцо не коммутативно и обладает делителями нуля. Центральными (т. е. перестановочными со всеми) элементами в Mn(K) являются только скалярные матрицы, т. е. матрицы вида kE, где E единичная матрица, а k – элемент из K. Если P – поле, то кольцо Mn(P) – просто, оно не содержит нетривиальных идеалов и, следовательно, каждый ненулевой гомоморфизм кольца Mn(P) является изоморфизмом. ОБРАТИМЫЕ МАТРИЦЫ. Далее будем рассматривать только матрицы с элементами из поля P. Так как умножение в кольце квадратных матриц ассоциативно и имеет единицу, можно говорить о мультипликативной группе матричного кольца. Эта группа состоит из всех обратимых матриц, обозначается символом1 GLn(P) и называется полной линейной группой. Группа, которая изоморфна некоторой подгруппе полной линейной группы, называется линейной. Группу подстановок степени n можно изоморфно представить в виде линейной группы, поставив в соответствие подстановке 161 2 ... n   1  α =   α (1) α (2 ) ... α (n ) n×n-матрицу, в которой в i-строке и α(i)-столбце стоят единицы (i = 1, 2, …, n), а на всех прочих местах – нули. По теореме Кэли любая конечная группа изоморфна группе подстановок, и это значит, что л ю б а я к о н е ч н а я г р у п п а – л и н е й н а . Ранг произведения матриц не больше ранга каждого из сомножителей, ранг единичной матрицы равен ее порядку, поэтому если n×n-матрица обратима, то ее ранг равен n. Ранг n×n-матрицы A тогда и только тогда, когда ее можно получить из единичной матрицы E с помощью элементарных преобразований строк и столбцов. Элементарное преобразование первого типа равносильно умножению на элементарную матрицу (k −1) Eii + E . Элементарное преобразование второго типа равносильно умножению на элементарную матрицу kЕij + E (i ≠ j). Элементарные матрицы обратимы, и произведение обратимых матриц снова обратимо. Таким образом, полная линейная группа GLn(P) порождается (как полугруппа) элементарными матрицами, а квадратная n×n-матрица A обратима тогда и только тогда, когда ранг A = n. Равенство ранга матрицы ее порядку означает, что определитель матрицы отличен от нуля (матрица невырожденная). Матрица A – обратима тогда и только тогда, когда она невырожденная. 1 GL – первые две буквы слов Group Linear. 162 ВЫЧИСЛЕНИЕ ОБРАТНОЙ МАТРИЦЫ. Если квадратная n×n-матрица матрица A обратима, то ее можно преобразовать в единичную матрицу с помощью элементарных преобразований столбцов. Элементарные преобразования можно заменить умножениями на элементарные матрицы, и, таким образом, найти матрицу A−1 . Для практической реализации этой идеи припишем к матрице A сбоку единичную матрицу E того же порядка и с помощью элементарных преобразований строк преобразуем эту (n × 2n)-матрицу так, чтобы на месте матрицы A появилась единичная матрица. Тогда на месте E появится матрица A−1 . На рисунке схематически проиллюстрирована эта процедура получения обратной матрицы. Под стрелками и многоточием скрываются элементарные преобразования строк большой прямоугольной матрицы. С помощью определителя квадратной матрицы, можно вычислить обратную матрицу, используя не алгоритм, а формулу. Сумма элементов строки определителя, умноженных на алгебраические дополнения соответствующих элементов своей строки, равна определителю, а умноженных на соответствующие дополнения чужой строки – нулю. Отсюда следует, что если матрица  a11 a12 ... a1n     a21 a22 ... a2n  A= . . . .    a a ... a nn   n1 n2 обратима, то 163  A11  1  A12 −1 A =  A .   A1n A21 ... An1   A22 ... An 2  . . . .   A2 n ... Ann  (*) РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В МАТРИЧНОЙ ФОРМЕ. Решение системы линейных уравнений от n неизвестных можно свести к решению одного уравнения с векторными коэффициентами и n неизвестными, но можно - и к одному матричному уравнению с одной неизвестной (матрицей). Пусть дана система линейных уравнений a11 x1 + a12 x2 + ... + a1n xn = b1 , a x + a x + ... + a x = b ,  21 1 22 2 2n n 2   . . . . . . . . . am1 x2 + am 2 x2 + ... + amn xn = bm . В связи с этой системой рассмотрим три матрицы: m×n-матрицу системы A, n×1-матрицу X из одного столбца, заполненного неизвестными, и m×1-матрицу B тоже из одного столбца, заполненного свободными членами:  a11  a A =  21 .   am1 a12 a22 . am 2 ... ... . ...  b1   x1      a1n  x  b2    2   .   .  a2n  B = , X = ⋅ ,  .   .  .  .      .   .  amn  b  x   m  n При этих обозначениях система линейных уравнений записывается в виде одного матричного уравнения: AX = B, где A, B – матрицы, а X - неизвестная матрица. Если матрица m = n и ранг A = n, то ранг расширенной матрицы сис164 темы тоже равен n, и по теореме Кронекера-Капелли, система уравнений имеет решение, и это решение единственно. Используя обратимость матрицы A, находим это решение: X = A−1B . Подставив в произведение A−1B вместо A−1 ее выражение (*), получим правило Крамера. 165 11. РАНГ МАТРИЦЫ, ЕГО ВЫЧИСЛЕНИЕ. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. КРИТЕРИЙ СОВМЕСТНОСТИ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. РЕШЕНИЕ СИСТЕМЫ МЕТОДОМ ГАУССА Основные понятия: максимальная подсистема, ранг системы векторов, строчечный ранг матрицы, столбцовый ранг матрицы, элементарные преобразования строк и столбцов, система линейных уравнений, совместность и несовместность, равносильность, следствие систем, определенность и неопределенность, основная и расширенная матрицы системы уравнений, элементарные преобразования системы линейных уравнений, исключение переменных, линейное многообразие. Основные факты: строчечный ранг матрицы равен ее столбцовому рангу; системы линейных уравнений совместна тогда и только тогда, когда ранг ее основной матрицы равен рангу расширенной матрицы; каждая совместная система линейных уравнений равносильна системы треугольного или трапецеидального вида. РАНГ СИСТЕМЫ ВЕКТОРОВ. Максимальную линейно независимую подсистему векторов системы α1, α2, ..., αn, принято называть максимальной подсистемой. Число элементов в максимальной подсистеме называют рангом системы α1, α2, ..., αn. Ранг системы векторов совпадает с размерностью подпространства, которая эта система порождает. Чтобы узнать размерность подпространства, порожденного данной системой векторов, надо уметь находить ранг этой системы. С помощью координат общая ситуация сводится к вычислению ранга системы арифметических векторов. Поэтому для примера рассмотрим векторы из арифметического n-мерного векторного пространства: 166 α1 = (a11, a12, ..., a1n), α2 = (a21, a22, ..., a2n), . . . . . . . . αm = (am1, am2, ..., amn). Если все векторы этой системы - нулевые, то ранг ее равен нулю. Если в ней есть ненулевые векторы, удалим из нее все нулевые, и пусть для определенности α1 ≠ θ. Это значит, что найдется a1i ≠ 0. Заменим вектор α2 на вектор  a  α2 +  − 2i  α1,  a1i  вектор α3 заменим на  a  α3 +  − 3i  α1  a1i  и так далее, … вектор αm заменим на  a  αm +  − mi  α1.  a1i  Если после таких преобразований все векторы, кроме первого, станут нулевыми, то ранг системы равен единице (а первый вектор образует максимальную подсистему). Если в результате еще есть ненулевые векторы, отличные от первого, то снова удалим все нулевые, и пусть β1 – первый ненулевой вектор среди оставшихся. Продолжим те же рассуждения для всех векторов, начиная с вектора β1. 167 Если в результате новой серии преобразований получатся одни нулевые векторы, то ранг системы равен двум (а векторы α1 и α2 образуют ее максимальную подсистему). Если есть ненулевой вектор среди оставшихся, то продолжаем рассуждения и далее таким же образом. В результате получится линейно независимая система векторов, ранг которой совпадает с рангом исходной системы. Для таких вычислений удобно записать координаты всех векторов системы в виде матрицы  a11  a A =  21 .   am1 a12 a22 ... ... . . ... am 2 a1n   a2 n  .   amn  и производить элементарные преобразования над ее строками. Описанная процедура элементарных преобразований строк матрицы A приводит к новой матрице A1 с таким же числом столбцов и, возможно, меньшим числом строк (r ≤ m):  c11  a A1 =  21 .   c r1 c12 c22 . cr 2 ... ... . ... c1n   c2 n  . .   crn  Внутри A1 находится треугольник из нулей, рассыпанный, возможно, по столбцам матрицы. Иначе говоря, в матрице A1 под некоторым ненулевым элементом первой строки и i1-го столбца стоят одни нули. Если вычеркнуть первую строку и i1-ой столбец из A1, то снова (если r > 1) под некоторым ненулевым элементом первой строки и i2-го столбца находятся 168 одни нули. Снова, если r>2, вычеркнем новую первую строку и i2-ый столбец и так далее. Для наглядности пусть i1 = 1, i2 = 2, ir = r, т. е. треугольник из нулей расположен в первых столбцах матрицы A1.  c11 c12 ... c1r   0 c22 ... c2 r A1 =  0 .  . . .  .  0 crr  c1r +1 ... c1n   c2 r +1 ... c2 n  . . .   . . .  crr +1 crn  Система строк матрицы A1 линейно независима. Если нулевые строки не выбрасывать, а перемещать вниз, то наглядно ситуацию можно представить следующей схемой матрицы. Матрицу такого вида называют ступенчатой матрицей, а нахождение ранга этим способом – приведением матрицы к ступенчатому виду. На рисунке показано, как примерно выглядит ступенчатая матрица. Белым цветом покрашена лестница из нулей, черным выделены заведомо ненулевые элементы, а серым цветом – все прочие элементы матрицы (может, нулевые, а, может быть, и нет). Ранг левых системы строк в векторов равен соответствующей числу нену- ступенчатой матрице. 169 РАНГ МАТРИЦЫ И ЕГО ВЫЧИСЛЕНИЕ. На матрицу  a11  a A =  21 .   am1 a12 a22 . am 2 a1n   a2n  .   amn  ... ... . ... можно смотреть с двух точек зрения. Можно считать, что A – это векторы-столбцы, записанные в строчку – один за другим. Ранг системы этих столбцов называют столбцовым рангом матрицы A. Но можно считать, что матрица A - это векторы-строки, записанные в столбик – одна строка над другой. Ранг системы этих строк – это строчечный ранг матрицы A. Строчечный и столбцовый ранги матрицы не изменяются при элементарных преобразованиях строк и столбцов этой матрицы. Поэтому вычислить ранг матрицы можно, преобразуя ее элементарными преобразованиями в ступенчатую матрицу. Ранг ступенчатой матрицы равен числу ее ненулевых ступеней, причем строчечный и столбцовый рани ступенчатой матрицы равны. Отсюда следует, что строчечный и столбцовый ранги произвольной матрицы совпадают, и поэтому можно говорить просто о ранге матрицы. Ранг матрицы A обозначают символом rank (A). Только что увидели, как вычислить ранг матрицы с помощью элементарных преобразований строк. Теперь при вычислениях, если в этом будет необходимость, можно выполнять и элементарные преобразования столбцов. С помощью таких комбинированных преобразований можно получить красивую, «настоящую» ступенчатую матрицу. Ранг строк рице. 170 матрицы в равен соответствующей числу ненулевых ступенчатой мат- Способ решения системы линейных уравнений с помощью элементарных преобразований называется по имени автора методом Гаусса. Методом Гаусса называют и вычисление ранга матрицы путем приведения ее к ступенчатому виду. Есть и другой способ вычисления ранга матрицы, опирающийся на свойства определителей подматриц. ТЕОРЕМА О РАНГЕ МАТРИЦЫ. Пусть A – п рямоугольная m×n-матрица. Рассмотрим ее миноры порядка k, где k = 1, 2, ..., min{m, n}. Если минор k-того порядка отличен от нуля, то строки (и столбцы), проходящие через этот минор, линейно независимы, и поэтому k ≤ ранг A . Теорема о ранге матрицы: ранг матрицы равен наивысшему порядку ее ненулевого минора. Если минор M2 получен из минора M1 добавлением одной строки и одного столбца, то M2 называют минором, окаймляющим минор M1. Ранг матрицы равен r, если в ней содержится ненулевой минор M порядка r, а все миноры, окаймляющие M, равны нулю. Если ранг матрицы A равен r, то любой ее минор r-того порядка, отличный от нуля, называют базисным минором. Строки матрицы, проходящие через базисный минор, образуют базис системы строк, а столбцы, проходящие через базисный минор, - базис системы столбцов. Строки (столбцы) матрицы являются базисными тогда и только тогда, когда через них проходит какой-нибудь базисный минор. РАНГ ПРОИЗВЕДЕНИЯ МАТРИЦ. Если α1, α2, ..., αs и β1, β2, ..., βk – две системы векторов и αi линейно выражается через βj, то rank{α1, α2, ..., αs } ≤ rank{β1, β2, ..., βk }. 171 Столбцы произведения матрицы AB являются линейными комбинациями столбцов матрицы A, поэтому rank (AB) ≤ rank (A). Строки матрицы AB – это линейные комбинации столбцов матрицы B, поэтому rank (AB) ≤ ранг (B). Другими словами, р а н г п р о и з в е д е н и я м а т р и ц н е п р е в ы ш а е т ранга каждого из сомножителей. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. Системой линейных уравнений назы- вают систему вида: a11 x1 + a12 x2 + ... + a1n xn = b1 , a x + a x + ... + a x = b ,  21 1 22 2 2n n 2  ... am1 x2 + am 2 x2 + ... + amn xn = bm, (s) Элементы aij и bi предполагаются выбранными из некоторого поля P, и неизвестные xj разыскиваются в том же поле P. Элементы aij называют коэффициентами системы, а bi – свободными членами. Множество решений системы от n неизвестных находится в арифметическом n-мерном векторном пространстве Pn. Пространство, в котором находится множество решений, удобней представлять как пространство векторов-строк. С системой из m линейных уравнений связано и m-мерное векторное про172 странство Pm, которое лучше представить в виде векторов-столбцов. Две системы от одинакового числа неизвестных называют равносильными, если их множества решений совпадают. Решение системы уравнений (s) состоит в поиске простейшего представителя в классе равносильных систем, содержащих (s). Задача эта имеет разрешающий алгоритм, а это значит, что проблема упрощения для отношения равносильности на множестве систем линейных уравнений от n неизвестных разрешима. КРИТЕРИЙ СОВМЕСТНОСТИ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. С системой уравнений (s) свяжем две матрицы. В первую матрицу A включим все коэффициенты уравнений системы в том порядке, как они расположены:  a11  a A =  21 .   am1 a12 a22 . am 2 ... ... . ... a1n   a2 n  .   amn  Во вторую матрицу A включим и коэффициенты, и свободные члены уравнений системы:  a11  a A =  21 .   am1 ... ... . ... a1n a2 n . amn b1 b2 . bm    .   Матрицу A называют основной матрицей системы, а A – расширенной матрицей системы. Систему линейных уравнений можно записать в виде одного матричного уравнения 173 x1α1 + x2α2 + … + xnαn = β, где  a1n   a11   a12   b1          a a a    21   22   b2  2n .  .  .  .        α1 = , α2 = , β =  . , …, α1 = . . .      .    .  .  .  .        a  a  b  a   m1   m2   m  mn  Система линейных уравнений будет совместной, если вектор β линейно выражается через векторы α1, α2, ..., αn, и несовместной в противном случае. Для того чтобы вектор β линейно выражался через векторы α1, α2, ... αn необходимо и достаточно, чтобы β принадлежал подпространству H = пр(α1, α2, ... αn), порожденному векторами α1, α2, ... αn, а для этого в свою очередь необходимо и достаточно (как видно из поясняющей схемы) совпадения подпространств H и H1 = пр(α1, α2, ... αn, β). β∉H 174 β∈H Используя связь ранга системы и размерности подпространства, получаем следующие необходимое и достаточное условие (критерий) совместности системы линейных уравнений: с и с т е м а л и н е й н ы х у р а в н е н и й с о в м е с т на тогда и только тогда, когда ранги основной и расширенной матриц системы совпадают. Этот факт принято называть теоремой Кронекера-Капелли1. Таким образом, можно, не решая систему, заранее установить, пусто или нет ее множество решений. Кстати, не решая систему, можно узнать, является ли она определенной или неопределенной. Число свободных неизвестных в системе равно n – rank (A), и поэтому с и с т е м а линейных уравнений имеет един- ственное решение тогда и только тогда, когда ранги основной и расширенной матриц системы совпадают и равны числу неизвестных. Получение ответов на вопросы, совместна система или нет, определенна или нет, называют исследованием системы. И все-таки, кроме исследования, нужно уметь и находить множество решений системы – говорят: «решить систему». Решить систему можно, приведя ее к такому виду )сохраняя множество решений), что решение ее очевидно. Проще всего это сделать с помощью элементарных преобразований. РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ МЕТОДОМ ГАУССА. Умноже- ние левой и правой частей одного из уравнений системы на ненулевой элемент из P называют элементарным преобразованием первого типа. Замену одного из уравнений системы на сумму этого уравнения с другим, умноженным на любой элемент из P, называют элементарным преобразованием второго типа. Элементарные преобразования системы уравнений не изменяют ее множеЛеопольд Кронекер (1823–1891) - немецкий математик; основные труды по алгебре и теории чисел. Эта теорема содержится в лекциях Кронекера 1883-1991 годов. Альфредо Капелли (1855–1910) итальянский математик. В 1892 году впервые сформулировал критерий совместности системы линейных уравнений, используя термин «ранг матрицы». 1 175 ство решений. С помощью элементарных преобразований системы уравнений можно поменять местами любые два ее уравнения. Если в ходе преобразований появится противоречивое уравнение, то система (s) - несовместна. В результате через конечное число шагов в случае совместности исходной системы (с точностью до нумерации переменных) получится система  a11 x1 + a12 x2 + ... + a1r xr + ... + a1n xn = b1 ,  ′ x2 + ... + a2 r xr + ... + a2′ n xn = b2′ , a22   . . . . . . . . . .   ′′ x2 + ... + arn ′′ xn = br′′. arr Эта система имеет вид трапеции, если r < n, или треугольника (при r = n). Множество решений M системы (s) в случае неопределенной системы имеет вид: M = { ( f1 ( xr +1 , ... , xn ) , ... , f r ( xr +1 , ... , xn ) , xr , ... , xn ) xr +1 , ... , xn ∈ P } , где fi(xr+1, ..., xn) - линейные функции от свободных переменных xr+1, ..., xn. Метод последовательного исключения неизвестных из системы линейных уравнений называют по имени автора методом Гаусса1. При практическом использовании метода Гаусса нет необходимости каждый раз переписывать полностью новые уравнения, достаточно записывать их коэффициенты. Да и сама система однозначно задается матрицей коэффициентов и свободных членов: 1 Впервые этот метод описан Гауссом в 1849 году. 176    A=    a11 a21 . am1 ... ... . ... a1n a2 n . amn b1 b2 . . bm    .    Если все свободные члены равны нулю, т. е. система однородная, то последний столбец можно не писать – при всех преобразованиях нули останутся нулями. Множество элементов {a11, a22, …ak k}, где k равно наименьшему из чисел m, n, называют диагональю. Матричная диагональ похоже на геометрическую лишь тогда, когда m=n. Преобразования Гаусса сводятся к тому, чтобы сначала «сделать нули» под первым диагональным элементом, затем - под вторым и так далее, пока под диагональю не возникнет треугольник из нулей. Матрица системы тогда превратиться в трапециидальную или треугольную. На рисунке изображены примерные виды треугольной и трапецеидальной матриц. Белым цветом выделены нули, черным – ненулевые (диагональные) элементы. Серым цветом изображены прочие (нулевые и ненулевые) элементы. Полученную матрицу можно улучшить, построив таким же способом треугольник из нулей над диагональю матрицы. 177 Затем с помощью элементарных преобразований первого типа ненулевые элементы, стоящие на диагонали, можно дополнительно превратить в единицы. Такое преобразование матрицы называют в честь авторов1 методом Гаусса-Жордана. На рисунке изображен примерный вид трапецеидальной r×n-матрицы после преобразования ее методом Гаусса-Жордана. Черными квадратиками здесь изображены единицы. На белом поле стоят только нули, а под серым цветом скрываются прочие (нулевые и ненулевые) элементы. Если матрица системы имеет такой вид, то остается только записать множество решений системы, выразив первые r неизвестных через оставшиеся n – r неизвестных. Такие выражения называют общим решение системы. ПРАВИЛО ПРЯМОУГОЛЬНИКА. Основной этап преобразований состоит в «изготовлении нулей» над или под некоторым ненулевым элементом. Этот особый элемент этапа преобразований называют разрешающим. Строку, в которой находится разрешающий элемент, называют разрешающей строкой, а столбец – разрешающим столбцом. Умножая разрешающую строку на подходящие коэффициенты и складывая с остальными строками, получаем нули выше и ниже разрешающего элемента. Чтобы избежать дробных коэффициентов, можно воспользоваться элементарным произведением первого типа и умножить элементы на наименьше общее кратное знаменателей коэффициентов. Можно преобразовывать матрицу, используя оба элементарных преобразований сразу. Пусть элемент a – разрешающий, элемент – на рисунке он выделен рамоч1 Камиль Мари Энмон Жордан (1838–1922) – французский математик. 178 кой. При комбинированном элементарном преобразовании все элементы разрешающего столбца (кроме a) превратятся в нули, а все элементы разрешающей строки останутся без изменения. На рисунке элемент b останется без изменения, а на месте c появится нуль. Остается только заменить элемент d, составляющий четвертую вершину прямоугольника. На месте элемента d ставим элемент ad – bc (на рисунке множители соединены диагоналями). Такой способ преобразования матрицы называют правилом прямоугольника. Расположение элементов a, d, c, d в матрице может быть и другим; правило не изменяется: заменяемый элемент умножается на разрешающий и вычитается произведение элементов по другой диагонали (независимо от направления диагоналей). 179 12. СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ Основные понятия: линейное неравенство, равносильность систем, следствие системы, совместность и несовместность, гиперплоскость, выпуклое множество, выпуклая оболочка, выпуклый конус, вершина и опора множества решений системы линейных неравенств, граничные решения. Основные факты: множество решений системы линейных неравенств является суммой выпуклого конуса, порожденного граничными решениями, и выпуклого замыкания вершин системы; система линейных неравенств несовместна тогда и только тогда, когда линейная комбинация неравенств системы с неотрицательными коэффициентами является противоречивым неравенством. СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ. Система линейных неравенств над полем R – это система вида  f1 ( x1 ,x2 ,...,xn ) ≤ b1 ,  f ( x ,x ,...,x ) ≤ b ,  2 1 2 n 2  . . . . . . .  f m ( x1 ,x2 ,...,xn ) ≤ bm , (s) где все fi(x1, x2, ..., xn) – однородные линейные многочлены с действительными коэффициентами. Если все bi равны нулю, то система (s) называется однородной. Приравняв все bi нулю, получим сопутствующую для (s) систему однородных линейных неравенств. Неравенство, в котором все коэффициенты равны нулю 0 ⋅ x1 + 0 ⋅ x2 + ... + 0 ⋅ xn ≤ b, а свободный член положителен (b > 0), является противоречивым, если систе180 ма (s) содержит противоречивое неравенство, то она несовместна. Множество решений уравнения a1 ⋅ x1 + a2 ⋅ x2 + ... + an ⋅ xn = b, является линейным многообразием в L размерности n – 1, т. е. гиперплоскостью. Множество решений неравенства a1⋅x1 + a2⋅x2 +...+ an⋅xn ≤ b называют полупространством пространства L, задаваемым этой гиперплоскостью. Если α, β принадлежат действительному векторному пространству L, то отрезком [α, β] называется множество {γ ∈ L  γ = α + x (β – α ), 0 ≤ x ≤ 1}. Подмножество S из L называется выпуклым, если оно вместе с каждыми двумя элементами α, β содержит и отрезок [α, β]: α, β ∈ L ⇒ [α, β] ⊂ L. Пересечение любого числа выпуклых подмножеств является выпуклым множеством, и полупространство является выпуклым множеством. Поэтому множество решений системы линейных неравенств является выпуклым множеством. Наименьшее выпуклое множество, содержащее данное множество M, называют выпуклой оболочкой множества M. Каждое подмножество множества L имеет (и в точности одну) выпуклую оболочку. Выпуклой оболочкой множества S из действительного пространства L является множество, состоящее из всех линейных комбинаций k1α1 + k2α2 + ... + kmαm , где αi∈S, ki≥0, 181 k1 + k2 + ... + km=1. Рангом системы линейных неравенств a11 x1 + a12 x2 + ... + a1n xn ≤ b1 , a x + a x + ... + a x ≤ b ,  21 1 22 2 2n n 2  ... am1 x2 + am 2 x2 + ... + amn xn ≤ bm , (s1) называют ранг системы векторов α1 = (a11, a12, ..., a1n), α2 = (a21, a22, ..., a2n), . . . . . . . αm = (am1, am2, ..., amn). Вершиной системы линейных неравенств ранга r называется такое решение системы, которое обращает в равенства ее r неравенств с линейно независимыми левыми частями. Если ранг совместной системы линейных неравенств положителен, то среди ее решений есть решение, обращающее в равенство одно из неравенств системы. Множество решений совместной системы линейных неравенств ненулевого ранга имеет хотя бы одну вершину. СЛЕДСТВИЯ СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ. Все следствия системы линейных уравнений полностью описываются линейными комбинациями уравнений этой системы. Для неравенств это утверждение не выполняется. 182 Однако для однородных систем линейных неравенств аналогичная теорема о следствиях (с естественной поправкой) уже выполняется. ТЕОРЕМА (Г. Минковского) е с л и л и н е й н о е н е р а в е н с т в о g ( x 1 , x 2 , ... , xn)≤0 является следствием системы:  f1 ( x1, x2 ,...,xn ) ≤ 0,  f ( x ,x ,..., x ) ≤ 0,  2 1 2 n   ...  f m ( x1 ,x2 ,...,xn ) ≤ 0, (s0) то существуют неотрицательные числа k1, k2,... , km такие, что g(x)=k1 f1(x)+k2 f2(x)+...+km fm(x). КРИТЕРИЙ СОВМЕСТНОСТИ СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ. Система линейных уравнений несовместна тогда и только тогда, когда некоторая линейная комбинаций уравнений системы является противоречивым уравнением. Из теоремы Минковского следует, что аналогичный критерий несовместности остается верным и для систем линейных неравенств. ТЕОРЕМА (А.Д. Александрова): с и с т е м а л и н е й н ы х н е р а в е н с т в н е совместна тогда и только тогда, линейная комбинация левых частей неравенств системы с неотрицательными коэффициентами ki равна нулю, k1f1(x)+k2f2(x)+...+kmfm(x)≡0, а та же комбинация свободных членов отрицательна, k1b1+k2b2+...+kmbm<0. 183 Пусть система (s1) несовместна. Рассмотрим вспомогательную систему из m уравнений от n+1 неизвестного fi(x) - biy ≤ 0, i = 1, 2, ..., m. (s2) Если (c1, c2, ..., cn, d) - решение этой системы, то d≥0, так как в противном случае (c1d-1, c2d-1, ..., cnd-1) является решением несовместной системы (s1). Отсюда следует, что неравенство y≤0 является следствием системы (s2). По теореме Минковского существуют неотрицательные числа ki такие, что m y= ∑ ki ( fi ( x) − bi y ) . i =1 Теорему Александрова можно доказать, не ссылаясь на теорему Минковского, а примерно теми же рассуждениями, что и при решении системы линейных уравнений методом Гаусса, т. е. применив последовательное исключение неизвестных из неравенств системы. МНОЖЕСТВО РЕШЕНИЙ СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ. Множество векторов действительного векторного пространства называют выпуклым конусом, если оно замкнуто относительно сложения и умножения на неотрицательный скаляр. Выпуклый конус является выпуклым множеством. Пересечение выпуклых конусов является выпуклым конусом. Множество решений однородной системы линейных неравенств является выпуклым конусом. Если S - подмножество действительного векторного пространства, то множество {k1α1 + ... + kmαmαi∈S, ki≥0,} 184 является наименьшим выпуклым конусом, содержащим множество S. Выпуклый конус K называется конечно порожденным (или многогранным), если множество S можно выбрать конечным. Конус решений однородной системы линейных неравенств конечно порожден. Опорой множества S называют полупространство, заданное гиперплоскостью, проходящей через начала координат, и включающее в себя S. Иначе говоря, множество O - опора S, если O - множество решений уравнения a1x1 + a2x2 + ... + anxn = 0, и O содержит S. Крайней опорой системы векторов S ранга r называется полупространство решений этого уравнения, содержащее все векторы из S, причем, по крайней мере, r − 1 вектор из S принадлежит гиперплоскости, заданной уравнением. ТЕОРЕМА (Вейля). Е с л и в ы п у к л ы й к о н у с , п о р о ж д е н н ы й к о нечной системой S ранга n из n-мерного векторного пространства L, не совпадает со всем L, то он равен пересечению всех крайних опор множества S. Пусть теперь (s0) – однородная система, сопутствующая для системы (s1). Произвольное решение δ системы линейных неравенств ранга n можно представить в виде δ = β + γ, где β принадлежит выпуклому замыканию S множества вершин системы (s1), а γ принадлежит выпуклому конусу K множества решений системы (s0). На рисунке изображено множество решений системы линейных неравенств с двумя переменными. 185 Это описание означает, что если δ - решение системы (S1), то δ = k1β1 + k2β2 + ... + kpβp + t1γ1 + t2γ2 + ... +tqγq, где β1, β2, ..., βp - вершины системы (1), γ1, γ2, ... , γq - граничные решения соответствующей однородной системы, ki, tj≥0, k1 + k2 + ... + kq = 1. Такое описание множества решений системы линейных неравенств называют принципом граничных решений. 186 13. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ, МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА. ИНВАРИАНТНЫЕ ПОДМНОЖЕСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ ЛИНЕЙНОГО ОПЕРАТОРА И ИХ НАХОЖДЕНИЕ Основные понятия: гомоморфизм, эндоморфизм, линейная алгебра, ядро гомоморфизма, гомоморфный образ, базис векторного пространства, инвариантное подпространство, собственный вектор и собственное значение линейного оператора, характеристическое уравнение, подобные матрицы, диагональный вид матрицы, алгебраическая и геометрическая кратность корней характеристического уравнения. Основные факты: линейная алгебра эндоморфизмов векторного пространства изоморфна линейной алгебре квадратных матриц; матрица линейного оператора подобна диагональной матрице тогда и только тогда, когда существует базис пространства, состоящий из собственных векторов; множество собственных значений оператора и множество корней его характеристического многочлена совпадают. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ. Эндоморфизм векторного пространства при- нято называть линейным оператором, а гомоморфизм векторного пространства - линейным отображением. При гомоморфизме, как обычно, можно сравнивать только однотипные алгебры, и, следовательно, поля скаляров у векторных пространств, находящихся в гомоморфной связи, должны совпадать. Отображение f: L → L1 векторного пространства L на векторное пространство L1 является линейным тогда и только тогда, когда для каждых α, β из L и каждых скаляров a, b выполняется тождество f (a α + b β) = a f (α) + b f (β). 187 Если отображение f: L → L1 векторного пространства L на векторное пространство L1 является линейным, то f(θ) является нулем в пространстве L1, и f(–α) = –f(α). Отображение, переводящее каждый вектор из L в нулевой вектор из L1, называют нулевым отображением. Отображение L на L, переводящее каждый вектор сам в себя называется единичным. И единичное и нулевое отображения линейны. Если пространство L является прямой суммой двух подпротсранств, L = A ⊕ B, то каждый x элемент из L можно представить и единственным образом в виде x = α + β, где α ∈ A, β ∈ B. Отображение, заданное правилом x a α , является линейным (его называют проектированием на подпространство A параллельно подпространству B). ЯДРО И ОБРАЗ ЛИНЕЙНОГО ОТОБРАЖЕНИЯ. Как обычно при отображении, образ пространства L при линейном отображении f обозначают символом f(L) и понимают под ним множество значений функции f, f (L) = {f (x)x ∈ L}. Если отображение f: L→L1 – линейное, то образ f(L) является подпространством пространства L1, причем dim f (L) ≤ dim L. Полный прообраз нулевого элемента θ из L1 называется ядром линейного отображения f, Ядро f = Ker f = f – 1(θ) = {x∈L  f (x) = θ}. Если отображение f : L → L1 – линейное, то ядро f является подпространством пространства L. В этом случае, как каждое подпространство, Ker f обла188 дает базисом и имеет размерность. РАНГ И ДЕФЕКТ ЛИНЕЙНОГО ОТОБРАЖЕНИЯ. Размерность образа f(L) про- странства L при линейном отображении f приято называть рангом отображения f, а размерность ядра называют дефектом отображения f, ранг f + дефект f = dim L. Пространство размерности n содержит изоморфную копию любого пространства, размерности, не превышающей n. Все пространства одной размерности изоморфны. Поэтому любое линейное отображение пространства L можно представить как отображение L в себя, т. е. в виде линейного оператора L. МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ. Линейное отображение однозначно задается образами базиса. Если α1, α2, ..., αm - базис пространства L, а γ1, γ2, ,...., γn - базис пространства L1, и f - линейное отображение пространства L в пространство L1, то f полностью задается векторами f(α1), f(α2), ..., f(αm). Эти вектора, в свою очередь, единственным образом выражаются через γ1, γ2, ,...., γn, f(α1) = a11γ1+a12γ2,+....+a1nγn, f(α2) = a21γ1+a22γ2,+....+a2nγn, . . . . . . . . . f(αm) = am1γ1+am2γ2,+....+amnγn. Это значит, что при фиксированных базисах пространств L и L1 каждое линейное отображение f единственным образом задается матрицей 189  a11 a12 ... a1n     a21 a22 ... a2 n  .  . . . .    a a ... a n2 mn   m1 Эту матрицу называют матрицей1 линейного отображения. Если dim L=m, dim L1=n, то любая m×n-матрица является матрицей линейного отображения пространства L в пространство L1. МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА. В случае гомоморфизма пространства L в себя, линейное отображение называется линейным оператором, и соответственно матрица гомоморфизма становится матрицей линейного оператора. Образ элемента x при действии оператора A принято обозначать символом xA. Если A – матрица линейного оператора A векторного пространства L, то для любого вектора x из L [xA] = [x]A. Поэтому изучение произвольного n-мерного векторного пространства можно заменить изучением арифметического пространства. То, что линейный оператор произвольного пространства представляется умножением элементов арифметического пространства на квадратную матрицу, означает, что изучение линейных операторов произвольного n-мерного векторного пространства можно заменить изучением n×n-матриц. Если A, B - две квадратные матрицы, векторы δ1, δ2, ..., δn из Pn - линейно независимы и для каждого δi 190 δi A = δi B (i = 1, 2, ..., n), то A = B. Любой линейный оператор можно представить как умножение на квадратную матрицу элементов из арифметического пространства строк. Множество решений системы линейных уравнений является прообразом элемента при действии линейного оператора арифметического n-мерного векторного пространства. Поэтому полные прообразы элементов при действии линейного отображения являются пересечениями не более чем n различных гиперплоскостей. ОПЕРАЦИИ НА МНОЖЕСТВЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ. На множестве мат- риц Mn (P) определены операции: сложение, умножение и умножение на скаляр. На множестве Hom(L, L) гомоморфизмов векторного пространства L в себя можно определить те же самые операции следующими правилами: если A, B принадлежат Hom(L, L), то для каждого x из L каждого k из P: x(A +B) = xA + xB, x(A B) = (xA)B, x(kA) = (kx)A. Сумма и произведение линейных операторов и произведение линейного оператора на скаляр снова являются линейным оператором. Множество линейных операторов с этими операциями образует линейную алгебру над P. Этим обстоятельством и объясняется этимология термина «матрица». Термин (от латинского – matrix – м а т к а животного) ввел в XIX веке английский математик Джеймс Сильвестр (1814–1897), имея в виду, что в матрице зарождается линейное отображение векторного пространства. 1 191 Линейные алгебры n×n-матриц и линейных операторов n-мерного векторного пространства с операциями сложения, умножения и умножения на скаляр изоморфны. Так как матричное кольцо < Mn(P) ; + , ⋅ > просто, простой является и матричная алгебра Mn(P): у нее нет ненулевых гомоморфизмов, отличных от изоморфизмов. СВЯЗЬ МЕЖДУ МАТРИЦАМИ ЛИНЕЙНОГО ОПЕРАТОРА ОТНОСИТЕЛЬНО РАЗЛИЧНЫХ БАЗИСОВ. Матрица перехода от одного базиса к другому является обратимой матрицей. Сопряженные квадратные матрицы принято называть подобными. Две матрицы одного линейного оператора подобны тогда и только тогда, когда они представляют один и тот же линейный оператор (в разных базисах). Характеристические многочлены подобных матриц совпадают, поэтому, в частности, подобные матрицы имеют равные следы и определители. ИНВАРИАНТНЫЕ ПОДМНОЖЕСТВА ЛИНЕЙНЫХ ПРОСТРАНСТВ. Подмноже- ство H пространства L называется инвариантным подмножеством линейного оператора A, если каждый элемент из H отображается линейным оператором снова в H, т. е. для каждого x из H элемент xA принадлежит H. Пересечение и объединение инвариантных подмножеств является инвариантным подмножеством. Линейный оператор можно представить диагональной матрицей тогда и только тогда, когда найдется базис, каждый элемент которого порождает инвариантное подпространство этого оператора. СОБСТВЕННЫЕ ОПЕРАТОРА. ВЕКТОРЫ И СОБСТВЕННЫЕ ЛИНЕЙНОГО Вектор, порождающий одномерное инвариантное подпространст- во, называют собственным вектором. 192 ЗНАЧЕНИЯ Ненулевой вектор x является собственным вектором линейного оператора A, если xA = λx для некоторого скаляра λ из P. Скаляр λ называют собственным значением собственного вектора x. Линейный оператор n-мерного пространства представим диагональной матрицей тогда и только тогда, когда он имеет n линейно независимых собственных векторов. Если собственных векторов у оператора нет вообще, или они есть, но не образуют базис, то оператор нельзя представить диагональной матрицей. НАХОЖДЕНИЕ СОБСТВЕННЫХ ЛИНЕЙНОГО ОПЕРАТОРА. ВЕКТОРОВ И СОБСТВЕННЫХ ЗНАЧЕНИЙ Сначала проще найти собственные значения операто- ра, а уж потом искать собственные векторы. Множество собственных значений матрицы и множество корней характеристического многочлена этой матрицы совпадают. Зная собственное значение λ0, с помощью векторного уравнения [x]A = λ0[x] можно найти координатную строку [x] собственного вектора x. 193 14. ЕВКЛИДОВЫ ПРОСТРАНСТВА. ОРТОГОНАЛЬНЫЕ ДОПОЛНЕНИЯ К ПОДПРОСТРАНСТВУ. СТРОЕНИЕ КОНЕЧНОМЕРНЫХ ЕВКЛИДОВЫХ ПРОСТРАНСТВ Основные понятия: внешняя операция, скалярное произведение, норма ортогональность, ортнормированность, ортогонализация, изоморфизм, ортогональное дополнение, прямая сумма алгебр. Основные факты: каждое евклидово пространство обладает ортонормированным базисом; евклидовы пространства одинаковой размерности изоморфны; конечномерное евклидово пространство является прямой суммой попарно ортогональных одномерных подпространств. СКАЛЯРНОЕ УМНОЖЕНИЕ. Пусть L векторное пространство над полем P. Рассмотрим еще одну внешнюю операцию над L, а именно: отображение L × L → P. Результат этой операции, примененной к элементам α и β, обозначают символом (α, β), а операцию называют скалярным умножением, если она обладает свойствами (для каждых α, β, γ из L и каждого k из P): 1) (α, β)= (β, α); 2) (α, β+γ)= (α, γ)+(β, γ); 3) (kα, β)=(α, kβ)=k(α, β). 4) если α≠θ, то (α, α)≠0, ЕВКЛИДОВО ВЕКТОРНОЕ ПРОСТРАНСТВО. Наибольший интерес среди про- странств со скалярным умножением представляют пространства над полем действительных чисел R, для таких пространств четвертое свойство скалярного умножение записывается немного иначе: 4*) если α≠θ, то (α, α)≥0. Действительное векторное пространство со скалярным умножением, удов194 летворяющим условиям 1), 2), 3), 4*), называют евклидовым пространством. Размерностью евклидова пространства E называется размерность его векторного пространства; обозначают ее тем же символом: dim E (индекс P писать нет необходимости, поле P сейчас всегда R). Арифметическое n-мерное векторное пространство Rn превращается в евклидово пространство, если определить скалярное умножение по правилу: ((a1, a2, ..., an ), (b1, b2, ..., bn )) опр = a1b1+a2b2+...+anbn. Пусть L пространство трехмерных (или двумерных) направленных отрезков. Скалярным произведением (α, β) ненулевых векторов α и β называют произведение их модулей на косинус угла ϕ между ними: (α, β) опр = α⋅βcos ϕ. Все свойства скалярного произведения для этой операции выполнены, и пространство трехмерных векторов становится евклидовым пространством. Приведем еще один пример (уже бесконечномерного) евклидова пространства. Рассмотрим множество M функций от одного действительного переменного, интегрируемых на отрезке [a, b]. Сложение и умножение на скаляр не выводят за пределы M, и поэтому M является действительным векторным пространством. Опередим скалярное произведение функций f(x) и g(x) следующим правилом: опр (f(x), g(x)) = b ∫ f ( x) g ( x)dx . a Все свойства скалярного произведения выполнены, так что M является евклидовым пространством. Два евклидовых пространства E1 и E2 изоморфны, если существует взаимно однозначное соответствие f: E1 → E2, сохраняющее операции (для всех α, β из E1 и всех k из R): 195 f(α + β) = f(α) + f(β) (сохранение сложения); f(kα) = kf (α) (сохранение умножения на скаляр); (f (α), f (β)) = (α, β) (сохранение скалярного умножения). НОРМА ВЕКТОРА. Если E - евклидово (не обязательно конечномерное) пространство, то нормой вектора α из E называют число α , вычисляемое по формуле: α = (α , α ) . Если норма вектора α равна единице, то вектор α называют нормированным. Для каждого ненулевого вектора евклидова пространства найдется нормированный вектор, коллинеарный с данным вектором. Если каждый вектор системы векторов нормирован, то систему принято называть нормированной. В каждом конечномерном евклидовом пространстве существует нормированный базис. ОРТОГОНАЛЬНОСТЬ И ОРТНОНОРМИРОВАННОСТЬ. Два вектора α и β из произвольного евклидова пространства E ортогональны, если (α, β)=0 (иногда ограничивают ситуацию ненулевыми векторами). Если векторы α и β ортогональны, то пишут α ⊥ β. Два подмножества A и B евклидова пространства называют ортогональными, если каждый элемент из A ортогонален каждому элементу из B, A ⊥ B ⇔ (∀a ∈ A) (∀b ∈ B)[a ⊥ b]. Система векторов α1, α2, ..., αm называется ортогональной, если каждая 196 пара различных векторов ортогональна: i ≠ j ⇒ αi ⊥ αj. Ортогональная система векторов линейно независима Система векторов, являющаяся одновременно ортогональной и нормированной, называется ортонормированной. Система α1, α2, ..., αm ортонормирована, если  1, если i = j ,   0, если i ≠ j. Если евклидово пространство имеет ортонормированный базис, то оно изоморфно арифметическому евклидову пространству С помощью ортогонализации устанавливается, что любое конечномерное евклидово пространство обладает ортонормированным базисом. Существование ортонормированного базиса у каждого евклидова про- странства означает, что конечномерное евклидово пространство изоморфно арифметическому n-мерному евклидову пространству. Два евклидовых пространства E1 и E2 изоморфны тогда и только тогда, когда dim E1=dim E2. НЕРАВЕНСТВО КОШИ-БУНЯКОВСКОГО-ШВАРЦА. Любое двумерное евклидово пространство изоморфно пространству направленных отрезков на плоскости. Так как cos ϕ≤ 1 для любого ϕ, в этом пространстве для любых a, b выполняется неравенство (a, b ) ≤ a ⋅ b . Так как все евклидовы пространства одинаковой размерности изоморфны, а dim пр(a, b) ≤ 2, это неравенство будет выполняться и в произвольном евклидовом пространстве. В частности, для любых действительных чисел xi, yi (x1y1+x2y2+...+xnyn)2≤(x12+x22+...xn2)(y12+y22+...+yn2), и для любых интегрируемых на отрезке [a, b] функций f(x) и g(x) 197 2 b b b  2 2  ∫ f ( x ) ⋅ g ( x )dx  ≤ ∫ f ( x )dx ⋅ ∫ g ( x )dx.  a  a a ОРТОГОНАЛЬНОЕ ДОПОЛНЕНИЕ К ПОДПРОСТРАНСТВУ. Пусть M - произ- вольное непустое подмножество евклидова пространства E. Назовем ортогональным дополнением и обозначим символом M⊥ множество всех векторов, ортогональных каждому элементу из M, включив туда и нулевой вектор: M⊥ ={x∈E(∀y∈M)[(x, y)=0]}. Ортогональное дополнение любого непустого подмножества евклидова пространства является подпространством. Как найти базис H⊥, если известен базис H? Какая связь между размерностями пространств H и H⊥? Чтобы ответить на эти вопросы, можно воспользоваться изоморфизмом евклидовых пространств одинаковой размерности, т. е. решить эти задачи лишь для арифметического n-мерного евклидова пространства (а ответ будет верен для всех конечномерных евклидовых пространств). Если H – подпространство произвольного n-мерного евклидова пространства, то dim H ⊥ = n − dim H . Так как только нулевой вектор ортогонален сам себе, пересечение H ∩ H⊥ состоит только из нуля. Следовательно, сумма H ⊥ + H – прямая, и ее размерность совпадает с размерностью всего пространства. Это значит, что каждое конечномерное евклидово пространство E является прямой суммой любого своего подпространства H и его ортогонального дополнения H⊥, Если dim E=n, то ( ) dim H ⊥ 198 ⊥ = n − (n − dim H ) = dim H . E = H ⊕ H ⊥. Из равенства размерностей и включения (H ) ⊥ ⊥ > H следует (H ) ⊥ ⊥ = H. Из этого равенства следует, что к а ж д о е л и н е й н о е м н о г о о б р а з и е арифметического n-мерного векторного пространства Rn (и, в частности, каждое подпространство) является множеством решений некоторой системы линейных уравнений. Если пересечение линейных многообразий не пусто, то оно является линейным многообразием, причем найти это пересечение можно решая систему линейных уравнений. СТРОЕНИЕ КОНЕЧНОМЕРНЫХ ЕВКЛИДОВЫХ ПРОСТРАНСТВ. Каждое ариф- метическое n-мерное евклидово пространство является прямой суммой попарно ортогональных одномерных евклидовых подпространств. Следовательно, этот свойством обладают и все евклидовы пространства. Каждое n-мерное евклидово пространство E является прямой суммой одномерных попарно ортогональных евклидовых подпространств, E=E1⊕E2⊕...⊕En, причем для всех i dim Ei=1, и если i≠j, то Ei ⊥ Ej. 199 15. ГРУППЫ И ПОДГРУППЫ. ГОМОМОРФИЗМЫ И НОРМАЛЬНЫЕ ДЕЛИТЕЛИ. ТЕОРЕМА О ГОМОМОРФИЗМАХ ГРУПП Основные понятия: алгебраическая операция, полугруппа, моноид, мультипликативная и аддитивная запись, подгруппа, смежный класс, индекс, гомоморфизм, изоморфизм, мономорфизм, группа подстановок, ядро гомоморфизма, нормальный делитель, факторгруппа, естественный гомоморфизм. Основные факты: ассоциативный закон можно распространить на любое число множителей; множество подгрупп образует решетку; порядок подгруппы делит порядок группы; гомоморфный образ группы изоморфен факторгруппе по ядру гомоморфизма. ГРУППЫ И ПОДГРУППЫ. Алгебра G = - называется группой, если операция – ассоциативна, обладает нейтральным элементом, и каждый элемент из G – обратим. Группа — это фундаментальное понятие современной математики. Теория функций, топология, кристаллография, квантоваямеханика и другие области естествознания в настоящее время немыслимы без применения этого математического объекта. Группа является частным случаем моноида, а тот, в свою очередь, — частным случаемполугруппы. Число элементов группы называют порядком группы. Как обычно, если G – множество группы, то порядок обозначают символом G. Значение произведения a1 ⋅ a2 ⋅ ... ⋅ an элементов полугруппы не зависит от расстановки скобок. В группе xa = b и ay = b имеют единственное решение для любых элементов a, b. Если алгебра A с одной операцией изоморфна группе, то A является груп200 пой. Гомоморфный образ группы сам является группой. Для любого натурального n существует группа из n элементов. Группа называется абелевой, если любые два ее элемента a, b коммутируют: ab = ba. Группу, состоящую из всех взаимно однозначных отображений множества на M себя, называют симметрической группой и обозначают символом SM. Если множество M конечно и состоит из n элементов, то вместо SM пишут Sn. Группа Sn состоит из n! элементов, и если n≥3, то эта группа не абелева. ПОДГРУППЫ. Подалгебра подгруппы называется подгруппой. Если H – подгруппа группы G, то символически это записывают: H называется идемпотентным (или идемпотентом), ес- ли x o x=x. В группе существует единственный идемпотентный элемент. Единица любой подгруппы является идемпотентным элементом, поэтому единичный элемент группы содержится в любой ее подгруппе. Отсюда следует, что п е р е с е ч е н и е л ю б о г о ч и с л а п о д г р у п п н е пусто, и поэтому является подгруппой. 201 В любой неединичной группе G содержится, по крайней мере, две подгруппы: сама G и единичная подгруппа E = {1}. Эти две подгруппы называют тривиальными (или несобственными). Наименьшую подгруппу группы G, содержащую непустое подмножество M, называют подгруппой, порожденной подмножеством M и обозначают символом гр(M). Например, симметрическая группа Sn порождается транспозициями, а знакопеременную группу An порождают циклы длины 3. ПРЕДСТАВЛЕНИЕ ГРУППЫ. Как и любая алгебра, группа может быть описана своими порождающими элементами и таблицей действия - таблицей Кэли. Таблица действия, в свою очередь может быть полностью определена с помощью некоторых соотношений между порождающими элементами. Соотношения можно представить в виде произведений порождающих и их обратных, равных единичному элементу. Единичный элемент и символ равенства в записи обычно опускаются. Точнее говоря, что если группа G порождается элементами a1, a2, …, an и имеет определяющие соотношения R1, R2, …, Rm, то пишут: G = < a1, a2, …, an ; R1, R2, … , Rm > ТЕОРЕМА КЭЛИ. Множество всех взаимно однозначных отображений конечного множества из n элементов на себя называют симметрической группой степени n и обозначают символом Sn. Любую подгруппу симметрической группы принято называть группой подстановок. Т ЕОРЕМА (Кэли1). Каждая конечная группа изоморфна группе подстаноВозможность представления конечной группы в виде группы подстановок установлена Артуром Кэли в 1854 г. 1 202 вок. ЦИКЛИЧЕСКИЕ ГРУППЫ. Если подмножество M группы G состоит из од- ного элемента, M = {a}, то подгруппу гр(a), порожденную этим множеством, называют циклической, порожденной элементом a. Если гр(a) = G, то G называется циклической группой. Циклическая подгруппа состоит из всех целочисленных степеней порождающего элемента, гр(a) = {ak  k ∈ Z}. Если найдется такое натуральное число n, что n-ая степень элемента a равна единице группы, an = 1, то наименьшее натуральное число n с таким свойством называют порядком элемента a (а если такого числа n не существует, то порядок элемента a считается бесконечным). Если n – порядок элемента a, то равенство an = 1 является определяющим соотношением для гр(a): гр(b) = < a; an >. Таким образом, п о р я д о к э л е м е н т а a р а в е н п о р я д к у цикли- ческой подгруппы гр(a). Каждая конечная мультипликативная группа любого поля – циклическая. Конечная группа движений плоскости является циклической или содержит циклическую подгруппу индекса 2. Для каждого натурального делителя m числа n в циклической группе < a; an > содержится в точности одна подгруппа, состоящая из m элементов. РЕШЕТКА ПОДГРУПП. Рассмотрим теперь множество всех подгрупп дан- ной группы G. Это множество упорядочено отношением включения ⊂ для 203 множеств. Пересечение A ∩ B подгрупп A, B группы G снова является подгруппой в G, причем пересечение A ∩ B – это наибольшая подгруппа, содержащаяся в подгруппах A, B одновременно. Другими словами, A ∩ B – это точная нижняя грань для подгрупп A, B. Подгруппа гр(A ∪ B) является наименьшей, содержащей подгруппы A, B, т. е. гр(A ∪ B) является точной верхней гранью для подгрупп A, B. Таким образом, м н о ж е с т в о п о д г р у п п д а н н о й г р у п п ы G о б р а зует решетку. В этой решетке есть наибольший элемент (группа G) и есть наименьший элемент – единичная подгруппа E. Так как в конечной циклической группе для каждого делителя k порядка группы найдется в точности одна подгруппа порядка k, решётка подгрупп циклической группы порядка n изоморфна решетке натуральных делителей числа n. ТЕОРЕМА ЛАГРАНЖА. Различные правые (левые) смежные классы по подгруппе не имеют общих элементов, и группа распадается на непересекающиеся смежные классы. Число элементов в каждом классе равно порядку подгруппы. Поэтому имеет место следующая теорема Т ЕОРЕМА (Лагранж1). Если H – подгруппа конечной группы G, то H ⋅ G : H = G . Если k = G : H , а x1, x2, …, xk – представители различных смежных клас- Жозеф Луи Лагранж (1736–1813) – французский математик; связь между порядком группы, порядком подгруппы и ее индексом установлена им в 1773 г. 1 204 сов, то G является объединением непересекающихся подмножеств: G = Hx1 C Hx2 C ...C Hxk . Однако это современная символика здесь не используется; представление множества группы G в виде объединения смежных классов по подгруппе H принято записывать так же, как во времена Лагранжа: G = H + Hx2 +… + Hxk. Это представление группы называют правосторонним разложением по подгруппе H. Обращение теоремы Лагранжа неверно: число m может делить порядок группы G, но группа G не содержать подгруппы порядка m. Например, в знакопеременной группе A4, содержащей 12 элементов, нет подгруппы шестого порядка. НОРМАЛЬНЫЕ ДЕЛИТЕЛИ. Если для каждого элемента x левый класс совпадает с правым, Hx = xH, то подгруппу H называют нормальной подгруппой (или нормальным делителем). Пишут в таком случае: H < G. Пересечение нормальных делителей и подгруппа, порожденная нормальными делителями, снова являются нормальным делителями, т. е. множество нормальных делителей образует подрешетку в решетке всех подгрупп группы G. Если операция в группе коммутативна, т. е. для любых элементов x, y xy = yx, 205 то группу называют абелевой.1 Например, все циклические группы - абелевы. Из теоремы Лагранжа следует, что конечная группа простого порядка не содержит нетривиальных подгрупп, и поэтому является циклической (и, следовательно, абелевой). В абелевой группе все подгруппы нормальны. В любой неединичной группе есть, по крайней мере, два нормальных делителя – сама группа и единичная подгруппа. Группа, не имеющая нетривиальных нормальных делителей, называется простой. ПРЯМОЕ ПРОИЗВЕДЕНИЕ ГРУПП. Если в группе G содержатся две нормальные подгруппы A и B такие, что G = {ab a∈A, b∈B} и A∩B = E, то группа G является прямым произведением своих подгрупп (пишут: G = A×B). Прямое произведение абелевых групп снова является абелевой группой. Более того, каждая конечная не простого порядка (или даже бесконечная, но не циклическая и конечно порожденная) абелева группа раскладывается в прямое произведением циклических подгрупп. Если абелева группа G состоит из n элементов, то для каждого делителя m числа n в группе G найдется подгруппа H порядка m (а если G – не циклическая, то такая H может быть не единственной). ГОМОМОРФИЗМЫ. Пусть f – гомоморфное отображение группы G= на группу G1=. Полный прообраз элемента e называют ядром гомоморфизма и обозначают символом Ker f: Ker f = {x∈Gf(x)=e}. В честь норвежского математика Нильса Хенрика Абеля (1802–1829). Абель первым обнаружил связь между существованием формулы для корней алгебраического уравнения и строением группы подстановок корней этого уравнения. 1 206 Пусть H - ядро гомоморфизма f: G→G1. Равенство f(x)=f(y) равносильно f(xy-1)=e, откуда следует, что f(x) = f(y) ⇔ x ≡ y(mod H). Ядро гомоморфизма является нормальным делителем. Если N < G , то отношение сравнимости по модулю N является конгруэнцией: каждый нормальный делитель группы является ядром некоторого гомоморфизма. Пусть N < G. Отношение сравнимости по модулю N разбивает множество G на смежные классы. Фактормножество G: N для нормального делителя N принято обозначать символом G N . На этом множестве определим операции по правилу: (Hx) ⋅ (Hy) = H(xy). Группа < G N ; ⋅ > называется факторгруппой группы G по нормальному делителю N. Отображение ε: G→ G N , переводящее каждый элемент x в свой смеж- ный класс, является гомоморфизмом; этот гомоморфизм называют естественным гомоморфизмом. Ядром естественного гомоморфизма ε: G→ G N является нормальный де- литель N. Каждый ядром нормальный делитель N группы естественного гомоморфизма ε: G→ G факторгруппу G N N G является группы G на по нормальному делителю. Представление группы в виде порождающего множества с определяющими 207 соотношениями является особенно удобным, когда требуется получить представление факторгруппы. Пусть группа G задана своим представлением G = < a1, a2, ..., an; R1(ai) = 1, R2(ai) = 1, Rk(ai) = 1 >. Предположим, далее, что h1(ai), h2(ai), …, hs(ai) - произвольные множество элементов из G, записанные в порождающих ai, а N - нормальное замыкание этого множества в G. Тогда факторгруппа G N имеет представление G N = < a1, a2, ..., an; R1(ai) = 1, R2(ai) = 1, Rk(ai) = 1, h1(ai) = 1, h2(ai) = 1, ..., hs(ai) = 1 >. ТЕОРЕМА О ГОМОМОРФИЗМАХ ГРУПП. Пусть f - гомоморфизм группы G на группу G1, и Ker f=N. Вместе с данным отображениям f и естественным гомоморфизмом ε определим соответствие ψ : G N →G1 по правилу ψ(Nx)=f(x). Это соответствие является биективным и сохраняет операцию: G N и G1 изоморфны. Гомоморфный образ группы изоморфен факторгруппе по ядру гомоморфизма. 208 Любой гомоморфизм групп является произведением естественного гомоморфизма и изоморфизма. Если группа G1 имеет порядок больше двух, то ее группа автоморфизмов Aut(G1) отлична от единичной, и поэтому, кроме естественного гомоморфизма группы G на G1, найдется и неестественный гомоморфизм. Теорема о гомоморфизмах групп позволяет свести описание всех гомоморфных образов к описанию нормальных делителей этой группы и факторгрупп. Группа G, имеющая лишь тривиальные нормальные делители, называется простой. Если группа проста, то она не имеет гомоморфизмов, отличных от изоморфизма и отображения на единичную группу. Например, простой является конечная группа простого порядка, так как из теоремы Лагранжа следует, что она вообще не содержит никаких подгрупп, кроме тривиальных. Простыми будут и все знакопеременные группы An при n > 4. ПРОСТОТА ЗНАКОПЕРЕМЕННЫХ ГРУПП. Группа An порождается циклами длины 3, поэтому для доказательства простоты An достаточно показать, что любой неединичный нормальный делитель N группы An содержит все тройные циклы. 209 Пусть α – неединичная подстановка из N, перемещающая наименьшее число символов. Если α = (a b c), то рассмотрим две подстановки: a b σ1 =  u v a b σ 2 =  u v w d e ...  , e ...  c d e w e d c d ...  , ...  в которых элементы, стоящие на месте многоточий, остаются неподвижными. Одна из подстановок σ1, σ2 принадлежит группе An. Обозначим эту подстановку символом σ. Тогда γ1 = σ –1ασ = (uvw) – элемент из N. Предположим теперь, что α не является тройным циклом, но разложение α содержит цикл, длина которого не меньше трех: α = (a b c… ) … Так как α – четная, она должна перемещать по крайней мере еще два символа,например d, e. Если β = (c d e), то коммутатор γ = β –1 α β α –1 принадлежит N. Эта подстановка не равна единице, так как 210 β–1 α β (b) ≠ α (b). Подстановка γ оставляет на месте все символы, которые оставляет α, и γ(a) = a. Все это наглядно видно на фрагменте графа, изображающего подстановку γ. Итак, если подстановка α содержит в своем разложении цикл длины не менее трех, то α— это просто тройной цикл. Если α является произведением независимых транспозиций: α = (a b) (c d) …, то снова тот же коммутатор неединичен и, оставляя неподвижными все неперемещаемые символы α, дополнительно не трогает символы a, b. Снова получено противоречие с выбором α, а это значит, что подстановка α может быть только тройным циклом. Следовательно, N = An . Группа Anпроста. Отметим, кстати, что теперь появляется не одна группа, а целая бесконечная серия групп, для которых обращение теоремы Лагранжа неверно. Действительно, для n > 4 порядок группы An всегда четный, однако подгруппы индекса 2 там нет. Подгруппа индекса 2 является нормальным делителем, а Anпроста, в ней нетривиальный нормальных делителей нет. 211 16. СРАВНЕНИЯ. СИСТЕМЫ ВЫЧЕТОВ. ТЕОРЕМЫ ЭЙЛЕРА И ФЕРМА. КОЛЬЦО КЛАССОВ ВЫЧЕТОВ. ЛИНЕЙНЫЕ СРАВНЕНИЯ. ДИОФАНТОВЫ УРАВНЕНИЯ ПЕРВОЙ СТЕПЕНИ. Основные понятия: факторкольцо, сравнимость по модулю идеала, конгруэнция, мультипликативная группа кольца, полная и приведенная системы вычетов, порядок элемента в группе, функция Эйлера, мультипликативное свойство целочисленной функции, линейное сравнение, цепная дробь, подходящая цепная дробь, неопределенные уравнения. Основные факты: отношение сравнимости является конгруэнцией; функция Эйлера мультипликативная; проблема совместности диофантова уравнения первой степени алгоритмически разрешима. СРАВНЕНИЯ. Если K – произвольное кольцо, I - идеал этого кольца, а K I - факторкольцо по этому идеалу. Элементами факторкольца являются смежные классы I+x. Два элемента x, y из одного класса [z] называют сравнимыми по модулю I; пишут: x ≡ y (mod I ) . Элементы x, y сравнимы по модулю I тогда и только тогда, когда x − y ∈ I . Сравнимость по модулю идеала является конгруэнцией в K. Согласованность сравнимости и операций гарантирует корректность определения операций над смежными классами по представителям, опр опр [x ] + [ y ] = [x + y ] , [x ] ⋅ [ y ] = [x ⋅ y ] . Смежный класс по отношению сравнимости называют классом вычетов по модулю идеала I. В кольце целых чисел любой идеал - главный, порожденный одним элементом m (будем считать для определенности, что m>0). Пусть I=(m). При записи сравнимости целых чисел по модулю идеала принято опускать круглые 212 внутренние скобки; вместо x ≡ y (mod (m )) пишут: x ≡ y (mod m ) . Включение x − y ∈ (m ) означает, что m делит x − y , что равносильно x=y+km, где k - целое число. Используя теорему о делении с остатком можно заметить, что каждое из этих двух условий будет выполняться тогда и только тогда, когда числа x, y имеют одинаковые остатки при делении на m. Это значит, что кольцо Z (m ) состоит из m элементов. Для гомоморфных образов кольца целых чисел по традиции принята особая символика и слова. Вместо символа Z (m ) принято писать: Zm. Модулем в этом случае называют не идеал (m), а само число m. Если x∈[y], то x − m снова лежит в том же классе [y], следовательно, вычитание модуля m из числа не выводит за пределы смежного класса, котором это число находится. Именно по этой причине смежный класс [x] по модулю m называют классом вычетов числа x по модулю m, а факторкольцо Zm кольцом классов вычетов по модулю m. ПОЛНАЯ И ПРИВЕДЕННАЯ СИСТЕМЫ ВЫЧЕТОВ. Кольцо классов вычетов Zm состоит в точности из m элементов. Набор чисел, состоящий из m чисел, выбранных из различных смежных классов по модулю m, называют полной системой вычетов по модулю m. Число a является представителем обратимого класса по модулю m тогда и только тогда, когда (a, m)=1; таким образом, [a]∈ Z *m ⇔ (a, m)=1. Систему представителей обратимых классов называют приведенной системой вычетов по модулю m. ТЕОРЕМЫ ЭЙЛЕРА И ФЕРМА. Функцию ϕ: N → N, определенную по прави213 лу: ϕ(n) = число натуральных чисел, меньших n и взаимно простых с n, называют функцией Эйлера. Таким образом, ϕ(n)= Z*m . Из теоремы Лагранжа (а для абелевых групп – непосредственным вычислением) получается утверждение: е с л и g – э л е м е н т к о н е ч н о й г р у п п ы G из n элементов, то gn=e, где e – нейтральный элемент G. В группе Z*m содержится ϕ(m) элементов, а нейтральный элемент - [1] . Следовательно, если [a ] - обратим, то [a ]ϕ (m ) ≡ [1 ] . На языке сравнимости это означает, что если числа a, m – взаимно просты, то aϕ (m ) ≡ 1 (mod m ) . Этот факт называют теоремой Эйлера. Если число p просто, то все числа 1, 2, …, p − 1 - взаимно просты с p, и ϕ(p)= p − 1 . Таким образом, получается частный случай теоремы Эйлера (малая теорема Ферма): если число a не делится на простое p, то a p −1 ≡ 1 (mod p ) . ЛИНЕЙНЫЕ СРАВНЕНИЯ. Уравнение [a][x] = [b], где [a], [b] принадлежат кольцу Zm, а [x] - неизвестный класс вычетов, удобнее записать в виде сравнения с неизвестным x: ax ≡ b (mod m). Числом различных решений сравнения называют число различных классов вычетов по модулю m. Необходимым и достаточным условием ax ≡ b(mod m) является делимость (a, m)b. 214 разрешимости сравнения Сравнение ax ≡ b(mod m), где (a, m)=d имеет d решений по модулю m, если d делит b и не имеет решений, если d не делит b. Для небольшого модуля для решения сравнения с неизвестным можно просто перебрать полную систему вычетов. Числа a и m при поиске решения сравнения можно считать взаимно простыми. Но тогда по теореме Эйлера aϕ(m) ≡ 1(mod m). Отсюда получается решение сравнения ax ≡ b(mod m): x ≡ aϕ(m) ⋅ b (mod m). ДИОФАНТОВЫ УРАВНЕНИЯ ПЕРВОЙ СТЕПЕНИ. Неопределенные уравнения Алгебраическое уравнение от любого числа неизвестных с целыми коэффициентами, решение которого разыскивается тоже в целых числах, называют диофантовым уравнением1.Число неизвестных в диофантовом уравнении обычно больше двух, и в случае совместности, множество решений бесконечно. Поэтому такие уравнения называют еще неопределенными уравнениями. В докладе «Математические проблемы», сделанном 8 августа 1900 г. на втором Международном математическом конгрессе в Париже Д. Гильберт2 сформулировал 23 нерешенные математические проблемы, исследование которых, как он сказал,«может значительно стимулировать развитие науки». Проблема Гильберта № 10 — это задача о разрешимости диофантова уравнения. Декартову n-ю степень множества Z0 можно эффективно перечислить, поэтому если у нас есть алгоритм для узнавания, имеет данное диофантово В честь Диофанта (∆ιυϕαντοζ, ок. III в.) — греческого математика из Александрии. Сохранились 6 книг (из 13) его трактата «Арифметика», где дается решение задач, в основном сводящихся к решению неопределенных уравнений 2 Давид Гильберт (Hilbert, 1862–1943) — немецкий математик, профессор Геттингенского университета (1895–1930), иностранный почетный член АН СССР (с 1934 г.). 1 215 уравнение решение или нет, то в конечное число шагов, простым перебором, это решение можно найти. Десятая проблема Гильберта оказалась алгоритмически неразрешимой1. Отрицательное решение проблемы о диофантовых уравнениях делает тем более значимыми классы, для которых алгоритм распознавания совместных уравнений существует. Например, один из этих классов — уравнения, входящие в формулировку Великой теоремы Ферма xn + yn = zn, где n > 2. Утверждение о несовместности такого уравнения на множествецелых неотрицательных чисел (записанное Пьером Ферма на полях «Арифметики» Диофанта) опубликовано Ферма-сыном в 1665 г. Это утверждение оказалось верным, но доказать его удалось лишь более чем через три столетия. Обычно имеется в виду, что диофантово уравнение имеет не менее двух неизвестных, однако алгебраическоеуравнение с целыми коэффициентами формально подпадает под определение. Простым испытанием делителей свободного члена такого уравнения можно выяснить, имеет оно целые решения или нет. Другими словами, проблема совместности диофантова уравнения с одним неизвестным алгоритмически разрешима. Так как кольцо целых чисел является кольцом главных идеалов, сумма любого числа идеалов порождается одним элементом. Это значит, что диофантово уравнение a1 x1 + a2 x2 + … + an xn = b Решение десятой проблемы Гильберта получено в 1970 г.российским математиком Юрием Владимировичем Матиясевичем (род. в 1947 г.) 1 216 имеет решение в целых числах тогда и только тогда, когда наибольший общий делитель чиселa1,a2,…, an делит число b. Таким образом, nнеизвестными проблема сводится к совместности поиску линейного наибольшего уравнения общего с делителя, следовательно, эта проблемаалгоритмически разрешима. Однако даже решение простейшего уравнения ax + by = c с двумя неизвестными для больших чисел a, b, cможет оказаться весьма трудоемким. Значительно облегчить ситуацию могут цепные дроби. ЦЕПНЫЕ ДРОБИ. Пусть рациональное число представлено несократимой дробью a , где a, b — целые числа. b Наибольший общий делитель равен последнему ненулевому остатку в алгоритме Евклида, примененного к числам a и b.Применим алгоритм и получим равенства: a = b⋅q1 + r1; b = r1⋅q2+ r2; r1= r2⋅q3+r3; . . . . . . . rn–3= rn–2⋅qn–1+1; rn–2 = 1⋅qn. Последний ненулевой остаток rn–1 (равный единице) появляется в предпоследнем равенстве; в последнем равенстве остаток равен нулю. Теперь разделим первое равенство на b, второе — на r1, третье на r3 и т. д., предпоследнее — на rn–2, последнее — на rn–1, равное единице. Получим: a r = q1 + 1 ; b b 217 b r = q2 + 2 ; r1 r1 r r1 = q3 + 3 ; r2 r2 r2 r = q4 + 2 ; r3 r3 . . . . . . . rn − 1 rn − 2 = qn − 1 + rn − 2 1 rn − 2 ; = qn . Мы можем взять от второго равенства обратное число и подставить значение r1 в первое. равенство: b 1 a . = q1 + r2 b q2 + r1 Затем возьмем обратноеот второго равенства и подставим значение в полученноеновое равенство для r2 r1 a : b a 1 = q1 + . 1 b q2 + r q3 + 3 r2 Продолжая и далее таким же образом, в результате получим представление числа 218 a в виде многоэтажной (говорят — цепной) дроби: b a = q1 + b q2 + 1 . 1 q3 + ... 1 qn − 1 + 1 qn Так как любое рациональное число можно представить обыкновенной несократимой дробью, получаем, что каждое рациональное число можно развернуть в конечную цепную дробь. Наоборот, если дана цепная дробь такого вида, где целая часть и знаменатели — целые неотрицательные числа, то, выполнив вычисления, можно свернуть цепную дробь в обыкновенную. Эти наблюдения показывают, что к а ж д о е рациональное положительное число может быть представлено конечной цепной дробью. «Свернув» дробь, т. е. выполнивдействия, предписанные ее изображением, мы получим рациональное число. Таким образом,м н о ж е с т в о рациональных чисел и множество конечных цепных дробей совпадает. Числители и знаменатели трех последовательных подходящих дробей, начинаяс i = 2,связаны следующими равенствами: Pi = q i ⋅ Pi − 1 + Pi − 2 , Qi = q i ⋅ Qi −1 + Qi − 2 . Числители и знаменатели двух последовательных подходящих дробей, начинаяс i = 1,связаны равенством: Pi − 1 Pi i = (− 1) . Qi − 1 Qi 219 a , поэтому Pn = a, Qn = b. b Последняя подходящая дробь — это сама дробь Тогда a Pn − 1 n = (− 1) . b Qn −1 Отсюда aQn–1 (–1)n+ bPn–1 (–1)n+1 = 1. С помощью этого равенства можно гораздо эффективнее(т. е. с существенно меньшим числом действий) получить какое-нибудь конкретное решение уравнения ax + by = 1 (а, следовательно,и решение уравнения ax + by = с). ПОЛОЖИТЕЛЬНЫЕ РЕШЕНИЯ НЕОПРЕДЕЛЕННОГО УРАВНЕНИЯ С ДВУМЯ НЕИЗВЕСТНЫМИ. Знание хотя бы одного конкретного решения позволяет опи- сать все множество решений линейного диофантова уравнения. Пусть ax + by = c — уравнение, в котором a, b, c — целые числа. Если (a, b) не делит c, то уравнение не имеет решения, а если (a, b) делит c, то уравнение имеет решение. Поэтому если(a, b) = 1, то уравнение имеет решение при любом c. К этому случаю сводится произвольное совместное уравнение такого вида. Действительно, разделив левую и правую части уравнения на (a, b),получим уравнение с взаимно простыми коэффициентами и равносильное исходному. Если (x0, y0) — решение исходного уравнения, то {(x0, y0) + t(b, –a) t∈Z0} — этовсе множество решений данного уравнения. 220 Множество решений уравнения ax + by = c Геометрический смысл уравнения следующий. Множество решений — это точки с целочисленными координатами, попавшие на прямую, описанную этим уравнением. Множество {t(b, –a) t ∈ Z0} представляет собой все точки с целыми координатами,лежащие на графике зависимости ax + by = 0, а вектор (x0, y0) — это вектор сдвига этой прямой. Наши b2 + (− a ) 2 точки расположены на прямой ax + by = c на расстоянии друг от друга. Пусть теперь все параметры a, b, c в уравнении положительны. Уравнение прямой, заданной этим уравнением, можно задать в отрезках: x y + = 1. c c a b Если c > ab, то b + (− a ) 2 2 2 2 c c <   +  . a b Отсюда следует, что в положительном квадранте плоскости на 221  c отрезке, соединяющем точки  , 0  и a   c  0,  , найдется хотя бы одна точка с  b целыми координатами. Следовательно, если c ≥ ab, то уравнение ax + by = c имеет решения в целых неотрицательных числах. При решении сравнений по большому модулю этот модуль иногда можно понизить. Делается это спомощью китайской теоремы об остатках. КИТАЙСКАЯ ТЕОРЕМА ОБ ОСТАТКАХ. Если числа m1, m2, ... , mn попарно взаимно просты, то для любых целых чисел c1 , c2, ... , cn система сравнений:  x ≡ c1 (mod m1 ),  x ≡ c (mod m ),  2 2  . . . . . .  x ≡ cn (mod mn ), имеет единственное решение по модулю m1 ⋅ m2 ⋅ ... ⋅ mn. На языке идеалов в кольце Z (или в любом целостном кольце K) китайская теорема означает, что если каждая пара различных идеалов I1, I2, ..., In в сумме дает всё кольцо Z, то для любых элементов c1, c2, ..., cn из кольца Z пересечение смежных классов Ij+cj не пусто, (I1 + c1) ∩ (I2 + c2) ∩ ... ∩ (In + cn) ≠ ∅. С точки зрения строения кольца Zm китайская теорема об остатках означает, что если m=m1m2...mn, причем mi - попарно взаимно просты, то кольцо Zm разлагается в прямое произведение: Z m = Z m1 × Z m2 × ... × Z mn . 222 На языке школьного курса математики китайская теорема гарантирует, задача, что задача «найти число, которое при делении на mi дает соответственно остатки ci» всегда имеет решение, если mi – попарно взаимно просты. 223 17. АРИФМЕТИЧЕСКИЕ ПРИЛОЖЕНИЯ СРАВНЕНИЙ: РЕШЕНИЕ НЕОПРЕДЕЛЕННЫХ УРАВНЕНИЙ, ВЫЧИСЛЕНИЕ ОСТАТКА ОТ ДЕЛЕНИЯ, ПРИЗНАКИ ДЕЛИМОСТИ, ДЛИНА ПЕРИОДА СИСТЕМАТИЧЕСКОЙ ДРОБИ Основные понятия: неопределенное уравнение, функция Эйлера, признак делимости, g-ичная система счисления, гомоморфизм, десятичная дробь, смешанная и периодическая десятичная дробь, длина периода, порядок числа по модулю. Основные факты: решение неопределенного уравнения в кольце целых чисел можно свести к решению уравнения в кольце классов вычетов; вычисление остатков от деления, признаки делимости и проверка арифметических действий сводится к вычислениям в гомоморфных образах; вычисление длины периода систематической дроби сводится к отысканию порядка элемента в мультипликативной группе кольца классов вычетов. АРИФМЕТИЧЕСКИЕ ПРИЛОЖЕНИЯ ТЕОРИИ СРАВНЕНИЙ. Арифметические приложения теории сравнений - это вычисления в гомоморфных образах. Задача, первоначально сформулированная для целых чисел, переводится на язык кольца классов вычетов и решается уже в конечном кольце Zm. РЕШЕНИЕ НЕОПРЕДЕЛЕННЫХ УРАВНЕНИЙ ПЕРВОЙ СТЕПЕНИ. Рассмотрим линейное уравнение с двумя неизвестными ax+by=c с целыми коэффициентами. Если (a, b) не делит число с, то уравнение ax+by=c не имеет решений в целых числах. Если (a, b) делит число с, то после деления на c левой части коэффициенты при неизвестных становятся взаимно простыми. Кольцо целых чисел является кольцом главных идеалов, а это значит, что если (a, b)=1, то уравнение ax+by=с всегда имеет решение в целых числах. 224 Пусть (x0, y0) - какое-нибудь решение уравнения ax+by=c. Тогда для любого целого k если (x0, y0) - какое-нибудь решение уравнения ax+by=c, то {(x0+bk, y0-ak)k∈Z} - все множество решений этого уравнения. Итак, решение неопределенного уравнения в случае его совместности сводится к поиску какого-нибудь частного решения. Найти какое-нибудь решение уравнения ax+by=c можно решая линейное сравнение ax≡c(mod b), и этим сводя исходную задачу к решению уравнения [a][x]=[c] с одним неизвестным [x] в кольце Zb. ВЫЧИСЛЕНИЕ ОСТАТКОВ ОТ ДЕЛЕНИЯ. Речь идет о нахождении остатка от деления большой степени (или арифметического выражения, содержащего такие степени) на число m без вычисления частного от деления. Используя вычисления в факторкольце Zm и теорему Эйлера, можно решить задачу такого типа, оставаясь в кольце Zm. Если (a, m)=1, то ab≡(Rest(a, m))Rest(b, ϕ(m))(mod m). Случай не взаимно простых a и m с помощью деления левой и правой частей равенства на общий делитель (a, m) сводится к только что рассмотренному случаю - только искомым будет теперь число ПРИЗНАКИ ДЕЛИМОСТИ. r . (a, m ) Для любого целого числа g>1 если gi≡bi(mod m), i=1, 2, ... , n, то angn + a n−1gn−1 + ... + a1g +a0 ≡ anbn + a n−1bn−1 + ... + a1b +a0(mod m). Число g - здесь произвольное целое, большее единицы, как и произвольное m. Этот признак делимости на m в g-ичной системе счисления называют обобщенным признаком делимости Паскаля. Обобщенный признак Паскаля для небольших чисел m дает обычные школьные признаки делимости (а точнее, равноостаточности, так как, применяя 225 признак Паскаля, мы не только узнаем, делится ли число на m, но и какой остаток получается при этом делении). Например, так как 10i ≡ 0(mod 2), получаем, что при делении на 2 число дает такой же остаток, что и его последняя цифра при делении на 2. Так как 10i ≡ 0(mod 4) для i > 1, поэтому при делении на 4 число дает такой же остаток, что и число, изображенное его последними двумя цифрами. Так как 10i ≡ 1(mod 3) и 10i ≡ 1(mod 9) , получаем, что число при делении на 3 (или на 9) дает такой же остаток, что и его сумма цифр его сумма цифр при делении на 3 (или на 9). При m=11 имеем 10i ≡ (-1)i(mod 11) , и поэтому при делении на 11 число дает такой же остаток, что и его знакопеременная сумма цифр. ПРОВЕРКА АРИФМЕТИЧЕСКИХ ДЕЙСТВИЙ. Одно из применений признаков делимости – проверка арифметических действий. Любое равенство двух выражений f(x1, x2, ...xn)= g(x1, x2, ...xn), составленных из целых чисел xi с помощью операций сложения, вычитания, умножения и возведения в степень, при гомоморфизме кольца Z в кольцо классов вычетов Zm переходит в верное равенство f([x1], [x2], ...[xn]) = g([x1], [x2], ...[xn]) в кольце Zm. В таких выражениях может быть и деление, но все делители должны быть взаимно просты с m (только тогда они попадут в мультипликативную группу кольца Z*m ).Таким образом, с помощью кольца классов вычетов Zm мы можем проверить правильность выполнения арифметических действий в Z. Правда, 226 ошибке при такой проверке, может быть, удастся скрыться: число, кратное модулю m, играет в Zm роль нуля, а число mk + 1 – роль единицы. Это значит, что при “удачной проверке” исходное равенство, может быть, неверным. Например, левая часть может отличаться от правой части слагаемым вида mk и (или) множителем mk + 1, тогда неверное равенство в кольце Z превратится в верное равенство в факторкольце Zm. Но если в Zm равенство не выполняется, то исходное равенство в Z наверняка не выполняется. Проще всего проделать проверку с помощью модулей 9 и 11. «Удачная проверка» неверного равенства с помощью двух колец Z9 и Z11 означает, что пропавшее слагаемое – это любое число, кратное 99, а множитель, исчезнувший при переходе к гомоморфному образу, – любое число вида 99k + 1. ДЛИНА ПЕРИОДА СИСТЕМАТИЧЕСКОЙ ДРОБИ. Пусть основание системы равно g. Рассмотрим положительную, правильную, несократимую дробь которой знаменатель взаимно прост с основанием системы, т. е. a ,в b 1 ≤ a < b, (a, b) = 1, (b, g)=1. Начнем обращать дробь a в g-ичную, используя школьное правило делеb ния «уголком»: a = bq1 + r1, gr1 = bq2 + r2, … grr – 1 = bqi + ri, … В результате возникает представление 227 q a q1 q2 = + 2 + ... + ii + ... , b g g g или, в систематической записи: a =0, q1 q2 ... qi ... b Остатки от деления ri в равенствах деления отличны от нуля, они даже взаимно просты с числом b. Следовательно, процесс деления никогда не оборвется, и систематическая дробь, представляющая число a , бесконечна. Различных остатков, взаимно b простых с числом b, при делении на b может возникнуть не более чем ϕ(b). Это значит, что наша дробь после обращения ее в систематическую является периодической, и длина периода не превышает ϕ(b). Запишем равенства, возникающие при делении, в виде сравнений и перемножим первые k сравнений. Получится сравнение gkr1r2 ... rk-1 ≡ r1r2 ... rk(mod b). Сокращая на взаимно простые с модулем b (а поэтому обратимые в кольце Zb) числа ri, получаем gka ≡ rk(mod b). Для наименьшего числа k, для которого выполняется это сравнение, k-тый остаток впервые совпадает с числом a, и, начиная с этого момента, сформируется период систематической дроби. Иначе говоря, длина периода дроби a , где b 1 ≤ a < b, (a, b) = (g, b) = 1, после обращения ее в g-ичную систематическую дробь равна порядку числа g по модулю b. Если дробь неправильная, то можно выделить целую часть и дальнейшие 228 вычисления проводить с правильной частью. Если в каноническом разложении числа b содержатся степени простых чисел, входящих в разложение числа g, то получившаяся дробь будет иметь допериодическую часть. Например, если g = 10 и b=2k ⋅ 5m ⋅ p1p2 ... pn, где pi – простые числа, отличные от 2 и 5, то обыкновенная несократимая дробь a после обращения ее в десятичную будет иметь допериодическую b часть, длина которой равна max{k, m}. По теореме Лагранжа порядок числа g по модулю b является делителем ϕ(b). Это значит, что если ϕ(b) = kp, где p – простое число, и после k шагов деления a на b в качестве остатка еще не появилось число a, то для вычисления длины периода можно дальше и не делить: длина периода дроби равна в точности ϕ(b). Если знаменатель дроби a является простым, то вычисление длины пеp риода можно провести с помощью дискретных логарифмов. МУЛЬТИПЛИКАТИВНАЯ ГРУППА КОЛЬЦА КЛАССОВ ВЫЧЕТОВ ПО ПРОСТОМУ МОДУЛЮ. Из школьного курса математики известно, что группы < R+; ⋅ > и < R; + > — изоморфны. А именно: отображение f : R+ → R, заданное правилом f (x) = log a x, является изоморфизмом (a ≠ 1, a > 0). Сохранение операции отображением log a записывается так: log a (x ⋅ y) = log a x + log a y. 229 С помощью этого изоморфизма задачу о положительных действительных числах, сформулированную на языке умножения, можно перевести на язык сложения, но уже на множестве всех действительных чисел. Например, уравнение xn = a в мультипликативной группе < R+; ⋅ > превращаетсяв аддитивной группе < R; + > в уравнение вида nx = b. Аналогично перевод уравнения ax = c с мультипликативного языка на аддитивный дает уравнение xa = d. На аддитивном языке уравнения выглядят (и внешний вид здесь не обманчив) гораздо доступней по сравнению с соответствующими мультипликативными задачами. По существу, этот изоморфизм выглядит как неожиданный подарок природы для человеческой цивилизации. Точно такой же подарок природа приготовила и в мультипликативной * группе Z p кольца классов вычетов по простому модулю p. Оказывается, что группа мультипликативная группа кольца классов вычетов по простому модулю < Z p ; ⋅ > — циклическая. * Обнаружил (и нестрого доказал в 1761 г.) этот замечательный факт Эйлер, а первое безупречное доказательство принадлежит Лежандру1 (1830). На самом деле выполняется более сильное утверждение: к о н е ч н а я группа, состоящая из элементов поля, является циклической. Пусть G — конечная подгруппа из некоторого поля P и порядок G равен n. Предположим, что a — элемент максимального порядка k из G. По определению порядка k ≤ n. Цикличность G означает, что k = n. Покажем, что n ≤ k, и этим будет установлено требуемое равенство. Адриен-Мари Лежандр (Legendre, 1752–1833) — один из величайших французских математиков. В 1787 г. принял участие в вычислении длины дуги меридиана между Барселоной и Дюнкерком, сделанном для определения длины метра. 1 230 Пусть g — произвольный элемент из G и m — порядок этого элемента. Покажем, что m непременно делитk. Предположим, что это не так. Тогда, используя канонические разложения чисел m и k, можно представить эти числа в виде m = m1 m2, k = k1 k2 , где (m1, k1) = 1, а [m, k] = m2 k2. Но тогда элемент a k 2 b m 2 имеет порядок, равный[m, k],больший, чем k. Полученное противоречие означает, что порядок любого элемента из G делит максимальный порядок k. Следовательно, каждый элемент из G является корнем многочлена xk – 1. Теперь снова воспользуемся тем фактом, что многочлен с коэффициентами из поля имеет корней не больше,чем его степень1. В частности, многочлен xk – 1, где 1 — единица поля P, имеет не более чем k корней, а значит, n ≤ k, что и доказывает теорему Лежандра. Все циклические группы одинакового порядка изоморфны. Аддитивная группа < Zp – 1; + > кольца классов вычетов по модулю p – 1 является циклической порядка p – 1, и < Z*p ; ⋅ > тоже состоит из p – 1 элементов. Следовательно,г р у п п ы < Z p − 1; + > и < Z *p ; ⋅ > и з о м о р ф н ы . Порождающий элемент циклической группы называют еще первообразным элементом (или первообразным корнем). Для группы Z*p первообразным элементом принято называть и число-представитель порождающего класса. Цикличность группы < Z *p ; ⋅> означает, что по простому модулю p существует первообразный элемент, т. е. элемент, мультипликативный порядок которого равен в точности p – 1. Чтобы пожинать плоды установленного изоморфизма между мультипликативной группой Z*p и аддитивной группой Zp – 1, нам следует ввести понятие, аналогичное школьным логарифмам. 231 Впрочем, ситуация сейчас существенно проще, чем с логарифмами, изучаемыми в школе. Там логарифмы были определены на бесконечном (континуальном), непрерывном множестве. Наше множество — конечное, поэтому в нем нет непрерывности — оно дискретное. ДИСКРЕТНЫЕ ЛОГАРИФМЫ. Элементами изоморфных групп < Zp – 1; + > и < Z*p ; ⋅ > являются смежные классы вычетов по различным модулям. Чтобы их различать, смежный класс по модулю p с представителем x обозначим символом [x], а смежный класс по модулю p – 1 с тем же самым представителем обозначим символом x . Если g — первообразный элемент в Z*p , то Z*p = {[g]0, [g]1, [g]2, ..., [g]p–2} В свою очередь: Zp–1 = {0 , 1 , 2 , ..., p − 2 }. Отображение f ([g]i) = i изоморфно отображает первую группу на вторую. Пусть теперь элемент [a] принадлежит группе Z*p , т. е. p не делит a. Тогда для некоторого числаiвыполняется равенство [a] = [g] i. Число i в этом равенстве называют индексом числа a при основании g по модулю p и пишут: i = indg a. Таким образом, отображение f : Z*p → Z p 1 Доказанным впервые также Лежандром. 232 − 1 переписывается в виде f ([a]) = indg a, т. е. отображение f построено точно так же, как и упомянутый ранее школьный изоморфизм между мультипликативной группой положительных действительных чисел и аддитивной группой всех действительных чисел. На языке сравнений изоморфизм f означает, чтоесли p — простое число, а g — первообразный корень по модулю p, то для любыхa, b, взаимно простых с p: a≡b(mod p) ⇔ indga≡ indgb(mod p−1). Если p — простое число, g — первообразный корень по модулю p, то для любых целых чисел a, b, взаимно простых счислом p выполняется сравнимость: indg(a⋅b) ≡ indga + indgb(mod p−1). Индукцией по n последнее свойство обобщается на натуральную степень: если p — простое число, а g — первообразный корень по модулю p, то для любого целого числа a, взаимно простого с p, и любого целого неотрицательного числа n: indgan≡n⋅indga (modp−1). Теперь, как и для логарифмов, с помощью индексов поиск решения сравнений xn ≡ a(mod p), ax ≡ b(mod p) сводится к решению некоторых линейных сравнений по модулю p – 1. Для такого перехода нужна таблица, аналогичная таблице логарифмов — таблица индексов (для обратного перевода — соответственнотаблица антииндексов). 233 В отличие от «настоящих» логарифмов, для которых поиск основания — не проблема, для дискретных, «игрушечных» логарифмов (индексов) сначала надо найти основание — первообразный элемент. Впервые таблицы индексов для простых чисел, меньших 1000, были опубликованы в 1839 г.В честь своего создателя они называются таблицами Якоби1. Для поиска первообразного элемента вручную (или с помощью вычислительной техники) можно учесть следующее обстоятельство. Первообразный элемент gимеет порядокp – 1 в группе < Z *p ; ⋅ > . Порядок любого элемента из этой группы является делителем числа p – 1. Для нечетного простогоpчисло p – 1 — четно. Если порядок элемента g больше, чем p −1 , то он уж точно равен p – 1. 2 В общем случаедля произвольного модуля m картина не меняется: если порядок элемента g больше максимального собственного делителя числа ϕ(m), то порядок g по модулю m равен ϕ(m), и g — первообразный по модулю m. К сожалению, первообразный элемент для составного модуля может и не существовать, например: группа Z*8 , состоящая из четырех элементов, не содержит элементов четвертого порядка. С другой стороны, если m = m1m2 ... mn , где mi — попарно взаимно просты, то группа Z*m распадается в прямое произведение: * * * Z *m = Z m 1 × Z m 2 × ... × Z m n . На основе этого наблюдения иногда можно ответить на вопрос, для каких модулей первообразный элемент существует, а для каких нет. Например, ЯкобКарл Густав Якоби (Jacobi, 1804–1851), немецкий математик, иностранный членкорреспондент (1830) и иностранный почетный член (1833) Петербургской АН. 1 234 Z*2 = 1, поэтому если p — простое нечетное число, то первообразный элемент по модулю 2p существует. С другой стороны, если числа m и n не взаимно просты, то прямое произведение циклических групп порядков m и n не является циклической группой. Поэтому если числа a, b — взаимно просты и нечетны, то первообразного элемента по модулю ab не существует. Так как подгруппа циклической группы снова циклическая, предыдущее замечание означает, что если в каноническое разложение числа m входят по крайней мере два различных простых нечетных числа, то группа Z*m — не циклическая. * Отметим, что если p — нечетное простое число, то группа Z p k тоже циклическая, а если k > 2, тогруппа Z *2 k нециклическая. * Снова ссылаясь на то, что Z 2 * = 1 получаем, чтогруппа Z2 p k тоже циклическая. Непосредственно проверкой можно убедиться, что группа Z*4 циклическая. Таким образом, г р у п п а < Z*m ; ⋅ > я в л я е т с я ц и к л и ч е с к о й т о г д а и толькотогда, когда m∈{2, 4, pk, 2pk}, где k ≥ 1. Отметим, наконец, что, несмотря на многолетние (и даже многовековые) исследования, свойства первообразных чисел по простому модулю остаются загадочными. Например, до сих пор неизвестно, является ли каждое простое число p первообразным элементом по бесконечному числу простых модулей? Более того, пока нет ответа на этот вопрос даже для числа p = 2. 235 18. КОЛЬЦА ГЛАВНЫХ ИДЕАЛОВ, ЕВКЛИДОВЫ И ГАУССОВЫ КОЛЬЦА. ТЕОРЕМА О ГОМОМОРФИЗМАХ КОЛЕЦ Основные понятия: кольцо, целостное кольцо, идеал, главный идеал, сумма идеалов, евклидовость, наибольший общий делитель и наименьшее общее кратное элементов кольца, простые и составные элементы целостного кольца, гомоморфизм, ядро гомоморфизма, факторкольцо, естественный гомоморфизм. Основные факты: в кольце главных идеалов отношение делимости точно соответствует отношению включения между идеалами; евклидово кольцо является кольцом главных идеалов; кольцо главных идеалов - гауссово; с точностью до изоморфизма все гомоморфизмы кольца – естественные. КОЛЬЦА ГЛАВНЫХ ИДЕАЛОВ. Кольцо K называют кольцом главных идеалов, если все идеалы в K – главные (т. е. одно-порожденные). Для каждого идеала H из кольца главных идеалов существует элемент d из K такой что (d)=H. Любое отношение порядка можно изоморфно представить отношением включения для множеств. В кольце K главных идеалов отношение делимости на K изоморфно представляется отношением включения для идеалов кольца K. Элемент c, порождающий пересечение идеалов (a) ∩ (b), является точной верхней гранью множества {a, b} в смысле делимости. Элемент c – это наименьшее общее кратное элементов a и b. Наименьшее общее кратное элементов a, b обозначают символом [a, b] В кольце главных идеалов для любого множества элементов существует наименьшее общее кратное. Как и в произвольном кольце, сумма двух идеалов (a)+(b) снова является идеалом. В кольце главных идеалов эта сумма будет главным идеалом. Если d - порождающий элемент главного идеала (a)+(b), то d является точной нижней гранью множества {a, b} в смысле делимости. Такой элемент называют наибольшим общим делителем элементов a и b. Наибольший общий делитель 236 элементов a, b обозначают символом (a, b). В кольце главных идеалов любые два элемента обладают наибольшим общим делителем. В кольце главных идеалов К для любого множества элементов S существует наибольший общий делитель d, причем найдутся такие элементы a1, a2, ... , an из S и элементы u1, u2, ... , un из K, что d = a1u1 + a2u2 +... + anun. Два элемента из кольца принято называть взаимно простыми, если у них нет общих делителей, кроме делителей единицы. В кольце главных идеалов К два элемента a, b взаимно просты тогда и только тогда, когда найдутся такие элементы u, v из K, что au + bv=1. В кольце главных идеалов К два элемента a, b взаимно просты тогда и только тогда, когда (a)+(b)=K. В кольце главных идеалов наибольший общий делитель и наименьшее общее кратное элементов a и b связаны соотношением (a, b)[a, b] = ab. Если K - кольцо главных идеалов, то факторкольцо идеал I является максимальным в K тогда и только тогда, когда I порождается простым элементом. Если K - кольцо главных идеалов, то факторкольцо K I является полем то- гда и только тогда, когда I порождается простым элементом. ЕВКЛИДОВЫ КОЛЬЦА. Целостное кольцо K - евклидово, если существует отображение f: K\{0}→Z0, и для каждых a, b из K (b≠0) существуют такие элементы q, r, что a=b q + r, где r =0 или f(r) — гомоморфный образ кольца K = < K; + , ⋅ > если существует отображение ϕ множества K на множество K1, сохраняющее операции кольца (для любых x, y из K): ϕ(x + y) =ϕ(x) + ϕ(y); ϕ(x⋅y) = ϕ(x) ⋅ϕ(y). Отображение ϕ называют в таком случае гомоморфизмом. Если ϕ — гомоморфизм кольца K на алгебру K1 и 0 — нуль в K, то ϕ(0) — нуль в K1 и ϕ(–x) = –ϕ(x). Кроме того, все тождества при гомоморфном отображении сохраняются; сохранится и дистрибутивность умножения относительно сложения. Поэтому гомоморфный образ кольца я в л я е т с я к о л ь ц о м. В частности, если гомоморфизм является взаимно однозначным (т. е. изоморфизмом), то получаем, что изоморфный образ кольца является кольцом. Другими абстрактное. 240 словами, свойство алгебры «быть кольцом» — Гомоморфизмы колец обладают всеми свойствами гомоморфизмов всех алгебр; в частности, гомоморфизм задает конгруэнцию на кольце-прообразе, и наоборот — любая конгруэнция на множестве кольца определяет гомоморфизм этого кольца. групп (кольцо является группой по сложению) конгруэнция, определяемая гомоморфизмом, полностью описывалась ядром этого (группового) гомоморфизма. ЯДРО КОЛЬЦЕВОГО ГОМОМОРФИЗМА. Если нет особых оговорок, то под словом «кольцо» далее будет подразумеваться ассоциативно-коммутативное кольцо без делителей нуля, т. е. целостное кольцо (к тому же, как правило, с единицей). Кольцевой гомоморфизм является, в частности, гомоморфизмом аддитивных групп. Пусть 0 — нулевой элемент кольца K1. Как и для группового гомоморфизма, полный прообраз нейтрального элемента при гомоморфизме ϕ : K → K1 называют ядром гомоморфизма ϕ: Ker ϕ = {x ∈ Kϕ(x) = 0}. Ядро гомоморфизма ϕ : K → K1 колец K и K1 является подкольцом в кольце K. Действительно, если элементы x, y при гомоморфизме переходят в нулевой элемент, то их разность и произведение тоже переходят в нуль. Обозначим Ker ϕ = H. Множество H образует подкольцо кольца K, и в частности < H; + > — это подгруппа группы < K; + >. Кольцевой гомоморфизм является одновременно и групповым гомоморфизмом аддитивных групп колец. Гомоморфизм групп тесно связан со сравнимостью по модулю ядра: сравнимость по модулю H в K, заданная правилом 241 опр a≡b(modH) ⇔a – b∈H, согласована с операцией сложения. Общие соображения о связи гомоморфизмов групп и конгруэнций на группах наводят на следующие предположения: 1) Если H— ядро кольцевого гомоморфизма ϕ, то сравнимостьпо модулю H является конгруэнцией. 2) Для того чтобы подкольцо H было ядром некоторого гомоморфизма, достаточно, чтобысравнимостьпо модулю H была конгруэнцией. Кроме того, ситуация с гомоморфизмами групп заставляет подозревать, что не каждое подкольцо кольца K является ядром некоторого гомоморфизм, как не каждая подгруппа способна быть ядром группового гомоморфизма. Для того чтобы быть ядром группового гомоморфизма, подгруппа должна быть нормальной. Только для нормальной подгруппы сравнимость по модулю является конгруэнцией, и соответственно появляется фактор-группа и естественный гомоморфизм исходной группы на свою фактор-группу. При описании кольцевого гомоморфизма или построении гомоморфизма для данного кольца возникает некий аналог нормальной подгруппы, но он не называется «нормальным подкольцом». Его имя —идеал. ИДЕАЛЫ И ГОМОМОРФИЗМЫ КОЛЬЦА. Пусть H— ядро гомоморфизма ϕ : K → K1. Так как кольцевой гомоморфизм явялется одновременно и групппповым, сравнимость по модулю подгруппы H согласована с операцией сложения: a ≡ a1 (mod H), b ≡ b1 (mod H) ⇒ a + b ≡ a1 + b1 (mod H). Предположим, что сравнимость по модулю H согласована и с операцией умножения, т. е. 242 a ≡ a1 (mod H), b ≡ b1 (mod H) ⇒ ab ≡ a1b1 (mod H). Тогда если a1 = a + h1, b1 = b + h2, то a1b1 = (a + h1) ⋅ (b + h2) = ab + (ah2 + h1b + h1h2). В случае согласованности с умножением элемент ah2 + h1b + h1h2должен принадлежать подкольцу H. Следовательно, для согласованности сравнимости по модулю H с умножением достаточно, чтобы подкольцо H вместе с каждым своим элементом h содержало и произведение hx для всех элементов x из K. Это условие и необходимо, так для a, сравнимого с нулем по модулю H, т. е. для a = h элемента из H имеем: h ≡ 0 (mod H), x ≡ x (mod H) ⇒ hx ≡ 0 (mod H). Последняя сравнимость означает, что hx принадлежит H. Подкольцо, обладающее таким свойством, называют идеалом кольца K. Другими словами, непустое подмножество I кольца K является идеалом, если: (1) z, y ∈ I ⇒ x −y ∈ I; (2) x ∈ I и z ∈ K ⇒ xz ∈ I. Наименьший идеал, содержащий подмножество M, принято изображать символом (M). Фигурные скобки внутри круглых, как правило, опускают. Например, для случая двух порождающих вместо ({a, b}) пишут (a, b). Пересечение любого числа идеалов содержит нулевой элемент, поэтому не пусто. Выполнение условий (1) и (2) для идеалов переносится на их пересечение, т. е. пересечение идеалов кольца снова образует идеал в этом кольце. Если A, B — два идеала кольца K, то сумма идеалов 243 A + B = {a + ba∈A, b∈B} тоже является идеалом. Этот идеал — наименьший, содержащий идеалы A, B. Таким образом, множество идеалов кольца образует решетку — подрешетку в решетке всех L(K) всех подколец кольца K. На рисунке изображен типичный фрагмент этой решетки. Фрагмент решётки идеалов Отметим, кстати, что, несмотря на то, что решетка P (K) всех подмножеств множества K— дистрибутивна (и даже булева), решетка идеалов всего лишь модулярна, т. е. для любых идеалов A, B, C кольца K: A ∩ [(A ∩B) + C] = (A ∩B) + (A ∩C). Пусть x принадлежит A∩ [A∩B) + C] , тогда x ∈ A и x = y + c, где y ∈ A ∩ B, c ∈ C. Отсюда следует, что c = x – y принадлежит A, поэтому c ∈ A ∩ C. Это значит, что y+c принадлежит (A ∩ B) + (A ∩ C), следовательно: A ∩ [(A ∩ B) + C] ⊂ (A ∩ B) + (A ∩ C). Докажем обратное включение. Пусть x ∈ (A ∩ B) + (A ∩ C), 244 и, тогда x ∈ (A ∩ B) + C. Кроме того, x = y + z, где y ∈ A ∩ B и z ∈ A ∩ C, и, следовательно, элемент xпринадлежит A: A ∩ [(A∩B) + C] ⊃ (A∩B) + (A∩C). Итак, р е ш е т к а и д е а л о в ц е л о с т н о г о к о л ь ц а м о д у л я р н а . Связь между понятиями идеала и нормального делителя теснее, чем это кажется на первый взгляд. Решетка нормальных делителей группы тоже модулярна, причем доказательство модулярности решетки нормальных делителей в группе почти буквально повторяет приведенное доказательство модулярности решетки идеалов кольца. .Нуль является поглощающим элементом кольца, поэтому ядро гомоморфизма ϕ : K → K1 колец K и K1 является идеалом в кольце K. Не каждое подкольцо кольца обязано удовлетворять дополнительному «идеальному» свойству. Например, множество коэффициентов K образует кольцо, но не идеал в кольце всех многочленов K [x] с коэффициентами из K. Следовательно, не каждое подкольцо является ядром кольцевого гомоморфизма. ИДЕАЛЫ И ЯДРА ГОМОМОРФИЗМОВ. Каждый ли идеал кольца является ядром некоторого гомоморфизма кольца? Другими словами, переносится ли теорема о гомоморфизмах групп на кольца? Ответ на этот вопрос положительный: да, каждый идеал является ядром некоторого (точнее, естественного) гомоморфизма. Докажем это утверждение. Пусть I — идеал кольца K. Используя построение для групп, устроим гомоморфизм, ядром которого является I. Как и для групп, символом K I обозначим фактор-множество по сравнимости по модулю I: K = {I, ..., I+ x, ..., I + y, ... }. I 245 Теперь для доказательства нашего утверждения достаточно показать, что отношение сравнимости по модулю I и операции кольца согласованы: x ≡ x1(mod I), y ≡ y1(mod I) ⇒ x + y≡x1 + y1(mod I), x ≡ x1(mod I), y ≡ y1(mod I) ⇒ x ⋅ y ≡x1⋅ y1(mod I). Согласованность сравнимости со сложением выполняется потому, что кольцевой гомоморфизм является групповым гомоморфизмом для аддитивных групп колец. Согласованность сравнимости с умножением выполнена благодаря дополнительному «идеальному» свойству подкольца I, а именно замкнутости относительно умножении на произвольные элементы кольца. ФАКТОРКОЛЬЦО. Согласованность сравнимости по модулю I с операциями кольца позволяет определить операции на множестве K I смежных классов по идеалу следующими правилами: (I + x) + (I + y) = I + (x + y), (I + x) ⋅ (I + y) = I + x ⋅y. Кольцо < K ; + , ⋅ > называют фактор-кольцом кольца K по идеалу I. I Отображение ε : K → K , переводящее каждый элемент x кольца K в I смежный класс I + x, является отображением, сохраняющим операции, т. е. гомоморфизмом. Гомоморфизм ε, как и для произвольной алгебры, принято называть естественным гомоморфизмом кольца. Роль нуля в кольце K моморфизма является I. 246 I играет идеал I, поэтому ядром естественного го- Этим установлено, в частности, ч т о каждый идеал кольца является ядромнекоторого гомоморфизма. Как и для групп, естественными гомоморфизмами фактически исчерпываются все гомоморфизмы кольца. Иначе говоря, и для колец выполняется теорема о гомоморфизмах: гомоморфный образ кольца изоморфен фактор-кольцу по ядру гомоморфизма. К теореме о гомоморфизмах колец Изобразим ситуацию графически. Схема в точности такая же, как и для групп. Точнее, это и есть иллюстрация группового гомоморфизма f аддитивных групп K и K1, просто оказалось, что изоморфизм ψ вместе со сложением сохраняет и умножение в кольце.Из схемы, приведенной на рисунке, видно, что произвольный гомоморфизм f является композицией естественного гомоморфизма ε и некоторого изоморфизма ψ: f = ε o ψ. Это значит, что с точностью до изоморфизма все гомоморфизмы колец — естественные. Таким образом, как и для групп, описание всех гомоморфных образов кольца K (образно говоря, всех «внешних связей» кольца K) можно получить, не выходя из этого K. Вместо исследования гомоморфизмов кольца достаточно изучить его идеалы. Например, если в кольце нет идеалов, кроме тривиальных — нулевого и самого кольца K, то нет и нетривиальных гомоморфизмов. 247 Тривиальными гомоморфизмами являются изоморфизмы и нулевой гомоморфизм. Кольцо без нетривиальных идеалов называют простым кольцом. 248 19. КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОЙ И НЕСКОЛЬКИХ ПЕРЕМЕННЫХ. ПОДКОЛЬЦО СИММЕТРИЧЕСКИХ МНОГОЧЛЕНОВ И ЕГО ПОРОЖДАЮЩИЕ Основные понятия: простое трансцендентное расширение, многочлен, степень многочлена, евклидовость, алгоритм Евклида, главный идеал, приводимый и неприводимый многочлены, гауссовость, нётеровость, действие подстановки на многочлен от нескольких переменных, словарное упорядочение, высший член, основные симметрические многочлены, формулы Виета. Основные факты: при простом трансцендентном расширении кольца сохраняются целостность, нётеровость и гауссовость, и, вообще говоря, не сохраняются евклидовость и одно-порожденность идеалов; подкольцо симметрических многочленов порождается основными симметрическими многочленами. КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОЙ ПЕРЕМЕННОЙ. Наименьшее кольца K[a], содержащее кольцо K и элемент a, называют простым расширением кольца K и обозначают символом Элемент a называют трансцендентным над K, если a не является корнем никакого многочлена с коэффициентами из K. В таком случае кольцо K[a] называют простым трансцендентным расширением кольца K. Для каждого ненулевого кольца K и трансцендентного над K элемента x существует простое трансцендентное расширение K[x]. Если K1 и K2 – изоморфны, то трансцендентные расширения K1[x] и K2[x] тоже изоморфны. Верно ли обратное утверждение для произвольных колец; следует из изоморфизма колец многочленов K1[x] и K2[x] изоморфизм колец коэффициентов K1 и K2, пока неизвестно. МНОГОЧЛЕНЫ НАД ЦЕЛОСТНЫМ КОЛЬЦОМ. Кольцо коэффициентов K мо249 жет обладать различными свойствами. Оно может быть целостным, гауссовым, кольцом главных идеалов и т.п. Простое трансцендентное расширение целостного кольца является целостным кольцом. Целостное кольцо K называется евклидовым, если в нем выполняется теорема о делении с остатком. Точнее говоря, K - евклидово, если существует отображение ε:KàK\{0} такое, что для любых элементов a из K и b из K\{0} существуют такие элементы q, r из K, что a = b q + r, где =0 или ε(r)< ε(b). В евклидовом кольце каждый идеал является главным. Указав хотя бы один неглавный идеал, мы тем самым устанавливаем что функции ε, реализующей евклидовость, не существует. Если бы идеал, порожденный элементами x и 2, в кольце многочленов с целыми коэффициентами был главным, то есть (x, 2) = (d) для некоторого целочисленного многочлена d, то этот d делил бы x и 2. Такой элемент в кольце Z[x] есть, но он не принадлежит идеалу (x, 2). Иначе говоря, свойства “быть кольцом главных идеалов” и “быть евклидовым кольцом” при простом трансцендентном расширении кольца, вообще говоря, не сохраняются. ДЕЛЕНИЕ НА НОРМИРОВАННЫЙ МНОГОЧЛЕН. СХЕМА ГОРНЕРА. Многочлен называется нормированным, если коэффициент его старшего члена равен единице. Для любого многочлена f(x) и нормированного g(x) с коэффициентами из целостного кольца K существуют многочлены q(x) и r(x) из K[x] такие, что f(x) = g(x)⋅q(x) + r(x), где r(x)=0 или deg r(x)n, то s(n, k) = 0. Для любого неотрицательного n число s(n, n) = 1, а для положительных n числоs(n, 0) = 0. Из равенств коэффициентов при степенях неизвестного в левой и правой частях равенства pn(x) = pn – 1(x) (x – n+ 1) получаются следующие формулы для вычисления чисел Стирлинга первого рода: s(n, k) = s(n – 1, k – 1) – ( n – 1) ⋅s(n – 1, k). Джеймс Стирлинг (Stirling, 1692–1770) — шотландский математик, член Лондонского королевского общества (с 1729 г.), его основные результаты опубликованы в 1730 г. в работе «Метод разностей». 1 255 Напомним, что числом Стирлинга второго рода называют число всех разбиений n-элементного множества на k смежных классов. Число Стирлинга второго рода обозначают символом S(n, k). Числа Стирлинга второго рода для небольших значений n и k можно найти непосредственно по определению, а следующие числа Стирлинга второго рода тоже вычисляются с помщью рекуррентных соотношений: S(n, k) = S(n– 1, k– 1) + k⋅S(n– 1, k). Из определения чисел Стирлинга первого рода, следует, что s(n, k)— элементы матрицы перехода от базиса 1, p1(x), p2(x), …, pn(x) к базису 1, x, x2, …, xn. Числа Стирлинга второго рода, наоборот, равны элементам матрицы перехода от базиса xi к базису pi (x). Иначе говоря, для каждого n ≥ 0 n n x = ∑ S (n, i ) pi (x ). i=0 Итак, ч и с л а С т и р л и н г а п е р в о г о и в т о р о г о р о д а я в л я ю т с я э л е м е н т а м и в з а и м н о о б р а т н ы х м а т р и ц , и связь между числами Стирлинга первого и второго рода выражается следующей формулой: n ∑ i =k  1, если k = n, s (n, i ) ⋅ S (i, k ) =   0, если k ≠ n. Это соотношение, выражающее связь между числами Стирлинга, принято называть свойством ортогональности чисел Стирлинга первого и второго рода. АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ. Под словом «многочлен» будем понимать далее только многочлен положительной степени. Поле P называется алгебраически замкнутым, если каждый многочлен с коэффициентами из P имеет корень в P. 256 Если поле ненулевой представить P алгебраически многочлен в виде с замкнуто, коэффициентами произведения то из каждый P можно многочленов первой степени. Другими словами, над алгебраически замкнутым полем неприводимыми является лишь многочлены первой степени. Например, поле рациональных чисел — не алгебраически замкнутое: многочлен x2 – 2 не имеет рациональных корней. Не алгебраически замкнуто и поле действительных чисел. Отвлечемся на время от числовых полей и посмотрим: может быть, какоенибудь конечное поле алгебраически замкнуто? Ни одно из конечных полей не является алгебраически замкнутым, так как над любым конечным полем существуют неприводимые многочлены, степень которых превышает любое наперед заданное натуральное число. Впрочем, чтобы показать незамкнутость конечного поля достаточно привести пример многочлена степени больше единицы, не имеющего линейного множителя. Начнем поиск такого многочлена с двухэлементного поля Z2. Многочлен x2 + x + 1 не имеет корней в поле классов вычетов Z2 по модулю 2. Это значит, что поле Z2 не алгебраически замкнуто. Посмотрим внимательней на устройство неприводимого многочлена. Многочлен x2 + x + 1 в Z2 имеет вид (x – 0) (x – 1) + 1, а элементы 0, 1 исчерпывают все кольцо Z2 . Поэтому x2 + x + 1 и не имеет линейных множителей с коэффициентами из этого поля. Эту идею можно реализовать в любом конечном поле. Если конечное поле P состоит из q элементов, P = {a1, a2, …, aq} то многочлен 257 g(x) = (x– a1) (x– a2) … (x – aq) + 1 степени n не имеет корней в поле P, и, следовательно, поле P не является алгебраически замкнутым. Многочлен, корнями которого являются все элементы конечного поля, можно построить еще проще. Ненулевые элементы группы образуют группу по умножению. Порядок этой группы равен q – 1, и по следствию теоремы Лагранжа каждый ненулевой элемент поля удовлетворяет тождеству xq – 1 – 1 = 0. Но тогда тождеству x(xq – 1 – 1) = 0 удовлетворяет любой элемент поля. Это значит, что многочлен g(x), не имеющий корней в конечном поле, имеет вид: g(x) = xq– x + 1. Итак, ни поле рациональных чисел, ни поле действительных чисел и ни одно конечное поле не являются алгебраически замкнутыми. После таких примеров возникают естественные сомнения: а существуют ли вообще алгебраически замкнутые поля? А л г е б р а и ч е с к и з а м к н у т ы е п о л я с у щ е с т в у ю т . Например, поле C комплексных чисел алгебраически замкнуто. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ. Определим кольцо от n переменных x1, x2, ..., xn с коэффициентами из кольца K по правилу K[x1, x2, ..., xn-1, xn] = (K[x1, x2, ..., xn-1])[xn]. Индукцией по числу переменных устанавливается: е с л и к о л ь ц о K – целостное (гауссово, нётерово), то и кольцо многочленов K[x1, x2, ..., xn] является целостным (гауссовым, нётеровым) кольцом. 258 Сохранение нётеровости при переходе от кольца K к кольцу K[x1, x2, ..., xn] означает, в частности, что л ю б а я с и с т е м а а л г е б р а и ч е с к и х у р а в н е ний с n неизвестными и коэффициентами из поля равносильна своей конечной подсистеме. Два многочлена f(x1, x2, ..., xn) и g(x1, x2, ..., xn) с коэффициентами из бесконечного целостного кольца равны в функциональном смысле тогда и только тогда, когда они равны в алгебраическом смысле. Если поле P - конечно, то каждая функция f(x1, x2, ..., xn), определенная в P со значениями в P, может быть представлена в виде многочлена от n переменных. ПОДКОЛЬЦО СИММЕТРИЧЕСКИХ МНОГОЧЛЕНОВ И ЕГО ПОРОЖДАЮЩИЕ. Действием подстановки α на многочлен f(x1, x2, ..., xn) называют многочлен αf(x1, x2, ..., xn) = f(xα(1), xα(2), ..., xα(n)). Многочлен f выдерживает подстановку α, если αf=f. Если многочлен от n переменных выдерживает все подстановки степени n, то этот многочлен называют симметрическим. Например, многочлены вида σk = ∑ xi xi 1 2 1≤ i1 < i 2 <...< i k ≤ n ...xik , - симметрические. Эти многочлены называют основными (или элементарными) симметрическими многочленами. Многочлен f(x1, x2, ..., xn).является симметрическим, если он выдерживает подстановки (1 2) и (1 2 ... n). Подкольцо, порожденное основными симметрическими многочленами, содержит любой симметрический многочлен. Этот факт принято называть основной теоремой о симметрических много259 членах. Основная теорема означает, в частности, что проблема вхождения в подкольцо, порожденное основными симметрическими многочленами, алгоритмически разрешима. Из основной теоремы о симметрических многочленах и формул Виета следует, что л ю б о е с и м м е т р и ч е с к о е в ы р а ж е н и е о т к о р н е й м н о г о члена f(x) находится в поле коэффициентов этого многочлен а (а если f(x) – нормирован, то – в кольце коэффициентов). Каждый симметрический многочлен f(x1, x2, ,..., xn) имеет единственное представление в виде многочлена g(σ1, σ2, ,..., σn), и поэтому кольцо симметрических многочленов K[σ1, σ2, ,..., σn] изоморфно кольцу K[x1, x2, ,..., xn]. 260 20. МНОГОЧЛЕНЫ НАД ПОЛЕМ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ; СОПРЯЖЕННОСТЬ КОРНЕЙ И НЕПРИВОДИМЫЕ МНОЖИТЕЛИ В КОЛЬЦЕ R[X]. ОТДЕЛЕНИЕ ДЕЙСТВИТЕЛЬНЫХ КОРНЕЙ МНОГОЧЛЕНА Основные понятия: многочлен, корень, сопряженность, автоморфизм, приводимые и неприводимые многочлены, гауссовость, кратные неприводимые множители и кратные корни, производная многочлена, границы корней многочлена, формула Тейлора, система многочленов Штурма. Основные факты: над полем действительных чисел все многочлены, степени выше второй, приводимы; задача отделения действительных корней многочлена с действительными коэффициентов алгоритмически разрешима. МНОГОЧЛЕНЫ НАД ПОЛЕМ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ. Кольцо многочленов R[x], как и любое кольцо многочленов над полем, является евклидовым, а поэтому кольцом главных идеалов и гауссовым. Это значит, что любые два многочлена с действительными коэффициентами обладают наименьшим общим кратным, наибольшим общим делителем, каждый идеал в кольце R[x] – однопорожден, и каждый многочлен положительной степени можно представить, и единственным образом в виде произведения неприводимых многочленов c действительными коэффициентами. Тот же многочлен можно представить в виде произведения многочленов первой степени, но, коэффициенты у таких множителей, вообще говоря, - комплексные. СОПРЯЖЕННОСТЬ КОРНЕЙ И НЕПРИВОДИМЫЕ МНОЖИТЕЛИ В КОЛЬЦЕ R[X]. Отображение, переводящее каждое комплексное число в комплексно сопряженное, является автоморфизмом поля комплексных чисел, оставляющим подполе действительных чисел неподвижным. Отсюда следует, что комплексные 261 корни многочлена с действительными коэффициентами сопряжены. Множество всех корней многочлена с действительными коэффициентами распадается на два подмножества: действительные и недействительные (комплексные) корни. Причем недействительные корни распадаются на пары комплексно сопряженных корней. Собирая комплексно сопряженные корни в пары, и учитывая, что и сумма, и произведение комплексно сопряженных чисел является действительным числом, получаем, что ненулевой многочлен с действительными коэффициентами можно представить в виде произведения многочленов с действительными коэффициентами первой и второй степени. Это значит, что над полем действительных чисел все многочлены, степень которых выше второй, - приводимы. Зная точно, что корни многочлена существуют, попробуем определить круг поискаэтих корней. Слово круг здесь вовсе не для красного словца, а понимается буквально. Можно указать на комплексной плоскости круг, содержащий все корни многочлена. Если же указать, круги (или прямоугольники), содержащие в точности по одному корню многочлена, то комплексные корни будут отделены (друг от друга). Пока нас интересуют лишь действительные корни многочлена с действительными коэффициентами. Если известно, что интервал [a; b] содержит в точности один действительный корень многочлена f (x) с действительными коэффициентами, то вычислить этот корень можно с любой точностью разными способами (например, методом дихотомии— последовательным делением этого интервала пополам). Главное, чтобы корень в интервале был один, т. е. отделен от других корней. Нахождение отрезков, каждый из которых содержит в точности один корень, называют отделением действительных корней. 262 Отделение действительных корней Например, на рисунке изображен график многочлена, имеющего в точности три действительных корня, и корни эти отделены (друг от друга): корень xi— единственный в отрезке [ai , bi ], а интервалы (–∝, a1), (b1, a2), (b2, a3), (b3, + ∝) уже не содержат ни одного корня многочлена, и, таким образом, корни многочлена отделены. Аналогичную задачу можно поставить и для комплексных корней многочлена с комплексными коэффициентами. Отделение корней будет состоять в нахождение круговна комплексной плоскости, каждый из которых содержит в точности один корень. Образно говоря, отделение корней — это предоставление каждому корню отдельной квартиры; квартира комплексного корня — это круг или прямоугольник на координированной комплексной плоскости, а квартира действительного корня — это отрезок на оси. Для начала заметим, что общая (коммунальная) квартира для корней многочлена — это интервал (–A, A), где A— число, превышающее максимальный модуль корня (а если речь идет о комплексных корнях многочлена, то это круг с центром в начале координат и радиусом A). В соответствии с леммой о модуле старшего члена в качестве числа A для многочлена xn+ a1 xn – 1 + … + an – 1 x + an 263 можно взять число, равное 1 + max{a1, a2, …, an}. Этим общим замечанием о местонахождении комплексных корней и ограничимся, сосредоточив далее свое внимание только на действительных корнях многочлена с действительными коэффициентами. Интервал (–A, A), как правило, слишком велик. Например, если все коэффициенты многочлена f (x) неотрицательны, то ясно, что число нуль является верхней границей корней — ни одно положительное число корнем такого многочлена быть не может, поэтому для поимки корней этого многочлена достаточно половины интервала (–A, A), а именно: (–A, 0). Используя разложение Тейлора для многочлена f (x) по степеням(x – a), f (x ) = n ∑ i=0 f (i ) (a ) (x − a ) i , i! получаем оценку верхней границы положительных корней многочлена. Число a является верхней границей положительных корней многочлена f(x), если f(a)>0 и f(i)(a)≥ 0. Эту границу впервые нашел еще Исаак Ньютон. Знак многочлена и его производных в точке a совпадает со знаком коэффициентов разложения по степеням (x – a), поэтому метод Ньютона удобно использовать совместно со схемой Горнера. Если при делении f (x) на (x – a) все коэффициенты частного и остаток являются неотрицательными числами, то все последующие коэффициенты будут тоже неотрицательные (и в их вычислении уже нет необходимости). Оценка Ньютона позволяет уточнить положительных корней (ВГПК) многочлена. 264 лишь верхнюю границу Однако для полноты картины следует найти и нижнюю границу положительных корней (НГПК), а также верхнюю и нижнюю границы отрицательных корней (ВГОК и НГОК). Верхние и нижние границы корней На рисунке изображен многочлен f (x), имеющий в точности четыре корня. Точка A является нижней границей отрицательных корней, а точка B— верхней границей положительных корней. Аналогично C— это нижняя, а D— верхняя граница положительных корней многочлена f (x).Для нахождения всех четырех границ корней достаточно уметь находить лишь одну — ВГПК. Действительно, если многочлен f(x) имеет степень n и M0— ВГПК многочлена f (x), M1— ВГПК многочлена 1 xn f   ,  x M2— ВГПК многочлена f (–x), M3— ВГПК многочлена  1 xn f  −  ,  x то все отрицательные корни многочлена f (x) принадлежат интервалу 1    − M 2; − , M1   а все положительные интервалу 265  1  ; M0  .   M1  В обозначениях предыдущего утверждения число — M2 является нижней 1 границей отрицательных корней, а − M — их верхней границей. Аналогично, к 1 ВГПК (M0) добавилась нижняя граница положительных корней — число 1 . Таким M1 образом, с помощью метода Ньютона можно найти верхние и нижние границы и положительных, и отрицательных корней многочлена. Границы корней Однако знания верхней и нижней границ положительных и отрицательных корней для вычисления самих корней недостаточно. Во-первых, наличие границ вовсе не дает гарантии, что корни там вообще есть. Во-вторых, если корней несколько, то для успешного отделения необходимо точно знать, сколько корней многочлена содержится в данном интервале. Число корней может вовсе не совпадать с числом общих точек графика многочлена и оси абсцисс: у многочлена могут быть и кратные корни. Впрочем, задача отделения кратных корней многочлена алгоритмически разрешима: разделив многочлен f (x) на наибольший делитель ( f (x ), f ′(x )) этого многочлена и его производной, получим многочлен без кратных корней, имеющий то же самое множество корней, что и f (x). 266 Ввиду этого замечания можно считать с самого начала, что многочлен не имеет кратных корней, и в частности, что каждая точка пересечения его графика с осью абсцисс изображает в точности один корень. МЕТОД ШТУРМА. Сформулируем задачу, которую осталось решить. Дан многочлен f (x) с действительными коэффициентами без кратных корней и нам нужно определить, сколько корней этого многочлена содержится в заданном числовом интервале. Есть несколько способов для решения этой задачи. Самым первым из них был получен метод Штурма1. Вычисления методом Штурма используют специальный набор многочленов, полученных из данного многочлена f(x). Многочлены f0(x), f1(x), …, fm(x) из R [x] образуют систему Штурма, если: (1) соседние многочлены не имеют общих корней; (2) fm(x) не имеет действительных корней; (3) α ∈ R и fi (α) = 0, то fi – 1(α) и fi + 1(α) имеют разные знаки; (4) α ∈ R и f0(α) = 0, то произведение f0(x) ⋅f1(x) меняет знак с минуса на плюс, когда x,возрастая, проходит через точку α. После такого неконструктивного определения сразу же возникает вопрос: а существует ли для многочлена f (x) хотя бы одна система многочленов Штурма? Покажем сначала, что с и с т е м а м н о г о ч л е н о в Ш т у р м а с у щ е с т в у ю т для любого многочлена f(x) без кратных корней. Пусть f0(x) = f (x) и f1(x) = f ' (x). Проверим, что свойства многочленов Штурма, в которых участвует f1(x), выполняются. Многочлен f1(x) участвует в первом и последнем свойствах. Жак Шарль Франсуа Штурм (Sturm, 1803–1855) — французский математик, иностранный членкорреспондент Петербургской академии наук (1836); учитель гимназии в Женеве до 1830 г. 1 267 Первое свойство: соседние многочлены не имеют общих корней. Если бы многочлены f0(x) и f1(x) обладали общим корнем, то это означало бы, что f (x) имеет кратный корень, а по нашему договору это не так. Рассмотрим четвертое условие. Пусть действительное число α является корнем многочлена f (x), т. е. f0(α) = 0. Невозможность общих корней у соседних многочленов означает, что α не может быть корнем многочлена f1(x). Это значит, что многочлен f1(x) в некоторой окрестности точки α сохраняет знак, а многочлен f0(x) меняет знак. Если выбрать окрестность достаточно малую, то функция y = f (x) в этой окрестности будет изменяться строго монотонно. Если y = f (x) строго убывает, то она изменяет знак с плюса на минус, а f1(x) < 0. Если y = f (x) строго возрастает, то она изменяет знак с минуса на плюс и f1(x) > 0. В любом случае четвертое свойство выполняется. Построим остальные многочлены Штурма. Для этого с помощью алгоритма Евклида найдем наибольший общий делитель многочленов f0(x) и f1(x). Так как эти многочлены взаимно просты, то последним ненулевым остатком в алгоритме Евклида будет многочлен ненулевой степени, т. е. действительное ненулевое число. При выполнении алгоритма Евклида можно умножать промежуточные остатки на любое ненулевое число: наибольший общий делитель в результате таких умножений тоже будет умножен на некоторое число, но НОД иопределен с точностью до ассоциированности, т. е. с точностью до любого ненулевого числового множителя. Иначе говоря, промежуточные умножения наибольшего делителя не испортят. Умножим все промежуточные остатки при нахождении (f0(x), f1(x)) алгоритмом Евклида на –1. Таким образом, результаты вычислений будут иметь вид: 268 f2(x) = –Rest (f0(x), f1(x)); f3(x) = –Rest (f1(x), f2(x)); . . . . . . . . . . . . . fi(x) = –Rest (fi – 2(x), fi – 1(x)); . . . . . . . . . . . . . (*) fm – 1(x) = –Rest (fm– 3(x), fm – 2(x)); fm(x) = –Rest (fm – 2(x), fm – 1(x)); fm + 1(x) = –Rest (fm – 1(x), fm (x)) = 0. Многочлен fm (x) в этом ряду имеет нулевую степень, т. е. является ненулевым действительным числом. Многочлены f0(x), f1(x), f2(x), …, fm (x) удовлетворяют всем свойствам системы многочленов Штурма. Если действительные числа a и b, a < b, не являются корнями многочлена f(x) без кратных корней, то число действительных корней многочлена f(x) в интервале (a, b) равно числу потерь перемен знаков в системе Штурма этого многочлена при переходе от a к b. Зная интервалы, содержащие в точности по одному действительному корню многочлена, можно найти их значения с заданной точностью. 269 21. МНОГОЧЛЕНЫ НАД ПОЛЕМ РАЦИОНАЛЬНЫХ ЧИСЕЛ И РАЦИОНАЛЬНЫЕ КОРНИ МНОГОЧЛЕНА. КРИТЕРИЙ НЕПРИВОДИМОСТИ ЭЙЗЕНШТЕЙНА Основные понятия: простое трансцендентное расширение, поле рациональных чисел, многочлен, корень многочлена, евклидовость, гауссовость, примитивный многочлен, гомоморфизм, целостность, делители нуля.. Основные факты: многочлен с целыми коэффициентами неприводим над кольцом целых чисел тогда и только тогда, когда он неприводим над полем рациональных чисел; над полем рациональных чисел существуют неприводимые многочлены любой положительной степени; задача разложения многочлена с рациональными коэффициентами на неприводимые множители алгоритмически разрешима. МНОГОЧЛЕНЫ НАД ПОЛЕМ РАЦИОНАЛЬНЫХ ЧИСЕЛ. Кольцо многочленов Q[x], как и любое кольцо многочленов над полем, является евклидовым, а поэтому кольцом главных идеалов и гауссовым. Это значит, что любые два многочлена с рациональными коэффициентами обладают наименьшим общим кратным, наибольшим общим делителем, каждый идеал в кольце Q[x] – однопорожден, и каждый многочлен положительной степени можно представить, и единственным образом в виде произведения неприводимых многочленов с рациональными коэффициентами. Тот же многочлен можно представить в виде произведения многочленов первой степени, но, коэффициенты у таких множителей, вообще говоря, - комплексные. Над полем комплексных чисел неприводимыми являются лишь многочлены первой степени. Над полем действительных чисел многочлен второй степени может быть неприводимым (если его дискриминант отрицателен), но все многочлены степени выше второй уже приводимы. Над полем рациональных чисел существуют неприводимые многочлены любой степени. Пусть p – простое число, n – натуральное, и многочлен 270 x n − p = f (x ) ⋅ g (x ), где f(x) и g(x) – многочлены с рациональными коэффициентами положительных степеней. Пусть deg f(x) = m. Над полем C комплексных чисел многочлен f(x) разложим в произведение линейных многочленов, свободные члены которых – это различные значения n p m . Однако число n n p . Модуль свободного члена многочлена f(x) равен p m - иррационально, и, таким образом, над полем ра- циональных чисел существуют неприводимые многочлены любой положительной степени. РАЦИОНАЛЬНЫЕ КОРНИ МНОГОЧЛЕНА. Все целые корни многочлена с целыми коэффициентами являются делителями свободного члена. Если многочлен нормированный, то поиск рациональных корней сводится к поиску лишь целых корней. Все рациональные корни нормированного многочлена с целыми коэффициентами являются целыми. Если несократимая дробь p - является рациональным корнем многочлена q a0xn + a1xn-1 + ... + an-1x +an с целыми коэффициентами, то p делит an, а q делит a0. Если несократимая дробь p - является рациональным корнем многочлена q f(x) = a0xn + a1xn – 1 + ... + an – 1x + an с целыми коэффициентами, то f (1) f (−1) и являются целыми числами. p−q p+q 271 Для того чтобы несократимая дробь p q являлась корнем многочлена f(x)=a0xn + a1xn-1 + ... + an-1x +an с целыми коэффициентами необходимо, чтобы для каждого целого числа k число СОХРАНЕНИЕ f (k ) - было целым (если p − kq ≠ 0 ). p − qk ГАУССОВОСТИ РАСШИРЕНИИ КОЛЬЦА. ПРИ ПРОСТОМ ТРАНСЦЕНДЕНТНОМ Многочлен f(x) c целыми коэффициентами называют примитивным, если все его коэффициенты его взаимно просты в совокупности. Произведение примитивных многочленов само прими- тивно. По имени автора этот факт называют леммой Гаусса. Из леммы Гаусса следует, что многочлен с целыми коэффициентами приводим над полем рациональных чисел тогда и только тогда, когда он приводим над кольцом целых чисел. При доказательстве этого утверждения никаких особых свойств кольца целых чисел не требуется – достаточности лишь выполнения основной теоремы арифметики. Это значит, что гауссовость при переходе к кольцу многочленов сохраняется: простое трансцендентное расширение гауссового кольца является гауссовым: КРИТЕРИЙ НЕПРИВОДИМОСТИ ЭЙЗЕНШТЕЙНА. Нахождение рациональных корней многочлена позволяет найти его неприводимые множители первой степени. Теорема о сохранении гауссовости при простом трансцендентном расширении дает возможность при разыскании неприводимых множителей многочлена с целыми коэффициентами ограничить поиск лишь многочленами с целыми коэффициентами. Рассмотрим многочлен f(x) = a0xn + a1xn – 1 + ... + an – 1x + an 272 с такими целыми коэффициентами, что существует такое простое число p, которое не делит a0; но делит все остальные коэффициенты f(x), и an не делится на p2. Такой многочлен f(x) неприводим над полем Q. Неприводимость над Q равносильна неприводимости над Z.. Предположим, что многочлен приводим над Z; f(x)=s(x)g(x), где s(x) и g(x) – многочлены положительных степеней с целыми коэффициентами. Тогда многочлен a0xn над кольцом Zp классов вычетов по простому модулю p тоже является произведением двух многочленов, и каждый из этих многочленов имеет вид bxk, где k > 0. Отсюда следует, что свободный член s(x)g(x) делится на p2, вопреки условию. В честь автора и по традиции приведенное достаточное условие неприводимости называют критерием Эйзенштейна Из критерия Эйзенштейна снова следует, что над полем рациональных чисел существуют неприводимые многочлены любой положительной степени. Критерий Эйзенштейна не является необходимым условием неприводимости. Например, неприводимый над Q многочлен x2+1 не удовлетворяет условию Эйзенштейна. Правда, заменой переменного x на y + 1, получаем многочлен y + 2y +2, приводимый или неприводимый одновременно с исходным, и уже удовлетворяющий условию Эйзенштейна. С помощью таких подстановок можно применить критерий Эйзенштейна и в других случаях. Например, корни многочлена xn – 1 расположены в вершинах правильного n-угольника, вписанного в окружность с центром в начале координат. Одним из корней является единица, поэтому после деления многочлена xn – 1 на x – 1 получим уравнение 273 xn – 1 + xn – 2 + ... + x + 1 = 0, корни которого изображают остальные вершины n-угольника. Это уравнение называют уравнением деления круга (а многочлен в левой части – соответственно – многочленом деления круга). Непосредственно к многочлену деления круга критерий Эйзенштейна неприменим, однако многочлен f(x) приводим или неприводим одновременно с многочленом f(x+1). Используя равенство f(x+1) = ( x + 1) p − 1 ( x + 1) − 1 и формулу бинома Ньютона, устанавливаем, что для многочлена f(x) условия критерия Эйзенштейна выполнены. Если p - простое число, то многочлен уравнения деления круга xp – 1 + xn – 2 + ... + x + 1 неприводим над полем рациональных чисел. Однако существуют такие неприводимые над полем рациональных чисел многочлены f(x) с целыми коэффициентами, что для любого целого a к многочлену f(x+a) неприменим критерий Эйзенштейна. МЕТОД КРОНЕКЕРА. Используя тот факт, что многочлен с целыми коэффициентами, неприводимый над кольцом целых чисел, неприводим и над полем рациональных, а, кроме того, что многочлен n-ой степени полностью определяется значениями в n+1 точке, можно найти и другие неприводимые множители (хотя бы простым перебором возможных кандидатов). 274 Идея такого перебора принадлежит Леопольду Кронекеру, поэтому нахождение неприводимых множителей над полем Q таким способом называют методом Кронекера. Пусть f(x) - многочлен степени n с целочисленными коэффициентами и многочлен g(x) с целыми коэффициентами делит f(x). Можно считать, что n deg g(x) = k ≤   , и записать многочлен g(x) с неопределенными пока коэф2 фициентами: g(x) =c0xk + c1xk – 1 + ... + ck-1xk + ck. .Если теперь m - произвольное целое число, то g(m) делит f(m), поэтому можно просто перебрать в конечное число шагов те значения, которое может принимать многочлен g(m). Взяв k+1 различных m можно получить конечное множество возможных значений многочлена g(x) этих точках, найти все варианты для ci, и непосредственным делением убедиться какой из многочленов делит f(x). Если же ни один из построенных кандидатов в делители на самом деле делителем не является, то многочлен f(x) - неприводим. 275 22. СТРОЕНИЕ ПРОСТОГО АЛГЕБРАИЧЕСКОГО РАСШИРЕНИЯ. ОСВОБОЖДЕНИЕ ОТ АЛГЕБРАИЧЕСКОЙ ИРРАЦИОНАЛЬНОСТИ В ЗНАМЕНАТЕЛЕ ДРОБИ. КОНЕЧНЫЕ ПОЛЯ Основные понятия: расширение, подполе, простое расширение, составное расширение, алгебраическое расширение ,конечное расширение, конечномерное векторное пространство, базис векторного пространства, алгебраический над полем элемент, минимальный многочлен, степень алгебраического элемента, алгебраические и трансцендентные числа, алгебраическая иррациональность, симметрические многочлены. Основные факты: простое алгебраическое расширение поля является конечным и алгебраическим расширением; составное алгебраическое расширение просто; существуют алгебраические расширения, не являющиеся простыми расширениями; конечное поле состоит из pn элементов (p – простое). РАСШИРЕНИЯ ПОЛЯ. Пусть P — подполе поля S, и a— произвольный элемент из S. Наименьшее подполе поля S, содержащее множество P ∪ {a}, называют простым расширением поля P с помощью элемента a. Обозначается простое расширение символом P (a). Ситуацию можно обобщить. Если a1, a2, ..., am — конечное множество элементов из S, то наименьшее подполе поля S, содержащее множество P ∪ {a1, a2, ..., am}, называют конечно-порожденным расширением поля P и обозначают символом P (a1, a2, ..., am). Таким образом, простое расширение поля является одно-порожденным расширением. Наименьшее подкольцо поля S, содержащее подполе P и элемент a, называют простым кольцевым расширением и обозначают символом P [a]. Подкольцо P [a] состоит из всех элементов из S, которые можно получить из элементов из P и элемента a с помощью кольцевых операций (сложения, умноже- 276 ния и вычитания). Для получения подполя P (a) нужна еще одна операция (деление на ненулевой элемент), поэтому P (a) ⊃ P [a]. Простое полевое расширение P (a) содержит все элементы поля S, которые можно получить с помощью полевых операций. Простое расширение P (a) совпадает с множеством элементов вида f (a) g (a) , где f (x), g(x) — многочлены с коэффициентами из поля P и g(a) ≠ 0. Действительно, во-первых, множество таких элементов является подполем поля S;во-вторых, это множество содержит и подполе P, и элемент a; наконец, в-третьих, этомножество содержится в любом подполе, содержащим P ∪ {a}. Если элемент a из поля S является корнем некоторого ненулевого многочлена с коэффициентами из подполя P, то a называют алгебраическим над P элементом. Если a — алгебраический над P элемент, то простое расширение P (a) поля P называют простым алгебраическим расширением поля P. По теореме Кронекера для любого поля P и любого многочлена f (x) из P [x] существует расширение P1 ⊃ P, содержащее элемент a — корень многочлена f (x). Но это значит, что для любого поля P и любого многочлена f (x) из P [x] существует простое алгебраическое расширение P(a) поля P с помощью элемента a—корня многочлена f (x). Если элемент a из поля S не является корнем никакого ненулевого многочлена с коэффициентами из подполя P, то a называют трансцендентным1над P элементом. Если a— трансцендентный над P элемент, то простое расширение P (a) поля P называют простым трансцендентным расширением поля P. Как и для любого простого расширения, каждый элемент из простого трансцендентного расширения P (a) можно представить в виде 277 f (a ) g (a) , где f (x), g(x) из P [x] и g(a) ≠ 0. Если f (x) и f1(x)— различные многочлены, а f (a) = f1(a), то a будет корнем ненулевого многочлена. Следовательно, если a— трансцендентный, то каждый элемент из P [a] имеет единственное представление в виде a0 an+ a1 an – 1+ ...+ an – 1 a + an , где n ∈Z0 и ai∈P. Иначе говоря, для трансцендентного элемента a кольцо P [a] изоморфно кольцу многочленов P [x]. Из изоморфизма колец P [a] и P [x] следует, что е с л и э л е м е н т a — трансцендентный над полем P, то простое трансцендентное расширение P(a) поля P изоморфно полю рациональных дробей P(x). Таким образом, простое трансцендентное расширение поля — это частный случай простого трансцендентного расширения кольца. ПРОСТЫЕ АЛГЕБРАИЧЕСКИЕ РАСШИРЕНИЯ. Элемент a — алгебраический над полем P — может являться корнем нескольких многочленов с коэффициентами из P. Многочлен f (x) из P [x] такой, что f (a) = 0 и f (x)наименьшей степени с таким свойством, называют минимальным многочленом для элемента a. Минимальный многочлен алгебраического элемента неприводим. Действительно, если f (x) = f1(x) ⋅ f2(a), где deg fi (x) < deg f(x), то f1(a) = 0 или f2(a) = 0, что противоречит минимальности степени f (x). 1 От латинского слова transcendens,род. падеж transcendentis— выходящий за пределы. 278 Пусть s(x) — минимальный многочлен элемента a и t(x)— многочлен, корнем которого тоже является элемент a. Многочлен s(x) неприводим, а наибольший общий делительмногочленов s(x) и t(x) отличен от делителя единицы. Это означает, что s(x) делится на t(x). Итак, любой многочлен, корнем которого является алгебраический элемент a, делится на минимальный многочлен этого элемента. В частности, если g(x)— другой минимальный многочлен элемента a, то g(x) тоже делится на f (x); следовательно, м и н и м а л ь н ы й м н о г о ч л е н алгебраического элемента определен с точностью до ассоциированности. Это позволяет ввести следующее понятие. Степенью элемента, алгебраического над P, называют степень его минимальногонад P многочлена. Если многочлен w(x) не обращается в нуль при x, равном a, то это значит, что минимальный многочлен s(x) не делит w(x). Из неприводимости минимального многочлена следует, что любой многочлен, корнем которого не является алгебраический элемент, взаимно прост с минимальным минимальный многочлен многочленом этого элемента. Таким образом,е с л и s(x) — алгебраического элемента a, то для каждого многочлена t(x) из P [x] элемент a не обращает t(x) в нуль тогда и только тогда, когда (s(x), t(x)) = 1. Представление простого расширения P (a) в виде множества  f (a) f ( x ), g ( x ) ∈ P[ x ],   g (a)  g (a ) ≠ 0  для простого алгебраического расширения является слишком избыточным, даже если договориться рассматривать только несократимые дроби 279 f ( x) g ( x) . Каждый элемент из P (a) имеет бесконечно много представлений в таком виде. Убрать излишние представления можно. Сначала заметим, что если n — степень минимального для a многочлена (т. е. n — степень элемента a), то степени многочленов f (x) и g(x), участвующих в представлении элемента из P (a), можно считать строго меньшими n. Если s(x) — минимальный многочлен для a, то для любого f (x) из P [x] f (x) = s(x) ⋅q(x) + r(x), где q(x), r(x) принадлежат P [x], и r(x) = 0 или deg r(x) < deg s(x). Но f (a) = s(a) ⋅ q(a) + r(a) = r(a). Итак, если степень алгебраического над P элемента a равна n, то простое расширение P (a) совпадает с множеством элементов вида f (a ) , g (a ) где f (x), g(x) — многочлены с коэффициентами из поля P, g(a) ≠ 0, deg f (x) — это группа векторного пространства над Zp , и она изоморфна прямой n-й степени группы , ≅Zp⊕Zp⊕ … ⊕Zp . Все элементы аддитивной группы имеют порядок p, поэтому если поле P не совпадает с Zp, то группа — нециклическая В отличие от аддитивной группы (которая порождается одним элементом лишь в полях Zp), мультипликативная группа конечного поля всегда циклическая, так как все конечные мультипликативные группы любого поля порождаются одним элементом. В поле P мультипликативную группу P* составляют все его ненулевые элементы, т. е. порядок P* мультипликативной группы поля P равен pn – 1. Итак, в поле P найдется такой элемент g, что 288 { P \ {0} = 1, g, g 2 , ..., g p n −2 }. Если циклическая группа гр(g) имеет порядок m, то элемент gk порождает эту группутогда и только тогда, когда k и m взаимно просты. Таким образом, в конечном поле Pпорядка pn содержится в точности ϕ(pn – 1) элементов, каждый из которых порождает группу < P*; ⋅ >. Порождающий элемент g мультипликативной группы P может быть выбран в качестве присоединяемого элемента, т. е. P = ZP (g). Действительно, степени элемента g— это все ненулевые элементы из P, а 0 = g – g. Впрочем, этот же факт можно рассмотреть с иной точки зрения. Каждый элемент конечного расширения поля Zp является корнем многочлена с коэффициентами из Zpи степень этого многочлена не превышает число n. Не будет исключением и порождающий элемент g мультипликативной группы P* поля P. Если k— наименьшая степень многочлена f (x) над Zp , корнем которого является элемент g, то элементы 1, g, g2, … gk – 1 еще линейно независимы над полем Zp , а элементы 1, g, g2, … gk – 1, gk уже линейно зависимы. Поэтому gk = a0 + a1 g + … + ak – 1 gk – 1, (∗) где ao, a1, …, ak – 1 — элементы из Zp . Из минимальности выбора числа k следует, что многочлен f (x) = a0 + a1 x + … + ak– 1 xk– 1 неприводим, поэтому простое алгебраическое расширение ZP (g) поля Zpс помощью g —корня многочлена f (x) — имеет над Zp размерность k. Поле ZP (g) содержится в поле P. С помощью равенства (∗) можно получить все остальные степени элемента g. Так как g — порождающий элемент группы P*, эти остальные степени вместе с 289 уже имеющимися: 1, g, g2, … gk – 1 , дадут все ненулевые элементы поля P. Поэтому ZP (g) = P, а k = n. n p Многочлен x − x не имеет кратных корней, поэтому каждый его неприводимый множитель степени n имеет n различных корней. Каждый порождающий мультипликативной группы поля является корнем одного из таких многочленов-множителей. Число различных порождающих циклической группы порядка pn равноϕ(pn – 1) Кроме того, если один из корней неприводимого многочлена степени n оказался порождающим муль- типликативной группы поля FG(pn), то и все остальные корни этого многочлена тоже будут порождающими. Если k— число неприводимых над Zp многочленов степени n,корни которых оказались порождающими циклической группы , то1 kn = ϕ(pn – 1). Следовательно, общее число неприводимых над Zp многочленов степени nне меньшечисла ( ) ϕ pn −1 . n Это число для некоторых pn действительно равно числу неприводимых многочленов степени n над полем Zp (например, для рассмотренного ранее поля из восьми элементов), но, вообще говоря, эта оценка грубовата. Дело в том, что не каждый корень минимального многочлена обязан быть порождающим мультипликативной группы поля. Например, ( ) ( ) ϕ 212 − 1 ϕ(4095 ) ϕ 32 ⋅ 5 ⋅ 7 ⋅ 13 6 ⋅ 4 ⋅ 6 ⋅ 12 = = = = 144 , 12 12 12 12 1 Отсюда, в частности, следует, что для любого простого p и любого натурального n число — целое. 290 ( n ) ϕ p −1 n но в действительности число неприводимых над Z2 многочленов степени 12 равно 335. Это значит, что поле FG(212) можно представить как расширение поля Zp с помощью любого из двенадцати корней 191 многочлена и этот корень не будет порождающим мультипликативной группы ненулевых элементов этого поля. Точное значение числа многочленов степени m и неприводимых над полем Zp равно 1 m ∑ µ (d )p d m d , m где µ(n) — функция Мебиуса1: µ(1) = 1 и если pi— различные простые числа, и n = p1α ⋅ p2α ⋅ ... ⋅ pkα , где αi ≥ 1, то 1 2 k  0, если существует i такой, что α i > 1, µ p1α1 ⋅ p 2α 2 ⋅ ... ⋅ p kα k =   (− 1)k , если все α i = 1 . ( ) Для строения поля важную роль играет устройство решётки подполей. ПОДПОЛЯ КОНЕЧНОГО ПОЛЯ. Пусть P— конечное поле порядка pn, и H — его подполе. Порядок k подполя H является делителем числа pn, поэтому k = pm, где m ≤ n. Поле P является расширением подполя H, и значит, P образует векторное пространство над H конечной размерности s. Каждое такое пространство изоморфно s-мерному арифметическому пространству строк. Число различных таких строк (размещений по s элементов из k с повторениями) равно k s , т. е.(pm)s = pn. Август Фердинанд Мебиус (Möbius, 1790–1868) — немецкий математик, получивший в основном результаты в геометрии; в 1858 г. установил существование односторонних поверхностей (лист Мебиуса). Функция µ(n) введена А. Мебиусом в 1832 г. 1 291 Таким образом, число элементов в подполе конечногополя порядка p n равно p m , где m делит n. С другой стороны, для каждого делителя m числа n в поле P найдется подполе порядка pm. Действительно, многочлен f (x ) = x p − x делится на n g (x ) = x p − x и, m следовательно, поле разложения H многочлена g(x) содержится в поле разложения многочлена f (x). Порядок H равен pm, а это значит, что для каждого m— делителя числа n в поле порядка pnнайдется подполе порядка pm. Мультипликативная группа каждого подполя является подгруппой мультипликативной группы поля, но в циклической группе порядка t существует в точности одна подгруппа порядка q для каждого q— делителя числа t. Единственная подгруппа дает единственное подполе. Для каждого m— делителя числа n в поле порядка единственное pn подполе найдется порядка p m . Это все означает, что решетка подполей поля GF(pn) элементов изоморфна решетке делителей числа n. Например, шести делителям числа 12 соответствуют шесть подполей поля GF(p12). Полное описание алгебры включает исследование ее полугруппы эндоморфизмов и группы автоморфизмов. Эндоморфизмов, отличных от изоморфизмов, не имеет любое поле, в том числе и конечное. АВТОМОРФИЗМЫ КОНЕЧНЫХ ПОЛЕЙ. Любой автоморфизм α поля оставляет на месте нейтральные элементы. Поэтому α(1) = 1, а тогда для любого натурального n выполняется тождество 292 α(n⋅ 1) = n ⋅ 1. Следовательно, любой автоморфизм оставляет простое подполе неподвижным. В конечном поле характеристики p простым подполем является Zp . Элементы из Zp не перемещаются при любом автоморфизме, в частности группа Aut(Zp) — единичная. Посмотрим, как устроена группа автоморфизмов конечного поля P из pn элементов при n > 1.Отображение ϕ: x a xp сохраняет операции и, следователь- но, является (кольцевым)гомоморфизмом. При этом гомоморфизме единица переходит в единицу, т. е. отображение ненулевое. У полей любой ненулевой гомоморфизм является изоморфизмом. Поле P—конечно, следовательно, ϕ— отображение на(биекция), т. е. автоморфизм. Этот автоморфизм называют автоморфизмом Фробениуса1. Для любого натурального m < n в поле P не выполняется тождество x p = x , поэтому и сам автоморфизм m Фробениуса нетождественный, все n степеней этого автоморфизма(1 ≤ k ≤ n) ( ) p ϕk (x ) =  x p ... = x p 14243  p k k различны. Тождество x p = x означает, что ϕn = ε. Итак, циклическая группа, n порожденная автоморфизмом Фробениуса, состоит в точности из n элементов. Покажем, что других автоморфизмов в группе Aut(P) нет. Пусть элемент α— корень неприводимого над Zp многочлена f (x) степени n и α2,α3, ..., αn— принадлежат остальные полю P, корни равному этого многочлена. ZP (α)— Все простому эти корни алгебраическому расширению поля Zp . Поэтому любой автоморфизм, оставляющий поле Zp неподвижным, однозначно определяется отображением α a αi (i = 2, 3, …, n) Число таких отображений равно n, значит, порядок Aut(P) тоже равен n. Фердинанд Георг Фробениус (Frobenius, 1849–1917) — немецкий математик, профессор Цюрихского политехникума (1875–1892), Берлинского университета(с 1892 г.). В 1877 г. Ф. Фробениус доказал теорему, из которой следует, что поле комплексных чисел — наибольшая из возможных числовых систем. 1 293 Отсюда следует, что д р у г и х а в т о м о р ф и з м о в , к р о м е с т е п е н е й автоморфизма Фробениуса, у конечного поля нет. Группа автоморфизмов конечного поля GF(pn) найдена. Aut(GF(pn))—э т о порожденная циклическая автоморфизмом группа x a xp , и порядка n, состоящая из n отображений вида x a x p . Отметим попутно, что если α— один из корней минимального многочлена, i то все корни этого многочлена имеют вид α p , где i = 0, 3, …, n – 1. Кроме того, из биективности отображения натурального n уравнение n xp = a n следует, что для любого в поле характеристики p имеет в точности одно решение для любого элемента a. 294 x a xp 23 .УСЛОВИЯ РАЗРЕШИМОСТИ УРАВНЕНИЯ ТРЕТЬЕЙ СТЕПЕНИ В КВАДРАТНЫХ РАДИКАЛАХ. ПРИМЕРЫ ГЕОМЕТРИЧЕСКИХ ЗАДАЧ, СВОДЯЩИХСЯ К УРАВНЕНИЯМ, НЕРАЗРЕШИМЫМ В КВАДРАТНЫХ РАДИКАЛАХ Основные понятия: расширение поля, подполе, многочлен, корень многочлена, сопряженность, простое алгебраическое расширение, квадратичное расширение, формулы Виета, геометрическая задача на построение. Основные факты: Корни многочлена третьей степени выражаются в квадратных радикалах тогда и только тогда, когда один из корней принадлежит полю коэффициентов; все классические задачи древности на построение циркулем и линейкой неразрешимы. КВАДРАТИЧНОЕ РАСШИРЕНИЕ ПОЛЯ. Если P – числовое поле, а элемент d { } не является точным квадратом в P. то множество a + b d a, b ∈ P обознача- ( ) ют символом P d и называют простым квадратичным расширением поля P с помощью элемента d. Каждый элемент из простого квадратичного расширения P( d ) имеет единственное представление в виде a+b d , где a, b∈P. Элементы a+b d и a-b d из P( d ) являются корнями одного и того же многочлена c коэффициентами из поля P и неприводимого над P. Таким образом, a+b d и a-b d - сопряжены над P. Отображение, переводящее каждый элемент a+b d в сопряженный a-b d , является автоморфизмом поля P( d ), оставляющим поле P неподвижным. Говорят, что корни многочлена f(x)=a0xn + a1xn-1 + ... + an-1x + an=0 выражаются в квадратных радикалах (или уравнение f(x)=0 разрешимо в квадратных радикалах), если корни этого многочлена выражаются через его ко295 эффициенты a0, a1, ..., an-1, an с помощью операций сложения, умножения, вычитания, деления и извлечения квадратного корня. Алгебраическое уравнение f(x)=0 разрешимо в квадратных радикалах, если от его поля коэффициентов P до поля разложения многочлена f(x) можно протянуть цепочку простых квадратичных расширений. Набор операций {+, -, ⋅, /, } представляет интерес в связи с геометриче- скими задачами на построение с помощью циркуля и линейки. Для того чтобы циркулем и линейкой можно было построить отрезок x, длина которого является выражением f(a, b, ..., c) от длин a, b, …, c данных отрезков, необходимо, и достаточно, чтобы в выражении f(a, b, …, c) использовались только операции сложения, вычитания, умножения, деления и извлечения квадратного корня. СОПРЯЖЕННЫЕ ЧИСЛА И КВАДРАТИЧНЫЕ РАСШИРЕНИЯ. Комплексные числа сопряжены (а, точнее, сопряжены над полем R), если они являются корнями одного и того же неприводимого многочлена с действительными коэффициентами. Такое определение сопряженности имеет далеко идущее обобщение. Пусть P – произвольное поле, а P1 – полевое (или кольцевое расширение поля P). Два элемента из P1 называют сопряженными над P, если эти элементы явялются корнями одного и того же неприводимого многочлена с коэффициентами из P. Если P – числовое поле, а элемент d не является точным квадратом в P. то множество {a + b d a, b ∈P}, обозначают символом P ( d ) называют простым квадратичным расширением поля P с помощью элемента Каждый элемент из простого d. квадратичного расширения P ( d ) имеет единственное представление в виде a + b d , где a, b ∈ P. Элементы a + b d и a - b d из P ( d ) являются корнями одного и того же многочлена 296 x2 – 2ax + (a2 – b2d) c коэффициентами из поля P и неприводимого над P. Таким образом, a + b d и a - b d - сопряжены над P. Отображение, переводящее каждый элемент a + b d a–b d в сопряженный , является автоморфизмом поля P ( d ), оставляющим поле P неподвиж- ным. УСЛОВИЯ РАЗРЕШИМОСТИ УРАВНЕНИЯ ТРЕТЬЕЙ СТЕПЕНИ В КВАДРАТНЫХ РАДИКАЛАХ. Говорят, что корни многочлена f(x) = a0xn + a1xn - 1 + ... + an - 1x + an = 0 выражаются в квадратных радикалах (или уравнение f(x) = 0 разрешимо в квадратных радикалах), если корни этого многочлена выражаются через его коэффициенты a0, a1, ..., an-1, an с помощью операций сложения, умножения, вычитания, деления и извлечения квадратного корня. Алгебраическое уравнение f(x)=0 разрешимо в квадратных радикалах, если от его поля коэффициентов P до поля разложения многочлена f(x) можно протянуть цепочку простых квадратичных расширений. Слово цепочка в этом утверждении означает, как обычно, линейно упорядоченное множество. В данном случае – это множество подполей, вложенных друг в друга. Наименьшим из них является поле P, а наибольшим поле разложения многочлена f(x). Набор операций (+, -, *, /, ) представляет интерес в связи с геометри- ческими задачами на построение с помощью циркуля и линейки. Для того чтобы циркулем и линейкой можно было построить отрезок x, длина которого является выражением f(a, b, ..., c) от длин a, b, …, c данных 297 отрезков, необходимо и достаточно, чтобы в выражении f(a, b, …, c) использовались только операции сложения, вычитания, умножения, деления и извлечения квадратного корня. Пытаясь решить классические задачи древности французский математик П. Вантцель1 доказал следующую теорему. Корни многочлена третьей степени выражаются в квадратных радикалах через коэффициенты многочлена тогда и только тогда, когда один из корней принадлежит полю коэффициентов. Если корень α многочлена x3 + a1x2 +a2x +a3 (*) принадлежит полю коэффициентов, то по теореме Безу x3 + a1x2 + a2x +a3 = (x – α) (x2 + b2x + b3), а уравнение второй степени разрешимо в квадратных радикалах. Более интересна обратная ситуация – необходимость условия. Предположим, что ни один из корней не принадлежит полю коэффициентов, но уравнение всё-таки разрешимо в квадратных радикалах. Это значит, что, по крайней мере, один из корней многочлена (*) выражается через его коэффициенты с помощью полевых операций и извлечения квадратного корня. Но тогда коэффициенты многочлена x2 +b2x + b3, а, следовательно, и его корни тоже имеют аналогичные выражения. Таким образом, для каждого корня исходного многочлена можно протянуть цепочку простых квадратичных расширений от его поля коэффициентов P до поля, содержащего этого корень. Пусть x1 – корень многочлена (*), имеющий цепочку наименьшей длины: 298 P = P0 < P1 < … < Pk, где k > 0 и каждое Pi является простым квадратичным расширением Pk – 1, и x1∈ Pk. Пусть Pk = Pk – 1 ( d ), где d – элемент из Pk – 1, а уравнение x2 = d не имеет решения в Pk-1. Тогда x1 = a + b d , где a, b – элементы из поля Pk – 1. Элемент x2 = a – b d из Pk является вторым корнем многочлена (*). Цепочка корня x2 имеет длину k. По формулам Виета имеем: x1 + x2 + x3 = a1, откуда x3 = a1 – (x1 + x2) = a1 – 2a. Элементы a1, a принадлежат полю Pk – 1, и, следовательно, x3 ∈ Pk – 1, т. е. цепочка у корня x3 короче минимальной. Полученное противоречие означает, что самая короткая цепочка в действительности состоит из одного звена – поля P, и соответствующий корень принадлежит полю коэффициентов. Утверждение доказано. Сделаем одно замечание о приведённом доказательстве. По существу, в нём речь шла о числе квадратных корней в записи корней многочлена, а рассуждение Вантцеля означает, что символ квадратного корня или вообще не появляется в выражении для корня многочлена или появляется в точности один раз. ПРИМЕРЫ ГЕОМЕТРИЧЕСКИХ ЗАДАЧ, СВОДЯЩИХСЯ К УРАВНЕНИЯМ, Пьер Лоран Вантцель (Wantzell) (1814–1848) - французский математик, репетитор в Политехнической школе в Париже. Теорему о кубических уравнений Вантцель доказал в 1837 году. 1 299 НЕРАЗРЕШИМЫМ В КВАДРАТНЫХ РАДИКАЛАХ. Под названием “классические за- дачи” имеют в виду следующие проблемы: – построить с помощью циркуля и линейки ребро куба, объем которого в два раза больше данного (задача об удвоении куба); – с помощью циркуля и линейки разделить угол на три равные части (задача о трисекции угла); – построить с помощью циркуля и линейки квадрат, площадь которого равна площади данного круга (задача о квадратуре круга); – разделить окружность на n равных частей (задача о построении правильного многоугольника). В истории человечества немного задач, проверенных временем так, как проверены «классические задачи». Решение этих задач на построение в течение многих столетий безуспешно пытались получить как профессионалы, так и математики-любители. В восемнадцатом веке число таких любительских «решений», представляемых в Парижскую академию наук превысило пределы разумного, и академия приняла постановление «...Отныне и впредь не рассматривать представляемых решений задач удвоения куба, трисекции угла, квадратуры круга»1. Постановление академии, впрочем, было поспешным: до окончательного решения задач об удвоении куба и трисекции угла должно было пройти еще более полувека, а задаче о квадратуре круга предстояло оставаться нерешенной еще более ста лет. С помощью своей теоремы П. Вантцель в той же работе 1837 года получил решение трех из четырех классических задач на построение c с помощью циркуля и линейки. Удвоение куба. Длину ребра данного куба можно считать единичной, и задача об удвоении куба сводится к построению отрезка 1 Решения и постановления Парижской академии наук, 1775 г. 300 3 2 . Непосредст- венной проверкой можно убедиться, что многочлен x3 - 2 не имеет рациональных корней, и поэтому по теореме Вантцеля з а д а ч а о б у д в о е н и и к у б а с помощью циркуля и линейки неразрешима. Трисекция угла. В задаче о трисекции угла требуется с помощью циркуля и линейки разделить данный угол на три равные части, т. е. построить трисектрису. Для некоторых частных случаев такое построение возможно. Например, чтобы разделить на три части угол в 180°, нужно построить угол в 60°, а это угол при вершине правильного треугольника. Чтобы разделить угол в 90°, нужно построить угол в 30°, а для этого достаточно угол в 60° разделить пополам. Аналогичным образом произойдет 180o трисекция угла в 45°, 22,5° и вообще угла n (где 2 n - любое натуральное число). Возможно, что своему возникновению задача обязана прямой аналогии с делением отрезка на равные части, тем более, что деление отрезка пополам и построение биссектрисы угла очень похожи. Деление отрезка на три равные части не представляет никаких трудностей - так же легко разделить отрезок и на n частей. По- видимому, первоначально задача с делением угла была задачей общего вида – разделить угол на n частей, но непреодолимые трудности возникли уже при n = 3. Будем считать, что нам даны два отрезка – единичный (на рисунке – это отрезок OA) и отрезок a = AC, равный cos 3α. Задача о трисекции угла сводится к построению отрезка x, равного cos α (на рисунке x = BC). Тогда 301 cos3 α = 4 cos 3 α − 3 cos α, и соответсвенно возникает уравнение для x: a = 4x3 – 3x. Возможность построения трисектрисы теперь зависит от числа a. Например, при a = 0 (тогда 3α = 90°) корни уравнения можно построить с помощью циркуля и линейки. Если a= 2 (тогда 3α=45°) построение тоже возможно. 2 1 Возьмем теперь угол, подлежащий трисекции, равным 60°, то есть a = . 2 Уравнение для x примет вид: 4 x3 − 3x − 1 = 0. 2 Это уравнение не имеет рациональных корней, и поэтому по теореме Вантцеля ни один из корней этого не выражается через коэффициенты с помощью арифметических операций и извлечения квадратного корня. Следовательно, разделить угол в 60° с помощью циркуля и линейки невозможно, з а дача о трисекции угла с помощью циркуля и линейки в общем случае неразрешима. Задача о квадратуре круга пользовалось исключительной популярностью в течение столетий, начиная с древнейших времен. По условию задачи дан отрезок a, и требуется построить отрезок x такой, что квадрат со стороной x имеет площадь, равную площади круга радиуса a. Иначе говоря, нужно построить корень уравнения x2 = πa2. 302 Отрезок πa - это в точности половина длины окружности. Если бы удалось «распрямить» окружность с помощью циркуля и линейки, то есть построить отрезок 2πa, то разделить его пополам нетрудно. Таким образом, задача о квадратуре круга – эта задача о спрямлении окружности, то есть построении отрезка, равного 2πa. При a = 1 эта длина составляет 2π. Построение с помощью циркуля и линейки отрезка, равного π, означало бы, что число π можно получить из числа 1 с помощью арифметических операций и извлечения квадратного корня. Индукцией по числу квадратных корней в таком представлении (т. е. по длине цепочки квадратичных расширений), получаем, что каждое число, которое можно получить из единицы с помощью арифметических операций и извлечения квадратного корня, является корнем многочлена с рациональными коэффициентами. Другими словами, ц и р к у л е м и л и н е й к о й п р и д а н н о м е д и н и ч н о м о т р е з к е м о ж н о п о с т р о и т ь л и ш ь а л г е б р а и ч е с к и е ч и с л а (да и то далеко не все). В 1882 году Ф. Линдеманн1 доказал, что число π - трансцендентно, и, следовательно, окружность не спрямляема с помощью циркуля и линейки: задача о квадратуре круга неразрешима. В задаче о построении правильного n-угольника можно считать данным произвольный отрезок r, а искомым отрезок, равный стороне правильного n-угольника, вписанного в окружность радиуса r. Фердинанд Карл Луис Линдеманн (Lindemann, 1852–1939) – немецкий математик, профессор Кёнигсбергского (с 1883 г.) и Мюнхенского (с 1893 г.) университетов. 1 303 Пусть n = 7, т. е. рассмотрим сейчас задачу построе360o ния правильного семиугольника. Пусть x = cos . 7 Число x является корнем уравнения деления круга x6 + x5 + x4 + x3 + x2 + x2 + 1 = 0. Это возвратное уравнение и подстановкой y = x + 1 оно сводится к уравx нению x3 + 2x − 8x − 8 = 0. Это уравнение (а, следовательно, и исходное) не имеет рациональных корней, поэтому, снова, применяя теорему Вантцеля, получаем, что задача о построении правильного с помощью циркуля и линейки семиугольника неразрешима. Доказательство невозможности построения правильного семиугольника с помощью циркуля и линейки было получено в 1796 году К. Гауссом1. Тогда же он обнаружил, что с помощью циркуля и линейки м о ж н о п о с т р о и т ь п р а в и л ь н ы й с е м н а д ц а т и у г о л ь н и к - результат, как сам автор правильно оценил, не уступающий по значимости классическим результатам древних. В 1801 г. К. Гаусс полностью решил задачу о построении правильного n-угольника, доказав, что правильный n-угольник можно построить с помощью циркуля и линейки тогда и только тогда, когда значение функции Эйлера от n является степенью двойки, ϕ(n) = 2n. Наивысшим достижением своей жизни Гаусс считал решение задачи о построении правильных многоугольников особенности о возможности построения правильного 17-угольника. Этого достижение отражено и в памятнике К. Гауссу в Гёттингене; этот памятник располагается на семнадцатигранном цоколе. 1 304 Функция Эйлера от степени двойки снова является степенью двойки. Если p - простое число, то ϕ(p) = p - 1. Таким образом, если простое число p = 2n + 1, то ϕ(p) = 2n. n П. Ферма1. заметил, что числа Fn= 22 + 1 при n=0, 1, 2, 3, 4 являются простыми, и сделал предположение, что Fn простые для любого n. Пока неизвестно ни одного простого числа Fn, кроме этих пяти. Простое число вида 2n + 1 называется простым числом Ферма. Правильный n-угольник можно построить с помощью циркуля и линейки тогда и только тогда, когда n имеет вид: n = 2k ⋅ p1 ⋅ p2 ⋅ ... ⋅ ps, где ⋅p1⋅p2⋅...⋅ps - различные простые числа Ферма. Если вдруг окажется, что существует лишь конечное число простых чисел Ферма, то число правильных n-угольников с нечетным n тоже будет конечным. А если выяснится, например, что простых чисел Ферма всего пять, то таких n-угольников будет в точности 31. Пьер Ферма (Pierre Fermat) (1601-1665) - французский юрист и математик-любитель. Научные результаты П. Ферма опубликованы его сыном в 1670 году в сборнике «Разные сочинения». 1 305 24. СИСТЕМА ЦЕЛЫХ НЕОТРИЦАТЕЛЬНЫХ ЧИСЕЛ. НЕПОЛНОТА АРИФМЕТИКИ Основные понятия: полукольцо, упорядоченность, вполне упорядоченность, условие индуктивности, условие обрыва убывающих цепей, условие минимальности, метод математической индукции, аксиоматическая теория, непротиворечивость, категоричность, полнота, независимость аксиоматики, аксиомы Пеано, рекурсивная функция. Основные факты: модель аксиом Пеано и тождеств Грассмана является линейно упорядоченным полукольцом; любая аксиоматическая теория, содержащая арифметику, неполна. АКСИОМАТИКА АРИФМЕТИКИ. Впервые и сразу удачно основные предло- жения аксиоматической теории целых неотрицательных чисел были предложены в 1889 году Д. Пеано1. В этой аксиоматике основное, то есть неопределяемое, понятие – это целое неотрицательное число. Будем обозначать число буквами латинского алфавита, а все множество целых неотрицательных чисел обозначим символом Z0. Основных отношений в этой аксиоматике Пеано будет два: двухместное отношение S(x) (которое чуть позже мы сразу объявим функциональным отношением, то есть одноместной функцией, поэтому сразу авансом и выбрана функциональная запись для отношения) и одноместное отношение, состоящее из одного элемента (назовем этот элемент «нулем» и обозначим символом 0). Элементы x и S(x), связанные отношением следования имеют особые названия. S(x) принято называть «последователем элемента x» , а x - «предшественником элемента S(x)». Теперь осталось написать основные предложения об основных отношений, то есть выписать аксиомы. В первоначальном авторском изложении аксиом Пеано было пять: 306 1) нуль является натуральным числом; 2) каждое натуральное число обладает последователем; 3) нуль не является последователем никакого натурального числа; 4) числа, имеющие одинаковых последователей, равны; 5) множество, содержащее нуль и вместе с каждым числом его последователь, содержит все натуральные числа. Первая аксиома утверждает, что нуль – это одноместное отношение, а четвертая, - что отношение S является функцией. Таким образом, объявив заранее, что нуль – одноместное отношение, а S одноместная функция (назовем ее функцией следования), можно ограничиться всего тремя аксиомами (которые обычно и называют аксиомами Пеано): 1) у нуля нет предшествующего; 2) функция следования разнозначна; 3) множество, содержащее нуль и вместе с каждым элементом x элемент S(x), содержит все натуральные числа. Множество всех логических следствий аксиом Пеано принято называть арифметикой. ЭЛЕМЕНТАРНОСТЬ АРИФМЕТИКИ. Формулы алгебры предикатов, кванторы которых навешены только на символы переменных, называют элементарными, а теорию, состоящую из элементарных формул - элементарной теорией. Правила вывода сохраняют элементарность, поэтому теория элементарна, если ее аксиомы – элементарные формулы. Навесив квантор на предикат, мы получим пример не элементарной формулы. Например, предложение, начинающееся словами «для каждого свойства элементов ... » или «для каждого подмножества», не является элементарным. Обозначим множество целых неотрицательных чисел символом Z0, а нуль - знаком 0. Джузеппе Пеано (Peano,1856–1932) - итальянский математик, с 1890 г. профессор Туринского университета. 1 307 Первая аксиома Пеано является элементарной формулой: (∀x)[x ≠ S(x)]. Вторая аксиома тоже элементарна: (∀x) (∀y)[S(x) = S(x) → x = y]. Последнюю, третью аксиому принято называть аксиомой индукции. Аксиома индукции означает, что для каждого подмножества M из Z0 если: 1) нуль принадлежит M, 2) из того, что x принадлежит M, следует, что и следующий, то есть S(x), тоже принадлежит M, то множество M совпадает с Z0. Другими словами, третья аксиома утверждает, что любое целое неотрицательное число непременно содержится в последовательности S(0), S((0)), S(((0))), ... . Множества описываются с помощью предикатов: M={x P(x)}. Правда, все подмножества множества натуральных чисел так описать невозможно (множество предикатов лишь счетно, а множество подмножеств множества Z0 несчетно), поэтому если в аксиоме индукции вместо слова «множество» говорить: «свойство элементов» (то есть «предикат»), то мы получим более слабое, чем аксиома индукции, утверждение: (∀P) [[P(0) & (∀x) [P(x) → P(S(x))]] →(∀x)P(x)], 308 означающее, что если нуль обладает свойством P и за каждым элементом, обладающим свойством P, следует элемент тоже со свойством P, то свойством P обладают все элементы. Даже ослабленная аксиома индукции не является элементарным предложением: там есть квантор, навешенный на предикат. Таким образом, аксиома индукция является не элементарной формулой. Однако множество одноместных предикатов всего лишь счётно, и если P1(x), P2(x), …, Pi(x), … – это все одноместные предикаты, то аксиому индукции можно заменить бесконечной серией элементарных аксиом вида: [Pi(0) & (∀x) [Pi(x) → Pi (S(x))]] →(∀x) Pi (x). С таким договором арифметика превращается в элементарную (но бесконечно аксиоматизируемую) теорию. НЕЗАВИСИМОСТЬ АКСИОМАТИКИ ПЕАНО. Самыми важными вопросами об арифметике будут следующие: является ли арифметика непротиворечивой? категоричной? полной? разрешимой? И, наконец, вопрос, имеющий наименьшую теоретическую значимость: является ли система аксиом Пеано независимой. К сожалению, вполне строго можно ответить лишь на этот последний, не главный вопрос. Ответ утвердительный: да, с и с т е м а а к с и о м П е а н о н е зависима. Независимость какой-либо аксиомы означает, что для нее не существует доказательства, опирающегося на оставшиеся аксиомы. 309 Покажем, что первая аксиома не зависит от остальных, т. е. сколько бы не получали логических следствий из второй и третьей аксиомы, никогда не получится теорема: у нуля нет предшествующего. Для этого укажем модель, на которой вторая и третья аксиома выполняются, а третья аксиома не выполняется. Тогда на модели верны все логические следствия из второй и третьей аксиомы и предположение о том, что среди следствий есть и аксиома один сразу приводит к противоречию. Пусть множество Z1 состоит из двух элементов, Z1={0, a}, а функция следования S задана правилами: S(0) = a, S(a) = 0. Вторая и третья аксиомы здесь выполняются, а первая – нет, значит, первая аксиома Пеано не выводится из двух оставшихся. Покажем, что вторая аксиома не выводится логически и первой и третьей. Теперь возьмем множество Z2 из трех элементов, Z2 = {0, a, b}, а функцию следования S зададим правилами: S(0) = a, S(a) = b, S(b) = a. Функция S здесь не разнозначна, она принимает одно и то же значение в различных точках: S(0)=S(b). Первая аксиома выполняется: у элемента 0 нет предшествующего, выполняется и третья аксиома: двигаясь от нуля согласно 310 функции следования, получим все множество модели. Итак, вторая аксиома Пеано не является следствием двух оставшихся. Первые две модели были конечными, чтобы убедиться в их существовании, не нужно никаких вспомогательных теорий. Теперь нам надо привести модель, на которой выполняются первая и вторая аксиома. Независимо, будет там выполняться третья аксиома или нет, можно заранее сказать: эта модель должна быть бесконечной. Действительно, функция S является по второй аксиоме взаимно однозначным отображением множества модели в себя. Первая аксиома означает, что образ множества при этом отображении является собственным подмножеством множества модели. Следовательно, если выполняются первая и вторая аксиомы, то множество равномощно своему собственному подмножеству. Таким образом, третья модель строится существенно на теоретикомножественной основе: если аксиоматическая теория множеств непротиворечива, то третья аксиома не зависит от двух первых. Построение системы рациональных чисел будет Q проводится на основе теории натуральных чисел, но без использования того факта, что третья аксиома не выводится из остальных, поэтому при построении третьей модели можно воспользоваться системой Q. Пусть множество модели Z3 состоит из нуля, единицы и рациональных чисел вида n , n +1 где n ∈{1, 2, 3, ... }, Z3={0, 1 2 3 , , , ... , 1}. 2 3 4 Действие функции следования будем считать уже заданной в записи множества Z3: 1 2 3 2 1 S(0)= , S ( ) = , S ( ) = 2 2 3 3 4 311 и так далее. Первая аксиома в этой модели выполняется: у нуля нет предшествующего. Вторая аксиома тоже выполняется: функция следования разнозначна. Третья аксиома не выполняется. В самом деле, пусть множество M=Z3\{1}. Тогда посылка аксиомы индукции выполнена: 0∈M и x∈M ⇒ S(x)∈M, а заключение - нет: M≠Z3. Итак, третья аксиома Пеано не зависит от остальных. Третья аксиома, аксиома индукции, играет особую роль в теории целых неотрицательных чисел. Доказательство, использующее аксиому индукции, называют методом математической индукции. МЕТОД МАТЕМАТИЧЕСКОЙ ИНДУКЦИИ. Предположим, что нам надо доказать теорему, имеющую вид утверждения: некоторыми свойством P обладают все целые неотрицательные числа: (∀x) P(x). Докажем это, используя аксиому индукции (а, точнее ее частный случай для предиката P): [P(0) & (∀x )[P(x ) → P(S (x ))] ] → (∀x )(P(x )) . Посылка аксиомы состоит из двух утверждений. Первое: свойством P обладает самый первый элемент нашего множества: P(0) – истинно. Второе утверждение посылки аксиомы индукции говорит о том, что если свойством P обладает элемент натуральное число x, то и число, следующее за ним, т. е. S(x), тоже должно обладать этим свойством. Следовательно, если будет установлена посылка аксиомы индукции, с помощью правила отделения 312 будет получено доказываемое утверждение. Проверку истинности утверждения теоремы для первого элемента принято называть базой (или базисом, или основанием) индукции. Второе утверждение посылки аксиомы индукции говорит о том, что если свойством P обладает элемент натуральное число n, то и следующее за ним, т. е. S(n), тоже должно обладать таким свойством. Если мы обозначим элемент S(n) символом n + 1, то это утверждение выглядит следующим образом: (∀x)[P(n) → P(n + 1)] (*) Доказательство утверждения (*) принято называть шагом индукции (или индуктивным переходом), а само утверждение об истинности P(n) называют индуктивным предположением (или индуктивной гипотезой). Истинность утверждения (∀x) [P(n) → P(n + 1)] означает, что всегда, когда истинно высказывание P(n), будет истинно и P(n + 1), или, другим словами, предикат P(n + 1) является логическим следствием предиката P(n): P(n) ⇒ P(n+1). 313 Символ ⇒ – «логическое следствие» - это знак отношения между предикатами. В таком виде обычно и записывают шаг индукции, то есть шаг состоит в движении вдоль символа логического следствия: ⇒. Напомним, что метод математической индукции и метод полной индукции – это не одно и тоже. Методом полной индукции называют полный разбор случаев. Если теорема имеет вид высказывания (∀x∈M)P(x), а множество M можно представить в виде объединения (не обязательно непересекающихся) подмножеств: M = M1 ∪ M2 ∪ ... ∪ Mn, то утверждение теоремы равносильно следующему: (∀x∈M1)P(x) & (∀x∈M2)P(x) & ... & (∀x∈Mn)P(x). Такое разбиение предложения на n более мелких утверждений и есть метод полной индукции Метод математической индукции использует аксиому индукции и применяется только для счётных множеств. Счетное множество, для которого происходит доказательство по индукции это не обязательно множество натуральных чисел в привычной для нас интерпретации, то есть множество N = {1, 2, .. , n, n+1,...}. Доказательство по индукции можно провести для любой модели Пеано. Например, для целых неотрицательных чисел Z0 если: 1) P(0) – истинно; 2) P(n) ⇒ P(n + 1), 314 то свойством P обладают все целые неотрицательные числа, В качестве модели Пеано можно взять, например, множество неотрицательных четных чисел M = {0, 2, 4, ...}. Тогда доказательство по индукции для множества M опирается на следующее утверждение (интерпретацию аксиомы индукции). Свойством P обладают все неотрицательные четные числа, если: 1) P(0) – истинно; 2) P(n) ⇒ P(n + 2). Число n + 2 – это четное число, следующее за числом n. Может случиться, что свойством P обладают натуральные числа, начиная с числа k. Тогда доказательство этого факта методом математической индукции будет использовать модель Пеано на множестве {k, k + 1, k + 2, ...}. Итак, метод математической индукции – это доказательство утверждения о свойстве элементов модели Пеано, опирающееся на третью аксиому – аксиому индукции (или на равносильные ей утверждения). УТВЕРЖДЕНИЯ, РАВНОСИЛЬНЫЕ УСЛОВИЮ ИНДУКТИВНОСТИ. Говорят, что в линейно упорядоченном множестве выполняется условие минимальности, если каждое непустое подмножество этого множества имеет наименьший элемент. На линейно упорядоченном множестве < M; < > с минимальным элементом m0 выполняется условие индуктивности, если для каждого подмножества S из M из выполнения двух условий: а) m0 ∈ M; б) если все элементы x < a принадлежат подмножеству S, то и эле- мент a ∈ S, следует S = M. Из условия индуктивности следует аксиома индукции. Условие обрыва убывающих цепей: каждая цепочка 315 x1 > x2 > ... > xn > ... элементов множества M обрывается на конечном шаге. Условия минимальности, индуктивности, обрыва убывающих цепей равносильны. Покажем сначала, что из условия индуктивности следует условие обрыва цепей. Рассмотрим следующее свойство элемента x: цепочка x > x1 > x2 > ... > xn > ..., начинающаяся с элемента x, обрывается на конечном шаге. Условия а), б) условия индуктивности выполнены, а это значит, что цепочка, начатая с любого элемента из множества M, обрывается. Теперь установим методом от противного, что из условия обрыва следует условие минимальности. Пусть S – непустое множество множества M, и для S не выполняется условие минимальности. Тогда для элемента x из S всегда можно указать, меньший его элемент, и, следовательно, построить строго убывающую бесконечную цепочку элементов множества M. Полученное противоречие показывает, что такого подмножества S не существует. Наконец, покажем, что из условия минимальности следует условие индуктивности. Доказательство проведем также методом от противного, т. е. допустим, что для подмножества S посылка условия индуктивности - пункты а), б) - выполнены, но множество S не совпадает с M. Тогда разность M \ S – не пуста, и, следовательно, по условию минимальности содержит минимальный элемент a. Элемент a не может быть минимальным во всем M: минимальный эле316 мент всего множества уже попал в S по пункту а). Это значит, что для любой элемент x такой, что x – модель Пеано, на которой уже есть две функции f(x), g(x, y, z). Новую функцию h(x, y) зададим тождествами (для каждых x, y из Z0): h(x, 0)=f(x), h(x, S(y))=g(x, y, h(x, y)). (*) Германн Гюнтер Грассман (Grassman, 1809–1877) – немецкий математик, с 1842 г. учитель Штеттинской гимназии. 1 320 Такое задание функции h(x, y) называют схемой примитивной рекурсии1. «Возвращение» связано с тем, что значение функции h(x, y) в точке (x, S(y)) определяется результатами предыдущих вычислений, в частности, значением нашей функции в точке (x, y). Понятие примитивной рекурсии лежит в основе точного определения понятия «алгоритм», поэтому алгоритмически вычислимые функции называют еще (частично) рекурсивными функциями. В модели Пеано существует не более одной функции, заданной схемой примитивной рекурсии. Пусть s(x, y) – вторая функция, удовлетворяющая тождествам (*). При фиксированном элементе x рассмотрим одноместную функцию hx , задаваемую тождеством: hx (y) = h(x, y) и аналогичную функцию sx , sx (y) = h(x, y). Две функции совпадают, если их значения совпадают в каждой точке. Функции hx(y) и sx(y) совпадают. Чтобы увидеть это совпадение, рассмотрим множество M всех таких y, для которых значения наших функций равны: M={y ∈ Z0  hx(y) = sx(y)}. Первое тождество из (*) утверждает, что 0 ∈ M. Второе тождество схемы примитивной рекурсии означает, что если y ∈ M, то S(y) ∈ M. Но теперь по аксиоме индукции, M = Z0, а это означает, что наши функции совпадают везде. 321 Таким образом, если существует функция, заданная схемой примитивной рекурсии, то в точности одна. Переходим к доказательству существования сложения и умножения. Сложение задается схемой примитивной рекурсии, поэтому если функция « сложение» существует, то в точности одна. Покажем, что сложение существует. Временно обозначим сумму x + y символом h(x,y): h(x, 0) = x, h(x, S(y)) = S(h(x, y)). Определим для каждого x из Z0 одноместную функцию hx(y) такую, что hx(0) = x, hx(S(y)) = S(hx(y)). (**) Это значит, что h(x, y) = hx(y). После появления hx(y) доказать существование двухместной функции h(x,y) – это то же самое, что доказать существование одноместной hx(y) для любого x. Доказательство будет снова опираться на аксиому индукции. Символом X обозначим множество таких x, для которых функция hx существует : X={x∈Z0функция hx(y), заданная тождествами (**), существует}. Принадлежит ли число 0 множеству X? Полагаем h0(y) = y, тогда условия (**) выполнены. Действительно, h0(0) = 0, h0(S(y)) = S(y) = S(h0(y)). 1 Рекурсия – от латинского recursio – возвращение) 322 Итак, нуль принадлежит множеству X. Пусть x принадлежит X, то есть существует hx(y), удовлетворяющая условиям (**). Определим тогда hS(x)(y) по правилу: hS(x)(y) = S(hx(y)). Покажем, что тогда и hS(x)(y) тоже удовлетворяет (**). Вычисляем. hS(x)(0)=S(hx(0)), но hx(0) уже определено: hx(0) = x, поэтому hS(x)(0) = S(hx(0)) = S(x). Это значит, что первое из тождеств (**) выполнено. Переходим ко второму тождеству. hS(x)(S(y)) = S(hx(S(y)) = S(S(hx(y))) = S(hS(x)(y)). Последнее равенство получено заменой S(hx(y)) на hS(x)(y). Замену эту сделали благодаря тождеству, определяющему функции hS(x)(y)); тождество это прочитано справа налево. Итак, если hx(y) существует, то существует hS(x)(y), или, другими словами, если x∈X, то S(x)∈X. Отсюда по аксиоме индукции X = Z0. Функция hx(y) (и операция сложение) существует. Обозначим элемент, следующий за нулем, символом 1 и назовем его единицей: S(0) = 1. Тогда по определению сложения для любого x получаем: 323 x + 1 = x + S(0) = S(x + 0) = S(x). Чаще это равенство придется читать справа налево: S(x)=x+1. Определение сложения с этим обозначением принимает вид: x + 0 = x, x + (y+1) = (x + y) + 1. Умножение, в свою очередь, задается схемой примитивной рекурсии: x ⋅ 0 = 0, x ⋅ (y+1) = x ⋅ y + x. Арифметика теперь принимает привычный вид: это алгебра с четырьмя операциями; одна из них – нульместная (т. е. просто выделенный элемент нуль), одна – одноместная и две двухместных – сложение и умножение. Таким образом, всего аксиом у арифметики семь: три аксиомы Пеано и четыре – Грассмана. СВОЙСТВА СЛОЖЕНИЯ И УМНОЖЕНИЯ. Важнейшими свойствами сложения являются ассоциативный и коммутативный законы. Доказательство каждого из них будет опираться на аксиому индукции. Докажем, например, что сложение ассоциативно (для любых целых неотрицательных чисел a, b, c): (a + b) + c = a + (b + c). Индукцию проведем по последнему слагаемому (c). База индукции: c = 0. Вычисляем согласно определению сложения: 324 (a + b) + 0 = a + b, a + (b + 0) = a + b, отсюда (a + b) + 0 = a + (b + 0). База доказана. Шаг индукции: (a + b) + c = a + (b + c) ⇒ (a + b) + (c + 1) = a + (b + (c + 1)). Вычисляем, применяя определение сложения (опр. слож.) и индуктивное предположение (инд. пред.): (опр. слож.) (инд. пред.) (a + b) + (c +1) = ((a + b) + c) + 1 = (опр. слож.) = (a + (b + c)) + 1 = a + (b + (c + 1)). Шаг индукции (и закон ассоциативности) доказан. Аналогичным образом устанавливаются и остальные свойства сложения и свойства умножения. Система Пеано с операциями сложения и умножения является архимедовски упорядоченным полукольцом. СОДЕРЖАТЕЛЬНАЯ И ФОРМАЛЬНАЯ АРИФМЕТИКИ. Отметим еще одно интересное обстоятельство. Практически у нас появились две арифметики: одна с аксиомой индукции, в которой фигурирует слово множество (эту арифметику называют содержательной), и вторая, где в той же аксиоме вместо «множества 325 » - слово предикат (такую арифметику называют формальной). Мы уже отмети- ли, что формальная арифметика, по крайне мере, на первый взгляд, беднее содержательной арифметики. Это первое впечатление верно, действительно, эти аксиоматические теории различны. Полнотой и категоричностью обладает лишь содержательная арифметика. Формальная арифметика не полна, т. е. если ограничиваться в записи арифметических предложений только предикатами вместо множеств, то можно указать такое предложение, которое не удастся ни доказать, ни опровергнуть. НЕПОЛНОТА АРИФМЕТИКИ. Любая непротиворечивая теория, с о д е р ж а щ а я а р и ф м е т и к у , я в л я е т с я н е п о л н о й . Это утверждение называется теоремой Гёделя1 о неполноте. Предложения теории (в том числе её аксиомы и теоремы) будем называть формулами, так как любое повествовательное предложение можно считать формулой алгебры предикатов. Для доказательства заметим сначала, что в любой формализованной теории содержится счётное число формул. Это значит, что все формулы теории можно занумеровать натуральными числами. Более того, эту нумерацию можно сделать эффективной, т. е. такой, что номер каждой формулы будет вычисляться по единому алгоритму, и по номеру формулы можно будет (также по единому алгоритму) находить саму формулу. Перенумеруем все символы алфавита теории. Пусть α(x) – это номер символа x. Каждая формула F теории является конечной цепочкой символов теории – x1 x2 ... xn. Сопоставим каждой такой цепочке число Гёдель Курт (Gődel, 1906–1978) – австрийский математик, с 1940 в США. Доказательство теоремы о неполноте арифметики Гёдель опубликовал в 1931 году. 1 326 α( x ) β(F) = 2 α( x1 ) ⋅ 3α ( x2 ) ⋅...⋅ p n n , где pn – n-ое простое число. Такой номер называют гёделевским номером формулы. Каждая формула имеет номер; благодаря оосновнгой теореме арифметики формулу теории можно однозначно восстановить по её гёделевскому номеру. Доказательство формулы F является конечной цепочкой формул F1, F2, ... , Fm = F. Сопоставим каждой такой цепочке число (гёделевский номер доказательства формулы F): 2 β ( x ) ⋅ 3β ( x ) ⋅ ... ⋅ p mβ ( x ) , 1 2 m где pm – m-ое простое число. Благодаря нумерации формул и доказательств, в теории, содержащей арифметику, можно формульно выразить, доказуема формула или нет: формула с номером x доказуема тогда и только тогда, когда для нее существует y – номер доказательства. Рассмотрим все формулы теории, содержащие одну свободную числовую переменную x. Все эти формулы расположим по порядку их гёделевских номеров, пусть fn(x) – формула с одной свободной переменной x и гёделевским номером n. Возьмем теперь модель теории. Так как теория содержит арифметику, ее множество содержит Z0. Выделим в Z0 подмножество M = { nfn(n) недоказуема } Множество M, состоящее из номеров формул, недоказуемых на своем номере, формульно описывается в теории. 327 Это значит, что означает, что существует формула S(x) от одного переменного x такая, что S(x) = И ⇔ x ∈ M. Так как в S(x) один свободный переменный, эта формула совпадает с одним из fn(x) подходящего номера n. Из того, что формула fn(n) доказуема в теории следует, что она недоказуема. Из доказуемости f n (n) следует доказуемость fn(n), и, таким образом, противоречивость теории. Итак, ни fn(n), ни f n (n) недоказуемы в этой теории: непротиворечивая теория, содержащая арифметику, не полна. ПОДОЗРИТЕЛЬНО ТРУДНЫЕ ЗАДАЧИ. Отметим, что доказательство теоремы Гёделя – косвенное, методом от противного. Указать явно предложение арифметики, которое нельзя не доказать не опровергнуть пока не удалось. После появления теоремы Гёделя о неполноте арифметики появилась подозрение, что знаменитые, до сих пор нерешенные арифметические задачи древности (о близнецах, совершенных числах) и более поздние (например, великая теорема Ферма) не поддаются решению потому, что их и решить невозможно – все они являются иллюстрациями к теореме Гёделя. В конце прошлого века, однако, появилось доказательство великой теоремы Ферм, судьба остальных остается пока неясной. 328
«Обзорные темы по алгебре» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач

Тебе могут подойти лекции

Смотреть все 938 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot