Линейная алгебра и геометрия

⌛ 2021 год
👀 1769 просмотров
📌 1715 загрузок
🏢️ НИУ ВШЭ

Выбери формат для чтения

Конспект лекции по дисциплине «Линейная алгебра и геометрия», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Линейная алгебра и геометрия», Word формат

А. Л. Городенцев∗ ЛИНЕЙНАЯ АЛГЕБРА И ГЕОМЕТРИЯ 1й курс Факультет математики НИУ ВШЭ 2021 ∕ 22 уч. год ∗ ВШЭ, НМУ, ИТЭФ, email:gorod@itep.ru , http://gorod.bogomolovlab.ru/ Оглавление Оглавление . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Неформальное предисловие . . . . . . . . . . . . . . . . . . . §1 Аффинная плоскость . . . . . . . . . . . . . . . . . . . 1.1 Векторные пространства . . . . . . . . . . . . . . 1.2 Двумерное векторное пространство . . . . . . . . 1.3 Площадь ориентированного параллелограмма . . 1.4 Аффинные пространства . . . . . . . . . . . . . . 1.5 Прямые . . . . . . . . . . . . . . . . . . . . . . . 1.6 Треугольники . . . . . . . . . . . . . . . . . . . . §2 Аффинные преобразования . . . . . . . . . . . . . . . 2.1 Преобразования, переводящие прямые в прямые 2.2 Аффинные отображения . . . . . . . . . . . . . . 2.3 Запись линейных отображений в координатах . . 2.4 Запись аффинных отображений в координатах . . 2.5 Аффинная группа . . . . . . . . . . . . . . . . . . 2.6 Двойные отношения . . . . . . . . . . . . . . . . §3 Евклидова плоскость . . . . . . . . . . . . . . . . . . . 3.1 Длина вектора и перпендикулярность . . . . . . . 3.2 Ортонормальные базисы . . . . . . . . . . . . . . 3.3 Углы и тригонометрия . . . . . . . . . . . . . . . 3.4 Движения . . . . . . . . . . . . . . . . . . . . . . 3.5 Комплексные числа . . . . . . . . . . . . . . . . . 3.6 Преобразования подобия . . . . . . . . . . . . . . §4 Многомерие . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Базисы и размерность . . . . . . . . . . . . . . . . 4.2 Подпространства . . . . . . . . . . . . . . . . . . 4.3 Аффинная геометрия . . . . . . . . . . . . . . . . 4.4 Линейные и аффинные отображения . . . . . . . 4.5 Фактор пространства . . . . . . . . . . . . . . . . §5 Матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Матрицы линейных отображений . . . . . . . . . 5.2 Умножение матриц . . . . . . . . . . . . . . . . . 5.3 Матрицы перехода . . . . . . . . . . . . . . . . . 5.4 Обратимые матрицы . . . . . . . . . . . . . . . . 5.5 Ранг матрицы . . . . . . . . . . . . . . . . . . . . 5.6 Системы линейных уравнений . . . . . . . . . . . 5.7 Алгебры над полем . . . . . . . . . . . . . . . . . §6 Метод Гаусса . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Построение базиса в подпространстве . . . . . . 6.2 Отыскание обратной матрицы . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 4 7 7 9 11 13 16 18 22 22 24 26 28 29 31 33 33 36 38 40 43 44 47 47 50 53 54 57 59 59 60 62 63 65 66 68 71 71 73 Оглавление §7 §8 §9 §10 §11 §12 6.3 Решение систем линейных уравнений . . . . . . . . . . . . . . . . . . 6.4 Построение базиса в ядре и образе линейного отображения . . . . . 6.5 Построение базиса в фактор пространстве . . . . . . . . . . . . . . . 6.6 Расположение подпространства относительно базиса . . . . . . . . . Двойственность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Двойственные пространства . . . . . . . . . . . . . . . . . . . . . . . 7.2 Двойственность между подпространствами . . . . . . . . . . . . . . 7.3 Двойственные линейные отображения . . . . . . . . . . . . . . . . . 7.4 Отступление о бесконечномерии . . . . . . . . . . . . . . . . . . . . Определители . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Объём, полилинейные косые формы и определитель . . . . . . . . . 8.2 Присоединённая матрица . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Геометрическое отступление: объём и барицентрические координаты 8.4 Комбинаторное отступление: длина и знак перестановки . . . . . . . 8.5 Алгебраическое отступление: грассмановы многочлены . . . . . . . Линейные операторы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 Пространство с оператором . . . . . . . . . . . . . . . . . . . . . . . 9.2 Собственные подпространства . . . . . . . . . . . . . . . . . . . . . . 9.3 Нильпотентные операторы . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Корневое разложение и функции от операторов . . . . . . . . . . . . 9.5 Разложение Жордана . . . . . . . . . . . . . . . . . . . . . . . . . . . Евклидова геометрия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1 Ортонормальные базисы . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Матрицы Грама . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Евклидова двойственность . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Ортогональное проектирование, расстояния и углы . . . . . . . . . . 10.5 Векторные произведения . . . . . . . . . . . . . . . . . . . . . . . . . Линейные отображения евклидовых пространств . . . . . . . . . . . . . . 11.1 Ортогональные операторы . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Евклидово сопряжение линейных отображений . . . . . . . . . . . . 11.3 Сопряжённые и антисамосопряжённые операторы . . . . . . . . . . 11.4 Сингулярные числа и сингулярные направления . . . . . . . . . . . . 11.5 Инвариантные углы между подпространствами . . . . . . . . . . . . Выпуклая геометрия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1 Выпуклые фигуры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Опорные полупространства . . . . . . . . . . . . . . . . . . . . . . . 12.3 Грани и крайние точки . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4 Выпуклые многогранники . . . . . . . . . . . . . . . . . . . . . . . . 12.5 Выпуклые многогранные конусы . . . . . . . . . . . . . . . . . . . . 3 75 78 79 79 83 83 86 88 91 95 95 101 105 108 110 115 115 119 122 123 127 130 130 132 133 135 138 140 140 145 146 148 152 155 155 157 158 161 164 Ответы и указания к некоторым упражнениям . . . . . . . . . . . . . . . . . . . 170 Неформальное предисловие Аксиомы vs определения. Есть две точки зрения на то, как выстраивать курс геомет рии. Лежащий в основе большинства школьных учебников аксиоматический подход восходит к Евклиду. Однако приемлемая с точки зрения современной математической логики система «аксиом Евклида» была предложена лишь в начале XX века Д. Гиль бертом, и только через несколько десятилетий была адаптирована А. Н. Колмогоро вым настолько, что вошла в регулярный школьный учебник под его редакцией1 в ви де нескольких страниц убористого петита в добавлении, предназначенном для факуль тативных занятий. Альтернативный «аналитический подход» вместо аксиоматическо го описания основных геометрических понятий (точек, прямых, их взаимного распо ложения и т. п.) даёт всем используемым объектам явные определения, основанные на известном из алгебры и анализа понятии числа. Так, вещественная плоскость ℝ2 определяется как множество, точками в котором являются пары вещественных чисел 𝑝 = (𝑝1 , 𝑝2 ). Прямая на такой плоскости определяется как траектория точки, равномер но движущейся в заданном направлении, т. е. как ГМТ2 вида 𝑝 + 𝑣 ⋅ 𝑡 = (𝑝1 , 𝑝2 ) + (𝑣1 , 𝑣2 ) ⋅ 𝑡 = (𝑝1 + 𝑣1 𝑡, 𝑝2 + 𝑣2 𝑡) , где параметр 𝑡 ∈ ℝ играет роль времени, 𝑝 = (𝑝1 , 𝑝2 ) ∈ ℝ2 — произвольным обра зом выбранная начальная точка, отвечающая нулевому моменту времени, а вектор 𝑣 = (𝑣1 , 𝑣2 ) задаёт скорость движения. После этих определений высказывания о том, что через любые две точки плоскости проходит одна и только одна прямая и что че рез любую точку плоскости, не лежащую на данной прямой 𝓁, проходит ровно одна не пересекающая 𝓁 прямая, становятся теоремами. Упражнение 0.1. Докажите эти две теоремы. Точки и векторы. Вектор 𝑣 = (𝑣1 , 𝑣2 ), хотя и записывается формально точно такой же парой чисел, как и точка 𝑝, является объектом совершенно иной геометрической природы. Его правильно представлять себе как преобразование сдвига3 𝜏𝑣 ∶ ℝ2 → ℝ2 , 𝑝 ↦ 𝑝+𝑣, переводящее каждую точку 𝑝 = (𝑝1 , 𝑝2 ) в точку 𝜏𝑣 (𝑝) = 𝑝 + 𝑣 = (𝑝1 + 𝑣1 , 𝑝2 + 𝑣2 ). Ко ординаты (𝑣1 , 𝑣2 ) вектора 𝑣 суть числа, описывающие этот сдвиг, а именно — разность 𝜏𝑣 (𝑝) − 𝑝, которая одинакова для всех точек 𝑝 ∈ ℝ2 . При переносе начала координат из нуля в какуюнибудь другую точку 𝑎 = (𝑎1 , 𝑎2 ) ∈ ℝ2 координаты каждой точки 𝑝 поме няются и станут равны (𝑝1 − 𝑎1 , 𝑝2 − 𝑎2 ), тогда как координаты вектора 𝑣 , задающего сдвиг 𝜏𝑣 не изменятся. 1 Основное учебное пособие по геометрии в советской средней школе 70х – 80х годов XX века. Здесь и далее «ГМТ» является сокращением фразы «геометрическое место точек». 3 Или параллельный перенос. 2 4 5 Неформальное предисловие Группы преобразований. Рассмотрим произвольное множество 𝑋 и обозначим через End(𝑋) множество всех отображений 𝑓 ∶ 𝑋 → 𝑋 из 𝑋 в себя1 . На множестве End(𝑋) име ется естественная операция композиции, сопоставляющая упорядоченной паре отоб ражений 𝑓 ∶ 𝑋 → 𝑋, 𝑔 ∶ 𝑋 → 𝑋, результат их последовательного выполнения справа налево: 𝑓 ∘ 𝑔 ∶ 𝑋 → 𝑋, 𝑥 ↦ 𝑓(𝑔(𝑥 )) . Упражнение 0.2. Приведите пример множества 𝑋 и таких трёх отображений 𝑓 , 𝑔, ℎ ∶ 𝑋 → 𝑋, что а) 𝑓 ∘ 𝑔 ≠ 𝑔 ∘ 𝑓 б) 𝑓 ∘ ℎ = 𝑔 ∘ ℎ, но 𝑓 ≠ 𝑔 в) ℎ ∘ 𝑓 = ℎ ∘ 𝑔, но 𝑓 ≠ 𝑔. Множество отображений 𝐺 ⊂ End(𝑋) называется группой, если все отображения 𝑔 ∈ 𝐺 взаимно однозначны2 , и вместе с каждым отображением 𝑔 ∈ 𝐺 обратное ему отобра жение3 𝑔−1 тоже принадлежит 𝐺 , а вместе с каждыми двумя отображениями 𝑔1 , 𝑔2 ∈ 𝐺 в 𝐺 лежит и их композиция 𝑔1 ∘ 𝑔2 . Отметим, что из этих требований вытекает, что тождественное отображение Id𝑋 , переводящее каждую точку в себя, автоматически со держится в 𝐺 , поскольку представимо в виде композиции Id𝑋 = 𝑔 ∘ 𝑔−1 = 𝑔−1 ∘ 𝑔, где 𝑔 ∈ 𝐺 — любое преобразование из группы. Группа сдвигов. Параллельные переносы плоскости ℝ2 на всевозможные векторы об разуют группу: обратным преобразованием к сдвигу 𝜏𝑣 на вектор 𝑣 = (𝑣1 , 𝑣2 ) является сдвиг 𝜏𝑣−1 = 𝜏−𝑣 на противоположный вектор −𝑣 = (−𝑣1 , −𝑣2 ), а композиция сдвигов на векторы 𝑢 = (𝑢1 , 𝑢2 ) и 𝑤 = (𝑤1 , 𝑤2 ) это сдвиг на вектор 𝑢 + 𝑤 = (𝑢1 + 𝑤1 , 𝑢2 + 𝑤2 ) . (01) Подчеркнём, что эта формула является координатной записью для операции компози ции отображений, которая сама по себе определяется без использования координат. Из формулы (01) вытекает, что не смотря на упр. 0.2 композиция сдвигов не зависит от того, какой сдвиг делается первым, а какой — вторым. Группа, состоящая из попарно перестановочных друг с другом преобразований4 на зывается коммутативной или абелевой. Таким образом, векторы составляют абелеву группу преобразований плоскости ℝ2 . Отметим, что на множестве точек никакого естественного сложения нет. Напри мер, если попытаться определить «сумму точек» складывая их координаты, то одна и та же пара точек будет иметь разные суммы в разных координатных системах, поскольку при сдвиге начала координат в точку 𝑎 от координат всех точек отнимаются координа ты точки 𝑎, и точки, имевшие в исходной координатной системе координаты (𝑝1 , 𝑝2 ) , (𝑞1 , 𝑞2 ) и (𝑝1 + 𝑞1 , 𝑝2 + 𝑞2 ) в сдвинутой координатной системе приобретают координаты (𝑝1 − 𝑎1 , 𝑝2 − 𝑎2 ) , (𝑞1 − 𝑎1 , 𝑞2 − 𝑎2 ) и (𝑝1 + 𝑞1 − 𝑎1 , 𝑝2 + 𝑞2 − 𝑎2 ) так что «сумма» первых двух из них перестаёт быть равна третьей. 1 Такие отображения обычно называют эндоморфизмами множества 𝑋, откуда и обозначение. Т. е. у каждой точки 𝑦 ∈ 𝑋 имеется ровно один прообраз — такая точка 𝑥 = 𝑔−1 (𝑦) ∈ 𝑋, что 𝑔(𝑥) = 𝑦. 3 Переводящее каждую точку 𝑦 ∈ 𝑋 в её прообраз 𝑥 = 𝑔−1 (𝑦). 4 Это означает, что 𝑔1 ∘ 𝑔2 = 𝑔2 ∘ 𝑔1 для всех 𝑔1 , 𝑔2 ∈ 𝐺 . 2 6 Неформальное предисловие Об этом курсе. Наш курс будет выстроен по схеме, предложенной в 30х годах XX века Г. Вейлем. Первичным геометрическим объектом для нас будет векторное простран ство — абелева группа векторов, которые можно складывать друг с другом и умножать на числа по известным из школы правилам. Мы напомним список этих правил в §1, он гораздо короче «аксиом Евклида». После чего мы свяжем с векторными пространства ми разные точечные пространства, в которых можно будет рисовать фигуры и изучать свойства этих фигур по отношению к различным геометрическим преобразованиям. Подчеркнём, что в конечном итоге все эти свойства будут выводиться из явных опре делений и алгебраических свойств операций с векторами. Первым делом мы покажем, как вписывается в эту картину школьная планимет рия — определим вещественную евклидову плоскость и убедимся в том, что в ней вы полняются все постулаты и теоремы школьной планиметрии. Затем мы построим раз ные другие точечные пространства, имеющие произвольные размерности и определён ные над любыми полями констант. О числах. Понятие числа столь же фундаментально для геометрии, сколь и понятие век тора. Чтобы перечислить свойства векторов необходимо сначала зафиксировать мно жество констант, на которые векторы можно умножать. Для нас будет существенно, что константы образуют поле, т. е. их можно складывать, вычитать, умножать и делить по тем же формальным алгебраическим правилам, что рациональные числа. Мы всегда обозначаем поле констант через 𝕜 и называем его основным полем или полем опреде ления рассматриваемой геометрии. Если специально не оговаривается противное, чи татель на первых порах может без ущерба для понимания происходящего считать, что 𝕜 = ℚ, ℝ, ℂ — это поле рациональных, или действительных, или комплексных чисел (выбирайте наиболее привычное). Однако, то обстоятельство, что многие из доказы ваемых ниже теорем справедливы над любым основным полем, следует всётаки иметь в виду. Скажем, над полем вычетов по простому модулю 𝑝, которое состоит из 𝑝 чисел1 , геометрические пространства становятся конечными множествами, и некоторые всем привычные картинки в этих пространствах превращаются в любопытные комбинатор ные утверждения. 1 Их можно воспринимать как всевозможные остатки от деления целых чисел на 𝑝. §1. Аффинная плоскость 1.1. Векторные пространства. Фиксируем произвольное поле1 𝕜, элементы которого будем называть числами или скалярами. Множество 𝑉 , элементы которого мы будем называть век торами2 , является векторным пространством над полем 𝕜, если на 𝑉 определены операция сложения векторов, сопоставляющая каждой паре векторов 𝑣1 , 𝑣2 ∈ 𝑉 их сумму 𝑣1 + 𝑣2 ∈ 𝑉 , и операция умножения векторов на числа, сопоставляющая каждым вектору 𝑣 ∈ 𝑉 и скаляру 𝜆 ∈ 𝕜 вектор 𝜆 ⋅ 𝑣 = 𝑣 ⋅ 𝜆 ∈ 𝑉 так, что выполняются следующие аксиомы. 1. Свойства сложения векторов: (1a) 𝑎 + 𝑏 = 𝑏 + 𝑎 для всех 𝑎, 𝑏 ∈ 𝑉 (см. рис. 1⋄1) (1б) 𝑎 + (𝑏 + 𝑐 ) = (𝑎 + 𝑏) + 𝑐 для всех 𝑎, 𝑏, 𝑐 ∈ 𝑉 (см. рис. 1⋄2) (1в) имеется такой нулевой вектор 0 ∈ 𝑉 , что 𝑎 + 0 = 𝑎 для всех 𝑎 ∈ 𝑉 (1г) для каждого вектора 𝑎 ∈ 𝑉 имеется такой противоположный вектор −𝑎 ∈ 𝑉 , что 𝑎 + (−𝑎) = 0. 𝑏 𝑎 𝑎 𝑎 𝑎+ 𝑏 𝑏 𝑏+ 𝑐 𝑎+𝑏 𝑏 𝑐 𝑎+𝑏+𝑐 Рис. 1⋄1. Правило параллелограмма. Рис. 1⋄2. Правило четырёхугольника. 2. Свойства умножения векторов на числа: (2a) 𝜆(𝜇𝑎) = (𝜆𝜇)𝑎 для всех 𝑎 ∈ 𝑉 и 𝜆, 𝜇 ∈ 𝕜 (2б) (𝜆 + 𝜇)𝑎 = 𝜆𝑎 + 𝜇𝑎 для всех 𝑎 ∈ 𝑉 и 𝜆, 𝜇 ∈ 𝕜 (2в) 𝜆(𝑎 + 𝑏) = 𝜆𝑎 + 𝜆𝑏 для всех 𝑎, 𝑏 ∈ 𝑉 и 𝜆 ∈ 𝕜 (2г) 1 ⋅ 𝑎 = 𝑎 для всех 𝑎 ∈ 𝑉 . Подмножество 𝑈 векторного пространства 𝑉 называется векторным подпространством, если для любых двух векторов 𝑢, 𝑤 ∈ 𝑈 все их линейные комбинации 𝜆𝑢 + 𝜇𝑤 с произвольными 𝜆, 𝜇 ∈ 𝕜 тоже лежат в 𝑈. Из написанных аксиом формально вытекает ещё несколько интуитивно ожидаемых свойств операций над векторами. 1 Точное определение поля будет дано в курсе алгебры (см., например, лекцию http://gorod.bogomolovlab.ru/ps/stud/algebra1/1314/lec02.pdf). 2 Векторы продуктивно представлять себе как направленные отрезки, рассматриваемые с точностью до параллельного переноса. 7 8 §1 Аффинная плоскость Лемма 1.1 В каждом векторном пространстве 𝑉 нулевой вектор 0 ∈ 𝑉 единствен. Для любого 𝑎 ∈ 𝑉 проти воположный к 𝑎 вектор −𝑎 однозначно определяется по 𝑎. Кроме того, 0 ⋅ 𝑎 = 0 и (−1) ⋅ 𝑎 = −𝑎, где 0 и −1 в левых частях равенств суть числа из поля 𝕜, а 0 и −𝑎 в правых — векторы из про странства 𝑉 . Аналогично, 𝜆 ⋅ 0 = 0 для всех 𝜆 ∈ 𝕜, где 0 ∈ 𝑉 — нулевой вектор. Доказательство. Для любых двух нулевых векторов 01 , 02 ∈ 𝑉 по аксиоме (1в) выполняется равенство 01 = 01 + 02 = 02 . Если векторы 𝑏 и 𝑐 оба противоположны к 𝑎, то 𝑏 = 𝑏 + 0 = = 𝑏 + (𝑎 + 𝑐 ) = (𝑏 + 𝑎) + 𝑐 = 0 + 𝑐 = 𝑐 . Если к левой и правой частям равенства 𝑎 + 0 ⋅ 𝑎 = 1 ⋅ 𝑎 + 0 ⋅ 𝑎 = (1 + 0) ⋅ 𝑎 = 1 ⋅ 𝑎 = 𝑎 прибавить противоположный к 𝑎 вектор −𝑎, мы получим 0 ⋅ 𝑎 = 0. Аналогично, прибавляя к обеим частям равенства 𝜆 ⋅ 0 = 𝜆 ⋅ (0 + 0) = 𝜆 ⋅ 0 + 𝜆 ⋅ 0 вектор, противоположный вектору 𝜆 ⋅ 0, получаем 0 = 𝜆 ⋅ 0. Вектор (−1) ⋅ 𝑎 противоположен к 𝑎, поскольку 𝑎 + (−1) ⋅ 𝑎 = 1 ⋅ 𝑎 + (−1) ⋅ 𝑎 = = (1 − 1) ⋅ 𝑎 = 0 ⋅ 𝑎 = 0. Пример 1.1 Простейшие примеры векторных пространств суть нулевое или тривиальное пространство 0, состоящее из одного лишь нулевого вектора 0, такого что 0 + 0 = 0 = −0 и 𝜆 ⋅ 0 = 0 для всех 𝜆 ∈ 𝕜, а также само поле 𝕜, где сложение векторов и их умножение на числа суть сложение и умножение, которые имеются в поле 𝕜. Пример 1.2 (𝑛мерное координатное пространство 𝕜𝑛 ) По определению, векторами пространства 𝕜𝑛 являются упорядоченные наборы из 𝑛 чисел1 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) , 𝑥𝑖 ∈ 𝕜 . Сложение векторов и их умножение на числа задаются правилами (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) + (𝑦1 , 𝑦2 , … , 𝑦𝑛 ) ≝ (𝑥1 + 𝑦1 , 𝑥2 + 𝑦2 , … , 𝑥𝑛 + 𝑦𝑛 ) 𝜆 ⋅ (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) ≝ (𝜆𝑥1 , 𝜆𝑥2 , … , 𝜆𝑥𝑛 ) . Пример 1.3 (пространство многочленов) Многочлены c коэффициентами в поле 𝕜 образуют векторное пространство над 𝕜 относительно операций сложения многочленов и умножения их на константы. Это пространство обозначает ся 𝕜[𝑥 ]. Многочлены степени не выше 𝑛 образуют в 𝕜[𝑥 ] векторное подпространство, которое мы будем обозначать 𝕜[𝑥 ]⩽𝑛 . 1.1.1. Линейные отображения. Отображение 𝐹 ∶ 𝑈 → 𝑊 из векторного пространства 𝑈 в векторное пространство 𝑊 называется линейным, если оно перестановочно со сложением век торов и их умножением на числа в том смысле, что 𝐹 (𝛼𝑎 + 𝛽𝑏) = 𝛼𝐹 (𝑎) + 𝛽𝐹 (𝑏) для всех 𝑎, 𝑏 ∈ 𝑈 и 𝛼 , 𝛽 ∈ 𝕜. Векторные пространства, между которыми имеется взаимно однозначное линейное отображение, называются изоморфными, а само это отображение называется изоморфизмом векторных пространств. Изоморфизмы 𝑉 ⥲ 𝑉 пространства с самим собою называются авто морфизмами. Автоморфизмы векторного пространства 𝑉 образуют группу преобразований2 . Эта группа обозначается GL(𝑉 ) и называется полной линейной группой векторного пространства 𝑉 . 1 Для экономии бумаги мы пишем их в строчку, но иногда бывает удобно представлять векторы про странства 𝕜𝑛 и в виде столбцов. 2 Cм. стр. 5. 1.2. Двумерное векторное пространство 9 Пример 1.4 Пространство 𝕜[𝑥 ]⩽𝑛 многочленов степени не выше 𝑛 изоморфно (𝑛 + 1)мерному координат ному пространству 𝕜𝑛+1 посредством линейного биективного отображения, сопоставляющего многочлену 𝑎0 𝑥 𝑛 + 𝑎1 𝑥 𝑛−1 + ⋯ + 𝑎𝑛−1 𝑥 + 𝑎𝑛 набор его коэффициентов (𝑎0 , 𝑎1 , … , 𝑎𝑛 ) ∈ 𝕜𝑛+1 . Предостережение 1.1. Обратите внимание, что отображение 𝜑 ∶ 𝕜 → 𝕜, заданное формулой 𝜑(𝑥 ) = 𝑎 ⋅ 𝑥 + 𝑏, которое в школе принято называть «линейной функцией», линейно в смысле n∘ 1.1.1 только при 𝑏 = 0. Если же 𝑏 ≠ 0, то 𝜑(𝜆𝑥 ) ≠ 𝜆𝜑(𝑥 ) и 𝜑(𝑥 + 𝑦) ≠ 𝜑(𝑥 ) + 𝜑(𝑦), т. е. 𝜑 не является линейным отображением. Упражнение 1.1. Докажите, что для любого линейного отображения 𝐹 выполняются равенства 𝐹 (0) = 0 и 𝐹 (−𝑣) = −𝐹 (𝑣) для всех 𝑣 ∈ 𝑉 . 1.1.2. Пропорциональные векторы и одномерные пространства. Векторы 𝑎 и 𝑏 из век торного пространства 𝑉 называются пропорциональными, если 𝑥 ⋅ 𝑎 = 𝑦 ⋅ 𝑏 для некоторых чисел 𝑥 , 𝑦 ∈ 𝕜, не равных одновременно нулю. Таким образом, нулевой вектор пропорционален лю бому вектору, а пропорциональность ненулевых векторов 𝑎 и 𝑏 означает, что 𝑎 = 𝜆𝑏 и 𝑏 = 𝜆−1 𝑎 для некоторого ненулевого 𝜆 ∈ 𝕜. Векторное пространство 𝑉 называется одномерным, что принято записывать равенством1 dim 𝑉 = 1, если в нём есть ненулевые векторы, но все они пропорциональны друг другу. Фик сируя в одномерном пространстве 𝑉 какойнибудь ненулевой вектор 𝑒, мы можем однозначно записать любой вектор 𝑣 ∈ 𝑉 как 𝑣 = 𝑥𝑒 с 𝑥 ∈ 𝕜. Такое представление единственно, поскольку из равенства 𝑥𝑒 = 𝑦𝑒 вытекает, что (𝑥 − 𝑦)𝑒 = 0, откуда 𝑥 − 𝑦 = 0, ибо в противном случае, умножая обе части равенства (𝑥 − 𝑦)𝑒 = 0 на число (𝑥 − 𝑦)−1 , мы получили бы 𝑒 = 0. Число 𝑥 называется координатой вектора 𝑣 = 𝑥𝑒 относительно базисного вектора 𝑒. Отоб ражение 𝑉 → 𝕜, переводящее каждый вектор 𝑣 = 𝑥𝑒 ∈ 𝑉 в его координату 𝑥 ∈ 𝕜 устанавливает изоморфизм между 𝑉 и 𝕜. При выборе другого базисного вектора 𝑒′ = 𝜆𝑒 координата 𝑥 ′ каж дого вектора 𝑣 = 𝑥 ′ 𝑒′ = 𝑥 ′ 𝜆𝑒 = 𝑥𝑒 относительно этого нового базисного вектора связана со старой координатой 𝑥 соотношением 𝑥 ′ = 𝜆−1 𝑥 . Каждое линейное отображение 𝐹 ∶ 𝑉 ⥲ 𝑉 одномерного пространства 𝑉 в себя однозначно задаётся тем, куда оно переводит какойнибудь базисный вектор 𝑒 пространства 𝑉 . Если 𝐹 (𝑒) = = 𝜆𝑒, то для произвольного вектора 𝑣 = 𝑥𝑒 получим 𝐹 (𝑥𝑒) = 𝑥𝐹 (𝑒) = 𝜆𝑥𝑒. В частности, отоб ражение 𝐹 либо переводит все векторы в нуль, либо является гомотетией2 с ненулевым коэф фициентом 𝜆 ∈ 𝕜. Таким образом, полная линейная группа GL(𝑉 ) одномерного пространства 𝑉 состоит из гомотетий с ненулевыми коэффициентами и изоморфна мультипликативной груп пе 𝕜∗ ненулевых элементов поля 𝕜. 1.2. Двумерное векторное пространство. Векторное пространство 𝑉 называется двумерным, что принято записывать равенством dim 𝑉 = 2, если в нём есть пара непропорциональных век торов 𝑒1 , 𝑒2 , и каждый вектор 𝑣 ∈ 𝑉 выражается через них в виде 𝑣 = 𝑥1 𝑒1 + 𝑥2 𝑒2 , где 𝑥1 , 𝑥2 ∈ 𝕜. Любая пара векторов 𝑒1 , 𝑒2 , обладающая этими двумя свойствами, называется базисом про странства 𝑉 . Коэффициенты 𝑥1 , 𝑥2 разложения вектора 𝑣 по базису однозначно определяются 1 Обозначение dim является сокращением от dimension (размерность). В полной общности мы обсудим это понятие чуть позже. 2 Или растяжением в 𝜆 раз, т. е. действует на любой вектор 𝑣 ∈ 𝑉 по правилу 𝑣 ↦ 𝜆𝑣. 10 §1 Аффинная плоскость вектором 𝑣 и базисом, поскольку из равенства 𝑥1 𝑒1 + 𝑥2 𝑒2 = 𝑦1 𝑒1 + 𝑦2 𝑒2 вытекает равенство (𝑥1 − 𝑦1 ) 𝑒1 = (𝑥2 − 𝑦2 ) 𝑒2 , возможное только при (𝑥1 − 𝑦1 ) = (𝑥2 − 𝑦2 ) = 0 в силу того, что векторы 𝑒1 и 𝑒2 не пропорциональны. Числа 𝑥1 , 𝑥2 ∈ 𝕜 из разложения 𝑣 = 𝑥1 𝑒1 + 𝑥2 𝑒2 называ ются координатами вектора 𝑣 в базисе 𝑒 = (𝑒1 , 𝑒2 ). Сопоставляя каждому вектору столбец его координат в базисе 𝑒, мы получаем биективное отображение 𝑐𝑒 ∶ 𝑉 ⥲ 𝕜2 , 𝑣 = 𝑥1 𝑒1 + 𝑥2 𝑒2 ↦ 𝑥1 ∈ 𝕜2 . (𝑥2 ) Упражнение 1.2. Проверьте, что это отображение линейно, т. е. при сложении векторов столб цы их координат складываются, а при умножении на число — умножаются на число по правилам координатного пространства 𝕜2 . Таким образом, всякое двумерное векторное пространство 𝑉 изоморфно координатному про странству 𝕜2 . 1.2.1. Определитель 2 × 2. Пропорциональность векторов 𝑎 = (𝑎1 , 𝑎2 ) и 𝑏 = (𝑏1 , 𝑏2 ) в 𝕜2 равносильна равенству перекрёстных произведений 𝑎1 𝑏2 = 𝑎2 𝑏1 . Число det(𝑎, 𝑏) ≝ 𝑎1 𝑏2 − 𝑎2 𝑏1 (11) называется определителем векторов 𝑎, 𝑏 ∈ 𝕜2 или 2 × 2матрицы, составленной из координат этих векторов. В последнем случае определитель записывают как det 𝑎1 (𝑎 2 𝑏1 𝑎 = 𝑎1 𝑏2 − 𝑎2 𝑏1 = det 1 (𝑏1 𝑏2 ) 𝑎2 𝑏2 ) Обратите внимание, что неважно, каким образом записаны координаты векторов — по стро кам или по столбцам матрицы, поскольку величина (11) не меняется при отражении матрицы относительно диагонали, ведущей из левого верхнего угла в правый нижний1 . Очевидно, что для всех векторов 𝑎, 𝑏, 𝑐 ∈ 𝕜2 и чисел 𝜆 ∈ 𝕜 выполняются равенства det(𝑎, 𝑏) = 0 ⟺ 𝑎 и 𝑏 пропорциональны (12) det(𝑎, 𝑏) = − det(𝑏, 𝑎) (13) det(𝜆𝑎, 𝑏) = 𝜆 det(𝑎, 𝑏) = det(𝑎, 𝜆𝑏) (14) det(𝑎 + 𝑏, 𝑐) = det(𝑎, 𝑐) + det(𝑏, 𝑐) det(𝑎, 𝑏 + 𝑐) = det(𝑎, 𝑏) + det(𝑎, 𝑐) (15) Упражнение 1.3. Убедитесь в этом! Свойство (13) называется знакопеременностью, (14) — однородностью, (15) — аддитивно стью. Вместе однородность и аддитивность означают, что определитель линеен по каждому из двух своих аргументов, т. е. билинеен. Из билинейности вытекает, что для любых векторов 𝑎, 𝑏, 𝑐 , 𝑑 ∈ 𝕜2 и констант 𝛼, 𝛽 , 𝛾, 𝛿 ∈ 𝕜 выполняется то же самое правило раскрытия скобок2 , что и для произведения чисел: det(𝛼𝑎 + 𝛽𝑏 , 𝛾𝑐 + 𝛿𝑑) = 𝛼𝛾 det(𝑎, 𝑐) + 𝛼𝛿 det(𝑎, 𝑑) + 𝛽𝛾 det(𝑏, 𝑐) + 𝛽𝛿 det(𝑏, 𝑑) . 1 Эта диагональ называется главной, а отражение матрицы относительно главной диагонали называ ется транспонированием. 2 Это правило называют дистрибутивностью или распределительным законом. 11 1.3. Площадь ориентированного параллелограмма Лемма 1.2 Каждая пара непропорциональных векторов 𝑎, 𝑏 ∈ 𝕜2 является базисом. Коэффициенты разло жения произвольного вектора 𝑣 ∈ 𝕜2 по этому базису вычисляются по правилу Крамера: 𝑣 =𝑥⋅𝑎+𝑦⋅𝑏 ⟺ 𝑥 = det(𝑣, 𝑏)∕ det(𝑎, 𝑏) {𝑦 = det(𝑎, 𝑣)∕ det(𝑎, 𝑏) . (16) Доказательство. Если имеется разложение 𝑣 = 𝑥 ⋅ 𝑎 + 𝑦 ⋅ 𝑏, то из билинейности и кососиммет ричности определителя вытекают равенства det(𝑎, 𝑣) = det(𝑎, 𝑥 ⋅ 𝑎 + 𝑦 ⋅ 𝑏) = 𝑥 ⋅ det(𝑎, 𝑎) + 𝑦 ⋅ det(𝑎, 𝑏) = 𝑦 ⋅ det(𝑎, 𝑏) det(𝑣, 𝑏) = det(𝑥 ⋅ 𝑎 + 𝑦 ⋅ 𝑏, 𝑏) = 𝑥 ⋅ det(𝑎, 𝑏) + 𝑦 ⋅ det(𝑏, 𝑏) = 𝑥 ⋅ det(𝑎, 𝑏) , из которых 𝑥 и 𝑦 однозначно выражаются в виде (16). Для доказательства существования раз ложения 𝑣 = 𝑥 ⋅ 𝑎 + 𝑦 ⋅ 𝑏 заметим, что разность 𝑣 − 𝑎 ⋅ det(𝑣 , 𝑏) ∕ det(𝑎, 𝑏) пропорциональна вектору 𝑏, т. к. det(𝑣 − 𝑎 ⋅ det(𝑣 , 𝑏)∕det(𝑎, 𝑏) , 𝑏) = det(𝑣 , 𝑏) − det(𝑎, 𝑏) ⋅ det(𝑣 , 𝑏)∕det(𝑎, 𝑏) = 0. Поэтому 𝑣 = 𝑎 ⋅ det(𝑣 , 𝑏)∕ det(𝑎, 𝑏) + 𝑏 ⋅ 𝑦 для некоторого 𝑦 ∈ 𝕜. Следствие 1.1 В любом двумерном векторном пространстве любые два непропорциональных вектора образу ют его базис. 𝑥1 , а векторы 𝑢1 , 𝑢2 , в (𝑥2 ) 𝑐11 𝑐12 свою очередь, имеют в неком другом базисе (𝑤1 , 𝑤2 ) координаты 𝑢1 = и 𝑢2 = . (𝑐21 ) (𝑐22 ) Найдите координаты вектора 𝑣 в базисе (𝑤1 , 𝑤2 ). Упражнение 1.4. Пусть вектор 𝑣 имеет в базисе (𝑢1 , 𝑢2 ) координаты 1.3. Площадь ориентированного параллелограмма. Функция 𝑠 ∶ 𝑉 × 𝑉 → 𝕜, сопоставляю щая каждой упорядоченной паре векторов 𝑎, 𝑏 двумерного векторного пространства 𝑉 число 𝑠(𝑎, 𝑏) ∈ 𝕜, называется площадью ориентированного параллелограмма, если для любых векто ров 𝑎, 𝑏 ∈ 𝑉 и чисел 𝜆, 𝜇 ∈ 𝕜 выполняются равенства 𝑠(𝑎, 𝑏 + 𝜆𝑎) = 𝑠(𝑎, 𝑏) = 𝑠(𝑎 + 𝜇𝑏, 𝑏) (17) 𝑠(𝜆𝑎, 𝑏) = 𝜆𝑠(𝑎, 𝑏) = 𝑠(𝑎, 𝜆𝑏) . (18) Первое из них означает, что площадь параллелограмма не меняется при параллельном пере носе одной из его сторон вдоль самой себя: треугольник, который при этом отрезается, парал лельно сдвигается и приклеивается с другой стороны, как на рис. 1⋄3. λa λa b+ b λa b a Рис. 1⋄3. Площадь не меняется. a Рис. 1⋄4. Ориентированный параллелограмм. 12 §1 Аффинная плоскость Второе свойство (18) утверждает, что при изменении одной из сторон параллелограмма в 𝜆 раз площадь также изменяется в 𝜆 раз. В частности, 𝑠(−𝑎, 𝑏) = −𝑠(𝑎, 𝑏) = 𝑠(𝑎, −𝑏), т. е. пло щадь меняет знак при смене знака одного из векторов. В школьном курсе геометрии над по лем 𝕜 = ℝ принято считать, что площадь положительна и 𝑠(𝜆𝑎, 𝑏) = 𝑠(𝑎, 𝜆𝑏) = |𝜆| ⋅ 𝑠(𝑎, 𝑏). Отказываясь от положительности, мы не просто упраздняем модуль1 , но помимо абсолютной величины площади учитываем также и ориентацию параллелограмма. На вещественной коор динатной плоскости ℝ2 упорядоченные пары векторов (𝑎, 𝑏) геометрически отличаются друг от друга тем, в какую сторону происходит кратчайший поворот, совмещающий направление пер вого вектора с направлением второго. Те пары векторов, для которых такой поворот происходит против часовой стрелки, называются положительно ориентированными, а те, для которых по часовой стрелке — отрицательно ориентированными. Равенство 𝑠(−𝑎, 𝑏) = −𝑠(𝑎, 𝑏) означает, что площадь меняет знак при смене ориентации параллелограмма на противоположную, как на рис. 1⋄5. b b a −a Pис. 1⋄5. Смена ориентации при смене знака. Лемма 1.3 Каждая функция площади 𝑠 ∶ 𝑉 × 𝑉 → 𝕜 обращается в нуль на парах пропорциональных векто ров2 , знакопеременна: 𝑠(𝑎, 𝑏) = −𝑠(𝑏, 𝑎) и аддитивна: 𝑠(𝑎, 𝑏 + 𝑐 ) = 𝑠(𝑎, 𝑏) + 𝑠(𝑎, 𝑐 ) ∀ 𝑎, 𝑏, 𝑐 ∈ 𝕜2 . (19) Доказательство. Первые два свойства вытекают прямо из (17) и (18): 𝑠(𝜆𝑣, 𝑣) = 𝑠(0 + 𝜆𝑣, 𝑣) = 𝑠(0, 𝑣) = 𝑠(0 ⋅ 0, 𝑣) = 0 ⋅ 𝑠(0, 𝑣) = 0 , 𝑠(𝑎, 𝑏) = 𝑠(𝑎, 𝑎 + 𝑏) = 𝑠(𝑎 − (𝑎 + 𝑏), 𝑎 + 𝑏) = 𝑠(−𝑏, 𝑎 + 𝑏) = −𝑠(𝑏, 𝑎 + 𝑏) = −𝑠(𝑏, 𝑎) . Докажем аддитивность. Если вектор 𝑎 пропорционален и вектору 𝑏, и вектору 𝑐 , то он пропор ционален и их сумме 𝑏 + 𝑐 . В этом случае все три площади в (19) зануляются. Если вектор 𝑎 не пропорционален, скажем, вектору 𝑏, то 𝑎 и 𝑏 составляют базис, и 𝑐 = 𝛼𝑎 + 𝛽𝑏 для некоторых 𝛼, 𝛽 ∈ 𝕜. В этом случае левая и правая части (19) тоже равны друг другу: 𝑠(𝑎, 𝑏 + 𝑐 ) = 𝑠(𝑎, 𝑏 + 𝛼𝑎 + 𝛽𝑏) = 𝑠(𝑎, (1 + 𝛽 )𝑏) = (1 + 𝛽 )𝑠(𝑎, 𝑏) , 𝑠(𝑎, 𝑏) + 𝑠(𝑎, 𝑐 ) = 𝑠(𝑎, 𝑏) + 𝑠(𝑎, 𝛼𝑎 + 𝛽𝑏) = 𝑠(𝑎, 𝑏) + 𝑠(𝑎, 𝛽𝑏) = = 𝑠(𝑎, 𝑏) + 𝛽𝑠(𝑎, 𝑏) = (1 + 𝛽)𝑠(𝑎, 𝑏) . 1 Что значительно упрощает вычисления и делает их осмысленными над любым полем 𝕜. В частности, когда один из векторов нулевой или когда два вектора совпадают друг с другом. Свой ство 𝑠(𝑎, 𝑎) = 0 называют кососимметричностью, см. упр. 1.5 ниже. 2 13 1.4. Аффинные пространства Упражнение 1.5 (кососимметричность и знакопеременность). Функция от двух аргументов 𝑓 ∶ 𝑉 × 𝑉 → 𝕜 называется кососимметричной, если 𝑓(𝑣, 𝑣) = 0 для всех 𝑣 ∈ 𝑉 . Убедитесь, что всякая билинейная кососимметричная функция знакопеременна, а если в поле 𝕜 выполне но неравенство 1 ≠ −1, то и наоборот, все знакопеременные функции кососимметричны. Теорема 1.1 На координатном векторном пространстве 𝕜2 имеется единственная с точностью до пропор циональности ненулевая функция площади. Она имеет вид 𝑠(𝑎, 𝑏) = 𝑐 ⋅ det(𝑎, 𝑏), где константа 𝑐 = 𝑠(𝑒1 , 𝑒2 ) равна площади стандартного базисного параллелограмма на векторах 𝑒1 = 1 (0) и 𝑒2 = . (1) Доказательство. В силу аддитивности, однородности и знакопеременности функции 𝑠(𝑎, 𝑏) для любой пары векторов 𝑎 = 𝛼1 𝑒1 + 𝛼2 𝑒2 и 𝑏 = 𝛽1 𝑒1 + 𝛽2 𝑒2 выполняются равенства 𝑠(𝑎, 𝑏) = 𝑠(𝛼1 𝑒1 + 𝛼2 𝑒2 , 𝛽1 𝑒1 + 𝛽2 𝑒2 ) = (𝛼1 𝛽2 − 𝛼2 𝛽1 )𝑠(𝑒1 , 𝑒2 ) = det(𝑎, 𝑏) ⋅ 𝑠(𝑒1 , 𝑒2 ) . (110) Поэтому все функции площади пропорциональны определителю. С другой стороны, из свойств определителя (12) – (15) вытекает, что при любом 𝜆 ∈ 𝕜 функция 𝑠(𝑎, 𝑏) = 𝜆 ⋅ det(𝑎, 𝑏) удовле творяет соотношениям (17), (18) и при 𝜆 ≠ 0 является ненулевой. Следствие 1.2 На любом двумерном векторном пространстве 𝑉 имеется единственная с точностью до про порциональности ненулевая функция площади. Если векторы 𝑒 = (𝑒1 , 𝑒2 ) образуют в 𝑉 базис, а векторы 𝑎 = 𝛼1 𝑒1 + 𝛼2 𝑒2 и 𝑏 = 𝛽1 𝑒1 + 𝛽2 𝑒2 произвольны, то1 𝑠(𝑎, 𝑏)∕ 𝑠(𝑒1 , 𝑒2 ) = det𝑒 (𝑎, 𝑏) = 𝛼1 𝛽2 − 𝛼2 𝛽1 для любой ненулевой функции площади 𝑠 на пространстве 𝑉 . Следствие 1.3 Координаты вектора 𝑣 = 𝑎𝑥 + 𝑏𝑦 в любом базисе (𝑎, 𝑏) двумерного векторного пространства 𝑉 равны отношениям площадей 𝑥 = 𝑠(𝑣 , 𝑏)∕ 𝑠(𝑎, 𝑏), 𝑦 = 𝑠(𝑎, 𝑣 )∕ 𝑠(𝑎, 𝑏). 1.4. Аффинные2 пространства. Множество 𝔸 называется аффинным пространством над век торным пространством 𝑉 , если каждой упорядоченной паре точек 𝑎, 𝑏 ∈ 𝔸 сопоставлен вектор ⃖⃖⃖ 𝑎𝑏⃗ ∈ 𝑉 так, что для любой точки 𝑝 ∈ 𝔸 отображение векторизации с центром в 𝑝 𝑣𝑝 ∶ 𝔸 → 𝑉 , ⃖⃖⃖⃗ , 𝑞 ↦ 𝑝𝑞 взаимно однозначно, и для любых трёх (не обязательно различных) точек 𝑎, 𝑏, 𝑐 ∈ 𝔸 выполня ется правило треугольника ⃖⃖⃖ 𝑎𝑏⃗ + ⃖⃖⃖ 𝑏𝑐⃗ = ⃖⃖⃖ 𝑎𝑐⃗. 1 Здесь и далее мы обозначаем через det𝑒 (𝑎, 𝑏) определитель матрицы, образованной столбцами ко ординат векторов 𝑎, 𝑏 в базисе 𝑒 . 1 Термин аффинный не должен вызывать «греческих» реминисценций — это банальная калька с ан глийского affine (ассоциированный). 14 §1 Аффинная плоскость Иначе можно сказать, что с каждым вектором 𝑣 ∈ 𝑉 связано биективное преобразование сдвига1 на вектор 𝑣 𝜏𝑣 ∶ 𝔸 → 𝔸 , 𝑝 ↦ 𝑝+𝑣, со следующими двумя свойствами: для каждой пары точек 𝑝, 𝑞 ∈ 𝔸 имеется единственный такой вектор 𝑣 ∈ 𝑉 , что 𝑝 + 𝑣 = 𝑞 , и для любых векторов 𝑢, 𝑤 ∈ 𝑉 выполняется равенство 𝜏𝑢 ∘ 𝜏𝑣 = 𝜏𝑢+𝑤 . Второе описание эквивалентно первому: вектор 𝑣 ∈ 𝑉 со свойством 𝑝 + 𝑣 = 𝑞 , о котором идёт ⃖⃖⃖⃗ из первого определения, а правило треугольника из речь во втором определении, это вектор 𝑝𝑞 первого определения означает равенство 𝜏𝑢 ∘ 𝜏𝑣 = 𝜏𝑢+𝑤 во втором. ⃖⃖⃖⃗ = 0 для всех точек Упражнение 1.6. Убедитесь в этом и выведите из определений, что: а) 𝑎𝑎 ⃖⃖⃖ ⃗ ⃖⃖⃖ ⃗ ⃖⃖⃖ ⃗ ⃖⃖⃖⃗ 𝑎 ∈ 𝔸 б) ⃖⃖⃖ 𝑝𝑞⃗ = −⃖⃖⃖ 𝑞𝑝⃗ для всех точек 𝑝, 𝑞 ∈ 𝔸 в) 𝑎𝑏 = 𝑑𝑐 ⇔ 𝑏𝑐 = 𝑎𝑑 для любой четвёрки точек 𝑎, 𝑏, 𝑏, 𝑑 ∈ 𝔸. Убедитесь также, что во втором определении требование биективности всех преобразований 𝜏𝑣 ∶ 𝔸 → 𝔸 можно заменить требованием, чтобы сдвиг на нулевой вектор действовал тождественно: 𝜏0 = Id𝔸 . Пример 1.5 (аффинная координатная плоскость 𝔸2 ) Множество 𝔸2 = 𝔸2 (𝕜), точками которого являются пары чисел 𝑝 = (𝑝1 , 𝑝2 ) из поля 𝕜 и точкам 𝑝, 𝑞 сопоставляется вектор ⃖⃖⃖ 𝑝𝑞⃗ = 𝑞 − 𝑝 = (𝑞1 − 𝑝1 , 𝑞2 − 𝑝2 ) очевидно удовлетворяет предыдущим определениям. Оно называется аффинной координатной плоскостью над полем 𝕜. Пример 1.6 (приведённые квадратные трёхчлены) Пространство 𝒫2 , точками которого являются приведённые2 квадратные трёхчлены 𝑝(𝑥 ) = 𝑥 2 + 𝑝1 𝑥 + 𝑝2 ∈ 𝕜[𝑥 ] , не является векторным пространством, поскольку сумма приведённых многочленов и произве дение приведённого многочлена на число не являются приведёнными многочленами. Однако разности 𝑞 − 𝑝 = (𝑞1 − 𝑝1 )𝑥 +(𝑞2 − 𝑝2 ) приведённых трёхчленов 𝑞 = 𝑥 2 + 𝑞1 𝑥 + 𝑞2 и 𝑝 = 𝑥 2 + 𝑝1 𝑥 + 𝑝2 образуют векторное пространство 𝑉 = 𝕜[𝑥 ]⩽1 многочленов степени ⩽ 1, и при произвольно зафиксированном многочлене 𝑝 сопоставление 𝑞 ↦ ⃖⃖⃖ 𝑝𝑞⃗ ≝ (𝑞1 − 𝑝1 , 𝑞2 − 𝑝2 ) устанавливает би екцию между 𝒫2 и 𝑉 , удовлетворяющую предыдущим определениям. Поэтому пространство 𝒫2 является аффинной плоскостью над пространством многочленов степени ⩽ 1. Пример 1.7 (аффинизация векторного пространства) Из каждого векторного пространства 𝑉 можно изготовить аффинное пространство 𝔸(𝑉 ), назы ваемое аффинизацией векторного пространства 𝑉 . Точками пространства 𝔸(𝑉 ) по определению являются векторы из 𝑉 . В пространстве 𝔸(𝑉 ) имеется выделенная точка 0, отвечающая нуле вому вектору, а все остальные точки продуктивно воспринимать как «концы» всевозможных «радиусвекторов» 𝑣 ∈ 𝑉 , отложенных от нулевой точки. Сдвиг 𝜏𝑣 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) переводит точку 𝑎, отвечающую радиусвектору 𝑎 ∈ 𝑉 , в точку 𝑎 + 𝑣 , отвечающую радиусвектору 𝑎 + 𝑣 . 1 2 Или откладывание вектора 𝑣 от точек 𝑝 ∈ 𝔸. Т. е. со старшим коэфффициентом 1. 15 1.4. Аффинные пространства 1.4.1. Аффинная система координат на аффинной плоскости 𝔸2 по определению состо ит из произвольно взятой точки 𝑜 ∈ 𝔸2 и базиса 𝑒1 , 𝑒2 в векторном пространстве 𝑉 . Тройку (𝑜; 𝑒1 , 𝑒2 ) также называют координатным репером c началом в 𝑜 и базисом 𝑒1 , 𝑒2 . Каждый коор динатный репер устанавливает биекцию между точками плоскости 𝔸2 и парами чисел, сопо ставляющую точке 𝑝 ∈ 𝔸2 координаты вектора ⃖⃖⃖ 𝑜𝑝⃗ в базисе 𝑒1 , 𝑒2 . Эти координаты называются аффинными координатами точки 𝑝 относительно репера (𝑜; 𝑒1 , 𝑒2 ). ⃖⃖⃖⃗ в произвольном базисе (𝑒1 , 𝑒2 ) Упражнение 1.7. Убедитесь, что столбец координат вектора 𝑝𝑞 2 пространства 𝕜 равен разности 𝑞 − 𝑝 столбцов координат точек 𝑞 , 𝑝 ∈ 𝔸(𝕜2 ) относительно любого репера (𝑜; 𝑒1 , 𝑒2 ) на аффинной плоскости 𝔸(𝕜2 ) вне зависимости от выбора началь ной точки 𝑜 этого репера. Так, в прим. 1.6 коэффициенты (𝑝1 , 𝑝2 ) трёхчлена 𝑥 2 + 𝑝1 𝑥 + 𝑝2 ∈ 𝒫2 являются его координатами относительно репера (𝑜; 𝑒1 , 𝑒2 ) с начальной точкой 𝑜 = 𝑥 2 ∈ 𝒫2 и стандартным базисом 𝑒1 = 𝑥 , 𝑒2 = 1 в векторном пространстве 𝕜[𝑥 ]⩽1 . 1.4.2. Барицентры и барицентрические комбинации точек. Для любого конечного на бора точек 𝑝1 , … , 𝑝𝑚 в аффинном пространстве 𝔸 и любых чисел 𝜇1 , … , 𝜇𝑚 ∈ 𝕜 с ненулевой суммой 𝜇 = ∑ 𝜇𝑖 ≠ 0 существует единственная такая точка 𝑐 ∈ 𝔸, что 𝜇1 ⃖⃖⃖ 𝑐𝑝⃗1 + 𝜇2 ⃖⃖⃖ 𝑐𝑝⃗2 + ⋯ + 𝜇𝑚 ⃖⃖⃖ 𝑐𝑝⃗𝑚 = 0 . (111) В самом деле, задавшись произвольной начальной точкой 𝑜 ∈ 𝔸, мы можем для любой точки 𝑐 ∈ 𝔸 записать сумму из левой части (111), как ∑ 𝜇𝑖 ⃖⃖⃖ 𝑐𝑝⃗𝑖 = ∑ 𝜇𝑖 (⃖⃖⃖ 𝑜𝑝⃗𝑖 − ⃖⃖⃖ 𝑜𝑐⃗) = −𝜇 ⃖⃖⃖ 𝑜𝑐⃗ + ∑ ⃖⃖⃖⃗𝑖 . 𝜇𝑖 𝑜𝑝 Поэтому соотношение (111) выполняется для единственной точки 𝑐 с радиус вектором 𝑚 ⃖⃖⃖ 𝑜𝑐⃗ = 𝜇𝑖 ⃖⃖⃖⃗𝑖 . ⋅ 𝑜𝑝 ∑ 𝜇 𝑖=1 (112) 𝜇 𝜇 𝑝 𝑝 𝑝 𝑐 𝑝 𝑝 𝛤 𝜇 𝜇 𝜇 Рис. 1⋄6. Моменты сил. Эта точка называется центром тяжести или барицентром точек 𝑝𝑖 с весами 𝜇𝑖 . Термин при шёл из механики: если поместить аффинное пространство 𝔸 в пространство на единицу боль шей размерности в качестве горизонтальной гиперплоскости 𝛤 , как на рис. 1⋄6, и приложить к каждой точке 𝑝𝑖 силу 𝜇𝑖 , направленную перпендикулярно вниз при 𝜇 > 0, и вверх при 𝜇 < 0, то 16 §1 Аффинная плоскость равенство (111) будет означать равенство нулю суммы моментов всех этих сил относительно точки 𝑐 . Если оно выполняется, плоскость 𝛤 останется неподвижной, удерживаемая ровно за одну точку 𝑐 . Так как по предыдущему точка 𝑐 однозначно определяется соотношением (111), в котором точка 𝑜 никак не участвует, точка 𝑚 𝑜 + ⃖⃖⃖ 𝑜𝑐⃗ = 𝑜 + 𝜇𝑖 ⃖⃖⃖⃗𝑖 ⋅ 𝑜𝑝 ∑ 𝜇 𝑖=1 не зависит от выбора точки 𝑜. Поэтому для любого набора точек 𝑝1 , … , 𝑝𝑚 и любых констант 𝜇1 , … , 𝜇𝑚 с суммой ∑ 𝜇𝑖 = 1, точка 𝑚 𝜇1 𝑝1 + 𝜇2 𝑝2 + ⋯ + 𝜇𝑚 𝑝𝑚 ≝ 𝑜 + ∑ ⃖⃖⃖⃗𝑖 𝜇𝑖 ⋅ 𝑜𝑝 (113) 𝑖=1 не зависит от выбора начальной точки 𝑜, что и оправдывает обозначение, использованное в левой части (113). Точка (113) называется барицентрической комбинацией точек 𝑝1 , … , 𝑝𝑚 с весами 𝜇1 , … , 𝜇𝑚 . Упражнение 1.8 (группирование масс). Пусть набор точек 𝑝𝑖 с весами 𝜇𝑖 и набор точек 𝑞𝑗 с весами 𝜈𝑗 имеют центры тяжести в точках 𝑝 и 𝑞 , причём обе суммы весов: 𝜇 = ∑ 𝜇𝑖 и 𝜈 = ∑ 𝜈𝑗 , а также их сумма 𝜇 + 𝜈 ненулевые. Убедитесь, что центр тяжести объединения всех точек1 𝑝𝑖 и 𝑞𝑗 совпадает с центром тяжести точек 𝑝 и 𝑞 , взятых с весами 𝜇 и 𝜈. Убедитесь также, что любая барицентрическая комбинация ∑𝑖 𝑦𝑖 𝑝𝑖 точек 𝑝𝑖 , 1 ⩽ 𝑖 ⩽ 𝑚, каждая из которых в свою очередь является барицентрической комбинацией 𝑝𝑖 = ∑𝑗 𝑥𝑖𝑗 𝑞𝑖𝑗 каких то ещё точек 𝑞𝑖𝑗 , 1 ⩽ 𝑗 ⩽ 𝑘𝑖 , тоже представляется в виде барицентрической комбинации ∑𝑖𝑗 𝑧𝑖𝑗 𝑞𝑖𝑗 тех же точек 𝑞𝑖𝑗 , причём если все 𝑦𝑖 ⩾ 0 и все 𝑥𝑖𝑗 ⩾ 0, то и все 𝑧𝑖𝑗 ⩾ 0. 1.5. Прямые. Три точки 𝑎, 𝑏, 𝑝 аффинного пространства называются коллинеарными, если век ⃖⃖⃖⃗ и ⃖⃖⃖ торы 𝑝𝑎 𝑝𝑏⃗ пропорциональны. Например, это так, когда какието две из трёх точек совпадают друг с другом. Если 𝑎 ≠ 𝑏 пропорциональность векторов ⃖⃖⃖ 𝑝𝑎⃗ и ⃖⃖⃖ 𝑝𝑏⃗ означает, что при некоторых 𝛼, 𝛽 ∈ 𝕜, не обращающихся одновременно в нуль, выполняются равносильные друг другу ра венства 𝛽 𝛼 𝛽 ⋅ ⃖⃖⃖ 𝑝𝑎⃗ + 𝛼 ⋅ ⃖⃖⃖ 𝑝𝑏⃗ = 0 ⟺ 𝑝 = ⋅𝑎+ ⋅𝑏. 𝛼+𝛽 𝛼+𝛽 В этом случае говорят, что точка 𝑝 делит точки 𝑎 и 𝑏 в отношении 𝛼 ∶ 𝛽 . Иначе можно сказать, что точка 𝑝 является барицентрической комбинацией точек 𝑎 и 𝑏 с весами 𝛽∕(𝛼 + 𝛽 ) и 𝛼∕(𝛼 + 𝛽 ) соответственно. Каждая точка 𝑝=𝑜+ 𝛽 𝛽 𝛼 𝛼 ⃖⃖⃖⃗ + ⋅ 𝑜𝑎 ⋅ ⃖⃖⃖ 𝑜𝑏⃗ = 𝑎 + ⋅ ⃖⃖⃖ 𝑎𝑏⃗ = 𝑏 + ⋅ ⃖⃖⃖ 𝑏𝑎⃗ , 𝛼+𝛽 𝛼+𝛽 𝛼+𝛽 𝛼+𝛽 коллинеарная паре различных точек 𝑎 ≠ 𝑏, однозначно определяется отношением 𝛼 ∶ 𝛽 , кото ⃖⃖⃖⃗, т. е. ⃖⃖⃖⃗ = 𝑝𝑏 рое может принимать любые значения, отличные от −1, ибо 𝛼 = −𝛽 означает, что 𝑝𝑎 𝑎 = 𝑏. При этом значения 𝛼∶𝛽=0∶1=0 и 𝛼∶𝛽=1∶0=∞ 1 Если какаято из точек 𝑝𝑖 совпадает с некоторой точкой 𝑞𝑗 , то их «объединение» заключается в сло жении весов. 17 1.5. Прямые допустимы и отвечают точкам 𝑝 = 𝑎 и 𝑝 = 𝑏 соответственно. Равновесный барицентр1 𝑐= 𝑎+𝑏 , 2 делящий 𝑎 и 𝑏 в отношении 1 ∶ 1, называется серединой или центром точек 𝑎 ≠ 𝑏. Множество всех точек 𝑥 , коллинеарных двум заданным различным точкам 𝑎 ≠ 𝑏, называется прямой и обозначается 𝑣 𝑥 (𝑎𝑏) ≝ {𝑥 = 𝛼𝑎 + 𝛽𝑏 | 𝛼, 𝛽 ∈ 𝕜 , 𝛼 + 𝛽 = 1} . Иначе прямую (𝑎𝑏) в аффинном пространстве 𝔸 над вектор ным пространством 𝑉 можно описать как ГМТ вида 𝑥 = 𝑎 + 𝑣𝑡, 𝑎 где 𝑡 пробегает основное поле 𝕜, а 𝑝 ∈ 𝔸 и 𝑣 ∈ 𝑉 суть фик сированные точка и ненулевой вектор, называемые началь ной точкой и направляющим вектором или вектором скоро сти прямой (𝑎𝑏). 𝑣 𝑣 𝑜 Рис. 1⋄7. Уравнение прямой. Предложение 1.1 На аффинной плоскости проходящая через точку 𝑎 = (𝑎1 , 𝑎2 ) прямая с вектором скорости 𝑣 = = (𝑣1 , 𝑣2 ) описывается в координатах (𝑥1 , 𝑥2 ) относительно произвольного репера уравнением det(𝑥, 𝑣) = det(𝑎, 𝑣) или 𝑣2 𝑥1 − 𝑣1 𝑥2 = 𝑣2 𝑎1 − 𝑣1 𝑎2 . (114) Наоборот, множество всех решений 𝑥 = (𝑥1 , 𝑥2 ) любого уравнения 𝛼1 𝑥1 + 𝛼2 𝑥2 = 𝛽 с не рав ными одновременно нулю коэффициентами 𝛼1 , 𝛼2 ∈ 𝕜 представляет собою прямую с вектором скорости, пропорциональным вектору 𝑣 = (𝛼2 , −𝛼1 ). ⃖⃖⃖⃗ = (𝑥1 , 𝑥2 ) и Доказательство. Обозначим начало координат через 𝑜 и рассмотрим векторы 𝑜𝑥 ⃖⃖⃖⃗ = (𝑎1 , 𝑎2 ). Равенство det(𝑣, 𝑥) = det(𝑣, 𝑎) равносильно равенству 0 = det(𝑣, 𝑎𝑥 ⃖⃖⃖⃗) = 0, озна 𝑜𝑎 ⃖⃖⃖⃗ и 𝑣. чающему пропорциональность векторов 𝑎𝑥 Замечание 1.1. На геометрическом языке уравнение (114) констатирует равенство площадей жёлтого и синего параллелограммов на рис. 1⋄7. Упражнение 1.9. Напишите уравнение прямой, параллельной вектору (5, 2) и проходящей че рез точку (2, −3), а также прямой, проходящей через точки (−3, 5) и (4, −1), и нарисуйте на клетчатой бумаге прямые, заданные уравнениями 3𝑥1 + 5𝑥2 = −1 и 2𝑥1 − 3𝑥2 = 5. Пример 1.8 (пересечение прямых) Если левые части уравнений 𝛼1 𝑥1 + 𝛼2 𝑥2 = 𝛾 и 𝛽1 𝑥1 + 𝛽2 𝑥2 = 𝛿 не пропорциональны, то решения 𝑥 = (𝑥1 , 𝑥2 ) системы 𝛼1 𝑥1 + 𝛼2 𝑥2 = 𝛾 { 𝛽1 𝑥1 + 𝛽2 𝑥2 = 𝛿 , 1 (115) Обратите внимание, что он существует над любым полем 𝕜, в котором 2 ≝ 1 + 1 ≠ 0. Если основное поле 𝕜 имеет характеристику char(𝕜) = 2, т. е. 1 + 1 = 0 в 𝕜, то середина не определена. 18 §1 Аффинная плоскость суть координаты вектора ров 𝑒1 = 𝛾 в координатном пространстве 𝕜2 относительно базиса из векто (𝛿 ) 𝛼1 𝛼2 и𝑒 . По правилу Крамера1 они равны ( 𝛽1 ) 2 ( 𝛽2 ) 𝑥1 = det 𝛾 𝛼2 𝛼 ∶ det 1 (𝛿 𝛽2 ) (𝛼2 𝛽1 , 𝛽2 ) 𝑥2 = det 𝛼1 ( 𝛽1 𝛾 𝛼 ∶ det 1 (𝛼2 𝛿) 𝛽1 . 𝛽2 ) (116) Таким образом, прямые с непропорциональными скоростями пересекаются в единственной точке, координаты которой выражаются через коэффициенты задающих эти прямые уравне ний (115) по формулам (116). Например, прямые 3𝑥1 + 5𝑥2 = −1 и 2𝑥1 − 3𝑥2 = 5 из упр. 1.9 пересекаются в точке с координатами 𝑥1 = 22 ∕ 19, 𝑥2 = −17 ∕ 19. Если же левые части уравнений (115) пропорциональны, скажем: 𝛽1 = 𝜆𝛼1 и 𝛽2 = 𝜆𝛼2 , то при 𝛿 ≠ 𝜆𝛾 задаваемые этими уравнениями прямые параллельны, а при 𝛿 = 𝜆𝛾 они совпадают друг с другом. Таким образом, на аффинной плоскости 𝔸2 над произвольным полем 𝕜 выполняются ев клидовы аксиомы, описывающие взаимное расположение прямых и точек на плоскости, т. е. справедливо Предложение 1.2 Через любые две различные точки аффинной плоскости проходит ровно одна прямая. Через любую точку, не лежащую на произвольно заданной прямой 𝓁, проходит ровно одна прямая, не пересекающая прямую 𝓁. 1.6. Треугольники. В этом разделе мы предполагаем, что 2 ≝ 1 + 1 ≠ 0 в поле 𝕜. Фигура, обра зованная на аффинной плоскости тремя неколлинеарными точками 𝑎, 𝑏, 𝑐 и соединяющими их прямыми (𝑎𝑏), (𝑏𝑐 ), (𝑐𝑎), называется треугольником ▵ 𝑎𝑏𝑐 . Зафиксируем какуюнибудь нену левую функцию площади 𝑠 и назовём площадью ориентированного треугольника ▵ 𝑎𝑏𝑐 полови ну площади ориентированного параллелограмма, натянутого на упорядоченную пару векторов ⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗: 𝑠(𝑎𝑏𝑐 ) ≝ 𝑠(⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗)∕ 2 . (117) Предложение 1.3 Для любого треугольника ▵ 𝑎𝑏𝑐 и любой точки 𝑝 выполняются соотношения: 𝑠(𝑎𝑏𝑐 ) = 𝑠(𝑏𝑐𝑎) = 𝑠(𝑐𝑎𝑏) = −𝑠(𝑏𝑎𝑐 ) = −𝑠(𝑎𝑐𝑏) = −𝑠(𝑐𝑏𝑎) (118) 𝑠(𝑎𝑏𝑐 ) = 𝑠(𝑝𝑎𝑏) + 𝑠(𝑝𝑏𝑐 ) + 𝑠(𝑝𝑐𝑎) . (119) Доказательство. Для доказательства соотношений (118) достаточно проверить равенства 𝑠(𝑏𝑐𝑎) = 𝑠(𝑎𝑏𝑐 ) и 𝑠(𝑏𝑎𝑐 ) = −𝑠(𝑎𝑏𝑐 ) , которые вытекают из билинейности и кососимметричности площади параллелограмма: 2𝑠(𝑏𝑐𝑎) = 𝑠(⃖⃖⃖ 𝑏𝑐⃗, ⃖⃖⃖ 𝑏𝑎⃗) = 𝑠(⃖⃖⃖ 𝑏𝑎⃗ + ⃖⃖⃖ 𝑎𝑐⃗, ⃖⃖⃖ 𝑏𝑎⃗) = 𝑠(⃖⃖⃖ 𝑎𝑐⃗, ⃖⃖⃖ 𝑏𝑎⃗) = 𝑠(⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗) = 2𝑠(𝑎𝑏𝑐 ) ⃖⃖⃖⃗, ⃖⃖⃖ ⃖⃖⃖⃗, 𝑏𝑎 ⃖⃖⃖⃗ + ⃖⃖⃖ ⃖⃖⃖⃗, ⃖⃖⃖ ⃖⃖⃖⃗, ⃖⃖⃖ 2𝑠(𝑏𝑎𝑐 ) = 𝑠(𝑏𝑎 𝑏𝑐⃗) = 𝑠(𝑏𝑎 𝑎𝑐⃗) = 𝑠(𝑏𝑎 𝑎𝑐⃗) = −𝑠(𝑎𝑏 𝑎𝑐⃗) = −2𝑠(𝑎𝑏𝑐 ) . 1 См. лем. 1.2 на стр. 11. 19 1.6. Треугольники Равенство (119) проверяется примерно так же: ⃖⃖⃖⃗ + ⃖⃖⃖ ⃖⃖⃖⃗) + 𝑠(⃖⃖⃖ 2𝑠(𝑎𝑏𝑐 ) = 𝑠(⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗) = 𝑠(⃖⃖⃖ 𝑎𝑝⃗ + ⃖⃖⃖ 𝑝𝑏⃗, 𝑎𝑝 𝑝𝑐⃗) = 𝑠(⃖⃖⃖ 𝑎𝑝⃗, ⃖⃖⃖ 𝑝𝑐⃗) + 𝑠(⃖⃖⃖ 𝑝𝑏⃗, 𝑎𝑝 𝑝𝑏⃗, ⃖⃖⃖ 𝑝𝑐⃗) = ⃖⃖⃖⃗) + 𝑠(⃖⃖⃖ = 𝑠(⃖⃖⃖ 𝑝𝑐⃗, 𝑝𝑎 𝑝𝑎⃗, ⃖⃖⃖ 𝑝𝑏⃗) + 𝑠(⃖⃖⃖ 𝑝𝑏⃗, ⃖⃖⃖ 𝑝𝑐⃗) = 2(𝑠(𝑝𝑎𝑏) + 𝑠(𝑝𝑏𝑐 ) + 𝑠(𝑝𝑐𝑎)) . Пример 1.9 (площади ориентированных многоугольников) Над полем 𝕜 = ℝ формула (118) имеет следующее наглядное описание. Будем называть ориен тацией треугольника выбор одного из двух возможных направлений обхода его контура. Обход против часовой стрелки, при котором треугольник остаётся слева по ходу движения, считает ся положительным, и площади таких треугольников положительны. Площади треугольников, обходимых по часовой стрелке отрицательны. Ориентация треугольников согласована с обсуж давшейся на стр. 12 ориентацией параллелограммов: если выпустить из вершины треугольника два вектора по его сторонам, то ориентация натянутого на них параллелограмма совпадает с той ориентацией контура треугольника, что задаётся движением от конца первого вектора к концу второго по противолежащему выбранной вершине основанию, см. рис. 1⋄8. 𝑐 𝑐 𝑝 𝑎 𝑎 𝑏 Рис. 1⋄8. 2𝑠(𝑎𝑏𝑐 ) = 𝑏 Рис. 1⋄9. ⃖⃖⃖⃗, ⃖⃖⃖ det(𝑎𝑏 𝑎𝑐⃗). 𝑠(𝑎𝑏𝑐 ) = 𝑠(𝑝𝑎𝑏) + 𝑠(𝑝𝑏𝑐 ) + 𝑠(𝑝𝑐𝑎). При таких договорённостях об ориентации, формула (119) утверждает, что площадь ориен тированного треугольника 𝑎𝑏𝑐 можно вычислять обходя его контур против часовой стрелки и складывая площади опирающихся на его стороны треугольников с вершиной в произвольно зафиксированной точке 𝑝, при этом исходящие из 𝑝 векторы, используемые для вычисления площадей, всегда упорядочиваются по ходу движения. Так на рис. 1⋄9 площадь ▵ 𝑝𝑏𝑐 войдёт в сумму со знаком плюс, а площади ▵ 𝑝𝑎𝑏 и ▵ 𝑝𝑎𝑐 — с минусами, что и даст площадь ▵ 𝑎𝑏𝑐 . Полученная формула очевидным образом обобщается на произвольную, возможно даже са мопересекающуюся, как на рис. 1⋄10, замкнутую ломаную 𝑞0 𝑞1 … 𝑞𝑚 , у которой 𝑞𝑚 = 𝑞0 . Об ходя контур ломаной против часовой стрелки и складывая площади опирающихся на её звенья треугольников с вершиной в произвольно заданной точке 𝑝, мы получим сумму 𝑚−1 𝑚−1 1 det(⃖⃖⃖ 𝑝𝑞⃗𝑖+1 ) 𝑠(𝑝𝑞𝑖 𝑞𝑖+1 ) = 𝑝𝑞⃗𝑖 , ⃖⃖⃖ ∑ ∑ 2 𝑖=0 𝑖=0 равную сумме взятых с надлежащими знаками площадей многоугольников, ограничиваемых этой ломаной. А именно, многоугольники контур которых обходится против часовой стрелки1 , 1 Т. е. многоугольники, лежащие слева по ходу движения вдоль ломаной. 20 §1 Аффинная плоскость надлежит учитывать со знаком плюс, а многоугольники, обходимые по часовой стрелке1 — со знаком минус. 𝑞 =𝑞 𝑞 𝑝 + + 𝑞 𝑎 − 𝑏 𝑞 𝑞 4 Рис. 1⋄10. ∑ 𝑠(𝑝𝑞𝑖 𝑞𝑖+1 ) = 𝑠(𝑞0 𝑞1 𝑎) − 𝑠(𝑏𝑎𝑞4 ) + 𝑠(𝑏𝑞2 𝑞3 ). 𝑖=0 Упражнение 1.10. Покажите, ориентированные площади треугольников с общей вершиной и лежащими на одной прямой основаниями относятся как эти ориентированные основания, т. е. для любых трёх коллинеарных точек 𝑎, 𝑏, 𝑐 и произвольной точки 𝑝 выполняется ра венство 𝑠(𝑝𝑎𝑏) ∶ 𝑠(𝑝𝑏𝑐 ) = ⃖⃖⃖ 𝑎𝑏⃗ ∶ ⃖⃖⃖ 𝑏𝑐⃗, где справа стоит такое число 𝜆 ∈ 𝕜, что 𝜆 ⋅ ⃖⃖⃖ 𝑏𝑐⃗ = ⃖⃖⃖ 𝑎𝑏⃗. 1.6.1. Барицентрические координаты. Зафиксируем на плоскости какойнибудь треуголь ник ▵ 𝑎𝑏𝑐 и сопоставим каждой тройке чисел 𝛼 , 𝛽 , 𝛾 ∈ 𝕜 с суммой 𝛼 + 𝛽 + 𝛾 = 1 точку 𝑝 = 𝛼⋅𝑎+𝛽⋅𝑏+𝛾⋅𝑐. Покажем, что это сопоставление устанавливает биекцию между такого рода тройками чисел ⃖⃖⃖⃗ + 𝛾 ⋅ ⃖⃖⃖ ⃖⃖⃖⃗ = 𝛽 ⋅ 𝑎𝑏 и точками плоскости. Равенство 𝑝 = 𝛼 ⋅ 𝑎 + 𝛽 ⋅ 𝑏 + 𝛾 ⋅ 𝑐 означает, что 𝑎𝑝 𝑎𝑐⃗, ⃖⃖⃖ ⃗ ⃖⃖⃖⃗ в базисе 𝑎𝑏, ⃖⃖⃖ т. е. числа 𝛽 , 𝛾 являются координатами вектора 𝑎𝑝 𝑎𝑐⃗. Так как пары координат би ективно соответствуют векторам, а векторы ⃖⃖⃖ 𝑎𝑝⃗ — точкам 𝑝, мы имеем биекцию между точка ми 𝑝 и произвольными парами чисел (𝛽 , 𝛾). Но такие пары биективно соответствуют тройкам (𝛼, 𝛽, 𝛾) = (1 − 𝛽 − 𝛾, 𝛽, 𝛾). Числа 𝛼, 𝛽, 𝛾 ∈ 𝕜 с суммой 𝛼 + 𝛽 + 𝛾 = 1 называются барицентриче скими координатами точки 𝑝 = 𝛼 ⋅ 𝑎 + 𝛽 ⋅ 𝑏 + 𝛾 ⋅ 𝑐 относительно ▵ 𝑎𝑏𝑐 . Использование тройки чисел 𝛼 , 𝛽 , 𝛾, связанных соотношением 𝛼 + 𝛽 + 𝛾 = 1, вместо пары чисел 𝛽 , 𝛾 часто оказывается более удобным, поскольку не привязано к выбору той или иной вершины в треугольнике, что позволяет видеть и использовать имеющиеся в задаче симметрии. Пример 1.10 (барицентрические координаты как отношения площадей) ⃖⃖⃖⃗ ∈ 𝑉 по базису ⃖⃖⃖ Согласно правилу Крамера2 , разложение произвольного вектора 𝑎𝑝 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗ имеет вид 𝑠(⃖⃖⃖ 𝑎𝑝⃗, ⃖⃖⃖ 𝑎𝑐⃗) ⃖⃖⃖⃗ 𝑠(⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑝⃗) 𝑠(𝑎𝑝𝑐 ) ⃖⃖⃖⃗ 𝑠(𝑎𝑏𝑝) ⃖⃖⃖ 𝑎𝑝⃗ = ⋅ 𝑎𝑏 + ⋅ ⃖⃖⃖ 𝑎𝑐⃗ = ⋅ 𝑎𝑏 + ⋅ ⃖⃖⃖ 𝑎𝑐⃗ . 𝑠(𝑎𝑏𝑐 ) 𝑠(𝑎𝑏𝑐 ) 𝑠(⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗) 𝑠(⃖⃖⃖ 𝑎𝑏⃗, ⃖⃖⃖ 𝑎𝑐⃗) Поэтому барицентрические координаты (𝛼 , 𝛽 , 𝛾) точки 𝑝 относительно ▵ 𝑎𝑏𝑐 равны 𝛾= 1 2 𝑠(𝑎𝑏𝑝) , 𝑠(𝑎𝑏𝑐 ) 𝛽= 𝑠(𝑝𝑐𝑎) , 𝑠(𝑎𝑏𝑐 ) 𝛼 =1−𝛽−𝛾 = Т. е. лежащие справа по ходу движения. См. сл. 1.3 на стр. 13. 𝑠(𝑎𝑏𝑐 ) − 𝑠(𝑎𝑏𝑝) − 𝑠(𝑝𝑐𝑎) 𝑠(𝑝𝑏𝑐 ) = , 𝑠(𝑎𝑏𝑐 ) 𝑠(𝑎𝑏𝑐 ) 1.6. Треугольники 21 т. е. являются отношениями площадей треугольников с вершиной 𝑝 и основаниями на сторо нах ▵ 𝑎𝑏𝑐 к площади треугольника ▵ 𝑎𝑏𝑐 , ориентированных так, что стороны ▵ 𝑎𝑏𝑐 проходятся в одном направлении как при обходе самого ▵ 𝑎𝑏𝑐 , так и при обходе каждого из треугольников с вершиной в точке 𝑝: 𝑠(𝑝𝑏𝑐 ) 𝑠(𝑎𝑝𝑐 ) 𝑠(𝑎𝑏𝑝) 𝑝= ⋅𝑎+ ⋅𝑏+ ⋅𝑐. (120) 𝑠(𝑎𝑏𝑐 ) 𝑠(𝑎𝑏𝑐 ) 𝑠(𝑎𝑏𝑐 ) Пример 1.11 (центр треугольника) Равновесный барицентр 𝑜 = (𝑎 + 𝑏 + 𝑐 ) ∕ 3 вершин треуголь 𝑏 ника ▵ 𝑎𝑏𝑐 называется центром этого треугольника. Согласно упр. 1.8 точка 𝑜 является центром тяжести любой из вершин и 2 2 середины противолежащей ей стороны, взятой с весом 2. Та 𝑜 ким образом, 𝑜 является точкой пересечения медиан ▵ 𝑎𝑏𝑐 и делит каждую из них в отношении 2 ∶ 1, считая от вершины 𝑐 𝑎 2 (см. рис. 1⋄11). Из формулы (120) вытекает, что центр тре угольника однозначно характеризуется как единственная та Рис. 1⋄11. Центр треугольника. кая точка 𝑜, для которой 𝑠(𝑜𝑎𝑏) = 𝑠(𝑜𝑏𝑐 ) = 𝑠(𝑜𝑐𝑎). §2. Аффинные преобразования 2.1. Преобразования, переводящие прямые в прямые. Рассмотрим ассоциированную с дву мерным векторным пространством 𝑉 над произвольным полем 𝕜 аффинную плоскость 𝔸(𝑉 ). Биективное отображение 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) называется полуаффинным, если оно переводит пря мые в прямые. Такие отображения составляют группу преобразований плоскости 𝔸(𝑉 ) в смысле определения со стр 5. 2.1.1. Дифференциал полуаффинного преобразования. В силу своей биективности, каж дое полуаффинное преобразование 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) переводит параллельные прямые в парал ⃖⃖⃖⃗ = ⃖⃖⃗ лельные, а значит, параллелограммы — в параллелограммы. Поэтому из равенства 𝑝𝑞 𝑟𝑠 вытекает равенство ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑝)𝜑(𝑞⃗) = ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃗ 𝜑(𝑟)𝜑(𝑠). Это равенство верно, даже когда точки 𝑝, 𝑞, 𝑟, 𝑠 кол линеарны и не образуют параллелограмма: в этом случае надо выбрать вектор ⃖⃖⃖ 𝑥𝑦⃗ = ⃖⃖⃖ 𝑝𝑞⃗ = ⃖⃖⃗ 𝑟𝑠 на параллельной (𝑝𝑞 ) прямой (𝑥𝑦) ≠ (𝑝𝑞 ), как на рис. 2⋄1, и использовать параллелограммы 𝑝𝑥𝑦𝑞 и 𝑟𝑥𝑦𝑠. Мы заключаем, что каждое полуаффинное отображение 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) корректно задаёт отображение векторов 𝐷𝜑 ∶ 𝑉 → 𝑉 , ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃗ ↦ 𝜑 𝑝𝑞 (𝑝)𝜑(𝑞⃗) , (21) которое называется дифференциалом отображения 𝜑. Отображение 𝜑 однозначно восстанавли вается, если известен его дифференциал и образ 𝜑(𝑝) хоть какойнибудь точки 𝑝: произвольная точка 𝑞 переводится преобразованием 𝜑 в точку 𝜑(𝑞 ) = 𝜑(𝑝) + ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑝)𝜑(𝑞⃗) = 𝜑(𝑝) + 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗). 𝑦 𝑥 𝑣 𝑣 +𝑤 𝑣 𝑟 𝑝 𝑠 𝑞 𝑢 Рис. 2⋄1. Корректность определения 𝐷𝜑 . 𝑤 Рис. 2⋄2. Аддитивность 𝐷𝜑 . Так как 𝜑 переводит параллелограмм со сторонами 𝑢, 𝑤 в параллелограмм со сторонами 𝐷𝜑 (𝑢) и 𝐷𝜑 (𝑤), дифференциал аддитивен: 𝐷𝜑 (𝑢 + 𝑤) = 𝐷𝜑 (𝑢) + 𝐷𝜑 (𝑤) , (22) причём это равенство справедливо даже когда векторы 𝑢 и 𝑤 пропорциональны, поскольку век тор 𝑢 всегда можно представить в виде суммы векторов 𝑣1 и 𝑣2 , каждый из которых не пропор ционален 𝑢, как на рис. 2⋄2, и тогда 𝐷𝜑 (𝑢 + 𝑤) = 𝐷𝜑 (𝑣1 + 𝑣2 + 𝑤) = 𝐷𝜑 (𝑣1 ) + 𝐷𝜑 (𝑣2 + 𝑤) = = 𝐷𝜑 (𝑣1 ) + 𝐷𝜑 (𝑣2 ) + 𝐷𝜑 (𝑤) = 𝐷𝜑 (𝑣1 + 𝑣2 ) + 𝐷𝜑 (𝑤) = 𝐷𝜑 (𝑢) + 𝐷𝜑 (𝑤) . Поскольку 𝜑 переводит прямые в прямые, 𝐷𝜑 переводит векторы, пропорциональные дан ному вектору 𝑣 , в векторы, пропорциональные 𝐷𝜑 (𝑣 ). Поэтому каждый ненулевой вектор 𝑣 ∈ 𝑉 задаёт отображение 𝜓𝑣 ∶ 𝕜 → 𝕜, значение которого на числе 𝜆 ∈ 𝕜 определяется равенством 𝐷𝜑 (𝜆𝑣) = 𝜓𝑣 (𝜆) ⋅ 𝐷𝜑 (𝑣) . 22 (23) 2.1. Преобразования, переводящие прямые в прямые 23 Лемма 2.1 Отображение 𝜓 = 𝜓𝑣 ∶ 𝕜 → 𝕜 одно и то же для всех векторов 𝑣 ∈ 𝑉 . Оно биективно и переста новочно со сложением и умножением, т. е. 𝜓(𝜆 + 𝜇) = 𝜓(𝜆) + 𝜓(𝜇) и 𝜓(𝜆𝜇) = 𝜓(𝜆)𝜓(𝜇) для всех 𝜆, 𝜇 ∈ 𝕜. Доказательство. Поскольку отображение 𝜓𝑣 является ограничением биективного и переводя щего прямые в прямые отображения 𝜑 на прямую, оно тоже биективно для каждого 𝑣 . Покажем, что 𝜓𝑢 = 𝜓𝑤 для любых двух непропорциональных векторов 𝑢, 𝑤 . Так как пересекающиеся в одной точке прямые переходят в прямые, которые тоже пересекаются в одной точке, векто ры 𝐷𝜑 (𝑢) и 𝐷𝜑 (𝑤) не пропорциональны и образуют базис пространства 𝑉 . Из аддитивности 𝐷𝜑 вытекает, что 𝐷𝜑 (𝜆(𝑢 + 𝑤)) = 𝜓𝑢+𝑤 (𝜆) ⋅ 𝐷𝜑 (𝑢 + 𝑤) = 𝜓𝑢+𝑤 (𝜆) ⋅ 𝐷𝜑 (𝑢) + 𝜓𝑢+𝑤 (𝜆) ⋅ 𝐷𝜑 (𝑤) ‖ 𝐷𝜑 (𝜆𝑢 + 𝜆𝑤) = 𝐷𝜑 (𝜆𝑢) + 𝐷𝜑 (𝜆𝑤) = 𝜓𝑢 (𝜆) ⋅ 𝐷𝜑 (𝑢) + 𝜓𝑤 (𝜆) ⋅ 𝐷𝜑 (𝑤) . Из единственности разложения вектора по базису мы заключаем, что для всех 𝜆 ∈ 𝕜 выпол няются равенства 𝜓𝑢 (𝜆) = 𝜓𝑢+𝑤 (𝜆) = 𝜓𝑤 (𝜆), что и требовалось. Если векторы 𝑢 и 𝑤 пропор циональны, то для любого непропорционального им вектора 𝑣 будут выполняться равенства 𝜓𝑢 = 𝜓𝑣 = 𝜓𝑤 . Таким образом, отображение 𝜓𝑣 одно и то же для всех 𝑣 и может быть обозна чено просто 𝜓. Далее, из аддитивности 𝐷𝜑 вытекают равенства 𝜓(𝜆 + 𝜇) ⋅ 𝐷𝜑 (𝑣) = 𝐷𝜑 ((𝜆 + 𝜇)𝑣) = 𝐷𝜑 (𝜆𝑣 + 𝜇𝑣 ) = 𝐷𝜑 (𝜆𝑣) + 𝜑(𝜇𝑣 ) = = 𝜓(𝜆) ⋅ 𝐷𝜑 (𝑣) + 𝜓(𝜇) ⋅ 𝐷𝜑 (𝑣) = (𝜓(𝜆) + 𝜓(𝜇)) ⋅ 𝐷𝜑 (𝑣) , откуда 𝜓(𝜆 + 𝜇) = 𝜓(𝜆) + 𝜓(𝜇). Равенства 𝜓(𝜆𝜇) ⋅ 𝐷𝜑 (𝑣) = 𝐷𝜑 ((𝜆𝜇)𝑣) = 𝐷𝜑 (𝜆(𝜇𝑣 )) = 𝜓(𝜆) ⋅ 𝐷𝜑 (𝜇𝑣 ) = 𝜓(𝜆)𝜓(𝜇) ⋅ 𝐷𝜑 (𝑣) показывают, что 𝜓(𝜆𝜇) = 𝜓(𝜆) ⋅ 𝜓(𝜇). 2.1.2. Отступление об автоморфизмах полей. Отображение поля в себя 𝜓 ∶ 𝕜 → 𝕜 назы вается гомоморфизмом, если 𝜓(𝜆 + 𝜇) = 𝜓(𝜆) + 𝜓(𝜇) и 𝜓(𝜆𝜇) = 𝜓(𝜆)𝜓(𝜇) для всех 𝜆, 𝜇 ∈ 𝕜. Упражнение 2.1. Убедитесь, что каждый гомоморфизм 𝜓 ∶ 𝕜 → 𝕜 либо инъективен, либо тож дественно нулевой1 , и обладает свойствами 𝜓(0) = 0 и 𝜓(𝜆 − 𝜇) = 𝜓(𝜆) − 𝜓(𝜇), а всякий ненулевой гомоморфизм — свойствами 𝜓(1) = 1 и 𝜓(𝜆 ∕ 𝜇) = 𝜓(𝜆)∕ 𝜓(𝜇) при 𝜇 ≠ 0. Биективные гомоморфизмы 𝕜 ⥲ 𝕜 называются автоморфизмами поля 𝕜. Из упр. 2.1 вытекает, что каждый автоморфизм 𝜓 ∶ 𝕜 ⥲ 𝕜 тождественно действует на всех элементах вида ±(1 + ⋯ + 1)∕(1 + ⋯ + 1) ∈ 𝕜 , где в числителе и в знаменателе стоят суммы какихто количеств единиц поля 𝕜, причём сумма в знаменателе отлична от нуля. Поскольку в поле ℚ и во всех полях вычетов 𝔽𝑝 = ℤ ∕ (𝑝), где 𝑝 ∈ ℕ — простое, никаких других элементов нет, у этих полей нет и никаких автоморфизмов кроме тождественного. 1 Т. е. 𝜓(𝜆) = 0 для всех 𝜆 ∈ 𝕜. 24 §2 Аффинные преобразования Всякий автоморфизм 𝜓 ∶ ℝ ⥲ ℝ тождественно действует на подполе ℚ ⊂ ℝ и является строго монотонной функцией1 , поскольку неравенство 𝜆 < 𝜇 равносильно тому, что 𝜇 − 𝜆 = 𝛼 2 для некоторого 𝛼 ∈ ℝ, откуда 𝜓(𝜇) − 𝜓(𝜆) = 𝜓(𝜇 − 𝜆) = 𝜓(𝛼 2 ) = 𝜓(𝛼 )2 > 0, т. е. 𝜓(𝜆) < 𝜓(𝜇). Упражнение 2.2 (по анализу). Пусть строго монотонная функция 𝜓 ∶ ℝ → ℝ такова, что 𝑓(𝑥 ) = 𝑥 при 𝑥 ∈ ℚ. Покажите, что 𝑓(𝑥 ) = 𝑥 при всех 𝑥 ∈ ℝ. Таким образом, у поля ℝ тоже нет никаких автоморфизмов кроме тождественного. Напротив, у поля комплексных чисел ℂ имеется нетождественный автоморфизм комплекс ного сопряжения 𝑧 = 𝑥 + 𝑖𝑦 ↦ 𝑧 = 𝑥 − 𝑖𝑦. Аналогичные нетривиальные автоморфизмы имеются у всех полей алгебраических чисел2 . Упражнение 2.3. Покажите что множество чисел ℚ[√2] = {𝑥 + 𝑦√2 | 𝑥 , 𝑦 ∈ ℚ} является полем и укажите нетождественный автоморфизм этого поля. 2.1.3. Полулинейные отображения. Отображение векторных пространств 𝐹 ∶ 𝑈 → 𝑊 над полем 𝕜 называется полулинейным, если существует такой автоморфизм 𝜓 ∶ 𝕜 ⥲ 𝕜, что 𝐹 (𝜆𝑢 + 𝜇𝑤 ) = 𝜓(𝜆)𝐹 (𝑢) + 𝜓(𝜇)𝐹 (𝑤) для всех векторов 𝑢, 𝑤 ∈ 𝑈 и всех чисел 𝜆, 𝜇 ∈ 𝕜. Если автоморфизм 𝜓 = Id𝕜 тождественный, то полулиненое отображение является линейным в смысле n∘ 1.1.1 на стр. 8. В частности, над простыми полями ℚ и 𝔽𝑝 = ℤ∕(𝑝), а также над полем вещественных чисел ℝ все полулинейные отображения линейны. Из формул (22), (23) и лем. 2.1 мы заключаем, что дифференциал 𝐷𝜑 ∶ 𝑉 → 𝑉 любого полуаффинного преобразования 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) является полулинейным отображением век торных пространств, а если основное поле равно ℚ, ℝ или 𝔽𝑝 , то — линейным отображением. Суммируем сказанное в виде теоремы. Теорема 2.1 Если биективное преобразование 𝐹 аффинной плоскости 𝔸(𝑉 ) переводит прямые в прямые, то существует такое полулинейное биективное преобразование 𝐷𝜑 векторного пространства 𝑉 , что 𝜑(𝑝) = 𝜑(𝑞 ) + 𝐷𝜑 (⃖⃖⃖ 𝑞𝑝⃗) для любых двух точек 𝑝, 𝑞 ∈ 𝔸(𝑉 ). Над полями ℝ, ℚ и 𝔽𝑝 преобразова ние 𝐷𝜑 автоматически является линейным. 2.2. Аффинные отображения. Отображение 𝜑 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) между аффинными простран ствами, ассоциированными с векторными пространствами 𝑈, 𝑊 , называется аффинным, если найдётся такая точка 𝑜 ∈ 𝔸(𝑈), что отображение между векторными пространствами 𝐷𝜑 ∶ 𝑈 → 𝑊 , ⃖⃖⃖⃗ ↦ ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝑜𝑝 𝜑(𝑜)𝜑(𝑝⃗) (24) ⃖⃖⃖⃗) = 𝛼𝐷𝜑 (⃖⃖⃖ ⃖⃖⃖⃗) для любых 𝛼, 𝛽 ∈ 𝕜 и 𝑎, 𝑏 ∈ 𝔸(𝑈). Из теор. 2.1 ⃖⃖⃖⃗ + 𝛽𝑜𝑏 линейно, т. е. 𝐷𝜑 (𝛼 𝑜𝑎 𝑜𝑎⃗) + 𝛽𝐷𝜑 (𝑜𝑏 вытекает, что любое биективное преобразование аффинной плоскости над полем ℚ, ℝ или 𝔽𝑝 , переводящее прямые в прямые, аффинно. Лемма 2.2 Если отображение 𝜑 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) аффинно, то отображение (24) линейно для каждой точки 𝑜 ∈ 𝔸(𝑈) и не зависит от выбора этой точки. 1 Т. е. для любых 𝑥1 , 𝑥2 ∈ ℝ неравенство 𝑥1 < 𝑥2 влечёт неравенство 𝜓(𝑥1 ) < 𝜓(𝑥2 ). Т. е. полей, которые содержат поле ℚ и линейно порождаются над ℚ корнями многочленов с целыми коэффициентами. 2 25 2.2. Аффинные отображения Доказательство. Если построенное по некоторой точке 𝑜 ∈ 𝔸(𝑈) отображение 𝐷𝜑 из форму ⃖⃖⃖⃗ = 𝑜𝑞 ⃖⃖⃖⃗ −⃖⃖⃖ лы (24) линейно, то для любой точки 𝑝 ∈ 𝔸(𝑈) и любого вектора 𝑝𝑞 𝑜𝑝⃗ ∈ 𝑈 выполняется равенство 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗) = 𝐷𝜑 (⃖⃖⃖ 𝑜𝑞⃗) − 𝐷𝜑 (⃖⃖⃖ 𝑜𝑝⃗) = ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑜)𝜑(𝑞⃗) − ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑜)𝜑(𝑝⃗) = ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑝)𝜑(𝑞⃗) . ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ Тем самым, 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗) = 𝜑 (𝑝)𝜑(𝑞⃗) для всех 𝑝, 𝑞 ∈ 𝔸(𝑈), т. е. при замене точки 𝑜 на точку 𝑝 мы получим то же самое отображение 𝐷𝜑 ∶ 𝑈 → 𝑊 , что ив точке 𝑜. Предложение 2.1 Отображение 𝜑 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) аффинно тогда и только тогда, когда оно переводит барицен трические комбинации точек в барицентрические комбинации их образов с теми же весами, т. е. 𝜑(𝜇1 𝑝1 + 𝜇2 𝑝2 + ⋯ + 𝜇𝑚 𝑝𝑚 ) = 𝜇1 ⋅ 𝜑(𝑝1 ) + 𝜇2 ⋅ 𝜑(𝑝2 ) + ⋯ + 𝜇𝑚 ⋅ 𝜑(𝑝𝑚 ) для любых 𝑝1 , 𝑝2 , … , 𝑝𝑚 ∈ 𝔸(𝑈) и любых 𝜇1 , 𝜇2 , … , 𝜇𝑚 ∈ 𝕜 с ∑ 𝜇𝑖 = 1. Доказательство. Если отображение 𝜑 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) аффинно, то при любом выборе началь ной точки 𝑜 и любых весах 𝜇1 , 𝜇2 , … , 𝜇𝑚 ∈ 𝕜 с ∑ 𝜇𝑖 = 1 ⃖⃖⃖⃗1 + 𝜇2 𝑜𝑝 ⃖⃖⃖⃗2 + ⋯ + 𝜇𝑚 𝑜𝑝 ⃖⃖⃖⃗𝑚 ) = 𝜑(𝜇1 𝑝1 + 𝜇2 𝑝2 + ⋯ + 𝜇𝑚 𝑝𝑚 ) = 𝜑 (𝑜 + 𝜇1 𝑜𝑝 ⃖⃖⃖⃗1 + 𝜇2 𝑜𝑝 ⃖⃖⃖⃗2 + ⋯ + 𝜇𝑚 𝑜𝑝 ⃖⃖⃖⃗𝑚 ) = = 𝜑(𝑜) + 𝐷𝜑 (𝜇1 𝑜𝑝 ⃖⃖⃖⃗1 ) + 𝜇2 ⋅ 𝐷𝜑 (𝑜𝑝 ⃖⃖⃖⃗2 ) + ⋯ + 𝜇𝑚 ⋅ 𝐷𝜑 (𝑜𝑝 ⃖⃖⃖⃗𝑚 ) = = 𝜑(𝑜) + 𝜇1 ⋅ 𝐷𝜑 (𝑜𝑝 ⃖⃖⃖⃗1 )) + ⋯ + 𝜇𝑚 ⋅ (𝜑(𝑜) + 𝐷𝜑 (𝑜𝑝 ⃖⃖⃖⃗𝑚 )) = = 𝜇1 ⋅ (𝜑(𝑜) + 𝐷𝜑 (𝑜𝑝 = 𝜇1 ⋅ 𝜑(𝑝1 ) + 𝜇2 ⋅ 𝜑(𝑝2 ) + ⋯ + 𝜇𝑚 ⋅ 𝜑(𝑝𝑚 ) . Наоборот, пусть отображение 𝜑 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) сохраняет барицентрические комбинации. То гда при любом выборе начальной точки 𝑜 для всех точек 𝑝, 𝑞 ∈ 𝔸(𝑈) и чисел 𝜆, 𝜇 ∈ 𝕜 точка ⃖⃖⃖⃗ + 𝜇 ⋅ 𝑜𝑞 ⃖⃖⃖⃗ = (1 − 𝜆 − 𝜇)𝑜 + 𝜆𝑝 + 𝜇𝑞 𝑟 = 𝑜 + 𝜆 ⋅ 𝑜𝑝 перейдёт в точку 𝜑(𝑟) = (1 − 𝜆 − 𝜇)𝜑(𝑜) + 𝜆𝜑(𝑝) + 𝜇𝜑(𝑞 ) = 𝜑(𝑜) + 𝜆 ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑜)𝜑(𝑝⃗) + 𝜇 ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑜)𝜑(𝑞⃗). Зафиксируем точку 𝑜 и определим отображение 𝐷𝜑 ∶ 𝑈 → 𝑊 правилом 𝐷𝜑 (⃖⃖⃖ 𝑜𝑟⃗) = ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑜)𝜑(𝑟⃗). ⃖⃖⃖⃗, 𝑜𝑞 ⃖⃖⃖⃗ ∈ 𝑈 и чисел Тогда для любой точки 𝑟 получаем 𝜑(𝑟) = 𝜑(𝑜) + 𝐷𝜑 (⃖⃖⃖ 𝑜𝑟⃗), а для всех векторов 𝑜𝑝 𝜆, 𝜇 ∈ 𝕜 имеем равенство ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃗ + 𝜇 𝑜𝑞 ⃖⃖⃖⃗) = 𝐷𝜑 (⃖⃖⃖ 𝐷𝜑 (𝜆 𝑜𝑝 𝑜𝑟⃗) = ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑜)𝜑(𝑟⃗) = 𝜆 𝜑 (𝑜)𝜑(𝑝⃗) + 𝜇 𝜑 (𝑜)𝜑(𝑞⃗) = 𝜆 𝐷𝜑 (⃖⃖⃖ 𝑜𝑝⃗) + 𝜇 𝐷𝜑 (⃖⃖⃖ 𝑜𝑞⃗) , означающее, что отображение 𝐷𝜑 ∶ 𝑈 → 𝑊 линейно. 2.2.1. Дифференциал аффинного отображения. Линейное отображение 𝐷𝜑 ∶ 𝑈 → 𝑊 , ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃗ ↦ 𝜑 𝑝𝑞 (𝑝)𝜑(𝑞⃗) называется дифференциалом аффинного отображения 𝜑 ∶ 𝔸(𝑈) → 𝔸(𝑊 ). Если аффинные отображения 𝜑, 𝜓 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) имеют одинаковый дифференциал, то ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ для всех 𝑝, 𝑞 ∈ 𝔸(𝑈) выполняется равенство ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑(𝑝)𝜑(𝑞⃗) = 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗) = 𝐷𝜓 (⃖⃖⃖ 𝑝𝑞⃗) = 𝜓 (𝑝)𝜓(𝑞⃗). По ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ упр. 1.6 на стр. 14 оно равносильно равенству 𝜑 (𝑝)𝜓(𝑝⃗) = 𝜑 (𝑞)𝜓(𝑞⃗), т. е. вектор 𝑤 = 𝜑 (𝑝)𝜓(𝑝⃗) не зависит от выбора точки 𝑝 ∈ 𝔸(𝑈). Это означает, что 𝜓 = 𝜏𝑤 ∘ 𝜑 является композицией отображения 𝜑 с последующим сдвигом 𝜏𝑤 ∶ 𝔸(𝑊 ) → 𝔸(𝑊 ), 𝑝 ↦ 𝑝 + 𝑤, на вектор 𝑤. 26 §2 Аффинные преобразования Предложение 2.2 Если отображения 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑊 ) и 𝜓 ∶ 𝔸(𝑈) → 𝔸(𝑉 ) аффинны, то их композиция 𝜑 ∘ 𝜓 ∶ 𝔸(𝑈) → 𝔸(𝑊 ) , 𝑥 ↦ 𝜑 (𝜓 ( 𝑥 ) ) , тоже аффинна и имеет дифференциал 𝐷𝜑∘𝜓 = 𝐷𝜑 ∘ 𝐷𝜓 . ⃖⃖⃖⃗ ∈ 𝑈 в вектор Доказательство. Отображение 𝐷𝜑∘𝜓 ∶ 𝑈 → 𝑊 , переводящее вектор 𝑝𝑞 ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ ⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖⃖ 𝜑 (𝜓(𝑝))𝜑(𝜓(𝑞))⃗ = 𝐷𝜑 (𝜓 (𝑝)𝜓(𝑞⃗)) = 𝐷𝜑 (𝐷𝜓 (⃖⃖⃖ 𝑝𝑞⃗)) ∈ 𝑊 , является композицией 𝐷𝜑 ∘ 𝐷𝜓 линейных отображений 𝐷𝜑 и 𝐷𝜓 . Поэтому оно тоже линейно: для любых 𝑎, 𝑏 ∈ 𝑈 и 𝛼 , 𝛽 ∈ 𝕜 имеем равенства 𝐷𝜑 (𝐷𝜓 (𝛼𝑎 + 𝛽𝑏)) = 𝐷𝜑 ((𝛼𝐷𝜓 (𝑎) + 𝛽𝐷𝜓 (𝑏)) = = 𝛼𝐷𝜑 (𝐷𝜓 (𝑎)) + 𝛽𝐷𝜑 (𝐷𝜓 (𝑏)). 2.3. Запись линейных отображений в координатах. Если в двумерном векторном простран стве 𝑉 зафиксирован базис 𝑒1 , 𝑒2 , всякое линейное отображение 𝜑 ∶ 𝑉 → 𝑉 однозначно за даётся указанием образов базисных векторов 𝑓1 = 𝜑(𝑒1 ) и 𝑓2 = 𝜑(𝑒2 ). Произвольный вектор 𝑣 = 𝑒1 𝑥1 + 𝑒2 𝑥2 переходит при этом в вектор 𝜑(𝑣) = 𝜑(𝑒1 ⋅ 𝑥1 + 𝑒2 ⋅ 𝑥2 ) = 𝜑(𝑒1 ) ⋅ 𝑥1 + 𝜑(𝑒2 ) ⋅ 𝑥2 = 𝑓1 ⋅ 𝑥1 + 𝑓2 ⋅ 𝑥2 . (25) Упражнение 2.4. Убедитесь, что при любом выборе векторов 𝑓1 , 𝑓2 ∈ 𝑉 формула (25) задаёт линейное отображение 𝜑 ∶ 𝑉 → 𝑉 . Если векторы 𝑓1 и 𝑓2 имеют в базисе (𝑒1 , 𝑒2 ) координаты 𝑓1 = 𝑒1 ⋅ 𝜑11 + 𝑒2 ⋅ 𝜑21 𝜑11 𝜑12 и , т. е. (𝜑21 ) (𝜑22 ) и 𝑓2 = 𝑒1 ⋅ 𝜑12 + 𝑒2 ⋅ 𝜑22 , то по формуле (25) действие отображения 𝜑 на произвольный вектор 𝑣 с координатами (26) 𝑥1 (𝑥2 ) задаётся правилом 𝜑∶ 𝑥1 𝜑11 𝜑12 𝜑11 𝑥1 + 𝜑12 𝑥2 ↦ ⋅𝑥 + ⋅𝑥 = , (𝑥2 ) (𝜑21 ) 1 (𝜑22 ) 2 (𝜑21 𝑥1 + 𝜑22 𝑥2 ) (27) которое принято сокращённо записывать как 𝒙 ↦ 𝛷𝒆 𝒙, где 𝒙= 𝑥1 , (𝑥2 ) 𝛷𝒆 = 𝜑11 (𝜑21 𝜑12 𝜑22 ) и 𝛷𝒆 𝑥 = 𝜑11 (𝜑21 𝜑12 𝑥 𝜑11 𝑥1 + 𝜑12 𝑥2 ⋅ 1 ≝ . ) ( ) ( 𝜑22 𝑥2 𝜑21 𝑥1 + 𝜑22 𝑥2 ) При этом используются следующие соглашения: под произведением 𝑎𝑏 строки 𝑎 на столбец 𝑏, высота которого равна ширине строки, понимается сумма произведений ⎛𝑏1 ⎞ ⎜𝑏 ⎟ (𝑎1 , 𝑎2 , … , 𝑎𝑠 ) ⋅ ⎜ 2 ⎟ ≝ 𝑎1 𝑏1 + 𝑎2 𝑏2 + ⋯ + 𝑎𝑠 𝑏𝑠 , ⋮ ⎜ ⎟ 𝑏 ⎝ 𝑠⎠ (28) а под произведением 𝑃 = 𝐴𝐵 таблицы 𝐴 из 𝑚 строк ширины 𝑠 на таблицу 𝐵 из 𝑛 столбцов той же самой высоты 𝑠 понимается таблица из 𝑚 строк и 𝑛 столбцов, у которой в пересечении 𝑖 той 27 2.3. Запись линейных отображений в координатах строки и 𝑗того столбца стоит произведение 𝑖 той строки таблицы 𝐴 на 𝑗тый столбец таблицы 𝐵, вычисленное по формуле (28): ⎛𝑏1𝑗 ⎞ 𝑠 ⎜𝑏 ⎟ 𝑎 𝑏 . 𝑝𝑖𝑗 ≝ (𝑎𝑖1 , 𝑎𝑖2 , … , 𝑎𝑖𝑠 ) ⋅ ⎜ 2𝑗 ⎟ = ∑ 𝑖𝜈 𝜈𝑗 ⋮ 𝜈 = 1 ⎜ ⎟ ⎝ 𝑏𝑠𝑗 ⎠ (29) Таблицы из 𝑚 строк и 𝑛 столбцов принято называть матрицами размера 𝑚 × 𝑛. Матрица 𝛷𝒆 = 𝜑11 (𝜑21 𝜑12 𝜑22 ) называется матрицей линейного отображения 𝜑 в базисе 𝒆 = (𝑒1 , 𝑒2 ), а её определитель det 𝛷𝒆 = det(𝑓1 , 𝑓2 ) = 𝜑11 𝜑22 − 𝜑12 𝜑21 называется определителем отображения 𝜑 и обозначается det 𝜑. Если положить 𝒆 = (𝑒1 , 𝑒2 ) , 𝜑(𝒆) = (𝑓1 , 𝑓2 ) , где в правых частях стоят 1 × 2 матрицы из векторов, то две формулы (26) свернутся в одно мат ричное равенство 𝜑(𝒆) = 𝒆 𝛷𝒆 . Разложение 𝑣 = 𝑒1 𝑥1 + 𝑒2 𝑥2 вектора 𝑣 по базису 𝒆 в матричных обозначениях записывается равенством 𝑣 = 𝒆𝒙, в котором 𝒆 = (𝑒1 , 𝑒2 ) — строчка из векторов, 𝑥1 — столбец из чисел. Линейность отображения 𝜑 ∶ 𝑉 → 𝑉 означает, что а𝒙= (𝑥2 ) 𝜑(𝑣) = 𝜑(𝒆𝒙) = 𝜑(𝒆)𝒙 . Эти равенства являются матричной записью вычисления (25). Подставляя 𝜑(𝒆) = 𝒆 𝛷𝒆 в пра вую часть, мы заключаем, что 𝜑(𝑣 ) = 𝒆 𝛷𝒆 𝒙, т. е. столбец координат вектора 𝜑(𝑣 ) в базисе 𝒆 равен произведению 𝛷𝒆 𝒙 матрицы 𝛷𝒆 на столбец 𝒙. Следующие далее утверждения мы будем доказывать в предположении, что dim 𝑉 = 2. В полной общности мы вернёмся к ним чуть позже. Предложение 2.3 Композиция 𝜓 ∘ 𝜑 линейных отображений 𝜓, 𝜑 ∶ 𝑉 → 𝑉 с матрицами 𝛹𝒆 и 𝛷𝒆 линейна и имеет матрицу 𝛹𝒆 𝛷𝒆 . В частности, умножение 2 × 2 матриц ассоциативно, т. е. (𝐴𝐵)𝐶 = 𝐴(𝐵𝐶 ). Доказательство. Линейность композиции проверяется непосредственно: 𝜓𝜑(𝜆𝑢 + 𝜇𝑤 ) = 𝜓(𝜑(𝜆𝑢 + 𝜇𝑤 )) = 𝜓(𝜆𝜑(𝑢) + 𝜇𝜑(𝑤)) = = 𝜆𝜓(𝜑(𝑢)) + 𝜇𝜓(𝜑(𝑤)) = 𝜆𝜓𝜑(𝑢) + 𝜇𝜓𝜑(𝑤) . Вычисление: 𝜓(𝜑(𝒆)) = 𝜓(𝒆 ⋅ 𝛷𝒆 ) = 𝜓(𝒆)⋅ 𝛷𝒆 = 𝒆 ⋅ 𝛹𝒆 ⋅ 𝛷𝒆 показывает, что композиция 𝜓𝜑 имеет в базисе 𝒆 матрицу 𝛹𝒆 𝛷𝒆 . Поскольку композиция отображений очевидным образом ассоциатив на1 , ассоциативно и умножение матриц. 1 Для любых трёх отображений 𝛼 ∶ 𝐴 → 𝐵, 𝛽 ∶ 𝐵 → 𝐶 , 𝛾 ∶ 𝐶 → 𝐷 обе композиции (𝛾𝛽 )𝛼 и 𝛾(𝛽𝛼 ) действуют на каждую точку 𝑎 ∈ 𝐴 по одному и тому же правилу 𝑎 ↦ 𝛾(𝛽 (𝛼 (𝑎))). 28 §2 Аффинные преобразования Предложение 2.4 Для любой формы площади 𝑠 ∶ 𝑉 × 𝑉 → 𝕜 и любых векторов 𝑣1 , 𝑣2 ∈ 𝑉 𝑠(𝜑(𝑣1 ), 𝜑(𝑣2 )) = 𝑠(𝑣1 , 𝑣2 ) ⋅ det 𝛷𝒆 . (210) В частности, определитель det 𝜑 = det 𝛷𝒆 = 𝑠(𝜑(𝑣1 ), 𝜑(𝑣2 )) ∕ 𝑠(𝑣1 , 𝑣2 ) зависит от 𝜑 и не зависит от базиса 𝒆. Линейное отображение 𝜑 ∶ 𝑉 → 𝑉 биективно если и только если det 𝜑 ≠ 0. Доказательство. Образуем из векторов 𝑣1 и 𝑣2 матрицу 𝒗 = (𝑣1 , 𝑣2 ) размера 1 × 2. Тогда 𝒗 = 𝒆 𝐶𝒆𝒗 , где 𝐶𝒆𝒗 — числовая матрица размера 2 × 2, столбцы которой являются столбцами коор динат векторов 𝑣1 , 𝑣2 в базисе 𝒆 = (𝑒1 , 𝑒2 ). Поскольку отображение 𝜑 линейно (𝜑(𝑣1 ), 𝜑(𝑣2 )) = 𝜑(𝒗) = 𝜑(𝒆 𝐶𝒆𝒗 ) = 𝜑(𝒆) 𝐶𝒆𝒗 = (𝑓1 , 𝑓2 ) 𝐶𝒆𝒗 , где (𝑓1 , 𝑓2 ) = (𝜑(𝑒1 ), 𝜑(𝑒2 )) = (𝑒1 , 𝑒2 ) 𝛷𝒆 . По сл. 1.2 на стр. 13 для любой ненулевой формы площади 𝑠 на 𝑉 выполняются равенства 𝑠(𝜑(𝑣1 ), 𝜑(𝑣2 )) = 𝑠(𝑓1 , 𝑓2 ) det 𝐶𝒆𝒗 = 𝑠(𝑒1 , 𝑒2 ) det 𝛷𝒆 det 𝐶𝒆𝒗 . Так как 𝑠(𝑒1 , 𝑒2 ) det 𝐶𝒆𝒗 = 𝑠(𝑣1 , 𝑣2 ), мы получаем (210). Если det 𝛷𝒆 = det(𝑓1 , 𝑓2 ) ≠ 0, то пара векторов 𝒇 = (𝑓1 , 𝑓2 ) тоже является базисом в 𝑉 . Отображение 𝜑 переводит вектор 𝑢 = 𝒆𝒙 со столбцом координат 𝒙 в базисе 𝒆 в вектор 𝜑(𝑢) = 𝜑(𝒆)𝒙 = 𝒇𝒙 с тем же самым столбцом коорди нат 𝑥 , но только в базисе 𝒇. Тем самым, оно биективно. Если же det(𝑓1 , 𝑓2 ) = 0, то 𝑓1 = 𝜆𝑓2 для некоторого 𝜆 ∈ 𝕜, откуда 𝜑(𝑒1 ) = 𝜑(𝜆𝑒2 ). Поскольку 𝑒1 ≠ 𝜆𝑒2 , отображение 𝜑 не биективно. Упражнение 2.5. Докажите для 2 × 2 матриц 𝐴 и 𝐵 равенство det(𝐴𝐵) = det(𝐴) ⋅ det(𝐵). 2.4. Запись аффинных отображений в координатах. Зафиксируем в аффинной плоскости 𝔸2 над двумерным векторным пространством 𝑉 координатный репер (𝑜; 𝑒1 , 𝑒2 ). Пусть аффинное отображение 𝜑 ∶ 𝔸2 → 𝔸2 переводит его начальную точку 𝑜 в точку 𝑏 = 𝜑(𝑜) с координатами 𝛽1 , а дифференциал 𝐷𝜑 ∶ 𝑉 → 𝑉 имеет в базисе 𝒆 = (𝑒1 , 𝑒2 ) матрицу (𝛽2 ) 𝛷𝒆 = 𝜑11 (𝜑21 𝜑12 . 𝜑22 ) Тогда действие отображения 𝜑 на произвольную точку с координатами 𝒙 = 𝑥1 описывается (𝑥2 ) матричной формулой 𝜑 ∶ 𝒙 ↦ 𝑏 + 𝛷𝒆 𝒙, которая в развёрнутом виде выглядит так: 𝑥1 𝛽1 𝜑11 ↦ + (𝑥2 ) (𝛽2 ) (𝜑21 𝜑12 𝑥 𝛽1 + 𝜑11 𝑥1 + 𝜑12 𝑥2 ⋅ 1 = . 𝜑22 ) (𝑥2 ) (𝛽2 + 𝜑21 𝑥1 + 𝜑22 𝑥2 ) Упражнение 2.6. Убедитесь в этом, и выясните, как аффинное преобразование 𝑥 ↦ 𝑏 + 𝐴𝑥 изменяет площади ориентированных параллелограммов. Мы заключаем, что аффинное отображение плоскости однозначно задаётся своим действием на произвольно выбранный аффинный репер: для любого аффинного репера (𝑝; 𝑒1 , 𝑒2 ), любой точки 𝑞 и любых векторов 𝑓1 , 𝑓2 существует единственное такое аффинное отображение 𝜑, что 𝜑(𝑝) = 𝑞, 𝐷𝜑 (𝑒1 ) = 𝑓1 , 𝐷𝜑 (𝑒2 ) = 𝑓2 . 29 2.5. Аффинная группа 2.5. Аффинная группа. Биективные аффинные отображения 𝔸(𝑉 ) → 𝔸(𝑉 ) называются аффин ными автоморфизмами или аффинными преобразованиями. Они образуют группу преобразова ний1 , которая обозначается Aff(𝑉 ) и называется аффинной группой векторного пространства 𝑉 . Аффинная группа координатного пространства 𝕜𝑛 обозначается Aff𝑛 (𝕜). 2.5.1. Сравнение аффинной и линейной групп. Аффинная группа Aff(𝑉 ) содержит под группу параллельных переносов или сдвигов 𝑇 ⊂ Aff(𝑉 ), изоморфную аддитивной группе век торов пространства 𝑉 . Вектору 𝑣 ∈ 𝑉 отвечает при этом изоморфизме сдвиг 𝜏 𝑣 ∶ 𝔸 (𝑉 ) → 𝔸 (𝑉 ) , 𝑝 ↦ 𝑝+𝑣, а композиции сдвигов отвечает сложение векторов: 𝜏𝑢 ∘ 𝜏𝑤 = 𝜏𝑢+𝑤 . Поскольку для любого аф финного преобразования 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) и произвольной точки 𝑝 ∈ 𝔸(𝑉 ) выполняются равен ства 𝜑(𝜏𝑣 (𝑝)) = 𝜑(𝑝+𝑣 ) = 𝜑(𝑝)+𝐷𝜑 (𝑣 ) = 𝜏𝐷𝜑 (𝑣) (𝜑(𝑝)) сдвиги 𝜏𝑣 коммутируют с произвольными аффинными преобразованиями по правилу 𝜑 ∘ 𝜏𝑣 = 𝜏𝐷𝜑 (𝑣) ∘ 𝜑 или 𝜑 ∘ 𝜏𝑣 ∘ 𝜑−1 = 𝜏𝐷𝜑 (𝑣) . (211) Множество всех аффинных преобразований, оставляющих на месте произвольно выбранную точку 𝑝 ∈ 𝔸2 , образует в Aff(𝑉 ) подгруппу, которая называется стабилизатором точки 𝑝 и обо значается Stab𝑝 ≝ {𝜑 ∈ Aff(𝑉 ) | 𝜑(𝑝) = 𝑝} . Аффинное преобразование 𝜑 ∈ Stab𝑝 действует на произвольную точку 𝑞 ∈ 𝔸(𝑉 ) по правилу 𝜑(𝑞) = 𝑝 + 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗). В частности, два аффинных преобразования 𝜑, 𝜓 ∈ Stab𝑝 совпадают если и только если 𝐷𝜑 = 𝐷𝜓 . Таким образом, мы имеем инъективное отображение 𝐷 ∶ Stab𝑝 → GL(𝑉 ) , 𝜑 ↦ 𝐷𝜑 , (212) переводящее аффинное преобразование в его дифференциал. Это отображение является изо морфизмом групп, поскольку каждый линейный автоморфизм 𝐹 ∶ 𝑉 ⥲ 𝑉 является дифферен циалом аффинного преобразования 𝐹𝑝 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) , 𝑥 ↦ 𝑝 + 𝐹 (⃖⃖⃖ 𝑝𝑥⃗) , (213) оставляющего точку 𝑝 на месте. Предложение 2.5 Зафиксируем произвольным образом точку 𝑝 ∈ 𝔸(𝑉 ). Тогда для каждого аффинного преобра зования 𝜑 ∈ Aff(𝑉 ) существуют единственные такие вектор 𝑣 ∈ 𝑉 и линейный автоморфизм 𝐹 ∈ GL(𝑉 ), что 𝜑 = 𝜏𝑣 ∘ 𝐹𝑝 . При этом для всех 𝑢, 𝑤 ∈ 𝑉 и всех 𝐹 , 𝐺 ∈ GL(𝑉 ) (𝜏𝑢 ∘ 𝐹𝑝 ) ∘ (𝜏𝑤 ∘ 𝐺𝑝 ) = 𝜏𝑢+𝐹(𝑤) ∘ (𝐹 ∘ 𝐺 )𝑝 . (214) ⃖⃖⃖⃗ и 𝜓 = 𝜏−𝑣 ∘ 𝜑 ∈ Stab𝑝 . Тем Доказательство. Пусть 𝜑(𝑝) = 𝑞 . Тогда 𝜑 = 𝜏𝑣 ∘ 𝜓, где 𝑣 = 𝑝𝑞 самым, 𝜓 = 𝐹𝑝 для некоторого линейного преобразования 𝐹 ∈ GL(𝑉 ). Если аффинное преоб разование 𝜑 допускает два разложения 𝜏𝑣 ∘ 𝐹𝑝 = 𝜑 = 𝜏𝑢 ∘ 𝐺𝑝 , то применяя к правой и левой частям этого равенства обратный к 𝜏𝑣 сдвиг 𝜏−𝑣 , заключаем, что 𝐹𝑝 = 𝜏𝑢−𝑣 ∘ 𝐺𝑝 . Так как и 𝐹𝑝 , и 1 См. обсуждение на стр. 5 30 §2 Аффинные преобразования 𝐺𝑝 оставляют точку 𝑝 на месте, сдвиг 𝜏𝑢−𝑣 переводит точку 𝑝 в себя, откуда 𝑢 = 𝑣 и 𝜏𝑢−𝑣 = Id. Поэтому 𝐹𝑝 = 𝐺𝑝 и 𝐹 = 𝐺 . Соотношение (214) вытекает из формулы (211) : 𝜏𝑢 ∘ 𝐹𝑝 ∘ 𝜏𝑤 ∘ 𝐺𝑝 = 𝜏𝑢 ∘ 𝐹𝑝 ∘ 𝜏𝑤 ∘ 𝐹𝑝−1 ∘ 𝐹𝑝 ∘ 𝐺𝑝 = 𝜏𝑢 ∘ 𝜏𝐹𝑝 (𝑤) ∘ 𝐹𝑝 ∘ 𝐺𝑝 . Замечание 2.1. Из предл. 2.5 вытекает, что фиксация точки 𝑝 аффинном пространстве 𝔸(𝑉 ) поз воляет отождествить множество Aff(𝑉 ) с прямым произведением множеств 𝑉 × GL(𝑉 ) так, что имеющаяся в группе Aff(𝑉 ) композиция будет задаваться в терминах 𝑉 × GL(𝑉 ) правилом (𝑢, 𝐹 ) ∘ (𝑤, 𝐺 ) = (𝑢 + 𝐹 (𝑤), 𝐹𝐺 ) . В этой ситуации говорят, что группа Aff(𝑉 ) является полупрямым произведением групп 𝑉 и GL(𝑉 ), и пишут Aff(𝑉 ) = 𝑉 ⋊ GL(𝑉 ). Обратите внимание, что отождествление множества Aff(𝑉 ) с мно жеством 𝑉 × GL(𝑉 ) требует выбора точки 𝑝 ∈ 𝔸(𝑉 ), и два разложения 𝜏𝑢 ∘ 𝐹𝑝 = 𝜑 = 𝜏𝑤 ∘ 𝐹𝑞 одного и того же аффинного преобразования 𝜑 ∈ Aff(𝑉 ), возникающие при фиксации разных точек 𝑝, 𝑞 ∈ 𝔸(𝑉 ), имеют один и тот же линейный автоморфизм 𝐹 = 𝐷𝐹𝑝 = 𝐷𝐹𝑞 = 𝐷𝜑 ∈ GL(𝑉 ), но, вообще говоря, разные сдвиги 𝜏𝑢 ≠ 𝜏𝑤 . ⃖⃖⃖⃗ + 𝐷𝜑 (⃖⃖⃖ Упражнение 2.7. Убедитесь, что 𝑤 = 𝑢 − 𝑝𝑞 𝑝𝑞⃗) и что этот вектор отличен от 𝑢 если 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗) ≠ ⃖⃖⃖ 𝑝𝑞⃗. 2.5.2. Аффинная конгруэнтность фигур. Две фигуры в аффинном пространстве называ ются аффинно конгруэнтными, если существует аффинный автоморфизм, переводящий одну их этих фигур в другую. Следствие 2.1 Для любых треугольников ▵ 𝑝0 𝑝1 𝑝2 , ▵ 𝑞0 𝑞1 𝑞2 на аффинной плоскости существует единственное аффинное преобразование этой плоскости, переводящее 𝑝𝑖 в 𝑞𝑖 при всех 𝑖 = 0, 1, 2. Доказательство. Как мы видели выше, имеется единственное такое аффинное отображение 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) , что 𝜑(𝑝0 ) = 𝑞0 и 𝐷𝜑 (⃖⃖⃖⃖⃗ 𝑝0 𝑝1 ) = ⃖⃖⃖⃖⃗ 𝑞0 𝑞1 , 𝐷𝜑 (⃖⃖⃖⃖⃗ 𝑝0 𝑝2 ) = ⃖⃖⃖⃖⃗ 𝑞0 𝑞2 . Произвольная точка 𝑦 ∈ 𝔸(𝑉 ) с радиус вектором ⃖⃖⃖⃖⃗ 𝑞0 𝑦 = 𝜆⃖⃖⃖⃖⃗ 𝑞0 𝑞1 + 𝜇⃖⃖⃖⃖⃗ 𝑞0 𝑞1 является при этом образом единственной точки 𝑥 ∈ 𝔸(𝑉 ) с радиус вектором ⃖⃖⃖⃖⃗ 𝑝0 𝑥 = 𝜆⃖⃖⃖⃖⃗ 𝑝0 𝑝1 + 𝜇⃖⃖⃖⃖⃗ 𝑝0 𝑝1 . Следствие 2.2 Аффинные преобразования плоскости переводят прямые в прямые, сохраняя параллельность. Любые три различные попарно не параллельные и не пересекающиеся в одной точке прямые 𝓁0 , 𝓁1 , 𝓁2 переводятся в любые три различные попарно не параллельные и не пересекающиеся в одной точке прямые 𝓁′0 , 𝓁′1 , 𝓁′2 единственным аффинным преобразованием. Предложение 2.6 Если три различные прямые 𝓁0 , 𝓁1 , 𝓁2 пересекаются в точке 𝑜, а три различные прямые 𝓁′0 , 𝓁′1 , 𝓁′2 пересекаются в точке 𝑜′ , то существует аффинное преобразование, переводящее 𝓁𝑖 в 𝓁′𝑖 при всех 𝑖 = 0, 1, 2. Такое преобразование единственно с точностью до композиции с гомотетиями относительно точек 𝑜 и 𝑜′ . 31 2.6. Двойные отношения Доказательство. Зафиксируем на всех прямых 𝓁𝑖 и 𝓁′𝑖 направляющие векторы 𝑣𝑖 и 𝑣𝑖′ . Тогда 𝑣0 = 𝑥1 𝑣1 + 𝑥2 𝑣2 , 𝑣0′ = 𝑥1 𝑣1′ + 𝑥2 𝑣2′ , (215) где все четыре числа 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 ∈ 𝕜 отличны от нуля. Аффинное преобразование 𝜑 переводит прямые 𝓁1 , 𝓁2 , соответственно, в прямые 𝓁′1 , 𝓁′2 если и только если 𝜑(𝑜) = 𝑜′ и 𝐷𝜑 (𝑣1 ) = 𝜆1 𝑣1′ , 𝐷𝜑 (𝑣2 ) = 𝜆2 𝑣2′ для некоторых 𝜆1 , 𝜆2 ∈ 𝕜. Такое преобразование переводит прямую 𝓁0 в 𝓁′0 если и только если 𝐷𝜑 (𝑣0 ) = 𝜇𝑣0′ для некоторого 𝜇 ∈ 𝕜. Подставляя в это равенство разложения (215) и пользуясь линейностью 𝐷𝜑 , заключаем что 𝜆1 𝑥1 = 𝜇𝑥1′ и 𝜆2 𝑥2 = 𝜇𝑥2′ , откуда числа 𝜆1 = 𝜇𝑥1∕𝑥1′ и 𝜆2 = 𝜇𝑥2 ∕𝑥2′ определяются однозначно с точностью до умножения на константу 𝜇. Поскольку преобразование 𝜑 однозначно задаётся этими числами, оно существует и единственно с точно стью до гомотетии с центром в точке 𝑜 или 𝑜′ . Упражнение 2.8. Пусть три различные прямые 𝓁1 , 𝓁2 , 𝓁3 пересекаются в точке 𝑜. Покажите, ⃖⃖⃖⃗3 = 𝑜𝑝 ⃖⃖⃖⃗1 + 𝑜𝑝 ⃖⃖⃖⃗2 , и любые что существует такая тройка точек 𝑝1 ∈ 𝓁1 , 𝑝2 ∈ 𝓁2 , 𝑝3 ∈ 𝓁3 , что 𝑜𝑝 две такие тройки получаются друг из друга гомотетией с центром в 𝑜. Получите отсюда другое доказательство предл. 2.6 2.6. Двойные отношения. Две четвёрки конкурентных1 прямых на аффинной плоскости не всегда аффинно конгуэнтны. Полным инвариантом, характеризующим четыре пересекающие ся в точке 𝑜 прямые 𝓁1 = (𝑜𝑝1 ), 𝓁2 = (𝑜𝑝2 ), 𝓁3 = (𝑜𝑝3 ), 𝓁4 = (𝑜𝑝4 ) с точностью до аффинного преобразования является их двойное отношение2 [ 𝓁1 , 𝓁 2 , 𝓁3 , 𝓁 4 ] ≝ ⃖⃖⃖⃗3 ) 𝑠(⃖⃖⃖ ⃖⃖⃖⃗4 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 𝑠(𝑜𝑝1 𝑝3 ) 𝑠(𝑜𝑝1 𝑝4 ) 𝑜𝑝⃗1 , 𝑜𝑝 ∶ = ∶ . 𝑠(𝑜𝑝2 𝑝3 ) 𝑠(𝑜𝑝2 𝑝4 ) ⃖⃖⃖⃗3 ) 𝑠(⃖⃖⃖ ⃖⃖⃖⃗4 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗2 , 𝑜𝑝 𝑜𝑝⃗2 , 𝑜𝑝 Упражнение 2.9. Убедитесь, что двойное отношение не за висит ни от выбора ненулевой функции площади 𝑠, ни от выбора отличных от 𝑜 точек 𝑝𝑖 ∈ 𝓁𝑖 , а также не меняет ся, если каклибо разбить четвёрку на две пары и одно временно переставить между собою прямые в каждой из пар: [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] = [𝓁2 , 𝓁1 , 𝓁4 , 𝓁3 ] = [𝓁3 , 𝓁4 , 𝓁1 , 𝓁2 ] = = [𝓁4 , 𝓁3 , 𝓁2 , 𝓁1 ]. ℓ ℓ ℓ 𝑜 (216) ℓ 𝑝 = 𝑝 + 𝑡𝑒 𝑝 Расположим тройку точек 𝑝1 , 𝑝2 , 𝑝3 так, чтобы четырёхуголь 𝑝 ник 𝑜𝑝1 𝑝3 𝑝2 оказался параллелограммом, как в упр. 2.8, а 𝑒 в качестве 𝑝4 возьмём точку пересечения прямой 𝓁4 с пря мой (𝑝1 𝑝3 ), см. рис. 2⋄3. Тогда 𝑝4 = 𝑝2 + 𝑡 ⋅ ⃖⃖⃖⃖⃗ 𝑝2 𝑝3 , где число 𝑝 𝑡 = ⃖⃖⃖⃖⃗ 𝑝2 𝑝4 ∕⃖⃖⃖⃖⃗ 𝑝2 𝑝3 является аффинной координатой точки 𝑝4 на прямой (𝑝2 𝑝3 ) относительно репера с началом 𝑝2 и базисным Рис. 2⋄3. 𝑡 = [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ]. вектором 𝑒 = ⃖⃖⃖⃖⃗ 𝑝2 𝑝3 . Положение четвёртой прямой однознач но характеризуется этой координатой в том смысле, что отоб ражение 𝓁4 ↦ 𝑡 устанавливает биекцию между множеством всех проходящих через точку 𝑜 пря мых 𝓁4 и множеством 𝕜 ⊔ ∞. Прямым 𝓁1 , 𝓁2 , 𝓁3 при этом соответствуют значения 𝑡 = ∞, 0, 1. С 1 2 Т. е. пересекающихся в одной точке. Поанглийски crossratio. 32 §2 Аффинные преобразования другой стороны [ 𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] = ⃖⃖⃖⃗3 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 ∶ ⃖⃖⃖⃗4 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 = ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗3 , 𝑜𝑝 𝑜𝑝⃗4 , 𝑜𝑝 ⃖⃖⃖⃗1 + 𝑜𝑝 ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ ⃖⃖⃖⃗2 + 𝑡𝑜𝑝 ⃖⃖⃖⃗1 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 𝑜𝑝⃗1 , 𝑜𝑝 = ∶ = ⃖⃖⃖⃗2 , 𝑜𝑝 ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ ⃖⃖⃖⃗1 , 𝑜𝑝 ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 + 𝑜𝑝 𝑜𝑝⃗2 + 𝑡𝑜𝑝 ⃖⃖⃖⃗2 ) ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 = ∶ = 𝑡. ⃖⃖⃖⃗2 ) 𝑡 ⋅ 𝑠(⃖⃖⃖ ⃖⃖⃖⃗2 ) 𝑠(⃖⃖⃖ 𝑜𝑝⃗1 , 𝑜𝑝 𝑜𝑝⃗1 , 𝑜𝑝 (217) Таким образом, двойное отношение 𝑡 = [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] принимает все значения из поля 𝕜, а также значение ∞ и однозначно характеризует положение четвёртой прямой по отношению к первым трём. Если [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] = −1, то прямая 𝓁2 пересекает любую параллельную 𝓁1 пря мую 𝓁′1 в середине отрезка, высекаемого из 𝓁′1 прямыми 𝓁3 и 𝓁4 . Такие четвёрки конкурентных прямых называют гармоническими. Упражнение 2.10. Покажите, что гармоничность равносильна тому, что двойное отношение не меняется при перестановке первых двух точек: [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] = [𝓁2 , 𝓁1 , 𝓁3 , 𝓁4 ]. Предложение 2.7 Четыре различные конкурентные прямые 𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 переводятся в четыре различные конку рентные прямые 𝓁′1 , 𝓁′2 , 𝓁′3 , 𝓁′4 если и только если [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] = [𝓁′1 , 𝓁′2 , 𝓁′3 , 𝓁′4 ]. Доказательство. Обозначим точки пересечения четвёрок прямых через 𝑜 и 𝑜′ . По упр. 2.8 су ществуют такие тройки точек 𝑝𝑖 ∈ 𝓁𝑖 и 𝑝𝑖′ ∈ 𝓁′𝑖 , где 𝑖 = 1, 2, 3, что четырёхугольники 𝑜𝑝1 𝑝3 𝑝2 и 𝑜′ 𝑝1′ 𝑝3′ 𝑝2′ являются параллелограммами, причём эти тройки единственны с точностью до го мотетий с центрами 𝑜 и 𝑜′ . Аффинное преобразование, переводящее параллелограмм 𝑜𝑝1 𝑝3 𝑝2 в параллелограмм 𝑜′ 𝑝1′ 𝑝3′ 𝑝2′ является по предл. 2.6 единственным с точностью до гомотетий с центрами 𝑜 и 𝑜′ аффинным преобразованием, переводящим прямую 𝓁𝑖 в прямую 𝓁′𝑖 при 𝑖 = = 1, 2, 3. Оно переводит прямую 𝓁4 в прямую 𝓁′4 если и только если точка 𝑝4 = 𝓁4 ∩ (𝑝2 𝑝3 ) делит точки 𝑝2 , 𝑝3 в том же отношении, что точка 𝑝4′ = 𝓁′4 ∩ (𝑝2′ 𝑝3 𝑐 ′ ) делит точки 𝑝2′ , 𝑝3′ . Согласно (217) эти отношения равны двойным отношениям [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] и [𝓁′1 , 𝓁′2 , 𝓁′3 , 𝓁′4 ]. 2.6.1. Двойное отношение четырёх коллинеарных точек. Если в форм. (216) на стр. 31 расположить все четыре точки 𝑝𝑖 на одной не проходящей через точку 𝑜 прямой 𝓁, как на рис. 2⋄4, то двойное отношение площадей треугольников в ℓ ℓ ℓ ℓ формуле (216) можно переписать как двойное отношение че тырёх пропорциональных векторов1 𝑜 𝑠(𝑜𝑝1 𝑝3 ) 𝑠(𝑜𝑝1 𝑝4 ) ⃖⃖⃖⃖⃗ ⃖⃖⃖⃖⃗ 𝑝 𝑝 𝑝 𝑝 ∶ = 1 3 ∶ 1 4. ⃖⃖⃖⃖⃗ ⃖⃖⃖⃖⃗ 𝑠(𝑜𝑝2 𝑝3 ) 𝑠(𝑜𝑝2 𝑝4 ) 𝑝2 𝑝3 𝑝 2 𝑝4 ℓ Правая часть этого равенства обозначается ⃖⃖⃖⃖⃗ ⃖⃖⃖⃖⃗ 𝑝 𝑝 𝑝 𝑝 [𝑝1 , 𝑝2 , 𝑝3 , 𝑝4 ] ≝ 1 3 ∶ 1 4 ⃖⃖⃖⃖⃗ ⃖⃖⃖⃖⃗ 𝑝2 𝑝3 𝑝 2 𝑝4 𝑝 𝑝 𝑝 𝑝 Рис. 2⋄4. и называется двойным отношением упорядоченной четвёрки коллинеарных точек 𝑝1 , 𝑝2 , 𝑝3 , 𝑝4 . Такая четвёрка называется гармонической, если [𝑝1 , 𝑝2 , 𝑝3 , 𝑝4 ] = −1. 1 См. упр. 1.10 на стр. 20. §3. Евклидова плоскость Этот параграф посвящён метрической геометрии. Мы определим длины и углы — величины, по природе своей являющиеся действительными числами и характеризующиеся специфическими для поля ℝ отношениями больше – меньше или ближе – дальше. Поэтому всюду в этом парагра фе мы по умолчанию считаем, что основное поле 𝕜 = ℝ. Определение 3.1 Скалярным произведением (или евклидовой структурой) на векторном пространстве 𝑉 над по лем ℝ называется функция 𝑉 × 𝑉 → ℝ, сопоставляющая каждой паре векторов 𝑢, 𝑤 ∈ 𝑉 число (𝑣, 𝑤) ∈ ℝ и обладающая тремя свойствами: билинейность: для всех 𝜆1 , 𝜆2 , 𝜇1 , 𝜇2 ∈ ℝ и 𝑢1 , 𝑢2 , 𝑤1 , 𝑤2 ∈ 𝑉 выполняется равенство (𝜆1 𝑢1 + 𝜆2 𝑢2 , 𝜇1 𝑤1 + 𝜇2 𝑤2 ) = 𝜆1 𝜇1 (𝑢1 , 𝑤1 ) + 𝜆1 𝜇2 (𝑢1 , 𝑤2 ) + 𝜆2 𝜇1 (𝑢2 , 𝑤1 ) + 𝜆2 𝜇2 (𝑢2 , 𝑤2 ) , симметричность: (𝑢, 𝑤 ) = (𝑤 , 𝑢) для всех 𝑢, 𝑤 ∈ 𝑉 , положительность: (𝑣 , 𝑣 ) > 0 для всех ненулевых векторов 𝑣 ∈ 𝑉 . Пример 3.1 (стандартная евклидова структура на ℝ𝑛 ) Скалярное произведение векторов 𝑢 = (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) и 𝑤 = (𝑦1 , 𝑦2 , … , 𝑦𝑛 ) координатного про странства ℝ𝑛 , заданное формулой (𝑢, 𝑤 ) ≝ ∑ 𝑥𝑖 𝑦𝑖 = 𝑥1 𝑦1 + 𝑥2 𝑦2 + ⋯ + 𝑥𝑛 𝑦𝑛 , называется стан дартным. Упражнение 3.1. Убедитесь, что это скалярное произведение билинейно, симметрично и по ложительно. 3.1. Длина вектора и перпендикулярность. Неотрицательное число |𝑣 | ≝ √(𝑣 , 𝑣 ) называет ся длиной вектора 𝑣 евклидова пространства 𝑉 . Все ненулевые векторы имеют строго положи тельную длину и |𝜆𝑣| = |𝜆| ⋅ |𝑣 | при всех 𝜆 ∈ ℝ и 𝑣 ∈ 𝑉 . Скалярное произведение 𝑉 × 𝑉 → ℝ однозначно восстанавливается по функции длины 𝑉 → ℝ как (𝑢, 𝑤) = (|𝑢 + 𝑤|2 − |𝑢|2 − |𝑤|2 ) ∕ 2 . (31) Векторы 𝑎, 𝑏 ∈ 𝑉 называются ортогональными или перпендикулярными, если (𝑎, 𝑏) = 0. Если 𝑎 и 𝑏 перпендикулярны, то квадрат длины вектора 𝑐 = 𝑏 − 𝑎, соединяющего их концы, выражается через квадраты длин векторов 𝑎 и 𝑏 по теореме Пифагора (см. рис. 3⋄1): |𝑐 |2 = (𝑐 , 𝑐 ) = (𝑏 − 𝑎, 𝑏 − 𝑎) = (𝑎, 𝑎) + (𝑏, 𝑏) = |𝑎|2 + |𝑏|2 . 𝑎 ⊥ 𝑏 𝑏 𝑏− 𝜆𝑎 𝑏 𝑏− 𝑐= (32) 𝑎 𝑏 = 𝑎 ( , ) ( , ) ⋅𝑎 𝜆𝑎 Рис. 3⋄2. Ортогональная проекция 𝑏 на 𝑎. Рис. 3⋄1. Теорема Пифагора. 33 34 §3 Евклидова плоскость Предложение 3.1 Во всяком евклидовом пространстве для любого ненулевого вектора 𝑎 и произвольного век тора 𝑏 существует единственная пара таких векторов 𝑏𝑎 и 𝑏𝑎⊥ , что 𝑏𝑎 пропорционален 𝑎, 𝑏𝑎⊥ перпендикулярен 𝑎, и 𝑏 = 𝑏𝑎 + 𝑏𝑎⊥ (см. рис. 3⋄2). Эти векторы выражаются через 𝑎 и 𝑏 как 𝑏𝑎 = (𝑎 , 𝑏 ) (𝑎, 𝑏) 𝑎 и 𝑏𝑎⊥ = 𝑏 − 𝑎, (𝑎 , 𝑎 ) (𝑎, 𝑎) (33) причём 𝑏𝑎⊥ = 0 если и только если 𝑎 и 𝑏 пропорциональны, а 𝑏𝑎 = 0 если и только если 𝑏 перпендикулярен 𝑎. Доказательство. Мы ищем такие векторы 𝑏𝑎 = 𝜆𝑎 и 𝑏𝑎⊥ = 𝑏 − 𝜆𝑎, что (𝑎, 𝑏𝑎⊥ ) = (𝑎, 𝑏 − 𝜆𝑎) = (𝑎, 𝑏) − 𝜆 (𝑎, 𝑎) = 0 . Так как (𝑎, 𝑎) ≠ 0, это равенство выполняется при единственном 𝜆 = (𝑎, 𝑏)∕(𝑎, 𝑎). При таком 𝜆 условие 𝑏𝑎 = 𝜆𝑎 = 0 равносильно равенству (𝑎, 𝑏) = 0. Условие 𝑏𝑎⊥ = 𝑏 − 𝜆𝑎 = 0 означает пропорциональность векторов 𝑎 и 𝑏. Определение 3.2 Векторы 𝑏𝑎 и 𝑏𝑎⊥ из предл. 3.1, называются соответственно ортогональной проекцией вектора 𝑏 на одномерное подпространство ℝ ⋅ 𝑎, порождённое вектором 𝑎, и нормальной составляющей вектора 𝑏 относительно 𝑎. Упражнение 3.2. Убедитесь, что векторы 𝑏𝑎 и 𝑏𝑎⊥ не меняются при замене вектора 𝑎 на про порциональный вектор 𝜆𝑎 с 𝜆 ≠ 0. Следствие 3.1 (неравенство Коши – Буняковского – Шварца) Для любых двух векторов 𝑎, 𝑏 евклидова пространства выполняется неравенство |(𝑎, 𝑏)| ⩽ |𝑎| ⋅ |𝑏| , (34) которое обращается в равенство если и только если векторы 𝑎 и 𝑏 пропорциональны. Доказательство. Если 𝑎 = 𝑏 = 0, обе части неравенства нулевые. Если 𝑎 ≠ 0, то определена нормальная составляющая 𝑏𝑎⊥ вектора 𝑏 относительно 𝑎, и её скалярный квадрат (𝑏𝑎⊥ , 𝑏𝑎⊥ ) = (𝑏, 𝑏) − (𝑎, 𝑏)2 ∕(𝑎, 𝑎) ⩾ 0 (35) зануляется если и только если 𝑏 пропорционален 𝑎. Домножая обе части (35) на (𝑎, 𝑎), получа ем (𝑏, 𝑏)(𝑎, 𝑎) ⩾ (𝑎, 𝑏)2 , что равносильно (34). Пример 3.2 (неравенство Коши – Буняковского для чисел) Неравенство (34) применительно к векторам евклидова пространства ℝ𝑛 из прим. 3.1 утвер ждает, что для любых двух наборов вещественных чисел 𝑥1 , 𝑥2 , … , 𝑥𝑛 и 𝑦1 , 𝑦2 , … , 𝑦𝑛 выполняет ся неравенство (𝑥1 𝑦1 + 𝑥2 𝑦2 +⋯+ 𝑥𝑛 𝑦𝑛 )2 ⩽ (𝑥12 + 𝑥22 + ⋯ + 𝑥𝑛2 )⋅(𝑦12 + 𝑦22 + ⋯ + 𝑦𝑛2 ), обращающееся в равенство если и только если эти наборы чисел пропорциональны. 35 3.1. Длина вектора и перпендикулярность Следствие 3.2 (неравенство треугольника) Для любых двух векторов 𝑎, 𝑏 евклидова пространства выполняется неравенство треугольника1 |𝑎 + 𝑏| ⩽ |𝑎| + |𝑏| (36) 𝑎 𝑎 𝑏 𝑎−𝑏 (см. рис. 3⋄3). Оно обращается в равенство если и только если векторы 𝑎 и 𝑏 сонаправлены, т. е. один получается из другого умножением на неотрицательное число. 𝑎+𝑏 𝑏 𝑎+𝑏 Рис. 3⋄3. Неравенство треугольника. Рис. 3⋄4. Диагонали ромба. Доказательство. Возводя обе части неравенства |𝑎 + 𝑏| ⩽ |𝑎| + |𝑏| в квадрат, получаем экви валентное неравенство (𝑎 + 𝑏, 𝑎 + 𝑏) ⩽ (𝑎, 𝑎) + 2 |𝑎| ⋅ |𝑏| + (𝑏, 𝑏), которое после раскрытия скобок в левой части и очевидных сокращений превращается в неравенство (𝑎, 𝑏) ⩽ |𝑎| ⋅ |𝑏|, отличающееся от неравенства (34) отсутствием модуля в левой части. При (𝑎, 𝑏) < 0 оно заве домо выполняется в строгой форме. При (𝑎, 𝑏) ⩾ 0 оно выполняется по сл. 3.1 и превращается в равенство если и только если 𝑏 = 𝜆𝑎, где 𝜆 ⩾ 0, так как (𝑎, 𝑏) ⩾ 0. Упражнение 3.3. Проверьте, что диагонали ромба перпендикулярны, т. е. (𝑎 + 𝑏, 𝑎 − 𝑏) = 0 для любых двух векторов 𝑎, 𝑏 одинаковой длины |𝑎| = |𝑏|, см. рис. 3⋄4. 3.1.1. Расстояние между точками. Аффинные пространства над евклидовыми векторны ⃖⃖⃖⃗| вектора 𝑎𝑏 ⃖⃖⃖⃗, соединяющего точ ми пространствами также называются евклидовыми. Длина |𝑎𝑏 ки 𝑎 и 𝑏 такого пространства, называется расстоянием между точками 𝑎 и 𝑏 и обозначает ся |𝑎, 𝑏| или |𝑏 − 𝑎|. Обратите внимание, что |𝑏 − 𝑎| = |𝑎 − 𝑏|, так же как и |𝑎, 𝑏| = |𝑏, 𝑎|. Неравенство треугольника (36) на языке точек означает, что для любых трёх точек 𝑎, 𝑏, 𝑝 вы полняется неравенство |𝑝 − 𝑎| + |𝑏 − 𝑝| ⩾ |𝑏 − 𝑎|, которое обращается в равенство если и только если векторы ⃖⃖⃖ 𝑎𝑝⃗ и ⃖⃖⃖ 𝑝𝑏⃗ сонаправлены. Последнее равносильно тому, что точка 𝑝 является барицентрической комбинацией2 точек 𝑎 и 𝑏 с неотрицательными весами. Упражнение 3.4. Убедитесь в этом. В вещественном аффинном пространстве множество всех неотрицательных барицентрических комбинаций двух различных точек 𝑎 ≠ 𝑏 называется отрезком и обозначается [𝑎, 𝑏] ≝ {𝛼𝑎 + 𝛽𝑏 | 𝛼, 𝛽 ⩾ 0 и 𝛼 + 𝛽 = 1} . Мы заключаем, что в евклидовом аффинном пространстве отрезок [𝑎, 𝑏] представляет собою ГМТ 𝑥 , удовлетворяющих равенству |𝑎 − 𝑥 | + |𝑥 − 𝑏| = |𝑎 − 𝑏|. 1 2 Чем, собственно, и оправдывается термин «длина». См. n∘ 1.5 на стр. 16. 36 §3 Евклидова плоскость 3.1.2. Перпендикулярные прямые. Две прямые в евклидовом пространстве называются перпендикулярными, если перпендикулярны их векторы скоростей. Предложение 3.2 (ортогональная проекция точки на прямую) Для любых прямой 𝓁 и точки 𝑝 ∉ 𝓁 следующие два условия на точку 𝑞 ∈ 𝓁 эквивалентны: 1) |𝑥 − 𝑝| > |𝑞 − 𝑝| для всех отличных от 𝑞 точек 𝑥 ∈ 𝓁 2) прямая (𝑝𝑞 ) перпендикулярна прямой 𝓁. Точка 𝑞 ∈ 𝓁 с такими свойствами существует и единственна1 . Доказательство. Пусть прямая 𝓁 задаётся параметрическим уравнением 𝑜 + 𝑡𝑣 , где 𝑡 пробега ет ℝ, 𝑜 ∈ 𝓁 — произвольно зафиксированная точка, 𝑣 — вектор скорости прямой 𝓁. Точка 𝑞 ∈ 𝓁, 𝑝 удовлетворяющая условию (1) очевидно единственна, если существует. С другой стороны, по предл. 3.1, при менённому к векторам 𝑎 = 𝑣 и 𝑏 = ⃖⃖⃖ 𝑜𝑝⃗, на прямой 𝓁 есть единственная такая точка 𝑞 ∈ 𝓁, что векторы 𝑣 и ⃖⃖⃖ 𝑞𝑝⃗ перпендикулярны, см. рис. 3⋄5. Тем самым, усло вие (2) выполняется для единственной точки 𝑞 ∈ 𝓁. 𝑞 𝑣 ℓ При этом для любой отличной от неё точки 𝑥 ∈ 𝓁 по 𝑜 𝑥 ) теореме Пифагора |⃖⃖⃖ 𝑝𝑥⃗|2 = |⃖⃖⃖ 𝑝𝑞⃗|2 + |⃖⃖⃖ 𝑞𝑥⃗|2 > |⃖⃖⃖ 𝑝𝑞⃗|2 , отку ⃖⃖⃖ 𝑜𝑞⃗ = (( ,⃖⃖⃖⃗ ⋅𝑣 , ) да |𝑥 − 𝑝| > |𝑞 − 𝑝|. Тем самым, эта точка 𝑞 одновре Рис. 3⋄5. менно удовлетворяет и условию (1). Упражнение 3.5. Покажите, что на евклидовой плоскости через любую точку 𝑝 проходит един ственная прямая, перпендикулярная произвольно заданной прямой 𝓁. 3.2. Ортонормальные базисы. Векторы единичной длины принято называть единичными. Ба зис двумерного евклидова векторного пространства называется ортонормальным, если он со стоит из двух перпендикулярных единичных векторов. С любой парой непропорциональных векторов 𝑎, 𝑏 можно связать ортонормальный базис из векторов 𝑒1 = 𝑎 ∕|𝑎| и 𝑒2 = 𝑏𝑎⊥ ∕|𝑏𝑎⊥ | , где 𝑏𝑎⊥ = 𝑏 − 𝑎 ⋅ (𝑎, 𝑏)∕(𝑎, 𝑎) — ортогональная проекция2 вектора 𝑏 на вектор 𝑎. Таким образом, на любой евклидовой плоскости есть ортонормальный базис. Упражнение 3.6. Покажите, что каждый единичный вектор 𝑒 на евклидовой плоскости вклю чается ровно в два ортонормальных базиса (𝑒, 𝑓) и (𝑒, −𝑓), отличающиеся друг от друга ори ентацией. Предложение 3.3 Координаты вектора 𝑢 = 𝑥1 𝑒1 + 𝑥2 𝑒2 в ортонормальном базисе 𝑒1 , 𝑒2 равны его скалярным произведениям с базисными векторами: 𝑥1 = (𝑢, 𝑒1 ), 𝑥2 = (𝑢, 𝑒2 ), а скалярное произведение векторов 𝑢 = 𝑥1 𝑒1 + 𝑥2 𝑒2 и 𝑤 = 𝑦1 𝑒1 + 𝑦2 𝑒2 вычисляется как в прим. 3.1 на стр. 33: (𝑢, 𝑤) = 𝑥1 𝑦1 + 𝑥2 𝑦2 . 1 2 Она называется ортогональной проекцией точки 𝑝 на прямую 𝓁. См. опр. 3.2 на стр. 34. 37 3.2. Ортонормальные базисы Доказательство. Первое утверждение доказывается скалярным умножением обеих частей ра венства1 𝑢 = 𝑥1 𝑒1 + 𝑥2 𝑒2 на векторы 𝑒1 и 𝑒2 , второе — бесхитростным раскрытием скобок в выражении (𝑥1 𝑒1 + 𝑥2 𝑒2 , 𝑦1 𝑒1 + 𝑦2 𝑒2 ). Пример 3.3 (уравнение прямой на евклидовой плоскости) В координатах (𝑥1 , 𝑥2 ) относительно ортонормального базиса уравнение ℓ = { 𝑥 | (𝑥 , 𝑛 ) = 𝑐 } (37) |𝑛 | 𝛼1 𝑥1 + 𝛼2 𝑥2 = 𝑐 ( , ) 𝑑 = |𝑐 | ∶ 𝑥 = ( , ) ⋅𝑛 Задаёт прямую, перпендикулярную вектору 𝑛 = (𝛼1 , 𝛼2 ) и расположенную на расстоянии |𝑐 |∕|𝑛| от начала коор динат в направлении этого вектора при 𝑐 > 0 и в проти 𝑛 𝑥 воположном направлении при 𝑐 < 0. Действительно, со отношение (37) означает, что скалярное произведение переменного вектора 𝑥 = (𝑥1 , 𝑥2 ) с фиксированным век 𝑜 тором 𝑛 постоянно и равно (𝑛, 𝑥 ) = 𝑐 , т. е. прямая (37) Рис. 3⋄6. Пямая (𝑛, 𝑥 ) = 𝑐 . заметается концами всех векторов 𝑥 , имеющих заданную ортогональную проекцию 𝑥𝑛 = 𝑛 ⋅ (𝑥 , 𝑛)∕(𝑛, 𝑛) = 𝑛 ⋅ 𝑐∕|𝑛|2 на вектор 𝑛, см. рис. 3⋄6. Длина этой проекции равна √(𝑥𝑛 , 𝑥𝑛 ) = |𝑐 | ∕ |𝑛|, а её направление определяется знаком константы 𝑐 : при 𝑐 > 0 проекция сонаправлена с 𝑛, а при 𝑐 < 0 — проти воположно направлена. При 𝑐 = 0 прямая (37) проходит через начало координат. К примеру, срединный перпендикуляр к отрезку [𝑎, 𝑏], т. е. прямая перпендикулярная вектору 𝑎 − 𝑏 и прохо дящая через точку (𝑎 + 𝑏)∕ 2, задаётся уравнением (𝑎 − 𝑏, 𝑥) = (𝑎 − 𝑏, 𝑎 + 𝑏)∕ 2 = (|𝑎|2 − |𝑏|2 ) ∕ 2 . (38) Две прямые (𝑛, 𝑥 ) = 𝑐1 и (𝑛, 𝑥 ) = 𝑐2 , перпендикулярные одному и тому же вектору 𝑛 удалены друг от друга на расстояние |𝑐1 − 𝑐2 |∕|𝑛|. В частности, расстояние от заданной точки 𝑎 до прямой (𝑛, 𝑥) = 𝑐 , равное расстоянию от этой прямой до параллельной ей и проходящей через точку 𝑎 прямой (𝑛, 𝑥 ) = (𝑛, 𝑎), можно вычислять как |𝑐 − (𝑛, 𝑎)|∕|𝑛|. Упражнение 3.7. Покажите, что биссектрисы углов, возникающих при пересечении прямых (𝑛1 , 𝑥) = 𝑐1 и (𝑛2 , 𝑥) = 𝑐2 , задаются уравнениями |𝑛2 | ⋅ (𝑐1 − (𝑛1 , 𝑥)) = ±|𝑛1 | ⋅ (𝑐2 − (𝑛2 , 𝑥)) и перпендикулярны друг другу. Предложение 3.4 (определитель Грама) Если векторы 𝑒1 , 𝑒2 составляют ортонормальный базис евклидова пространства 𝑉 , то для любых векторов 𝑢, 𝑤 ∈ 𝑉 и любой ненулевой функции площади 𝑠 ∶ 𝑉 × 𝑉 → ℝ выполняется равенство 𝑠 2 (𝑢 , 𝑤 ) (𝑢 , 𝑢 ) ( 𝑢 , 𝑤 ) = det ((𝑤, 𝑢) (𝑤, 𝑤)) 𝑠2 (𝑒1 , 𝑒2 ) (определитель в правой части называется определителем Грама векторов 𝑢, 𝑤). Доказательство. Пусть 𝑢 = 𝑥1 𝑒1 + 𝑥2 𝑒2 , 𝑤 = 𝑦1 𝑒1 + 𝑦2 𝑒2 . Тогда по сл. 1.2 на стр. 13 𝑠(𝑢, 𝑤)∕ 𝑠(𝑢, 𝑤) = det(𝑢, 𝑤) = 𝑥1 𝑦2 − 𝑥2 𝑦1 . 1 Ср. с доказательством лем. 1.2 на стр. 11. 38 §3 Евклидова плоскость С другой стороны, (𝑢, 𝑢) ⋅ (𝑤, 𝑤) − (𝑢, 𝑤 )2 = (𝑥12 + 𝑥22 )(𝑦12 + 𝑦22 ) − (𝑥1 𝑦1 + 𝑥2 𝑦2 )2 = (𝑥1 𝑦2 )2 + + (𝑥2 𝑦1 )2 − 2 𝑥1 𝑦1 𝑥2 𝑦2 = (𝑥1 𝑦2 − 𝑥2 𝑦1 )2 . Упражнение 3.8. Выведите из предл. 3.4 другое доказательство неравенства Коши – Буняков ского – Шварца (34). 3.2.1. Евклидова площадь. Из предл. 3.4 вытекает, что для любых двух ортонормальных базисов (𝑒1′ , 𝑒2′ ) и (𝑒1″ , 𝑒2″ ) на евклидовой плоскости и любой ненулевой формы площади 𝑠 отно шение 𝑠2 (𝑒1″ , 𝑒2″ ) 1 0 = det = 1, (0 1) 𝑠2 (𝑒1′ , 𝑒2′ ) откуда 𝑠(𝑒1″ , 𝑒2″ ) = ±𝑠(𝑒1′ , 𝑒2′ ), т. е. все ортонормальные базисы имеют равную по абсолютной величине площадь. Функция площади 𝑠 на евклидовой плоскости ℝ2 называется евклидовой, если 𝑠(𝑒1 , 𝑒2 ) = 1 для стандартного ортонормального базиса 𝑒1 = (1, 0), 𝑒2 = (0, 1). Всюду да лее обозначения 𝑠(𝑢, 𝑣 ) и 𝑠(𝑎𝑏𝑐 ) применительно в евклидову пространству ℝ2 по умолчанию означают именно евклидову площадь. Ортонормальные базисы площади 1 называются поло жительно ориентированными, а площади −1 — отрицательно ориентированными. Упражнение 3.9. Убедитесь, что | det(𝑎, 𝑏)| = |𝑎| ⋅ |𝑏𝑎⊥ |, т. е. модуль евклидовой площади па раллелограмма равен произведению длин основания и опущенной на него высоты. 3.3. Углы и тригонометрия. Пусть векторы 𝑒, 𝑒⊥ составляют положительно ориентированный ортонормальный базис. Коэффициенты 𝑥 , 𝑦 разложения 𝑓 = 𝑥 ⋅ 𝑒 + 𝑦 ⋅ 𝑒⊥ произвольного еди ничного вектора 𝑓 по этому базису удовлетворяют соотношению 𝑥 2 + 𝑦 2 = 1 и лежат на от резке [−1, 1]. Следовательно, существует такое число 𝛼 ∈ ℝ, что 𝑥 = cos 𝛼 и 𝑦 = sin 𝛼 , причём любые два числа 𝛼 ′ , 𝛼 ″ с этим свойством различаются на целое число оборотов по единичной окружности, т. е. 𝛼 ′ − 𝛼 ″ = 2𝜋𝑘, где 𝑘 ∈ ℤ, см. рис. 3⋄7. Множество всех таких чисел называется ориентированным углом между единичными векторами 𝑒 и 𝑓 и обозначается ∡(𝑒, 𝑓) ≝ {𝛼 ∈ ℝ | 𝑓 = 𝑒 ⋅ cos 𝛼 + 𝑒⊥ ⋅ sin 𝛼} . ∡( 𝑒𝑓 ) 𝑒⊥ sin Функции cos 𝑡 и sin 𝑡 принимают на всех числах из ∡(𝑒, 𝑓) одни и те же значения, которые мы будем записывать как cos ∡(𝑒, 𝑓) и sin ∡(𝑒, 𝑓). Таким образом, для любого положительно ориентирован ного ортонормального базиса 𝑒, 𝑒⊥ и любого единичного вектора 𝑓 выполняются соотношения1 (39) 𝑓 = 𝑒 ⋅ cos ∡(𝑒, 𝑓) + 𝑒⊥ ⋅ sin ∡(𝑒, 𝑓) cos ∡(𝑒, 𝑓) = (𝑒, 𝑓) = 𝑠(𝑓, 𝑒⊥ ) 𝑓 (310) sin ∡(𝑒, 𝑓) = 𝑠(𝑒, 𝑓) = (𝑒⊥ , 𝑓) Обратите внимание, что (𝑒, 𝑓) = (𝑓, 𝑒) и 𝑠(𝑒, 𝑓) = −𝑠(𝑓, 𝑒), отку да cos ∡(𝑒, 𝑓) = cos ∡(𝑓, 𝑒), sin ∡(𝑒, 𝑓) = − sin ∡(𝑓, 𝑒). Тем самым, ∡(𝑒, 𝑓) = −∡(𝑓, 𝑒), т. е. углы, откладываемые против часовой стрел ки считаются со знаком «+», а по часовой — со знаком «−». ∡(𝑒𝑓) co s∡ (𝑒 𝑓) 𝑒 Рис. 3⋄7. Упражнение 3.10. Убедитесь, что единичный вектор 𝑓 = 𝑥 ⋅ 𝑒 + 𝑦 ⋅ 𝑒⊥ дополняется до поло жительно ориентированного ортонормального базиса 𝑓, 𝑓⊥ вектором 𝑓⊥ = −𝑦𝑒 + 𝑥𝑒⊥ и выведите отсюда соотношения cos ∡(𝑒, 𝑓⊥ ) = − sin ∡(𝑒, 𝑓) и sin ∡(𝑒, 𝑓⊥ ) = cos ∡(𝑒, 𝑓). 1 Вторая и третья строки вычисляют коэффициенты написанного в первой строке разложения по фор мулам из лем. 1.2 на стр. 11 и предл. 3.3 на стр. 36. 39 3.3. Углы и тригонометрия Раскладывая по ортонормальному базису 𝑓, 𝑓⊥ произвольный единичный вектор 𝑔 = 𝑓 ⋅ cos(∡(𝑓, 𝑔)) + 𝑓⊥ ⋅ sin(∡(𝑓, 𝑔)) и подставляя сюда разложения векторов 𝑓, 𝑓⊥ по базису 𝑒, 𝑒⊥ , получаем в матричных обозначе ниях из n∘ 2.3 на стр. 26 равенство (𝑒, 𝑒⊥ ) ⋅ cos ∡(𝑒, 𝑔) cos ∡(𝑓, 𝑔) = 𝑔 = (𝑓 , 𝑓 ⊥ ) ⋅ = ( sin ∡(𝑒, 𝑔) ) ( sin ∡(𝑓, 𝑔) ) = (𝑒 , 𝑒 ⊥ ) ⋅ cos ∡(𝑒, 𝑓) − sin ∡(𝑒, 𝑓) cos ∡(𝑓, 𝑔) ⋅ = ( sin ∡(𝑒, 𝑓) cos ∡(𝑒, 𝑓) ) ( sin ∡(𝑓, 𝑔) ) = (𝑒 , 𝑒 ⊥ ) ⋅ cos ∡(𝑒, 𝑓) ⋅ cos ∡(𝑓, 𝑔) − sin ∡(𝑒, 𝑓) ⋅ sin ∡(𝑓, 𝑔) . (cos ∡(𝑒, 𝑓) ⋅ sin ∡(𝑓, 𝑔) + sin ∡(𝑒, 𝑓) ⋅ cos ∡(𝑓, 𝑔)) Тем самым, для любой тройки единичных векторов 𝑒, 𝑓, 𝑔 cos ∡(𝑒, 𝑔) = cos ∡(𝑒, 𝑓) ⋅ cos ∡(𝑓, 𝑔) − sin ∡(𝑒, 𝑓) ⋅ sin ∡(𝑓, 𝑔) (311) sin ∡(𝑒, 𝑔) = cos ∡(𝑒, 𝑓) ⋅ sin ∡(𝑓, 𝑔) + sin ∡(𝑒, 𝑓) ⋅ cos ∡(𝑓, 𝑔) . Ориентированный угол ∡(𝑎, 𝑏) между произвольными векторами 𝑎 и 𝑏 определяется как угол между сонаправленными с 𝑎 и 𝑏 единичными векторами 𝑎 ∕|𝑎| и 𝑏 ∕|𝑏|. Таким образом cos ∡(𝑎, 𝑏) = (𝑎, 𝑏) |𝑎| ⋅ |𝑏| и sin ∡(𝑎, 𝑏) = 𝑠(𝑎, 𝑏) . |𝑎 | ⋅ | 𝑏 | (312) В частности, мы имеем ориентированную версию школьной формулы для площади: 𝑠(𝑎, 𝑏) = |𝑎| ⋅ |𝑏| ⋅ sin ∡(𝑎, 𝑏) . (313) Упражнение 3.11. Убедитесь, что для любых векторов 𝑢, 𝑤 ∈ 𝑉 справедлива евклидова теоре ма косинусов: |𝑢 + 𝑤|2 = |𝑢|2 + |𝑤|2 + 2 ⋅ |𝑢| ⋅ |𝑤 | ⋅ cos ∡(𝑢, 𝑤). 𝑣 𝑢 𝑢− Пример 3.4 (окружности) ГМТ 𝑥 , удалённых от данной точки на заданное 𝑣 𝑥 расстояние 𝑟, называется окружностью радиуса 𝑟 с центром 𝑐 и обозначается 𝑆(𝑟, 𝑐 ). Таким обра 𝑣 зом, точка 𝑥 с радиус вектором ⃖⃖⃖ 𝑐𝑥⃗ = 𝑢 лежит на 𝑢+ 2 окружности 𝑆(𝑟, 𝑐 ) если и только если (𝑢, 𝑢) = 𝑟 . Каждая проходящая через центр прямая с направ 𝑐 ляющим вектором 𝑣 длины |𝑣 | = 𝑟 пересекает −𝑣 𝑣 окружность в точках 𝑐 ± 𝑣 , см. рис. 3⋄8. Отрезок 𝑤+ 𝑤 с концами в этих точках называется диаметром. 𝑣 Поскольку для вектора 𝑣 длины 𝑟 и любого век 𝑦 тора 𝑢 выполняется равенство (𝑢 + 𝑣 , 𝑢 − 𝑣 ) = 2 = (𝑢, 𝑢) − 𝑟 , точка 𝑥 = 𝑐 + 𝑢 лежит на окруж ности если и только если (𝑢 + 𝑣 , 𝑢 − 𝑣 ) = 0. Таким Рис. 3⋄8. Окружность и углы. образом, окружность 𝑆(𝑟, 𝑐 ) представляет собою ГМТ 𝑥 , из которых её диаметр виден под прямым углом, см. рис. 3⋄8. 𝑢 Упражнение 3.12. При помощи рис. 3⋄8 покажите, что дуга окружности видна из любой не лежащей на этой дуге точки окружности под вдвое меньшим углом, чем из центра. 40 §3 Евклидова плоскость 3.4. Движения. Отображение 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) евклидовой плоскости в себя называется дви жением или изометрией, если оно сохраняет расстояние, т. е. |𝑝 − 𝑞 | = |𝑓 (𝑝) − 𝑓 (𝑞 )| для любых двух точек 𝑝, 𝑞 ∈ 𝔸2 . Поскольку каждый отрезок [𝑎, 𝑏] представляет собою ГМТ 𝑥 , для которых1 |𝑎 − 𝑥| + |𝑥 − 𝑏| = |𝑎 − 𝑏|, каждое движение биективно переводит любой отрезок [𝑎, 𝑏] в отрезок [𝜑(𝑎), 𝜑(𝑏)] той же длины. Тем самым, все движения биективны и переводят прямые в прямые. Поэтому, согласно n∘ 2.2 на стр. 24, все движения являются аффинными преобразованиями. В частности, каждое движение однозначно определяется своим действием на любой треугольник. Упражнение 3.13. Докажите школьные признаки конгруэнтности треугольников по трём сто ронам, по стороне и двум прилежащим к ней углам и по двум сторонам и углу между ними2 . Движения образуют в аффинной группе Aff(𝑉 ) подгруппу, которая называется группой движе ний или группой изометрий евклидова аффинного пространства 𝔸(𝑉 ) и обозначается Isom 𝔸(𝑉 ). Группа параллельных переносов 𝑇, очевидно, содержится в Isom 𝔸(𝑉 ). 3.4.1. Линейные ортогональные преобразования. Фиксируем какуюнибудь начальную точку 𝑜 ∈ 𝔸(𝑉 ) и представим движение 𝜑 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) в виде композиции3 𝜑 = 𝜏𝑣 ∘ 𝜑𝑜 па ⃖⃖⃖⃗ ↦ 𝐷𝜑 (⃖⃖⃖ раллельного переноса на вектор 𝑣 = ⃖⃖⃖⃖⃖⃖⃖⃗ 𝑜𝜑(𝑜) и линейного преобразования 𝜑𝑜 ∶ 𝑜𝑥 𝑜𝑥⃗), задаваемого дифференциалом 𝐷𝜑 ∶ 𝑉 ⥲ 𝑉 движения 𝜑 и оставляющего точку 𝑜 на месте. По скольку линейное преобразование 𝜑𝑜 = 𝜏−𝑣 ∘ 𝜑 тоже является движением, оно сохраняет длины векторов, а следовательно и скалярные произведения: для всех 𝑢, 𝑤 ∈ 𝑉 имеем4 (𝜑(𝑢), 𝜑(𝑤)) = = (|𝜑(𝑢 + 𝑤)|2 − |𝜑(𝑢)|2 − |𝜑(𝑤)|2 ) ∕ 2 = (|𝑢 + 𝑤|2 − |𝑢|2 − |𝑤|2 ) ∕ 2 = (𝑣, 𝑤). Сохраняющие скалярное произведение линейные преобразования евклидова векторного пространства 𝑉 на зываются ортогональными или изометрическими. Так как ортогональное преобразование пе реводит ортонормальный базис в ортонормальный, оно сохраняет абсолютную величину ев клидовой площади и по предл. 2.4 на стр. 28 имеет определитель ±1. Ортогональные преобра зования определителя +1 сохраняют ориентацию и называются собственными или специальны ми. Ортогональные преобразования определителя −1 меняют ориентацию и называются несоб ственными. Пример 3.5 (отражения) Каждый отличный от нуля вектор 𝑛 ∈ 𝑉 задаёт несобственное ортогональное преобразова ние 𝜎𝓁 ∶ 𝑉 → 𝑉 , переводящее вектор 𝑛 в 𝜎𝑛 (𝑛) = −𝑛 и тождественно действующее на ортого нальной этому вектору прямой 𝓁 = 𝑛⊥ , которая задаётся в ортонормальном базисе уравнени ем (𝑛, 𝑥 ) = 0. Мы будем называть преобразование 𝜎𝑛 𝑣 = (( ,, )) ⋅ 𝑛 𝑣 𝜎ℓ (𝑣) отражением5 в прямой 𝓁. Отражение 𝜎𝓁 переводит 𝑣 каждый вектор 𝑣 ∈ 𝑉 в вектор 𝜎𝓁 (𝑣 ), который имеет ту же нормальную составляющую6 относительно 𝑛, ℓ = 𝑛⊥ что и 𝑣 , однако противоположную по знаку ортого нальную проекцию на 𝑛, см. рис. 3⋄9. Тем самым, (𝑛 , 𝑣 ) ⋅𝑛. 𝜎𝓁 (𝑣) = 𝑣 − 2 (𝑛, 𝑛) 𝑜 (314) 𝑛 Рис. 3⋄9. Отражение 𝜎𝓁 . См. n∘ 3.1.1 на стр. 35. Т. е. покажите, что в каждом из этих трёх случаев единственное аффинное преобразование, перево дящее вершины одного треугольника в соответствующие вершины другого, является движением. 3 См. предл. 2.5 на стр. 29. 4 См. формулу (31) на стр. 33. 5 В школьном курсе его обычно называют осевой симметрией. 6 См. опр. 3.2 на стр. 34. 1 2 41 3.4. Движения Упражнение 3.14. Проверьте прямым вычислением, что преобразование (314) линейно и со храняет скалярные произведения. Предложение 3.5 Каждое несобственное ортогональное линейное преобразование плоскости является отраже нием. Доказательство. Поскольку несобственное преобразование 𝜑 не тождественно, 𝜑(𝑣 ) ≠ 𝑣 для некоторого ненулевого вектора 𝑣 ∈ 𝑉 . Так как 𝜑 сохраняет начальную точку 𝑜 и середину 𝑠 отрезка [𝑣 , 𝜑(𝑣 )], оно действует на треугольник ▵ 𝑜𝑠𝑣 так же, как отражение в срединном пер пендикуляре (𝑜𝑠) к отрезку [𝑣 , 𝜑(𝑣 )]. Поэтому 𝜑 = 𝜎(𝑜𝑠) . Предложение 3.6 Каждое собственное ортогональное линейное преобразование плоскости является поворотом. Доказательство. Если собственное ортогональное линейное преобразование 𝜑 ∶ 𝑉 → 𝑉 пере водит единичный вектор 𝑒1 в вектор 𝑓1 = 𝜑(𝑒1 ), то оно переводит вектор 𝑒2 , дополняющий 𝑒1 до положительно ориентированного ортонормального базиса, в вектор 𝑓2 , дополняющий 𝑓1 до положительно ориентированного базиса, как на рис. 3⋄10. Тем самым, 𝜑 представляет собою поворот на ориентированный угол 𝜗 = ∡(𝑒1 , 𝑓1 ). Упражнение 3.15. Убедитесь, что матрица1 поворота на угол 𝜗 против часовой стрелки имеет cos 𝜗 − sin 𝜗 в любом положительно ориентированном ортонормальном базисе вид . ( sin 𝜗 cos 𝜗) 𝑢 𝑒 𝜎 𝜎 (𝑢 ) 𝑓 𝑢 = 𝜎 (𝑢 ) 𝑓 𝜗 𝜎 𝜎 (𝑢 ) 𝜗 Рис. 3⋄10. Поворот. 𝑒 𝜎 (𝑢 ) Рис. 3⋄11. Композиция отражений. Упражнение 3.16. Покажите, что композиция 𝜎2 ∘ 𝜎1 отражений в прямых с векторами скоро стей 𝑢1 и 𝑢2 является поворотом на угол 2∡(𝑢1 , 𝑢2 ) в направлении от 𝑢1 к 𝑢2 , см. рис. 3⋄11. 3.4.2. Описание изометрий аффинной евклидовой плоскости. Из предыдущего вытека ет, что любое несобственное движение евклидовой аффинной плоскости является композицией 𝜏𝑤 ∘𝜎𝓁 отражения и сдвига, а любое собственное — композицией 𝜏𝑢 ∘𝜚𝑜,𝜗 сдвига с поворотом 𝜚𝑜,𝜗 вокруг некоторой точки 𝑜 на какойто угол 𝜗. Собственное движение 𝜑 = 𝜏𝑢 ∘ 𝜚𝑜,𝜗 с ненулевым углом 𝜗 имеет неподвижную точку — конец вектора ⃖⃖⃖ 𝑝𝑞⃗ = 𝑢, который является основанием равнобедренного треугольника ▵ 𝑜𝑝𝑞 с 1 См. n∘ 2.3 на стр. 26. 42 §3 Евклидова плоскость ⃖⃖⃖⃗) = −𝜗, см. рис. 3⋄12. По предл. 3.5 преобра вершиной 𝑜 и ориентированным углом ∡(⃖⃖⃖ 𝑜𝑝⃗, 𝑜𝑞 зование 𝜑 является поворотом вокруг точки 𝑞 . Так как поворот вокруг 𝑞 на угол 𝜗 переводит 𝑜 в 𝜑(𝑜), мы заключаем, что 𝜑 = 𝜚𝑞,𝜗 . Упражнение 3.17. Найдите координаты точки 𝑞 относительно положительно ориентирован ного ортонормального репера (𝑜; 𝑢1 , 𝑢2 ), вектор 𝑢1 которого сонаправлен с 𝑢. Несобственное движение 𝜑 = 𝜏𝑤 ∘ 𝜎𝓁 является композицией 𝜑 = 𝜏𝑤𝓁 ∘ 𝜎𝜏𝑤∕2 (𝓁) отражения относительно сдвинутой на половину вектора 𝑤 прямой 𝜏𝑤∕2 (𝓁) и параллельного этой прямой сдвига на вектор 𝑤𝓁 — ортогональную проекцию вектора 𝑤 на прямую 𝓁, см. рис. 3⋄13. Дей ствительно, композиции 𝜏𝑤 ∘ 𝜎𝓁 и 𝜏𝑤𝓁 ∘ 𝜎𝜏𝑤∕2 (𝓁) одинаково действуют на аффинный репер (𝑜; 𝑣 , 𝑛) с началом в произвольной точке 𝑜 ∈ 𝓁 и ортонормальными базисными векторами 𝑣 , 𝑛, направ ленными, соответственно, параллельно и перпендикулярно прямой 𝓁, как на рис. 3⋄13. 𝑞 𝑢 𝑤 𝐷 (𝑣) 𝜑 (𝑜 ) 𝑤/ 2 𝑝 𝑤 𝜗 𝜗 𝐷 (𝑛) 𝑛 𝑢 𝑜 𝜑 (𝑜 ) Рис. 3⋄12. 𝜏𝑢 ∘ 𝜚𝑜,𝜗 = 𝜚𝑞,𝜗 . / (ℓ) 𝑤/ 2 𝜏 𝑜 𝑣 ℓ Рис. 3⋄13. 𝜏𝑤 ∘ 𝜎𝓁 = 𝜏𝑤 ∘ 𝜎𝜏 (𝓁) . 𝓁 𝑤∕2 Композиция отражения со сдвигом вдоль оси этого отражения называется скользящей сим метрией. Представление несобственного движения 𝜑 в виде скользящей симметрии 𝜆𝑣,𝓁 ≝ 𝜏𝑣 ∘ 𝜎𝓁 = 𝜎𝓁 ∘ 𝜏𝑣 , где 𝑣||𝓁 , замечательно тем, что отражение и сдвиг в нём коммутируют друг с другом, а само это пред ставление единственно: прямая 𝓁 однозначно определяется преобразованием 𝜑 как геометри ческое место середин отрезков [𝑝, 𝜑(𝑝)], после чего сдвиг 𝜏𝑣 = 𝜑 ∘ 𝜎𝓁 = 𝜎𝓁 ∘ 𝜑 тоже однозначно восстанавливается по 𝜑 и 𝓁. Суммируя сказанное, мы получаем следующее классическое опи сание движений плоскости. Теорема 3.1 (теорема Шаля1 ) Всякое собственное движение плоскости является сдвигом или поворотом, а всякое несобствен ное — скользящей симметрией. Упражнение 3.18. Покажите, что композиция отражения относительно прямой 𝓁1 с последую щим отражением относительно параллельной ей прямой 𝓁2 является сдвигом на удвоенное расстояние между 𝓁1 и 𝓁2 в направлении от 𝓁1 к 𝓁2 вдоль их общей нормали. Следствие 3.3 Любое собственное движение может быть (многими способами) разложено в композицию двух отражений, а несобственное — в композицию трёх. 1 Michel Floréal Chasles (15.XI.1793 – 18.XII.1880) — выдающийся французский геометр. 43 3.5. Комплексные числа 3.5. Комплексные числа. Обозначим через ℂ двумерное евклидово пространство с фиксиро ванным ортонормальным базисом, векторы которого будем обозначать 1 и 𝑖 . В разложении про извольного вектора 𝑧 ∈ ℂ по этому базису вектор 1 обычно опускают и пишут 𝑧 = 𝑥 + 𝑖𝑦, имея в виду вектор с координатами (𝑥 , 𝑦) в базисе 1, 𝑖 . Такой вектор имеет длину |𝑧| = √𝑥 2 + 𝑦 2 . Вещественные числа 𝑥 , 𝑦 и |𝑧| называются, соответственно, действительной частью, мнимой частью и модулем комплексного числа 𝑧 ∈ ℂ. Ориентированный угол ∡(1, 𝑧) между базисным вектором 1 и вектором 𝑧 называется аргументом числа 𝑧 и часто обозначается через1 Arg(𝑧) = {𝛼 ∈ ℝ | 𝑧 = |𝑧| cos 𝛼 + 𝑖 |𝑧| sin 𝛼} . Векторы 𝑧 ∈ ℂ называют комплексными числами, поскольку их можно не только складывать, но и умножать. Произведение 𝑧1 𝑧2 ∈ ℂ определяется как вектор, модуль которого равен произ ведению модулей, а аргумент — сумме аргументов сомножителей: |𝑧1 𝑧2 | ≝ |𝑧1 | ⋅ |𝑧2 | Arg(𝑧1 𝑧2 ) ≝ Arg(𝑧1 ) + Arg(𝑧2 ) = {𝜗1 + 𝜗2 | 𝜗1 ∈ Arg(𝑧1 ) , 𝜗2 ∈ Arg(𝑧2 )} (315) Базисный вектор 1 является нейтральным элементом относительно умножения, что оправды вает его опускание в формулах вроде 𝑧 = 𝑥 + 𝑦𝑖 = |𝑧| ⋅ (cos 𝛼 + 𝑖 sin 𝛼 ). Обратите внимание, что оба равенства суть верные равенства в ℂ, если понимать в них сложение и умножение как сложение и умножение комплексных чисел и считать поле вещественных чисел ℝ вложенным в плоскость ℂ в виде координатной прямой2 ℝ ⋅ 1 ⊂ ℂ. 𝑧 = 𝑥 + 𝑖𝑦 𝑦 = Im(𝑧) 𝒊 | |=√ + Arg( )= + , ∈ℤ 𝛼 𝑂 𝑧− 𝟏 −𝛼 𝑥 = Re(𝑧) | − |=| |− , Arg( − )=− + , ∈ℤ Рис. 3⋄14. Числа 𝑧 = |𝑧| ⋅ (cos 𝛼 + 𝑖 sin 𝛼 ) и 𝑧−1 = |𝑧|−1 (cos 𝛼 − 𝑖 sin 𝛼 ). Обратным по умножению к ненулевому вектору 𝑧 ∈ ℂ является вектор 𝑧−1 с противоположным аргументом Arg(𝑧−1 ) = − Arg(𝑧) и обратным модулем |𝑧−1 | = |𝑧|−1 , см. рис. 3⋄14. 1 Напомню, что ориентированный угол — это множество всех вещественных чисел, имеющих задан ные синус и косинус, как в форм. (39) на стр. 38. Любые два числа из этого множества различаются на целое число оборотов по единичной окружности. 2 Обратите внимание, что правило умножения отрицательных вещественных чисел («минус на минус даёт плюс») согласуется с формулами (315). 44 §3 Евклидова плоскость Предложение 3.7 Комплексные числа образуют поле. Доказательство. Из всех свойств поля1 нам остаётся проверить только распределительный за кон 𝑎(𝑏 + 𝑐 ) = 𝑎𝑏 + 𝑎𝑐 . На геометрическом языке это равенство означает, что задаваемое умно жением на фиксированный вектор 𝑎 ∈ ℂ отображение 𝜇𝑎 ∶ ℂ → ℂ, 𝑧 ↦ 𝑎𝑧, аддитивно, т. е. 𝜇𝑎 (𝑏 + 𝑐 ) = 𝜇𝑎 (𝑏) + 𝜇𝑎 (𝑐 ). Отображение 𝜇𝑎 представляет собою поворотную гомотетию — ком позицию поворота на угол Arg(𝑎) вокруг нуля и гомотетии с коэффициентом |𝑎| и центром в нуле. Так как и поворот, и гомотетия линейны, линейно и 𝜇𝑎 . 3.5.1. Алгебраическая запись комплексных чисел. Поскольку базисный вектор 𝑖 удовле творяет соотношению 𝑖 2 = −1 и умножение дистрибутивно по отношению к сложению, в поле ℂ выполняется равенство 𝑧1 𝑧2 = (𝑥1 + 𝑖𝑦1 )(𝑥2 + 𝑖𝑦2 ) = (𝑥1 𝑥2 − 𝑦1 𝑦2 ) + 𝑖 (𝑥1 𝑦2 + 𝑥2 𝑦1 ) . (316) Обратное к числу 𝑧 = 𝑥 + 𝑖𝑦 число 𝑧−1 равно 𝑧−1 = 𝑥 − 𝑖𝑦 𝑦 𝑥 − 𝑖𝑦 1 𝑥 = = 2 = −𝑖 2 . 2 2 𝑥 + 𝑖𝑦 (𝑥 + 𝑖𝑦)(𝑥 − 𝑖𝑦) 𝑥 + 𝑦 |𝑧| |𝑧 | (317) Число 𝑧 ≝ 𝑥 − 𝑖𝑦 называется комплексно сопряжённым к числу 𝑧 = 𝑥 + 𝑖𝑦. В терминах комплекс ного сопряжения 𝑧−1 = 𝑧 ∕|𝑧|2 . Геометрически, комплексное сопряжение 𝑧 ↦ 𝑧 представляет собою отражение комплексной плоскости относительно вещественной оси ℝ ⋅ 1. С алгебраической точки зрения сопряжение является инволютивным автоморфизмом поля ℂ, т. е. для всех 𝑧, 𝑧1 , 𝑧2 ∈ ℂ 𝑧 = 𝑧, 𝑧1 + 𝑧2 = 𝑧1 + 𝑧2 , 𝑧1 𝑧2 = 𝑧1 𝑧2 . Упражнение 3.19. Покажите, что следующие свойства автоморфизма2 𝜑 поля ℂ эквивалент ны: а) 𝜑(ℝ) ⊂ ℝ б) 𝜑 является линейным преобразованием двумерного векторного пространства ℂ над полем ℝ в) либо 𝜑(𝑧) = 𝑧 для всех 𝑧 ∈ ℂ, либо 𝜑(𝑧) = 𝑧 для всех 𝑧 ∈ ℂ. 3.6. Преобразования подобия. Отображение 𝜑 ∶ 𝔸2 (ℝ) → 𝔸2 (ℝ) евклидовой аффинной плос кости 𝔸2 = 𝔸(ℝ2 ) в себя называется преобразованием подобия или просто подобием, если оно изменяет все расстояния между точками в одно и тоже число раз, т. е. когда существует такая положительная вещественная константа 𝛾 = 𝛾(𝜑), зависящая только от 𝜑 и называемая коэф фициентом подобия, что |𝜑(𝑝) − 𝜑(𝑞 )| = 𝛾|𝑝 − 𝑞 | для всех точек 𝑝, 𝑞 ∈ 𝔸2 . Например, каждое движение является подобием с коэффициентом 1. Подобия образуют группу преобразований, которая называется группой подобий. Тот же аргумент, что и для движений3 , показывает, что подобия переводят прямые в прямые и, стало быть, являются аффинными преобразованиями. Упражнение 3.20. Убедитесь в этом и в том, что подобия переводят окружности в окружности. Подобия, сохраняющие ориентацию, называются собственными, а оборачивающие ориента цию — несобственными. 1 См. http://gorod.bogomolovlab.ru/ps/stud/algebra1/1314/lec02.pdf. См. n∘ 2.1.2 на стр. 23. 3 См. n∘ 3.4 на стр. 40. 2 45 3.6. Преобразования подобия Лемма 3.1 Собственные подобия сохраняют ориентированные углы, а несобственные изменяют знак ори ентированных углов. Доказательство. Беря композицию подобия 𝜑 с параллельным переносом, мы можем и будем считать, что оно сохраняет начало координат, т. е. является линейным преобразованием под лежащего векторного пространства 𝑉 ≃ ℝ2 . Тогда для любых двух векторов 𝑢, 𝑤 ∈ 𝑉 имеем1 2 2 2 (𝜑(𝑢), 𝜑(𝑤)) = |𝜑(𝑢) + 𝜑(𝑤)| − |𝜑(𝑢)| − |𝜑(𝑤)| = 2 2 2 = |𝜑(𝑢 + 𝑤)| − |𝜑(𝑢)| − |𝜑(𝑤)| = 𝛾2 (|𝑢 + 𝑤|2 − |𝑢|2 − |𝑤|2 ) = 𝛾2 (𝑢, 𝑤) , откуда cos ∡(𝜑(𝑢), 𝜑(𝑤)) = (𝜑(𝑢), 𝜑(𝑤)) (𝑢, 𝑤) = = cos ∡(𝑢, 𝑤) , |𝜑(𝑢)| ⋅ |𝜑(𝑤)| |𝑢| ⋅ |𝑤| т. е. ∡(𝜑(𝑢), 𝜑(𝑤)) = ±∡(𝑢, 𝑤 ). 3.6.1. Подобия как аффинные преобразования комплексной прямой. Фиксируем в дву мерном евклидовом пространстве 𝑉 любой ортонормальный базис, векторы которого обозна чим через 1 и 𝑖 , и отождествим это пространство с полем комплексных чисел ℂ, как в n∘ 3.5 выше. Это позволяет рассматривать вещественную аффинную плоскость 𝔸2 (ℝ) = 𝔸(𝑉 ) как ком плексную аффинную прямую 𝔸1 (ℂ). Мы собираемся показать, что группа собственных подобий вещественной плоскости 𝔸2 (ℝ) совпадает с аффинной группой комплексной прямой 𝔸1 (ℂ). Предложение 3.8 Каждое собственное подобие 𝜑 ∶ 𝔸1 (ℂ) → 𝔸1 (ℂ) является комплексным аффинным преобра зованием вида 𝑧 ↦ 𝑎𝑧 + 𝑏, а каждое несобственное — полуаффинным преобразованием вида 𝑧 ↦ 𝑎𝑧 + 𝑏, где числа 𝑎, 𝑏 ∈ ℂ однозначно определяются подобием 𝜑. Наоборот, для любых 𝑎, 𝑏 ∈ ℂ преобразования вида 𝑧 ↦ 𝑎𝑧 + 𝑏 и 𝑧 ↦ 𝑎𝑧 + 𝑏 являются, соответственно, собственным и несобственным подобиями. Доказательство. Беря композицию собственного подобия 𝜑 со сдвигом, мы можем и будем счи тать, что 𝜑 оставляет на месте нуль 0 ∈ ℂ. Так как 𝜑 сохраняет ориентированные углы и умно жает длины векторов на фиксированное положительное число 𝛾 ∈ ℝ, преобразование 𝜑 явля ется поворотной гомотетией, т. е. умножением на комплексное число 𝑎 = 𝜑(1), что доказывает первое утверждение. Для несобственного подобия 𝜑 преобразование 𝑧 ↦ 𝜑(𝑧), являющееся композицией 𝜑 с отражением в действительной оси, является собственным подобием и по уже доказанному имеет вид 𝑧 ↦ 𝑎𝑧 + 𝑏. Поэтому 𝜑(𝑧) = 𝑎𝑧 + 𝑏. Упражнение 3.21. Убедитесь в справедливости последнего утверждения из предл. 3.8. Следствие 3.4 Для любых двух пар различных точек 𝑎 ≠ 𝑏 и 𝑐 ≠ 𝑑 имеется единственное собственное подобие переводящее 𝑎 в 𝑐 и 𝑏 в 𝑑 . 1 Ср. с аналогичной выкладкой из n∘ 3.4.1 на стр. 40. 46 §3 Евклидова плоскость Доказательство. Неизвестные коэффициенты 𝑥1 , 𝑥2 ∈ ℂ искомого аффинного преобразования 𝑧 ↦ 𝑥1 𝑧 + 𝑥2 удовлетворяют системе линейных уравнений 𝑥1 𝑎 + 𝑥2 = 𝑐 {𝑥1 𝑏 + 𝑥2 = 𝑑 , имеющей в поле ℂ единственное решение1 𝑥1 = (𝑐 − 𝑑 )∕(𝑎 − 𝑏), 𝑥2 = (𝑎𝑑 − 𝑏𝑐 )∕(𝑎 − 𝑏). Следствие 3.5 Всякое собственное подобие является либо сдвигом, либо поворотной гомотетией. Доказательство. Аффинное преобразование 𝑧 ↦ 𝑎𝑧 + 𝑏 с нетождественным дифференциалом 𝑎 ≠ 1 имеет неподвижную точку 𝑐 = 𝑏 ∕(1 − 𝑎) и, стало быть, является поворотной гомотетией относительно этой точки. 1 См. лем. 1.2 на стр. 11. §4. Многомерие 4.1. Базисы и размерность. Рассмотрим произвольное векторное пространство 𝑉 над любым полем 𝕜. Будем говорить, что вектор 𝑣 ∈ 𝑉 линейно выражается через векторы 𝑤1 , … , 𝑤𝑚 , если 𝑣 = 𝜆1 𝑤1 + 𝜆2 𝑤2 + ⋯ + 𝜆𝑚 𝑤𝑚 для некоторых 𝜆𝑖 ∈ 𝕜. Правая часть этой формулы называется линейной комбинацией векторов 𝑤𝑖 ∈ 𝑉 с коэффициентами 𝜆𝑖 ∈ 𝕜. Набор векторов 𝑤1 , … , 𝑤𝑚 ∈ 𝑉 называется порождающим векторное пространство 𝑉 , если каждый вектор 𝑣 ∈ 𝑉 линейно через него выражается. Век торное пространство, порождённое конечным набором векторов, называется конечномерным. Порождающий набор векторов 𝑒1 , … , 𝑒𝑛 ∈ 𝑉 называется базисом векторного пространства 𝑉 , если любой вектор 𝑣 ∈ 𝑉 линейно выражается через него единственным образом, т. е. если из равенства 𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 = 𝑦1 𝑒1 + ⋯ + 𝑦𝑛 𝑒𝑛 вытекает, что 𝑥𝑖 = 𝑦𝑖 для всех 𝑖 . Коэффициенты 𝑥𝑖 единственного линейного выражения 𝑣 = 𝑥1 𝑒1 +⋯+ 𝑥𝑛 𝑒𝑛 называются координатами вектора 𝑣 в базисе 𝑒1 , … , 𝑒𝑛 . Например, в координатном векторном пространстве1 𝕜𝑛 векторы 𝑒𝑖 = (0, … , 0, 1, 0, … , 0) , где 1 ⩽ 𝑖 ⩽ 𝑛 , (41) с единицей на 𝑖 м месте и нулями в остальных местах образуют базис, поскольку произвольный вектор 𝑣 ∈ 𝕜𝑛 линейно выражается через них единственным способом: 𝑣 = (𝑥1 , … , 𝑥𝑛 ) = 𝑥1 𝑒1 + 𝑥2 𝑒2 + ⋯ + 𝑥𝑛 𝑒𝑛 . (42) Базис (41) называются стандартным базисом координатного пространства 𝕜𝑛 . Вскоре мы убе димся, что любое конечномерное векторное пространство 𝑉 обладает базисом, причём все ба зисы в 𝑉 состоят из одинакового числа векторов. Это число называется размерностью вектор ного пространства 𝑉 и обозначается dim 𝑉 . Таким образом, dim 𝕜𝑛 = 𝑛. Размерность тривиаль ного векторного пространства 𝑉 = 0 по определению полагается нулевой: dim 0 ≝ 0. 4.1.1. Линейная зависимость. Векторы 𝑣1 , … , 𝑣𝑚 ∈ 𝑉 называются линейно независимыми, если из равенства 𝜆1 𝑣1 + 𝜆2 𝑣2 + ⋯ + 𝜆𝑚 𝑣𝑚 = 0 (43) вытекает, что все 𝜆𝑖 = 0. Наоборот, если существует линейная комбинация (43), в которой хоть один коэффициент 𝜆𝑖 ≠ 0, то векторы 𝑣1 , … , 𝑣𝑚 называются линейно зависимыми. Если между векторами есть линейная зависимость, то каждый вектор, входящий в неё с ненулевым коэф фициентом, линейно выражается через остальные векторы. Например, если 𝜆𝑚 ≠ 0 в (43), то 𝜆 𝜆 𝜆 𝑣𝑚 = − 1 𝑣1 − 2 𝑣2 − ⋯ − 𝑚−1 𝑣𝑚−1 . 𝜆𝑚 𝜆𝑚 𝜆𝑚 Наоборот, любое линейное выражение вида 𝑣𝑚 = 𝜇1 𝑣1 + 𝜇2 𝑣2 +⋯+ 𝜇𝑚−1 𝑣𝑚−1 можно восприни мать как линейную зависимость 𝜇1 𝑣1 + 𝜇2 𝑣2 + ⋯ + 𝜇𝑚−1 𝑣𝑚−1 − 𝑣𝑚 = 0. Обратите внимание, что любой набор векторов, содержащий нулевой вектор, линейно зависим, поскольку 1 ⋅ ⃖0⃗ + 0 ⋅ 𝑣 = 0 для произвольного 𝑣 ∈ 𝑉 . Лемма 4.1 Порождающий векторное пространство 𝑉 набор векторов 𝑒1 , … , 𝑒𝑛 является базисом тогда и только тогда, когда он линейно независим. 1 См. прим. 1.2 на стр. 8. 47 48 §4 Многомерие Доказательство. Если ∑ 𝜆𝑖 𝑒𝑖 = 0 и не все 𝜆𝑖 нулевые, то любой вектор 𝑣 = ∑ 𝑥𝑖 𝑒𝑖 допускает дру гое выражение 𝑣 = ∑(𝑥𝑖 + 𝜆𝑖 )𝑒𝑖 через векторы 𝑒𝑖 . Наоборот, любые два различных разложения 𝑣 = ∑ 𝑥𝑖 𝑒𝑖 = ∑ 𝑦𝑖 𝑒𝑖 влекут линейную зависимость ∑(𝑥𝑖 − 𝑦𝑖 )𝑣𝑖 = 0. Лемма 4.2 (лемма о замене) Если векторы 𝑤1 , … , 𝑤𝑚 порождают пространство 𝑉 , а 𝑢1 , … , 𝑢𝑘 ∈ 𝑉 линейно независимы, то 𝑚 ⩾ 𝑘 и векторы 𝑤𝑖 можно перенумеровать так, что набор векторов 𝑢1 , … , 𝑢𝑘 , 𝑤𝑘+1 , … , 𝑤𝑚 , полученный заменой первых 𝑘 из них на векторы 𝑢𝑖 , тоже порождает 𝑉 . Доказательство. Пусть 𝑢1 = 𝑥1 𝑤1 + 𝑥2 𝑤2 + ⋯ + 𝑥𝑚 𝑤𝑚 . Так как векторы 𝑢𝑖 линейно независимы, 𝑢1 ≠ 0 и среди коэффициентов 𝑥𝑖 есть хоть один ненулевой. Перенумеруем векторы 𝑤𝑖 так, чтобы 𝑥1 ≠ 0. Поскольку вектор 𝑤1 линейно выражается через 𝑢1 и 𝑤2 , … , 𝑤𝑚 : 𝑤1 = 𝑥 𝑥 1 𝑢 − 2 𝑤 − ⋯ − 𝑚 𝑤𝑚 , 𝑥1 1 𝑥1 2 𝑥1 векторы 𝑢1 , 𝑤2 , 𝑤3 , … , 𝑤𝑚 порождают 𝑉 . Далее действуем по индукции. Пусть для очередного 𝑖 < 𝑘 векторы 𝑢1 , … , 𝑢𝑖 , 𝑤𝑖+1 , … , 𝑤𝑚 порождают 𝑉 . Тогда 𝑢𝑖+1 = 𝑦1 𝑢1 + ⋯ + 𝑦𝑖 𝑢𝑖 + 𝑥𝑖+1 𝑤𝑖+1 +, ⋯ + 𝑥𝑚 𝑤𝑚 . В силу линейной независимости векторов 𝑢𝜈 вектор 𝑢𝑖+1 нельзя линейно выразить только через векторы 𝑢1 , … , 𝑢𝑖 . Поэтому в предыдущем разложении присутствует с ненулевым коэффици ентом хоть один из оставшихся векторов 𝑤𝑗 . Следовательно, 𝑚 > 𝑖 и мы можем занумеровать оставшиеся 𝑤𝑗 так, чтобы 𝑥𝑖+1 ≠ 0. Теперь, как и на первом шагу, вектор 𝑤𝑖+1 линейно выра жается через векторы 𝑢1 , … , 𝑢𝑖+1 , 𝑤𝑖+2 , … , 𝑤𝑚 . Тем самым, эти векторы линейно порождают 𝑉 , что воспроизводит индуктивное предположение. Теорема 4.1 (теорема о базисе) В конечномерном векторном пространстве 𝑉 каждый порождающий 𝑉 набор векторов содер жит в себе некоторый базис, все базисы состоят из одинакового количества векторов, и каждый линейно независимый набор векторов можно дополнить до базиса. Доказательство. Поскольку векторов в любом линейно независимом наборе не больше, чем в любом порождающем, во всех базисах одинаковое число векторов. Если конечный набор век торов порождает 𝑉 , то последовательно выкидывая из него векторы, линейно выражающиеся через остальные, мы придём к линейно независимому порождающему набору, т. е. к базису. Если задан линейно независимый набор векторов 𝑢1 , … , 𝑢𝑘 , то по лемме о замене в любом базисе 𝑒1 , … , 𝑒𝑛 пространства 𝑉 можно заменить некоторые 𝑘 векторов 𝑒𝑖 векторами 𝑢𝑖 так, что полученный набор из 𝑛 векторов останется порождающим. Он будет базисом, так как по уже доказанному содержит в себе некоторый базис из 𝑛 векторов. Следствие 4.1 В 𝑛мерном векторном пространстве 𝑉 всякий линейно независимый набор из 𝑛 векторов, а также всякий порождающий набор из 𝑛 векторов являются базисами. Доказательство. По лем. 4.2 при замене любого базиса любыми 𝑛 линейно независимыми век торами получится порождающий набор, т. е. тоже базис. По теор. 4.1 любой порождающий на бор из 𝑛 векторов содержит в себе некоторый базис. Так как этот базис тоже состоит из 𝑛 век торов, он совпадает с исходным набором. 49 4.1. Базисы и размерность Следствие 4.2 В конечномерном пространстве 𝑉 каждое векторное подпространство 𝑈 ⊂ 𝑉 тоже конечномер но и dim 𝑈 ⩽ dim 𝑉 , причём равенство размерностей возможно только при 𝑈 = 𝑉 . Доказательство. Если 𝑘 векторов 𝑢1 , … , 𝑢𝑘 ∈ 𝑈 линейно независимы, но не порождают 𝑈, то для любого ненулевого вектора 𝑢𝑘+1 ∈ 𝑈, который линейно через них не выражается, набор из 𝑘 + 1 векторов 𝑢1 , … , 𝑢𝑘 , 𝑢𝑘+1 тоже будет линейно независим. По лемме о замене, линейно независимый набор в 𝑈 ⊂ 𝑉 не может содержать больше dim 𝑉 векторов. Таким образом, начав с произвольного линейно независимого набора векторов в 𝑈 и добавляя к нему векторы, ли нейно не выражающиеся через предыдущие, мы через конечное число шагов получим линейно независимый набор, порождающий 𝑈, т. е. базис. По теореме о базисе, этот базис можно до строить до базиса в 𝑉 . Поэтому dim 𝑈 ⩽ dim 𝑉 . Если dim 𝑈 = dim 𝑉 , то по предыдущему сл. 4.1 всякий базис в 𝑈 является одновременно базисом в 𝑉 , откуда 𝑉 = 𝑈. Следствие 4.3 Всякое 𝑛мерное векторное пространство 𝑉 над полем 𝕜 изоморфно координатному простран ству 𝕜𝑛 . Линейные изоморфизмы 𝕜𝑛 ⥲ 𝑉 взаимно однозначно соответствуют базисам в 𝑉 . Доказательство. Если задан линейный изоморфизм 𝐹 ∶ 𝕜𝑛 ⥲ 𝑉 , то векторы1 𝑣𝑖 = 𝐹 (𝑒𝑖 ) обра зуют базис пространства 𝑉 , и разным линейным отображениям отвечают разные базисы, по скольку из равенств 𝐹 (𝑒𝑖 ) = 𝐺 (𝑒𝑖 ) для всех 𝑖 вытекает, что и для любого вектора 𝑢 = ∑ 𝑥𝑖 𝑒𝑖 ∈ 𝕜𝑛 𝐹 (𝑢) = 𝐹 ( ∑ 𝑥𝑖 𝑒𝑖 ) = ∑ 𝑥𝑖 𝐹 (𝑒𝑖 ) = ∑ 𝑥𝑖 𝐺 (𝑒𝑖 ) = 𝐺 ( ∑ 𝑥𝑖 𝑒𝑖 ) = 𝐺 (𝑢) . Наоборот, для любого базиса 𝑣1 , … , 𝑣𝑛 пространства 𝑉 отображение 𝐹 ∶ 𝕜𝑛 → 𝑉 , (𝑥1 , … , 𝑥𝑛 ) ↦ 𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 , линейно, биективно и переводит 𝑒𝑖 в 𝑣𝑖 для всех 𝑖 . Пример 4.1 (пространство функций) Множество 𝕜𝑋 всех функций 𝑓 ∶ 𝑋 → 𝕜 на произвольном множестве 𝑋 со значениями в про извольном поле 𝕜 образует векторное пространство, в котором сложение функций и их умно жение на числа задаётся обычными правилами: 𝑓1 + 𝑓2 ∶ 𝑥 ↦ 𝑓1 (𝑥 ) + 𝑓2 (𝑥 ) и 𝜆𝑓 ∶ 𝑥 ↦ 𝜆 ⋅ 𝑓(𝑥 ). Пространство функций на конечном множестве 𝑋 = {1, … , 𝑛} изоморфно координатному про странству 𝕜𝑛 . Изоморфизм сопоставляет функции 𝑓 набор её значений (𝑓(1), … , 𝑓(𝑛)) и отож дествляет стандартный базис пространства 𝕜𝑛 с базисом из 𝛿 функций 𝛿𝑖 ∶ 𝑋 → 𝕜: 𝛿𝑖 (𝑗) = 1 {0 при 𝑗 = 𝑖 при 𝑗 ≠ 𝑖 . Пример 4.2 (интерполяционная формула Лагранжа) Зафиксируем 𝑛 + 1 различных чисел 𝑎0 , 𝑎1 , … , 𝑎𝑛 ∈ 𝕜 и обозначим через 𝕜[𝑥 ]⩽𝑛 пространство многочленов степени не выше 𝑛. По определению многочленов, мономы 1, 𝑥 , 𝑥 2 , … , 𝑥 𝑛 обра зуют базис в 𝕜[𝑥 ]⩽𝑛 , и dim 𝕜[𝑥 ]⩽𝑛 = 𝑛 + 1. Для каждого 𝑖 = 0, 1, 2, … , 𝑛 обозначим через 𝑓𝑖 (𝑥 ) = ∏ 𝜈≠𝑖 1 (𝑥 − 𝑎𝜈 ) ∶ ∏ (𝑎𝑖 − 𝑎𝜈 ) 𝜈≠𝑖 Здесь и далее 𝑒1 , … , 𝑒𝑛 ∈ 𝕜𝑛 обозначает стандартный базис в 𝕜𝑛 из формулы форм. (41) на стр. 47. 50 §4 Многомерие многочлен степени 𝑛, зануляющийся во всех точках 𝑎𝜈 кроме точки 𝑎𝑖 , а в точке 𝑎𝑖 принимаю щий значение 𝑓𝑖 (𝑎𝑖 ) = 1. Многочлены 𝑓𝑖 линейно независимы, ибо подставляя в равенство 𝜆0 𝑓0 (𝑥 ) + 𝜆1 𝑓1 (𝑥 ) + ⋯ + 𝜆𝑛 𝑓𝑛 (𝑥 ) = 0 значение 𝑥 = 𝑎𝑖 , мы заключаем, что 𝜆𝑖 = 0 для каждого 𝑖 . Тем самым, многочлены 𝑓𝑖 тоже образуют базис пространства 𝕜[𝑥 ]⩽𝑛 . Подставляя в разложение 𝑔(𝑥 ) = 𝑥1 𝑓1 (𝑥 ) + ⋯ + 𝑥𝑛 𝑓𝑛 (𝑥 ) произвольного многочлена 𝑔 ∈ 𝕜[𝑥 ]⩽𝑛 по базису 𝑓0 , 𝑓1 , … , 𝑓𝑛 значение 𝑥 = 𝑎𝑖 , мы заключаем, что 𝑥𝑖 = 𝑔(𝑎𝑖 ), т. е. 𝑖 я координата многочлена 𝑔 в базисе 𝑓0 , 𝑓1 , … , 𝑓𝑛 равна значению этого мно гочлена в точке 𝑎𝑖 . Таким образом, для любого набора значений 𝑏0 , 𝑏1 , … , 𝑏𝑛 ∈ 𝕜 существует единственный такой многочлен 𝑔 ∈ 𝕜[𝑥 ]⩽𝑛 , что 𝑔(𝑎𝑖 ) = 𝑏𝑖 для всех 𝑖 , а именно — 𝑔(𝑥 ) = 𝑏1 𝑓1 (𝑥 ) + 𝑏2 𝑓2 (𝑥 ) + ⋯ + 𝑏𝑛 𝑓𝑛 (𝑥 ) . Пример 4.3 (конечные поля) Пусть конечное поле 𝕂 содержит подполе 𝔽𝑞 ⊂ 𝕂, состоящее из 𝑞 элементов. Будучи конечно мерным векторным пространством над 𝔽𝑞 , поле 𝕂 находится в линейной биекции с координат 𝑛 ным пространством 𝔽𝑛 𝑞 для некоторого 𝑛 ∈ ℕ и, тем самым, состоит из 𝑞 элементов. Применяя это наблюдение к простому подполю поля 𝕂, состоящему из всех элементов вида1 ± 1+⋯+1 ∈𝕂 1+⋯+1 с ненулевым знаменателем, мы заключаем, что число элементов в любом конечном поле явля ется степенью некоторого простого числа. Упражнение 4.1 (по алгебре). Убедитесь, что простое подполе любого поля изоморфно либо полю ℚ, либо полю вычетов ℤ ∕(𝑝) по некоторому простому модулю 𝑝 ∈ ℕ. 4.2. Подпространства. Пересечение любого множества векторных подпространств в произ вольном векторном пространстве 𝑉 также является подпространством в 𝑉 . Упражнение 4.2. Убедитесь в этом. Пересечение всех подпространств, содержащих данное множество векторов 𝑀 ⊂ 𝑉 , называется линейной оболочкой множества 𝑀 и обозначается span(𝑀). Это наименьшее по включению век торное подпространство в 𝑉 , содержащее 𝑀. Иначе его можно описать как множество всех ко нечных линейных комбинаций векторов из 𝑀, ибо все такие линейные комбинации очевидным образом образуют векторное пространство и содержатся во всех векторных подпространствах, содержащих 𝑀. Пример 4.4 (гиперплоскости) Линейная оболочка 𝐻 = span(𝑣1 , … , 𝑣𝑛−1 ) произвольных 𝑛 − 1 линейно независимых векто ров в 𝑛мерном векторном пространстве 𝑉 является (𝑛 − 1)мерным подпространством. Та кие подпространства называются гиперплоскостями в 𝑉 . Если дополнить векторы 𝑣𝑖 некото рым вектором 𝑣𝑛 до базиса в 𝑉 и обозначить через 𝑥 = (𝑥1 , … , 𝑥𝑛 ) координаты относитель но этого базиса, то гиперплоскость 𝐻 можно описать как ГМТ 𝑥 удовлетворяющих линейному 1 Ср. с n∘ 2.1.2 на стр. 23. 51 4.2. Подпространства уравнению 𝑥𝑛 = 0. Покажем, что и наоборот, для любого ненулевого линейного отображения 𝜉 ∶ 𝑉 → 𝕜 множество Ann 𝜉 = {𝑣 ∈ 𝑉 | 𝜉 (𝑣) = 0} является гиперплоскостью. Упражнение 4.3. Убедитесь, что Ann 𝜉 ⊂ 𝑉 является векторным подпространством. Пусть векторы 𝑢1 , … , 𝑢𝑚 составляют базис в Ann 𝜉 , а вектор 𝑣 таков, что 𝜉 (𝑣 ) ≠ 0. Векторы 𝑣, 𝑢1 , … , 𝑢𝑚 линейно независимы, ибо векторы 𝑢𝑖 линейно независимы, а вектор 𝑣 ∉ Ann 𝜉 через них не выражается. Для любого вектора 𝑤 ∈ 𝑉 вектор 𝑤 − 𝑣 ⋅ 𝜉 (𝑤) ∕ 𝜉 (𝑣 ) ∈ Ann 𝜉 и линейно выражается через векторы 𝑢𝑖 . Следовательно, векторы 𝑣 , 𝑢1 , … , 𝑢𝑚 составляют базис в 𝑉 , откуда 𝑚 = dim 𝑉 − 1. Упражнение 4.4. Покажите, что векторное пространство 𝕜𝑛 над бесконечным полем 𝕜 не яв ляется объединением конечного числа своих гиперплоскостей. 4.2.1. Сумма подпространств. Объединение векторных подпространств почти никогда не является векторным пространством. Например, прямые 𝑥1 = 0 и 𝑥2 = 0 являются одномерны ми векторными подпространствами координатной плоскости 𝕜2 , но сумма любого ненулевого вектора первого из них с любым ненулевым вектором второго не лежит в их объединении — скажем, (1, 0) + (0, 1) = (1, 1). Упражнение 4.5. Покажите, что объединение двух подпространств является векторным про странством если и только если одно из подпространств содержится в другом. Линейная оболочка объединения произвольного множества подпространств 𝑈𝜈 ⊂ 𝑉 называ ется суммой подпространств 𝑈𝜈 и обозначается 𝑈1 + ⋯ + 𝑈𝑛 = ∑𝜈 𝑈𝜈 ≝ span ⋃𝜈 𝑈𝜈 . Таким образом, сумма подпространств состоит из всевозможных конечных сумм векторов, принадле жащих этим подпространствам. Например, 𝑈1 + 𝑈2 = {𝑢1 + 𝑢2 | 𝑢1 ∈ 𝑈1 , 𝑢2 ∈ 𝑈2 } 𝑈1 + 𝑈2 + 𝑈3 = {𝑢1 + 𝑢2 + 𝑢3 | 𝑢1 ∈ 𝑈1 , 𝑢2 ∈ 𝑈2 , 𝑢3 ∈ 𝑈3 } и т. д. Определение 4.1 (прямая сумма подпространств) Сумма подпространств 𝑈1 , … , 𝑈𝑛 ⊂ 𝑉 называется прямой и обозначается 𝑈1 ⊕ ⋯ ⊕ 𝑈𝑛 если отображение множеств 𝑈1 × … × 𝑈𝑛 → 𝑈1 + ⋯ + 𝑈𝑛 , переводящее набор векторов (𝑢1 , … , 𝑢𝑛 ) ∈ ∈ 𝑈1 ×…× 𝑈𝑛 в вектор 𝑢1 +⋯+ 𝑢𝑛 ∈ 𝑈1 +⋯+ 𝑈𝑛 биективно, т. е. каждый вектор 𝑤 ∈ 𝑈1 +⋯+ 𝑈𝑛 имеет единственное представление 𝑤 = 𝑢1 + ⋯ + 𝑢𝑛 , в котором 𝑢𝑖 ∈ 𝑈𝑖 при каждом 𝑖 . Например, пространство 𝑉 является прямой суммой своих одномерных подпространств, по рождённых векторами 𝑒1 , … , 𝑒𝑛 , если и только если эти векторы образуют в 𝑉 базис. Предложение 4.1 Сумма подпространств 𝑈1 , … , 𝑈𝑛 ⊂ 𝑉 является прямой если и только если каждое из подпро странств имеет нулевое пересечение с суммой всех остальных. В частности, сумма 𝑈 + 𝑊 двух подпространств прямая тогда и только тогда, когда 𝑈 ∩ 𝑊 = 0. Доказательство. Обозначим через 𝑊𝑖 сумму всех подпространств 𝑈𝜈 за исключением 𝑖 того под пространства 𝑈𝑖 . Если пересечение 𝑈𝑖 ∩ 𝑊𝑖 содержит ненулевой вектор 𝑢𝑖 = 𝑢1 + ⋯ + 𝑢𝑖−1 + 𝑢𝑖+1 + ⋯ + 𝑢𝑛 , где [ ]𝑢𝜈 ∈ 𝑈𝜈 при всех 𝜈, 52 §4 Многомерие то у этого вектора имеется два различных представления1 0 + ⋯ + 0 + 𝑢𝑖 + 0 + ⋯ + 0 = 𝑢1 + ⋯ + 𝑢𝑖−1 + 0 + 𝑢𝑖+1 + ⋯ + 𝑢𝑛 . Поэтому такая сумма не прямая. Наоборот, если 𝑈𝑖 ∩ 𝑊𝑖 = 0 при всех 𝑖 и имеется равенство 𝑢1 + ⋯ + 𝑢𝑛 = 𝑤1 + ⋯ + 𝑤𝑛 , где [ ]𝑢𝜈 , 𝑤𝜈 ∈ 𝑈𝜈 при всех 𝑖 , то, переписывая его для каждого 𝑖 = 1, … , 𝑛 как 𝑢𝑖 − 𝑤𝑖 = ∑𝜈≠𝑖 (𝑤𝜈 − 𝑢𝜈 ), видим, что этот вектор лежит в 𝑈𝑖 ∩ 𝑊𝑖 = 0. Поэтому 𝑢𝑖 = 𝑤𝑖 для любого 𝑖 . Упражнение 4.6. Покажите, что сумма подпространств 𝑈1 , … , 𝑈𝑚 ⊂ 𝑉 является прямой если и только если любой набор ненулевых векторов 𝑢1 , … , 𝑢𝑚 , в котором 𝑢𝑖 ∈ 𝑈𝑖 при каждом 𝑖 , линейно независим. 4.2.2. Размерность суммы и пересечения. По сл. 4.2 на стр. 49 для любого подпростран ства 𝑈 конечномерного пространства 𝑉 выполняется неравенство dim 𝑈 ⩽ dim 𝑉 . Разность codim𝑉 𝑈 ≝ dim 𝑉 − dim 𝑈 называется коразмерностью подпространства 𝑈 в 𝑉. Предложение 4.2 Для любых конечномерных подпространств 𝑈1 , 𝑈2 в произвольном2 векторном пространстве 𝑉 выполняется равенство dim(𝑈1 ) + dim(𝑈2 ) = dim(𝑈1 ∩ 𝑈2 ) + dim(𝑈1 + 𝑈2 ). Доказательство. Выберем какойнибудь базис 𝑢1 , … , 𝑢𝑘 в 𝑈1 ∩ 𝑈2 и дополним его векторами 𝑣1 , … , 𝑣𝑟 и 𝑤1 , … , 𝑤𝑠 до базисов в подпространствах 𝑈1 и 𝑈2 соответственно. Достаточно пока зать, что векторы 𝑢1 , … , 𝑢𝑘 , 𝑣1 , … , 𝑣𝑟 , 𝑤1 , … , 𝑤𝑠 образуют базис пространства 𝑈1 + 𝑈2 . Ясно, что они его порождают. Допустим, что они линейно зависимы. Поскольку каждый из наборов 𝑢1 , … , 𝑢𝑘 , 𝑣1 , … , 𝑣𝑟 и 𝑢1 , … , 𝑢𝑘 , 𝑤1 , … , 𝑤𝑠 в отдельности линейно независим, в равенстве 𝜆1 𝑢1 + ⋯ + 𝜆𝑘 𝑢𝑘 + 𝜇1 𝑣1 + ⋯ + 𝜇𝑟 𝑣𝑟 + 𝜂1 𝑤1 + ⋯ + 𝜂𝑠 𝑤𝑠 = 0 имеются как векторы 𝑣𝑖 , так и векторы 𝑤𝑗 . Перенося 𝑤1 , … , 𝑤𝑠 в правую часть, получаем равен ство между вектором из 𝑈1 и вектором из 𝑈2 , означающее, что этот вектор лежит в пересечении 𝑈1 ∩ 𝑈2 . Но тогда в его разложении по базисам пространств 𝑈1 и 𝑈2 нет векторов 𝑣𝑖 и 𝑤𝑗 — про тиворечие. Следствие 4.4 Для любых подпространств 𝑈1 , 𝑈2 конечномерного векторного пространства 𝑉 dim(𝑈1 ∩ 𝑈2 ) ⩾ dim(𝑈1 ) + dim(𝑈2 ) − dim(𝑉 ) . В частности, 𝑈1 ∩ 𝑈2 ≠ 0 при dim(𝑈1 ) + dim(𝑈2 ) > dim 𝑉 . Доказательство. Это вытекает из предл. 4.2 и неравенства dim(𝑈1 + 𝑈2 ) ⩽ dim 𝑉 . 1 2 В левом отлично от нуля только 𝑖 е слагаемое, а в правом оно нулевое. Не обязательно конечномерном. 53 4.3. Аффинная геометрия Следствие 4.5 (дополнительные подпространства) Следующие два свойства векторных подпространств 𝑈1 , 𝑈2 в конечномерном векторном про странстве 𝑉 эквивалентны1 : 1) 𝑉 = 𝑈1 ⊕ 𝑈2 2) 𝑈1 ∩ 𝑈2 = 0 и dim(𝑈1 ) + dim(𝑈2 ) = dim(𝑉 ) . Доказательство. При 𝑈1 ∩ 𝑈2 = 0 равенство dim(𝑈1 ) + dim(𝑈2 ) = dim(𝑉 ) равносильно равенству dim(𝑈1 + 𝑈2 ) = dim 𝑉 , означающему, что 𝑈1 + 𝑈2 = 𝑉 . Определение 4.2 (трансверсальные подпространства) Подпространства 𝑈1 и 𝑈2 в конечномерном векторном пространстве 𝑉 называются трансвер сальными, если dim 𝑈1 ∩ 𝑈2 = max(0, dim 𝑈1 + dim 𝑈2 − dim 𝑉 ), т. е. когда размерность их пере сечения принимает минимально возможное допустимое по сл. 4.4 значение. Например, любые два подпространства, сумма которых является прямой, трансверсальны. 4.3. Аффинная геометрия. Пусть множество 𝐴 является аффинным пространством2 над век торным пространством 𝑉 . Для любой точки 𝑝 ∈ 𝐴 и любого векторного подпространства 𝑈 ⊂ 𝑉 множество точек 𝛱(𝑝, 𝑈) = 𝑝 + 𝑈 = {𝜏𝑢 (𝑝) | 𝑢 ∈ 𝑈} называется проходящим через точку 𝑝 аффинным подпространством в 𝐴 с направляющим векторным подпространством 𝑈. Размер ность аффинного пространства 𝛱(𝑝, 𝑈) по определению полагается равной размерности dim 𝑈 его направляющего векторного подпространства. Пример 4.5 (прямые и плоскости) Аффинные подпространства 𝑝 + 𝑈, где dim 𝑈 = 1, 2 называются прямыми и плоскостями со ответственно. Таким образом, аффинная прямая представляет собою ГМТ вида 𝑝 + 𝑣𝑡, где 𝑝 — некоторая точка, 𝑣 — ненулевой вектор, а 𝑡 пробегает 𝕜. Аналогично, аффинная плоскость есть ГМТ вида 𝑝 + 𝜆𝑢 + 𝜇𝑤 , где 𝑝 — некоторая точка, 𝑢, 𝑤 — пара непропорциональных векторов, а 𝜆, 𝜇 независимо пробегают 𝕜. Отметим, что к любой такой плоскости применимо всё сказанное нами в §§ 1, 2. Предложение 4.3 ⃖⃖⃖⃗ ∈ 𝑈 + 𝑊 , и в Аффинные подпространства 𝑝 + 𝑈 и 𝑞 + 𝑊 пересекаются если и только если 𝑝𝑞 этом случае их пересечение является аффинным пространством с направляющим векторным пространством 𝑈 ∩ 𝑊 . ⃖⃖⃖⃗ = 𝑢 + 𝑤 равносильно равенству 𝑝 + 𝑢 = 𝑞 − 𝑤, означающему, что Доказательство. Равенство 𝑝𝑞 точка 𝑟 = 𝑝 + 𝑢 = 𝑞 − 𝑤 ∈ (𝑝 + 𝑈)∩(𝑞 + 𝑊 ). Если такая точка 𝑟 существует, то для любой лежащей в пересечении (𝑝 + 𝑈) ∩ (𝑞 + 𝑊 ) точки 𝑟′ = 𝑝 + 𝑢′ = 𝑞 + 𝑤′ вектор ⃖⃖⃗ 𝑟𝑟′ = 𝑢′ − 𝑢 = 𝑤′ + 𝑤 ∈ 𝑈 ∩ 𝑊 . Наоборот, для любого вектора 𝑣 ∈ 𝑈 ∩ 𝑊 точка 𝑟 + 𝑣 лежит в (𝑝 + 𝑈) ∩ (𝑞 + 𝑊 ). Следствие 4.6 Следующие условия на аффинные подпространства 𝑝 + 𝑈 и 𝑞 + 𝑈 с одним и тем же направля ющим подпространством 𝑈 ⊂ 𝑉 эквивалентны: (1) ⃖⃖⃖ 𝑝𝑞⃗ ∈ 𝑈 (2) 𝑝 ∈ 𝑞 + 𝑈 (3) 𝑞 ∈ 𝑝 + 𝑈 (4) 𝑝 + 𝑈 = 𝑞 + 𝑈 (5) (𝑝 + 𝑈) ∩ (𝑞 + 𝑊 ) ≠ ∅. 1 2 Обладающие этими свойствами подпространства 𝑈1 , 𝑈2 называются дополнительными. См. n∘ 1.4 на стр. 13. 54 §4 Многомерие Предложение 4.4 Точки 𝑝0 , 𝑝1 , … , 𝑝𝑘 аффинного пространства 𝔸 тогда и только тогда, когда не содержатся ни в каком (𝑘 − 1)мерном аффинном подпространстве, когда векторы ⃖⃖⃖⃖⃗ 𝑝0 𝑝1 , ⃖⃖⃖⃖⃗ 𝑝0 𝑝2 , … , ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑘 линейно независимы, и в этом случае через точки 𝑝0 , 𝑝1 , … , 𝑝𝑘 проходит единственное 𝑘мерное аффин ное подпространство. Доказательство. Линейная зависимость 𝑘 векторов ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 равносильна тому, что их линейная оболочка имеет размерность не больше 𝑘 − 1. Это в свою очередь означает, что в 𝑉 найдётся (𝑘 − 1)мерное векторное подпространство 𝑈, содержащее все векторы ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 . Последнее равно сильно тому, что (𝑘 − 1)мерное аффинное подпространство 𝑝0 + 𝑈 содержит все точки 𝑝𝑖 . Если векторы ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 линейно независимы, то они составляют базис в любом содержащем их 𝑘мерном векторном подпространстве 𝑈 ⊂ 𝑉 , и значит, любое такое подпространство совпадает с их ли нейной оболочкой. Поскольку прохождение аффинного пространства 𝑝0 + 𝑈 через все точки 𝑝𝑖 равносильно тому, что все векторы ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 лежат в 𝑈, мы заключаем, что такое пространство 𝑝0 + 𝑈 ровно одно и его направляющее векторное пространство 𝑈 представляет собою линейную обо лочку векторов ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 . Пример 4.6 (аффинный репер) В 𝑛мерном аффинном пространстве 𝔸𝑛 над векторным пространством 𝑉 каждый набор из 𝑛 + 1 не лежащих в одной гиперплоскости точек 𝑝0 , 𝑝1 , … , 𝑝𝑛 задаёт систему аффинных координат с началом в точке 𝑝0 и базисными векторами 𝑒𝑖 = ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 ∈ 𝑉 в том смысле, что точки 𝑞 ∈ 𝔸𝑛 оказываются в биекции с наборами таких чисел (𝑥1 , … , 𝑥𝑛 ), что ⃖⃖⃖⃖⃗ 𝑝0 𝑞 = 𝑥1 ⋅ ⃖⃖⃖⃖⃗ 𝑝0 𝑝1 + 𝑥2 ⋅ ⃖⃖⃖⃖⃗ 𝑝0 𝑝2 + ⋯ + 𝑥𝑛 ⋅ ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑛 . В самом деле, по определению аффинного пространства, сопоставление точке 𝑞 ∈ 𝔸𝑛 вектора ⃖⃖⃖⃖⃗ 𝑝0 𝑞 ∈ 𝑉 задаёт биекцию между точками и векторами. Так как точки 𝑝𝑖 не лежат в одной гипер плоскости, 𝑛 векторов 𝑒𝑖 линейно независимы и составляют базис в 𝑉 . Сопоставление вектору его координат в этом базисе задаёт линейную биекцию 𝑉 ⥲ 𝕜𝑛 . 4.4. Линейные и аффинные отображения. С каждым линейным отображением векторных пространств 𝐹 ∶ 𝑉 → 𝑊 связаны его ядро ker 𝐹 ≝ 𝐹−1 (0) = {𝑣 ∈ 𝑉 | 𝐹 (𝑣 ) = 0} и образ im 𝐹 ≝ 𝐹 (𝑉) ⊂ 𝑊 . Упражнение 4.7. Убедитесь, что ker 𝐹 ⊂ 𝑉 и im 𝐹 ⊂ 𝑊 являются векторными подпростран ствами. Поскольку равенства 𝐹 (𝑣1 ) = 𝐹 (𝑣2 ) и 𝐹 (𝑣1 −𝑣2 ) = 0 для линейного отображения 𝐹 эквивалентны друг другу, два вектора 𝑣1 , 𝑣2 ∈ 𝑉 тогда и только тогда переводятся отображением 𝐹 в один и тот же вектор 𝑤 = 𝐹 (𝑣1 ) = 𝐹 (𝑣2 ) ∈ im 𝐹 , когда 𝑣1 − 𝑣2 ∈ ker 𝐹 . Иными словами, полный прообраз 𝐹−1 (𝑤) любого вектора 𝑤 ∈ im 𝐹 либо пуст, либо является параллельным сдвигом векторного подпространства ker 𝐹 на произвольный вектор 𝑣 ∈ 𝐹−1 (𝑤 ): 𝐹−1 (𝐹 (𝑣)) = 𝑣 + ker 𝐹 . (44) В частности, мы получаем Предложение 4.5 Линейное отображение 𝐹 инъективно тогда и только тогда, когда ker 𝐹 = 0. 55 4.4. Линейные и аффинные отображения Следствие 4.7 Линейное отображение 𝐹 инъективно если и только если оно переводит линейно независимые наборы векторов в линейно независимые. Доказательство. Если 𝐹 не инъективен, то ker 𝐹 содержит ненулевой вектор 𝑢, и линейно неза висимый набор, состоящий из одного этого вектора, перейдёт в линейно зависимый набор, состоящий из нулевого вектора. Если ker 𝐹 = 0, то равенство 0 = 𝜆1 𝐹 (𝑢1 ) + ⋯ + 𝜆𝑘 𝐹 (𝑢𝑘 ) = = 𝐹 (𝜆1 𝑢1 + ⋯ + 𝜆𝑘 𝑢𝑘 ) означает, что вектор 𝜆1 𝑢1 + ⋯ + 𝜆𝑘 𝑢𝑘 ∈ ker 𝐹 нулевой, т. е. векторы 𝐹 (𝑢𝑖 ) могут быть линейно зависимы только когда сами векторы 𝑢𝑖 линейно зависимы. Предложение 4.6 Если 𝑉 конечномерно, то для любого линейного отображения 𝐹 ∶ 𝑉 → 𝑊 dim ker 𝐹 + dim im 𝐹 = dim 𝑉 . (45) Доказательство. Выберем базис 𝑢1 , … , 𝑢𝑘 ∈ ker 𝐹 , дополним его векторами 𝑒1 , 𝑒2 , … , 𝑒𝑚 до ба зиса в 𝑉 и покажем, что векторы 𝐹 (𝑒1 ), 𝐹 (𝑒2 ), … , 𝐹 (𝑒𝑚 ) образуют базис в im 𝐹 . Они порождают образ, т. к. для любого вектора 𝑣 = ∑ 𝑦𝑖 𝑢𝑖 + ∑ 𝑥𝑗 𝑒𝑗 ∈ 𝑉 𝐹 (𝑣 ) = 𝑥 𝐹 (𝑒𝑗 ) . ∑ 𝑗 Они линейно независимы, поскольку равенство 0 = ∑ 𝜆𝑖 𝐹 (𝑒𝑖 ) = 𝐹 (∑ 𝜆𝑖 𝑒𝑖 ) означает, что ∑ 𝜆𝑖 𝑒𝑖 лежит в ker 𝐹 , т. е. является линейной комбинацией векторов 𝑢𝑖 , что возможно только когда все 𝜆𝑖 = 0. ∑ 𝑦𝑖 𝐹 (𝑢𝑖 ) + ∑ 𝑥𝑗 𝐹 (𝑒𝑗 ) = Следствие 4.8 Следующие свойства линейного отображения 𝐹 ∶ 𝑉 → 𝑉 из пространства 𝑉 в себя эквивалент ны друг другу: (1) 𝐹 изоморфизм (2) ker 𝐹 = 0 (3) im 𝐹 = 𝑉 . Доказательство. Свойства (2) и (3) равносильны друг другу по предл. 4.6, а их одновременное выполнение равносильно (1) по предл. 4.5. Пример 4.7 (интерполяция с кратными узлами, продолжение прим. 4.2) Зафиксируем, как и в прим. 4.2 на стр. 49, несколько различных чисел 𝑎1 , … , 𝑎𝑛 ∈ 𝕜, однако теперь для каждого 𝑎𝑖 зададим 𝑚𝑖 + 1 произвольных значений 𝑏𝑖0 , 𝑏𝑖1 , … , 𝑏𝑖𝑚𝑖 ∈ 𝕜. Пусть общее число заданных значений (𝑚1 +1)+⋯+(𝑚𝑛 +1) = 𝑚+1. Покажем, что существует единственный такой многочлен 𝑔 ∈ 𝕜[𝑥 ] степени не выше 𝑚, что при каждом 𝑖 сам этот многочлен и первые его 𝑚𝑖 производных принимают в точке 𝑎𝑖 заданные значения 𝑔(𝑎𝑖 ) = 𝑏𝑖0 , 𝑔′ (𝑎𝑖 ) = 𝑏𝑖1 , 𝑔″ (𝑎𝑖 ) = 𝑏𝑖2 , … , 𝑔(𝑚𝑖 ) (𝑎𝑖 ) = 𝑏𝑖𝑚𝑖 , где 𝑔(𝑘) (𝑥 ) = 𝑑 𝑘 𝑔(𝑥 )∕𝑑𝑥 𝑘 означает 𝑘ю производную от многочлена 𝑔. Для этого произвольным образом занумеруем 𝑚 + 1 пар чисел (𝑖 , 𝑗) с 1 ⩽ 𝑖 ⩽ 𝑛, 0 ⩽ 𝑗 ⩽ 𝑚𝑗 и выпишем их в одну строчку в порядке возрастания номеров. Рассмотрим отображение 𝐹 ∶ 𝕜[𝑥 ]⩽𝑚 → 𝕜𝑚+1 , переводящее каждый многочлен 𝑔 степени deg 𝑔 ⩽ 𝑚 в набор значений1 𝑔(𝑗) (𝑎𝑖 ), записанных в строчку со гласно зафиксированному только что порядку на множестве индексов (𝑖 , 𝑗). Упражнение 4.8. Убедитесь, что отображение 𝐹 линейно и ker 𝐹 = 0. Так как dim im 𝐹 = dim 𝕜[𝑥 ]⩽𝑚 = dim 𝕜𝑚+1 , мы заключаем, что отображение 𝐹 биективно, что и требовалось. 1 Где для единообразия обозначений мы полагаем 𝑔(0) ≝ 𝑔. 56 §4 Многомерие Пример 4.8 (проекции) С каждой парой дополнительных подпространств1 𝑈, 𝑊 ⊂ 𝑉 = 𝑈 ⊕ 𝑊 связаны сюрьективные линейные отображения 𝜋𝑈 ∶ 𝑉 ↠ 𝑈, 𝑢 + 𝑤 ↦ 𝑢, и 𝜋𝑊 ∶ 𝑉 ↠ 𝑈, 𝑢 + 𝑤 ↦ 𝑤 , которые называ ются проекциями пространства 𝑉 , соответственно, на подпространство 𝑈 вдоль подпростран ства 𝑊 и на подпространство 𝑊 вдоль подпространства 𝑈. Первая из них имеет ker 𝜋𝑈 = 𝑊 и тождественно действует на 𝑈, а вторая имеет ker 𝜋𝑊 = 𝑈 и тождественно действует на 𝑊 . Проекции 𝜋𝑈 и 𝜋𝑊 , рассматриваемые как линейные эндоморфизмы 𝑉 → 𝑉 , удовлетворяют со отношениям 𝜋𝑈 𝜋𝑊 = 𝜋𝑊 𝜋𝑈 = 0, 𝜋𝑈 + 𝜋𝑊 = Id𝑉 , 𝜋𝑈 ∘ 𝜋𝑈 = 𝜋𝑈 , 𝜋𝑊 ∘ 𝜋𝑊 = 𝜋𝑊 . Упражнение 4.9. Покажите, что если линейный эндоморфизм 𝐹 ∶ 𝑉 → 𝑉 удовлетворяет со отношению 𝐹2 = 𝐹 , то 𝑉 = ker 𝐹 ⊕ im 𝐹 , и 𝐹 является проекцией 𝑉 на im 𝐹 вдоль ker 𝐹 , а оператор 𝐺 = Id𝑉 − 𝐹 тоже удовлетворяет соотношению2 𝐺2 = 𝐺 и является проекцией 𝑉 на ker 𝐹 вдоль im 𝐹 . Предложение 4.7 Пусть векторы 𝑒1 , … , 𝑒𝑛 образуют базис векторного пространства 𝑉 . Тогда для любого вектор ного пространства 𝑊 и любого набора из 𝑛 векторов 𝑤1 , … , 𝑤𝑛 ∈ 𝑊 существует единственное такое линейное отображение 𝐹 ∶ 𝑉 → 𝑊 , что 𝐹 (𝑒𝑖 ) = 𝑤𝑖 для всех 𝑖 . Доказательство. Если такое отображение 𝐹 существует, то в силу линейности оно действует на произвольный вектор 𝑣 = ∑ 𝑥𝑖 𝑒𝑖 ∈ 𝑉 по правилу 𝐹 (𝑣 ) = ∑ 𝑥𝑖 𝐹 (𝑒𝑖 ) = ∑ 𝑥𝑖 𝑤𝑖 и, тем самым, единственно. С другой стороны, для любого набора векторов 𝑤1 , … , 𝑤𝑛 ∈ 𝑊 отображение 𝐹∶ 𝑉 → 𝑊 , 𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 ↦ 𝑥1 𝑤1 + ⋯ + 𝑥𝑛 𝑤𝑛 , очевидно линейно и при каждом 𝑖 переводит 𝑒𝑖 в 𝑤𝑖 . Следствие 4.9 Для любого набора из 𝑛 + 1 не лежащих в одной гиперплоскости точек 𝑝0 , 𝑝1 , … , 𝑝𝑛 в 𝑛мерном аффинном пространстве 𝐴 и произвольного набора из 𝑛 + 1 точек 𝑞0 , 𝑞1 , … , 𝑞𝑛 любого аффин ного пространства 𝐵 существует единственное такое аффинное отображение3 𝜑 ∶ 𝐴 → 𝐵, что 𝜑(𝑝𝑖 ) = 𝑞𝑖 при всех 𝑖 . Доказательство. Обозначим через 𝑈, 𝑊 векторные пространства, подлежащие аффинным про странствам 𝐴, 𝐵. Если отображение 𝜑 существует, то его дифференциал4 𝐷𝜑 ∶ 𝑈 → 𝑊 перево дит 𝑛 векторов ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 , составляющих базис в 𝑈, в заданные 𝑛 векторов ⃖⃖⃖⃖⃗ 𝑞0 𝑞𝑖 ∈ 𝑊 . По предл. 4.7 такое линейное отображение 𝐷𝜑 существует, единственно и переводит вектор 𝑢 = ∑ 𝑥𝑖 ⋅ ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 в вектор 𝐷𝜑 (𝑢) = ∑ 𝑥𝑖 ⋅ ⃖⃖⃖⃖⃗ 𝑞0 𝑞𝑖 . Поэтому аффинное отображение 𝜑 тоже существует, единственно и переводит точку 𝑎 = 𝑝0 + ∑ 𝑥𝑖 ⋅ ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 в точку 𝜑(𝑎) = 𝑞0 + ∑ 𝑥𝑖 ⋅ ⃖⃖⃖⃖⃗ 𝑞0 𝑞𝑖 . Следствие 4.10 Аффинное отображение из 𝑛мерного аффинного пространства в себя биективно если и толь ко если оно переводит какиенибудь 𝑛 + 1 не лежащих в одной гиперплоскости точек в точки, 1 Напомню, что это означает, что 𝑉 = 𝑈 ⊕ 𝑊, т. е. 𝑈 + 𝑊 = 𝑉 и 𝑈 ∩ 𝑊 = 0, см. сл. 4.5 на стр. 53. А также соотношениям 𝐺𝐹 = 𝐹𝐺 = 0. 3 См. n∘ 2.2 на стр. 24. 4 См. n∘ 2.2.1 на стр. 25. 2 57 4.5. Фактор пространства также не лежащие в одной гиперплоскости. Для любых двух упорядоченных наборов из 𝑛 + 1 точек, в каждом из которых точки не лежат в одной гиперплоскости, существует единственное биективное аффинное преобразование, переводящее первый набор во второй. Доказательство. Аффинное отображение биективно если и только если биективен его диффе ренциал. Дифференциал биективен если и только если он переводит базис в базис. Векторы, соединяющие одну из 𝑛 + 1 точек со всеми остальными, образуют базис если и только если эти 𝑛 + 1 точек не лежат в одной гиперплоскости. 4.5. Фактор пространства. Рассмотрим произвольное векторное пространство 𝑉 и зафикси руем в нём некоторое подпространство 𝑈 ⊂ 𝑉 . Проходящее через точку 𝑣 ∈ 𝔸(𝑉 ) аффинное подпространство 𝑣 + 𝑈 с направляющим подпространством 𝑈 можно трактовать как класс эк вивалентности вектора 𝑣 по модулю сдвигов на векторы из подпространства 𝑈. Такой класс обычно обозначают через [𝑣 ]𝑈 = 𝑣 (mod 𝑈) = {𝑤 ∈ 𝑉 | 𝑤 − 𝑣 ∈ 𝑈} и называют классом вы четов вектора 𝑣 по модулю 𝑈. На множестве классов вычетов имеется естественная структура векторного пространства, в котором сложение и умножение на числа наследуются из 𝑉 и зада ются правилами [𝑣 ]𝑈 + [𝑤]𝑈 ≝ [𝑣 + 𝑤 ] и 𝜆[𝑣 ] ≝ [𝜆𝑣]. Упражнение 4.10. Проверьте, что эти определения корректны и задают на множестве классов структуру векторного пространства над полем 𝕜. Пространство классов вычетов по модулю подпространства 𝑈 обозначается 𝑉 ∕ 𝑈 и называется фактор пространством пространства 𝑉 по подпространству 𝑈. Повторюсь, что на геометриче ском языке векторами фактор пространства 𝑉 ∕ 𝑈 являются всевозможные аффинные подпро странства в 𝔸(𝑉 ) с заданным направляющим подпространством 𝑈 ⊂ 𝑉 . Линейное сюрьективное отображение 𝑉 ↠ 𝑉 ∕ 𝑈, 𝑣 ↦ [𝑣 ], переводящее каждый вектор 𝑣 ∈ 𝑉 в содержащий его класс [𝑣], называется отображением факторизации. Пример 4.9 (фактор по ядру) Каждое линейное отображение 𝐹 ∶ 𝑉 → 𝑊 задаёт изоморфизм 𝑉 ∕ ker 𝐹 ⥲ im 𝐹 , сопоставляю щий классу [𝑣 ] ∈ 𝑉 ∕ ker 𝐹 вектор 𝐹 (𝑣 ) ∈ im 𝐹 . Это переформулировка того, что 𝐹 (𝑣) = 𝐹 (𝑤) ⟺ 𝑣 − 𝑤 ∈ ker 𝐹 (ср. с форм. (44) на стр. 54). Пример 4.10 (линейная оболочка как фактор) Линейная оболочка 𝑊 = span(𝑤1 , … , 𝑤𝑚 ) ⊂ 𝑉 произвольного набора из 𝑚 векторов 𝑤𝑚 век торного пространства 𝑉 является образом линейного отображения 𝐹 ∶ 𝕜𝑚 → 𝑉 , переводящего стандартный базисный вектор 𝑒𝑖 ∈ 𝕜𝑚 в вектор 𝑤𝑖 ∈ 𝑊 . Ядро этого отображения 𝑈 = ker 𝐹 ⊂ 𝕜𝑚 представляет собою пространство линейных соотношений между образующими вектора ми 𝑤𝑖 пространства 𝑊 в том смысле, что вектор 𝑢 = (𝜆1 , … , 𝜆𝑚 ) = 𝜆1 𝑒1 + 𝜆2 𝑒2 + ⋯ + 𝜆𝑛 𝑒𝑛 ∈ 𝕜𝑚 лежит в 𝑈 тогда и только тогда, когда 𝜆1 𝑤1 + 𝜆2 𝑤2 + ⋯ + 𝜆𝑚 𝑤𝑚 = 0 в 𝑊 . Изоморфизм 𝑊 = im 𝐹 ≃ 𝕜𝑛 ∕ 𝑈 из предыдущего прим. 4.9 в данном случае утверждает, что векторы 𝑤 ∈ 𝑊 можно трактовать как классы вычетов всевозможных формальных линейных комбинаций 𝑥1 𝑤1 + 𝑥2 𝑤2 +⋯+ 𝑥𝑛 𝑤𝑛 по модулю тех комбинаций, что являются линейными зависимостями между векторами 𝑤𝑖 . 58 §4 Многомерие Предложение 4.8 Если векторы 𝑣1 , … , 𝑣𝑘 дополняют некоторый базис 𝑢1 , … , 𝑢𝑚 подпространства 𝑈 ⊂ 𝑉 до ба зиса во всём пространстве 𝑉 , то классы [𝑣1 ], … , [𝑣𝑘 ] их вычетов по модулю 𝑈 образуют базис фактор пространства 𝑉 ∕ 𝑈. В частности, dim 𝑈 + dim 𝑉 ∕ 𝑈 = dim 𝑉 . Доказательство. Это вытекает из предл. 4.6 на стр. 55 и его доказательства, применённых к линейному отображению факторизации 𝑉 ↠ 𝑉∕𝑈. Повторим проведённое там рассуждение ещё раз на языке классов вычетов. Классы [𝑣𝑖 ] линейно независимы в 𝑉∕𝑈, поскольку равенство [0] = = 𝜆1 [𝑣1 ]+⋯+𝜆𝑘 [𝑣𝑘 ] = [𝜆1 𝑣1 +⋯+𝜆𝑘 𝑣𝑘 ] в 𝑉∕𝑈 означает, что 𝜆1 𝑣1 +⋯+𝜆𝑘 𝑣𝑘 = 𝜇1 𝑢1 +⋯+𝜇𝑚 𝑢𝑚 в 𝑉 , а такое возможно только когда все 𝜆𝑖 = 0 и все 𝜇𝑗 = 0. Классы [𝑣𝑖 ] линейно линейно порождают пространство 𝑉 ∕ 𝑈, так как для любого вектора 𝑣 = 𝜆1 𝑣1 + ⋯ + 𝜆𝑘 𝑣𝑘 + 𝜇1 𝑢1 + ⋯ + 𝜇𝑚 𝑢𝑚 ∈ 𝑉 класс [𝑣 ] = [𝜆1 𝑣1 + ⋯ + 𝜆𝑘 𝑣𝑘 ] = 𝜆1 [𝑣1 ] + ⋯ + 𝜆𝑘 [𝑣𝑘 ] в 𝑉 ∕ 𝑈. §5. Матрицы 5.1. Матрицы линейных отображений. Линейные отображения 𝐹 ∶ 𝑈 → 𝑊 между двумя век торными пространствами 𝑈 и 𝑊 над полем 𝕜 сами образуют векторное пространство относи тельно операций поточечного сложения значений и умножения их на константы: 𝐹 + 𝐺 ∶ 𝑣 ↦ 𝐹 (𝑣) + 𝐺 (𝑣) и 𝜆𝐹 ∶ 𝑣 ↦ 𝜆 ⋅ 𝐹 (𝑣) . Упражнение 5.1. Убедитесь, что для всех 𝜆, 𝜇 ∈ 𝕜 и линейных отображений 𝐹 , 𝐺 ∶ 𝑈 → 𝑊 отоб ражение 𝜆𝐹 + 𝜇𝐺 линейно, причём для всех линейных отображений 𝐻 ∶ 𝑉 → 𝑈 и 𝐾 ∶ 𝑊 → 𝑉 выполняются равенства (𝜆𝐹 + 𝜇𝐺 ) 𝐻 = 𝜆𝐹𝐻 + 𝜇𝐺𝐻 и 𝐾 (𝜆𝐹 + 𝜇𝐺 ) = 𝜆𝐾𝐹 + 𝜇𝐾𝐺 . Пространство линейных отображений 𝑈 → 𝑊 обозначается Hom(𝑈, 𝑊 ) или Hom𝕜 (𝑈, 𝑊 ), если надо явно указать основное поле. Чтобы построить в Hom(𝑈, 𝑊 ) базис, зафиксируем какие нибудь базисы 𝑢1 , … , 𝑢𝑛 ∈ 𝑈, 𝑤1 , … , 𝑤𝑚 ∈ 𝑊 и для каждого 𝑗 = 1, 2, … , 𝑛 разложим вектор 𝐹 (𝑢𝑗 ) по базису 𝒘 = (𝑤1 , … , 𝑤𝑚 ): 𝑚 𝐹 (𝑢𝑗 ) = ∑ 𝑤𝑖 ⋅ 𝑓𝑖𝑗 . (51) 𝑖=1 Составленная из коэффициентов 𝑓𝑖𝑗 прямоугольная таблица1 ⎛ 𝑓11 ⎜ 𝑓21 (𝐹 (𝑢1 ), 𝐹 (𝑢2 ), … , 𝐹 (𝑢𝑛 )) = ⎜ ⋮ ⎜ ⎝𝑓𝑚1 𝑓12 𝑓22 ⋮ 𝑓𝑚2 … 𝑓1𝑛 ⎞ … 𝑓2𝑛 ⎟ ∈ Mat𝑚×𝑛 (𝕜) , ⋱ ⋮ ⎟ ⎟ … 𝑓𝑚𝑛 ⎠ (52) 𝑗й столбец которой содержит написанные сверху вниз координаты вектора 𝐹 (𝑢𝑗 ), называется матрицей отображения 𝐹 в базисах 𝒖 = (𝑢1 , … , 𝑢𝑛 ) и 𝒘 = (𝑤1 , … , 𝑤𝑚 ). Мы будем обозначать эту матрицу через 𝐹𝒘𝒖 или (𝑓𝑖𝑗 ). Согласно предл. 4.7 на стр. 56 эта матрица однозначно задаёт действие линейного отображения 𝐹 на любой вектор 𝑣 = ∑ 𝑢𝑗 𝑥𝑗 ∈ 𝑈: 𝑛 𝑛 𝑛 𝑚 𝑤 ⋅𝑓 𝑥 . 𝐹 (𝑢𝑗 ) ⋅ 𝑥𝑗 = 𝐹 (𝑣 ) = 𝐹 ( 𝑢 𝑥 = ∑ ∑ 𝑖 𝑖𝑗 𝑗 ∑ 𝑗 𝑗) ∑ 𝑗=1 𝑗 =1 (53) 𝑗=1 𝑖=1 Обозначая через 𝒖 = (𝑢1 , … , 𝑢𝑛 ), 𝒘 = (𝑤1 , … , 𝑤𝑚 ) и 𝐹 (𝒖) = (𝐹 (𝑢1 ), … , 𝐹 (𝑢𝑛 )) матрицыстроки, элементами которых являются векторы, а через ⎛ 𝑥1 ⎞ 𝒙=⎜⋮⎟ ⎜ ⎟ ⎝𝑥𝑛 ⎠ ⎛ 𝑦1 ⎞ и 𝒚=⎜⋮⎟ ⎜ ⎟ ⎝𝑦𝑚 ⎠ матрицыстолбцы, составленные из чисел — координат векторов 𝑣 и 𝐹 (𝑣 ) в базисах 𝒖 и 𝒘, мы получаем матричные равенства2 𝑣 = 𝒖𝒙, 𝐹 (𝑣 ) = 𝒘𝒚, 𝐹 (𝒖) = 𝒘 𝐹𝒘𝒖 и можем переписать вычис ление (53) в виде 𝐹 (𝑣 ) = 𝐹 (𝒖𝒙) = 𝐹 (𝒖)𝒙 = 𝒘 𝐹𝒘𝒖 𝒙, откуда 𝒚 = 𝐹𝒘𝒖 𝒙. Таким образом, линейное 1 2 Ср. с n∘ 2.3 на стр. 26. Напомню, что произведение матриц было определено в n∘ 2.3, см. форм. (28) на стр. 26. 59 60 §5 Матрицы отображение 𝐹 ∶ 𝑈 → 𝑊 , имеющее в базисах 𝒘 и 𝒖 матрицу 𝐹𝒘𝒖 , переводит вектор со столб цом координат 𝒙 в базисе 𝒖 в вектор со столбцом координат 𝐹𝒘𝒖 𝒙 в базисе 𝒘, т. е. действует на столбец координат по правилу 𝒙 ↦ 𝐹𝒘𝒖 𝒙 (54) Упражнение 5.2. Убедитесь, что при сложении линейных отображений и умножении их на числа матрицы этих отображений поэлементно складываются и умножаются на те же са мые числа. Предложение 5.1 Выбор базисов 𝒖 = (𝑢1 , … , 𝑢𝑛 ), 𝒘 = (𝑤1 , … , 𝑤𝑚 ) в пространствах 𝑈, 𝑊 задаёт линейный изо морфизм векторного пространства Hom𝕜 (𝑈, 𝑊 ) линейных отображений 𝑈 → 𝑊 с векторным пространством Mat𝑚×𝑛 (𝕜) ≃ 𝕜𝑚𝑛 матриц размера 𝑚 × 𝑛, сопоставляющий линейному отобра жению его матрицу в выбранных базисах: Hom𝕜 (𝑈, 𝑊 ) → Mat𝑚×𝑛 (𝕜) , 𝐹 ↦ 𝐹𝒘𝒖 , (55) В частности, dim Hom(𝑈, 𝑊 ) = dim 𝑈 ⋅ dim 𝑊 . Доказательство. Линейность отображения (55) вытекает из упр. 5.2. Если матрица 𝐹𝒘𝒖 нуле вая, то и задаваемое ею линейное отображение (54) тождественно нулевое, т. е. линейное отоб ражение (55) имеет нулевое ядро, а значит, инъективно. Так как каждая матрица 𝐹𝒘𝒖 задаёт по формуле (54) линейное отображение 𝐹 ∶ 𝑈 → 𝑊 , отображение (55) сюрьективно. 5.2. Умножение матриц происходит из композиции линейных отображений. А именно, зафик сируем в пространствах 𝑈, 𝑉 , 𝑊 некоторые базисы 𝒖, 𝒗, 𝒘, и пусть линейные отображения 𝐵 ∶ 𝑈 → 𝑉 и 𝐴 ∶ 𝑉 → 𝑊 имеют в этих базисах матрицы 𝐵𝒗𝒖 = (𝑏𝑖𝑗 ) и 𝐴𝒘𝒗 = (𝑎𝑖𝑗 ), т. е. 𝐵(𝑢𝑗 ) = ∑ 𝑣𝑘 𝑏𝑘𝑗 и 𝐴(𝑣𝑘 ) = 𝑘 ∑ 𝑤𝑖 𝑎𝑖𝑘 . 𝑖 Тогда их композиция 𝐶 = 𝐴 ∘ 𝐵 ∶ 𝑈 → 𝑊 переводит каждый базисный вектор 𝑢𝑗 из базиса 𝒖 в 𝑣 𝑏 𝐶 (𝑢𝑗 ) = 𝐴( = 𝐴(𝑣𝑘 )𝑏𝑘𝑗 = 𝑤𝑎 𝑏 = 𝑤 ⋅ 𝑎 𝑏 . ∑ 𝑘 𝑘𝑗 ) ∑ ∑ ∑ 𝑖 𝑖𝑘 𝑘𝑗 ∑ 𝑖 ∑ 𝑖𝑘 𝑘𝑗 𝑘 𝑘 𝑖 𝑘 𝑖 𝑘 Тем самым, матрица 𝐶𝒘𝒖 = (𝑐𝑖𝑗 ) имеет в 𝑖 й строке и 𝑗м столбце элемент 𝑐𝑖𝑗 = ∑ 𝑎𝑖𝑘 𝑏𝑘𝑗 = 𝑎𝑖1 𝑏1𝑗 + 𝑎𝑖2 𝑏2𝑗 + ⋯ + 𝑎𝑖𝑠 𝑏𝑠𝑗 , где [ ]𝑠 = dim 𝑉 , (56) 𝑘 равный произведению 𝑖 й строки матрицы 𝐴 на 𝑗й столбец матрицы 𝐵 в том самом смысле, как мы определили его в форм. (28) на стр. 26: ⎛𝑏1 ⎞ 𝒂 ⋅ 𝒃 = (𝑎1 , … , 𝑎𝑠 ) ⋅ ⎜ ⋮ ⎟ = 𝑎1 𝑏1 + 𝑎2 𝑏2 + ⋯ + 𝑎𝑠 𝑏𝑠 . ⎜ ⎟ ⎝ 𝑏𝑠 ⎠ (57) Таким образом, матрица композиции линейных отображений является произведением матриц этих отображений. Так как композиция линейных отображений ассоциативна, произведение 61 5.2. Умножение матриц матриц также ассоциативно, т. е. для любых 𝐹 ∈ Mat𝑚×𝑘 (𝕜), 𝐺 ∈ Mat𝑘×𝓁 (𝕜) и 𝐻 ∈ Mat𝓁×𝑛 (𝕜) в Mat𝑚×𝑛 (𝕜) выполняется равенство (𝐹𝐺 )𝐻 = 𝐹 (𝐺𝐻). Поскольку композиция линейных отобра жений линейна по каждому из сомножителей1 , в произведении линейных комбинаций матриц одинакового размера можно раскрывать скобки по обычным правилам, т. е. (𝜆1 𝐹1 + 𝜇1 𝐺1 )(𝜆2 𝐹2 + 𝜇2 𝐺2 ) = 𝜆1 𝜆2 𝐹1 𝐹2 + 𝜆1 𝜇2 𝐹1 𝐺2 + 𝜇1 𝜆2 𝐺1 𝐹2 + 𝜇1 𝜇2 𝐺1 𝐺2 для всех 𝐹1 , 𝐺1 ∈ Mat𝑚×𝑘 (𝕜), 𝐹2 , 𝐺2 ∈ Mat𝑘×𝓁 (𝕜) и всех 𝜆𝑖 , 𝜇𝑖 ∈ 𝕜. Как и композиция отображений, умножение матриц обычно не коммутативно. Например, 1 2 3 0 11 10 ⋅ = (0 3) (4 5) (12 15) 3 0 1 2 3 6 ⋅ = . (4 5) (0 3) (4 23) Более того, как и композиция отображений, произведение матриц не всегда определено: ши рина левого множителя должна быть равна высоте правого. В частности, бывает так, что про изведение 𝐴𝐵 определено, а 𝐵𝐴 — нет. В дальнейшем мы часто будем рассматривать матрицы не только с элементами из поля 𝕜, но и, к примеру, с элементами из векторного пространства 𝑉 . Вообще, для любой аддитивной абелевой группы 𝑅 можно образовать аддитивную абелеву группу Mat𝑚×𝑛 (𝑅 ) матриц размера 𝑚 × 𝑛 с элементами из 𝑅, изоморфную прямому произведению 𝑚𝑛 экземпляров группы 𝑅 с собой. Если есть шесть абелевых групп 𝑅1 , 𝑅2 , 𝑅3 , 𝑅12 , 𝑅23 , 𝑅123 , и заданы операции умножения: 𝑅1 × 𝑅2 → 𝑅12 , 𝑅12 × 𝑅3 → 𝑅123 , 𝑅2 × 𝑅3 → 𝑅23 , 𝑅1 × 𝑅23 → 𝑅123 , (58) то для любых 𝑚, 𝑘, 𝓁, 𝑛 ∈ ℕ определены умножения матриц с элементами из этих групп: Mat𝑚×𝑘 (𝑅1 ) × Mat𝑘×𝓁 (𝑅2 ) → Mat𝑚×𝓁 (𝑅12 ) , Mat𝑚×𝓁 (𝑅12 ) × Mat𝓁×𝑛 (𝑅3 ) → Mat𝑚×𝑛 (𝑅123 ) , Mat𝑘×𝓁 (𝑅2 ) × Mat𝓁×𝑛 (𝑅3 ) → Mat𝑘×𝑛 (𝑅23 ) , Mat𝑚×𝑘 (𝑅1 ) × Mat𝑘×𝑛 (𝑅23 ) → Mat𝑚×𝑛 (𝑅123 ) . (59) Упражнение 5.3. Убедитесь прямым вычислением, что если умножения (58) между абелевы ми группами ассоциативны2 и дистрибутивны3 , то и умножения матриц (59) тоже ассоци ативны4 и дистрибутивны. Если интерпретировать каждую букву 𝑎𝜈 в строке 𝒂 из формулы (57) ⎛𝑏1 ⎞ (𝑎1 , … , 𝑎𝑠 ) ⋅ ⎜ ⋮ ⎟ = 𝑎1 𝑏1 + 𝑎2 𝑏2 + ⋯ + 𝑎𝑠 𝑏𝑠 ⎜ ⎟ ⎝ 𝑏𝑠 ⎠ 1 См. упр. 5.1 на стр. 59. Т. е. (𝑥1 𝑥2 )𝑥3 = 𝑥1 (𝑥2 𝑥3 ) для всех 𝑥1 ∈ 𝑅1 , 𝑥2 ∈ 𝑅2 , 𝑥3 ∈ 𝑅3 . 3 Т. е. (𝑥1′ + 𝑥1″ )𝑥2 = 𝑥1′ 𝑥2 + 𝑥1″ 𝑥2 , 𝑥1 (𝑥2′ + 𝑥2″ ) = 𝑥1 𝑥2′ + 𝑥1 𝑥2″ , (𝑥2′ + 𝑥2″ )𝑥3 = 𝑥2′ 𝑥3 + 𝑥2″ 𝑥3 и т. д. 4 Причём для ассоциативности умножения матриц существенны как ассоциативность, так и дистри бутивность умножений между абелевыми группами. 2 62 §5 Матрицы как векторстолбец, являющийся 𝜈тым столбцом матрицы 𝐴, а вместо столбца 𝒃 подставить 𝑗й столбец матрицы 𝐵, то правило умножения матриц можно сформулировать следующим обра зом: в 𝑗м столбце матрицы 𝐴𝐵 стоит линейная комбинация столбцов матрицы 𝐴 взятых с ко эффициентами, стоящими в 𝑗м столбце матрицы 𝐵. Например, чтобы получить из матрицы 𝐴 с тремя столбцами 𝑎1 , 𝑎2 , 𝑎3 матрицу с четырьмя столбцами той же высоты, равными 𝑎1 + 2𝑎2 , 2𝑎2 − 3𝑎3 , 𝑎1 + 𝑎2 + 𝑎3 , 4𝑎1 , надо умножить матрицу 𝐴 справа на матрицу ⎛1 0 1 4⎞ ⎜2 2 1 0⎟ . ⎟ ⎜ ⎝0 −3 1 0⎠ Симметричным образом, интерпретируя каждую букву 𝑏𝜇 в столбце 𝒃 из формулы (57): ⎛𝑏1 ⎞ (𝑎1 , … , 𝑎𝑠 ) ⋅ ⎜ ⋮ ⎟ = 𝑎1 𝑏1 + 𝑎2 𝑏2 + ⋯ + 𝑎𝑠 𝑏𝑠 ⎜ ⎟ ⎝ 𝑏𝑠 ⎠ как 𝜇ю строку матрицы 𝐵, а строку 𝒂 — как 𝑖 ю строку матрицы 𝐴, мы заключаем, что в 𝑖 й стро ке матрицы 𝐴𝐵 стоит линейная комбинация строк матрицы 𝐵 с коэффициентами из 𝑖 й строки матрицы 𝐴. Например, если в матрице 𝐵, состоящей из двух строк, хочется поставить вторую строку на место первой, а вместо второй написать её сумму с первой строкой, умноженной на 𝜆, то это достигается умножением слева на матрицу 0 1 . ( 𝜆 1) Данные нами описания строк и столбцов матрицы 𝐴𝐵 получаются друг из друга заменой слова «столбец» на слово «строка» с одновременной перестановкой местами букв 𝐴 и 𝐵. Матрица, по строкам которой записаны столбцы матрицы1 𝐴 = (𝑎𝑖𝑗 ) называется транспонированной к 𝑡 𝑡 матрице 𝐴 и обозначается 𝐴𝑡 = (𝑎𝑖𝑗 ). Её элементы 𝑎𝑖𝑗 связаны с элементами 𝑎𝑖𝑗 матрицы 𝐴 𝑡 = 𝑎𝑗𝑖 . равенствами 𝑎𝑖𝑗 Упражнение 5.4. Проверьте, что транспонирование является инволютивным антигомомор физмом, т. е. (𝐴𝑡 )𝑡 = 𝐴 и (𝐴𝐵)𝑡 = 𝐵𝑡 𝐴𝑡 . 5.3. Матрицы перехода. Пусть вектор 𝑣 линейно выражается через векторы 𝑤1 , … , 𝑤𝑚 : 𝑚 𝑣= ∑ 𝑤𝑖 𝑥𝑖 = 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑚 𝑥𝑚 . (510) 𝑖=1 Организуем коэффициенты 𝑥𝑖 ∈ 𝕜 в матрицустолбец размера 𝑚 × 1 с элементами из 𝕜 : ⎛ 𝑥1 ⎞ 𝒙=⎜ ⋮ ⎟, ⎜ ⎟ ⎝𝑥𝑚 ⎠ а векторы 𝑤𝑖 — в матрицустроку 𝒘 = (𝑤1 , … , 𝑤𝑚 ) размера 1 × 𝑛 с элементами из 𝑉 . Тогда формула (510) свернётся в матричное равенство 𝑣 = 𝒘𝒙, в котором 𝑣 рассматривается как 1 Или — что то же самое — по столбцам которой стоят строки матрицы 𝐴. 63 5.4. Обратимые матрицы матрица размера 1 × 1 с элементом из 𝑉 . Если имеются два набора векторов: 𝒖 = (𝑢1 , … , 𝑢𝑛 ), 𝒘 = (𝑤1 , … , 𝑤𝑚 ), и каждый вектор 𝑢𝑗 первого из них линейно выражается через векторы вто рого в виде 𝑚 𝑢𝑗 = ∑ 𝑐𝜈𝑗 𝑤𝜈 = 𝑤1 ⋅ 𝑐1𝑗 + 𝑤2 ⋅ 𝑐2𝑗 + ⋯ + 𝑤𝑚 ⋅ 𝑐𝑚𝑗 , 𝜈=1 то эти 𝑛 равенств собираются в одну матричную формулу 𝒖 = 𝒘 ⋅ 𝐶𝒘𝒖 , где 𝒖 = (𝑢1 , … , 𝑢𝑛 ) и 𝒘 = (𝑤1 , … , 𝑤𝑚 ) рассматриваются как матрицыстроки с элементами из 𝑉 , а матрица 𝐶𝒘𝒖 ⎛ 𝑐11 ⎜𝑐 = (𝑐𝑖𝑗 ) = ⎜ 21 ⋮ ⎜ ⎝𝑐𝑚1 𝑐12 𝑐22 ⋮ 𝑐𝑚2 … 𝑐1𝑛 ⎞ … 𝑐2𝑛 ⎟ ⋱ ⋮ ⎟ ⎟ … 𝑐𝑚𝑛 ⎠ (511) получается подстановкой в матрицу 𝒖 вместо каждого из векторов 𝑢𝑗 столбца коэффициентов его линейного выражения через векторы 𝑤𝑖 . Матрица (511) называется матрицей перехода от векторов 𝒖 к векторам 𝒘. Название объясняется тем, что умножение на матрицу 𝐶𝒖𝒘 позво ляет переходить от линейных выражений произвольных векторов 𝑣𝑘 ∈ span(𝑢1 , … , 𝑢𝑛 ) через векторы 𝑢𝑗 к линейным выражениям этих же векторов через векторы 𝑤𝑖 , а именно: 𝒗 = 𝒖𝐶𝒖𝒗 ⇒ 𝒗 = 𝒘𝐶𝒘𝒖 𝐶𝒖𝒗 . Таким образом, произведение матрицы перехода от векторов 𝒖 к векторам 𝒘 и матрицы пере хода от векторов 𝒗 к векторам 𝒖 является матрицей перехода от векторов 𝒗 к векторам 𝒘: 𝐶𝒘𝒖 𝐶𝒖𝒗 = 𝐶𝒘𝒗 . (512) Подчеркнём, что когда набор векторов 𝒘 = (𝑤1 , … , 𝑤𝑚 ) линейно зависим, каждый вектор 𝑣 из их линейной оболочки допускает много различных линейных выражений через векторы 𝑤𝑗 . По этому обозначение 𝐶𝒘𝒗 в этой ситуации не корректно в том смысле, что элементы матрицы 𝐶𝒘𝒗 определяются наборами векторов 𝒘 и 𝒗 не однозначно, и равенство (512) означает, что имея какиенибудь линейные выражения 𝐶𝒘𝒖 и 𝐶𝒖𝒗 векторов 𝒖 через 𝒗 и векторов 𝒗 через 𝒘, мы мо жем предъявить некоторое явное линейное выражение 𝐶𝒘𝒗 векторов 𝒖 через векторы 𝒘, пере множив матрицы 𝐶𝒘𝒖 и 𝐶𝒖𝒗 . Если же набор векторов 𝒆 = (𝑒1 , … , 𝑒𝑛 ) является базисом, то матрица перехода 𝐶𝒆𝒘 , выража ющая произвольный набор векторов 𝒘 = (𝑤1 , … , 𝑤𝑚 ) через базис 𝒆 однозначно определяется по наборам 𝒆 и 𝒘, т. е. два набора векторов 𝒖, 𝒘 совпадают если и только если выполняется равенство 𝐶𝒆𝒖 = 𝐶𝒆𝒘 . 5.4. Обратимые матрицы. Квадратная матрица ⎛1 0 … 0⎞ ⎜0 1 ⋱ ⋮ ⎟ 𝐸=⎜ ⋮ ⋱ ⋱ 0⎟ ⎜ ⎟ ⎝0 … 0 1 ⎠ (по диагонали стоят единицы, в остальных местах — нули) называется единичной. Упражнение 5.5. Убедитесь, что 𝐴𝐸 = 𝐴 и 𝐸𝐴 = 𝐴 всякий раз, когда такие произведения опре делены. 64 §5 Матрицы Квадратная матрица 𝐴 называется обратимой или невырожденной, если существует такая мат рица 𝐴−1 , что 𝐴𝐴−1 = 𝐴−1 𝐴 = 𝐸 . Матрица 𝐴−1 называется обратной к 𝐴. Она однозначно опре деляется матрицей 𝐴, поскольку для любых двух матриц 𝐵, 𝐶 , удовлетворяющих равенствам 𝐴𝐵 = 𝐸 и 𝐶𝐴 = 𝐸 , имеем 𝐶 = 𝐶𝐸 = 𝐶 (𝐴𝐵) = (𝐶𝐴)𝐵 = 𝐸𝐵 = 𝐵. В частности, для обратимости матрицы 𝐴 достаточно, чтобы существовали такие матрицы 𝐵 и 𝐶 , что 𝐴𝐵 = 𝐸 и 𝐶𝐴 = 𝐸 . Упражнение 5.6. Докажите, что обратимость матрицы 𝐴 равносильна обратимости транспо нированной к ней матрицы1 𝐴𝑡 . Пример 5.1 (обратимые 2 × 2матрицы) Матричное равенство 𝑎 𝑏 𝑥 ⋅ 1 ( 𝑐 𝑑 ) (𝑥2 𝑦1 1 0 = 𝑦2 ) (0 1) означает, что стандартные базисные векторы 𝑒1 , 𝑒2 пространства 𝕜2 линейно выражаются через столбцы стоящей слева матрицы 𝐴 как 𝑎 𝑏 1 ⋅𝑥 + ⋅𝑥 = ( 𝑐 ) 1 (𝑑 ) 2 (0) и 𝑎 𝑏 ⋅𝑦 + ⋅𝑦 = . ( 𝑐 ) 1 (𝑑 ) 2 (1) Если такие выражения существуют, то столбцы матрицы 𝐴 линейно порождают 𝕜2 , а значит, не пропорциональны, и det 𝐴 ≠ 0. Наоборот, если det 𝐴 ≠ 0, то по правилу Крамера2 𝑥1 = 𝑑 , 𝑎𝑑 − 𝑏𝑐 −𝑐 , 𝑎𝑑 − 𝑏𝑐 𝑥2 = 𝑦1 = −𝑏 , 𝑎𝑑 − 𝑏𝑐 𝑦2 = 𝑎 . 𝑎𝑑 − 𝑏𝑐 Мы заключаем, что 2 × 2матрица 𝐴 с элементами из поля 𝕜 обратима тогда и только тогда, когда det 𝐴 ≠ 0 и в этом случае 𝑎 (𝑐 −1 𝑏 𝑑) = (𝑎𝑑 − 𝑏𝑐 )−1 𝑑 (−𝑐 −𝑏 . 𝑎) (513) Стоящая справа матрица называется присоединённой3 к матрице 𝐴 и обозначается 𝐴∨ ≝ 𝑑 −𝑏 . (−𝑐 𝑎 ) Предложение 5.2 Пусть набор векторов 𝒗 = (𝑣1 , … , 𝑣𝑛 ) образует базис пространства 𝑉 . Для того, чтобы набор из 𝑛 векторов 𝒖 = 𝒗 𝐶𝒗𝒖 тоже составлял базис, необходимо и достаточно, чтобы матрица пере −1 = 𝐶𝒖𝒗 . хода 𝐶𝒗𝒖 ∈ Mat𝑛×𝑛 (𝕜) была обратима, и в этом случае 𝐶𝒗𝒖 Доказательство. Если векторы 𝒖 образуют базис, то векторы 𝒆 линейно выражается через 𝒖, и согласно формуле (512) имеют место равенства 𝐶𝒆𝒆 = 𝐶𝒆𝒖 𝐶𝒖𝒆 и 𝐶𝒖𝒖 = 𝐶𝒖𝒆 𝐶𝒆𝒖 . Так как каж дый набор векторов имеет единственное выражение через базис, 𝐶𝒆𝒆 = 𝐶𝒖𝒖 = 𝐸 . Стало быть, 𝐶𝒖𝒆 𝐶𝒆𝒖 = 𝐶𝒖𝒆 𝐶𝒆𝒖 = 𝐸 . Наоборот, если матрица 𝐶𝒆𝒖 обратима, то умножая обе части равенства −1 −1 𝒖 = 𝒆𝐶𝒆𝒖 справа на 𝐶𝒆𝒖 , мы получаем линейное выражение 𝒆 = 𝒖 𝐶𝒆𝒖 векторов 𝒆 через векто ры 𝒖. Тем самым, последние линейно порождают пространство 𝑉 , а значит, составляют в нём базис. 1 См. упр. 5.4 на стр. 62. См. лем. 1.2 на стр. 11. 3 Поанглийски adjunct. 2 65 5.5. Ранг матрицы Следствие 5.1 Следующие условия на квадратную матрицу 𝐴 ∈ Mat𝑛×𝑛 (𝕜) эквивалентны: 1) матрица 𝐴 обратима 2) столбцы матрицы 𝐴 линейно независимы 3) столбцы матрицы 𝐴 линейно порождают координатное пространство 𝕜𝑛 , и то же самое верно с заменой столбцов на строки. Доказательство. Обозначим через 𝑎1 , … , 𝑎𝑛 столбцы матрицы 𝐴, воспринимаемые как векто ры координатного пространства 𝕜𝑛 . Матрица 𝐴 является матрицей перехода от этих векторов к стандартному базису пространства 𝕜𝑛 . По предл. 5.2 обратимость матрицы 𝐴 равносильна тому, что векторы 𝑎𝑖 образуют в 𝕜𝑛 базис, что в свою очередь равносильно каждому из усло вий (2), (3) по сл. 4.1 на стр. 48. Последнее утверждение предложения вытекает из упр. 5.6 на стр. 64. Пример 5.2 (замена координат при смене базиса) Пусть набор векторов 𝒘 = (𝑤1 , … , 𝑤𝑚 ) выражается через базис 𝒆 = (𝑒1 , … , 𝑒𝑛 ) как 𝒘 = 𝒆𝐶𝒆𝒘 . Если 𝒗 = 𝒆𝐶𝒆𝒗 — другой базис, то в выражении 𝒘 = 𝒗𝐶𝒗𝒘 векторов 𝒘 через базис 𝒗 матрица −1 𝐶𝒗𝒘 . В частности столбец координат произвольного вектора 𝒘 в базисе 𝒗 𝐶𝒗𝒘 = 𝐶𝒗𝒆 𝐶𝒆𝒘 = 𝐶𝒆𝒗 −1 , обратную получаются из столбца его координат в базисе 𝒆 умножением слева на матрицу 𝐶𝒆𝒗 к матрице координат векторов базиса 𝒗 в базисе 𝒆. Пример 5.3 (замена матрицы отображения при смене базиса) Напомню, что для линейного отображения 𝐹 ∶ 𝑈 → 𝑊 и строки векторов 𝒗 = (𝑣1 , … , 𝑣𝑟 ) мы обозначаем через 𝐹 (𝒗) ≝ (𝐹 (𝑣1 ), 𝐹 (𝑣2 ), … , 𝐹 (𝑣𝑟 )) строку значений отображения 𝐹 на этих век торах. В силу линейности отображения 𝐹 для любой числовой матрицы 𝑀 ∈ Mat𝑟×𝑠 (𝕜) выпол няется равенство 𝐹 (𝒗 𝑀) = 𝐹 (𝒗) 𝑀. Упражнение 5.7. Убедитесь в этом. Матрица 𝐹𝒘𝒖 отображения 𝐹 в базисах 𝒖 и 𝒘 пространств 𝑈 и 𝑊 однозначно определяется ра ̃ = 𝒖𝐶𝒖𝒖̃ и 𝒘 ̃ = 𝒘𝐶𝒘𝒘̃ мы получим венством 𝐹 (𝒖) = 𝒘𝐹𝒘𝒖 . В других базисах 𝒖 −1 −1 𝐹𝒘 ̃ = 𝐶𝒘 ̃ = 𝐶𝒘𝒘 ̃ = 𝐶𝒘 ̃𝒖 ̃ 𝒘 𝐹𝒘𝒖 𝐶𝒖𝒖 ̃ 𝒘 𝐹𝒘𝒖 𝐶𝒖 ̃ 𝐹𝒘𝒖 𝐶𝒖𝒖 ̃𝒖 , (514) ̃ 𝐶𝒘̃ 𝒘 𝐹𝒘𝒖 𝐶𝒖𝒖̃ . Если линейный оператор поскольку 𝐹 (̃ 𝒖) = 𝐹 (𝒖𝐶𝒖𝒖̃ ) = 𝐹 (𝒖) 𝐶𝒖𝒖̃ = 𝒘 𝐹𝒘𝒖 𝐶𝒖𝒖̃ = 𝒘 𝐹 ∶ 𝑉 → 𝑉 действует из векторного пространства 𝑉 в себя, и в 𝑉 выбран базис 𝒆 = (𝑒1 , … , 𝑒𝑛 ), оператору 𝐹 можно сопоставить матрицу 𝐹𝒆 ≝ 𝐹𝒆𝒆 , которая называется матрицей оператора 𝐹 в базисе 𝒆 и имеет 𝑗м столбцом координаты вектора 𝐹 (𝑒𝑗 ) в базисе 𝒆. В этом случае при замене базиса 𝒆 на базис 𝒖 = 𝒆𝐶𝒆𝒖 матрица отображения 𝐹 в новом базисе приобретёт вид −1 −1 𝐹𝒖 = 𝐶𝒖𝒆 𝐹𝒆 𝐶𝒆𝒖 = 𝐶𝒆𝒖 𝐹𝒆 𝐶𝒆𝒖 = 𝐶𝒖𝒆 𝐹𝒆 𝐶𝒖𝒆 . (515) 5.5. Ранг матрицы. Размерность линейной оболочки столбцов матрицы 𝐴 ∈ Mat𝑚×𝑛 (𝕜) в ко ординатном векторном пространстве 𝕜𝑚 называется рангом матрицы 𝐴 и обозначается rk 𝐴. Каждая матрица 𝐴 задаёт линейное отображение 𝐹𝐴 ∶ 𝕜𝑛 → 𝕜𝑚 , 𝑥 ↦ 𝐴𝑥 , которое переводит ко ординатный столбец 𝑥 ∈ 𝕜𝑛 в координатный столбец 𝐴𝑥 ∈ 𝕜𝑚 и матрица которого в стандарт ных базисах координатных пространств 𝕜𝑛 и 𝕜𝑚 совпадает с матрицей 𝐴. Линейная оболочка столбцов матрицы 𝐴 представляет собою образ оператора 𝐹𝐴 . Тем самым, rk 𝐴 = dim im 𝐹𝐴 . 66 §5 Матрицы Лемма 5.1 Ранг матрицы не меняется при умножении на обратимые матрицы слева или справа. Доказательство. Пусть 𝐴 ∈ Mat𝑚×𝑛 (𝕜), 𝐷 ∈ Mat𝑛×𝑛 (𝕜), 𝐶 ∈ Mat𝑚×𝑚 (𝕜). Рассмотрим задавае мые этими матрицами линейные отображения 𝐹𝐷 ∶ 𝕜𝑛 ⥲ 𝕜𝑛 , 𝑥 ↦ 𝐷𝑥 , 𝐹𝐶 ∶ 𝕜𝑚 ⥲ 𝕜𝑚 , 𝑦 ↦ 𝐶𝑦, и 𝐹𝐴 ∶ 𝕜𝑛 → 𝕜𝑚 , 𝑥 ↦ 𝐴𝑥 . Так как 𝐷 и 𝐶 обратимы, 𝐹𝐷 и 𝐹𝐶 — изоморфизмы векторных про странств. В силу биективности отображения 𝐹𝐷 образ композиции 𝐹𝐴 𝐹𝐷 совпадает с образом 𝐹𝐴 : 𝐹𝐴 (𝐹𝐷 (𝕜𝑚 )) = 𝐹𝐴 (𝕜𝑚 ). Образ композиции 𝐹𝐶 𝐹𝐴 𝐹𝐷 является образом подпространства im 𝐹𝐴 ⊂ 𝕜𝑚 при изоморфизме 𝐹𝐶 ∶ 𝕜𝑚 ⥲ 𝕜𝑚 . Следовательно dim im(𝐹𝐶 𝐹𝐴 𝐹𝐷 ) = dim im 𝐹𝐴 , т. е. линейная оболочка столбцов матрицы 𝐶𝐴𝐷 имеет ту же размерность, что и линейная оболочка столбцов матрицы 𝐴. Следствие 5.2 Размерность линейной оболочки строк произвольной матрицы 𝐴 тоже не меняется при умно жении матрицы 𝐴 слева или справа на любые обратимые матрицы. Доказательство. Применим лем. 5.1 к транспонированной матрице 𝐴𝑡 . Теорема 5.1 (теорема о ранге матрицы) Для любой матрицы 𝐴 ∈ Mat𝑚×𝑛 (𝕜) выполняется равенство rk 𝐴 = rk 𝐴𝑡 . Иными словами, линейная оболочка строк матрицы 𝐴 в координатном пространстве 𝕜𝑛 и линейная оболочка столбцов матрицы 𝐴 в координатном пространстве 𝕜𝑚 имеют равные размерности. Доказательство. Рассмотрим линейное отображение 𝐹𝐴 ∶ 𝕜𝑛 → 𝕜𝑚 , 𝑥 ↦ 𝐴𝑥 , выберем какой нибудь базис 𝑢𝑟+1 , … , 𝑢𝑛 в ker 𝐹𝐴 и дополним его до базиса 𝒖 = (𝑢1 , … , 𝑢𝑟 , 𝑢𝑟+1 , … , 𝑢𝑛 ) всего пространства 𝕜𝑛 . В доказательстве предл. 4.6 на стр. 55 мы видели, что векторы 𝑤𝑗 = 𝐹𝐴 (𝑢𝑗 ) c 1 ⩽ 𝑗 ⩽ 𝑟 образуют базис в im 𝐹𝐴 ⊂ 𝕜𝑚 . Поэтому 𝑟 = dim im 𝐹𝐴 = rk 𝐴. Дополним векторы 𝑤𝑗 до базиса 𝒘 = (𝑤1 , … , 𝑤𝑚 ) всего пространства 𝕜𝑚 . Матрица 𝐹𝒘𝒖 = (𝑓𝑖𝑗 ) оператора 𝐹𝐴 в бази сах 𝒘 и 𝒖 пространств 𝕜𝑚 и 𝕜𝑛 имеет 𝑓𝑖𝑖 = 1 при 1 ⩽ 𝑖 ⩽ 𝑟 и нули во всех остальных местах. Линейные оболочки её строк в пространстве 𝕜𝑛 и столбцов в пространстве 𝕜𝑚 имеют равные размерности 𝑟. В стандартных базисах 𝒎 и 𝒏 пространств 𝕜𝑚 и 𝕜𝑛 отображение 𝐹𝐴 имеет мат рицу 𝐴 = 𝐹𝒎𝒏 = 𝐶𝒎𝒘 𝐹𝒘𝒖 𝐶𝒖𝒏 , где 𝐶𝒎𝒘 и 𝐶𝒖𝒏 — обратимые1 матрицы переходов от базиса 𝒘 к стандартному базису 𝒎 в 𝕜𝑚 и от стандартного базиса 𝒏 к базису 𝒖 в 𝕜𝑛 . По лем. 5.1 и сл. 5.2 умножение на обратимые матрицы не меняет размерностей линейных оболочек строк и столб цов. Поэтому у 𝐴 они такие же, как у 𝐹𝒘𝒖 . 5.6. Системы линейных уравнений. Система неоднородных линейных уравнений ⎧ 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 𝑏1 ⎪ ⎪ 𝑎21 𝑥1 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛 = 𝑏2 ⎨ ⋯⋯⋯⋯⋯ ⎪ ⎪𝑎 𝑥 + 𝑎 𝑥 + ⋯ + 𝑎 𝑥 = 𝑏 ⎩ 𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 𝑚 (516) на неизвестные 𝑥1 , … , 𝑥𝑛 в матричных обозначениях записывается одним равенством 𝐴𝑥 = 𝑏, в котором 𝐴 = (𝑎𝑖𝑗 ) ∈ Mat𝑚×𝑛 , а 𝑥 и 𝑏 обозначают матрицыстолбцы, состоящие из неизвест ных и правых частей уравнений (516). Как и выше, обозначим через 𝐹𝐴 ∶ 𝕜𝑛 → 𝕜𝑚 , 𝑥 ↦ 𝐴𝑥 , 1 См. предл. 5.2 на стр. 64. 5.6. Системы линейных уравнений 67 линейное отображение, переводящее стандартные базисные векторы 𝑒1 , … , 𝑒𝑛 ∈ 𝕜𝑛 в столб цы матрицы 𝐴. Множество решений уравнения 𝐴𝑥 = 𝑏 и системы (516) состоит из всех таких векторов 𝑥 ∈ 𝕜𝑛 , что 𝐹𝐴 (𝑥 ) = 𝑏, т. е. представляет собою полный прообраз 𝐹𝐴−1 (𝑏) вектора 𝑏 при отображении 𝐹𝐴 . Если 𝑏 ∉ im 𝐹𝐴 , то этот прообраз пуст и система (516) несовместна. Если 𝑏 = 𝐹𝐴 (𝑝) ∈ im 𝐹𝐴 , то1 𝐹𝐴−1 (𝑏) = 𝑝 + ker 𝐹𝐴 , т. е. множество решений системы (516) представ ляет собою аффинное подпространство в 𝕜𝑛 , являющееся сдвигом векторного подпростран ства ker 𝐹𝐴 ⊂ 𝕜𝑛 в какуюнибудь такую точку 𝑝, что 𝐹 (𝑝) = 𝑏. На языке уравнений ядро ker 𝐹𝐴 представляет собою множество решений системы однород ных линейных уравнений 𝐴𝑥 = 0 с теми же самыми левыми частями, что и система (516). В развёрнутом виде она выглядит как ⎧ 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 0 ⎪ ⎪ 𝑎21 𝑥1 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛 = 0 ⎨ ⋯⋯⋯⋯⋯ ⎪ ⎪𝑎 𝑥 + 𝑎 𝑥 + ⋯ + 𝑎 𝑥 = 0 . ⎩ 𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 (517) Наличие у такой системы ненулевого решения означает, что ker 𝐹𝐴 ≠ 0, и в этом случае любая система (516) либо несовместна, либо имеет более одного решения2 . Это наблюдение извест но как альтернатива Фредгольма: либо у однородной системы (517) есть ненулевое решение, либо у каждой системы (516) имеется не более одного решения. Предложение 5.3 Пространство решений системы линейных однородных уравнений (517) имеет размерность 𝑛 − rk 𝐴. В частности, эта размерность не меньше 𝑛 − 𝑚, и если число уравнений 𝑚 меньше числа неизвестных 𝑛, то система обязательно имеет ненулевое решение. Доказательство. По предл. 4.6 на стр. 55 dim ker 𝐹𝐴 = 𝑛 − dim im 𝐹𝐴 = 𝑛 − rk 𝐴. Предложение 5.4 (критерий Кронекера – Капелли) Система (516) совместна если и только если rk 𝐴 = rk 𝐴 𝑏 , где3 𝐴 𝑏 ∈ Mat𝑚×(𝑛+1) (𝕜) полу чается приписыванием справа к матрице 𝐴 столбца 𝑏 правых частей системы (516). Доказательство. Совместность системы (516) равносильна тому, что вектор 𝑏 лежит в линей ной оболочке столбцов матрицы 𝐴, что в свою очередь означает, что размерность линейной оболочки столбцов у матрицы 𝐴 такая же, как у расширенной матрицы 𝐴 𝑏 . Пример 5.4 (системы с квадратной матрицей левых частей) Если количество уравнений в системе (516) равно количеству неизвестных, линейное отобра жение 𝐹𝐴 ∶ 𝕜𝑛 → 𝕜𝑛 является эндоморфизмом 𝑛мерного векторного пространства, и по сл. 4.8 на стр. 55 равенство ker 𝐹𝐴 = 0 равносильно сюрьективности оператора 𝐹𝐴 . Это позволяет уточ нить альтернативу Фредгольма: при 𝑚 = 𝑛 либо все неоднородные системы (516) имеют един ственное решение, либо у однородной системы (517) есть ненулевое решение. В первом слу чае матрица 𝐴 обратима по сл. 5.1, и знание обратной матрицы 𝐴−1 позволяет решить систему 𝐴𝑥 = 𝑏 при любой правой части 𝑏 по формуле 𝑥 = 𝐴−1 𝑏. 1 См. формулу (44) на стр. 54. А над бесконечным полем — бесконечно много решений. 3 Матрица 𝐴 𝑏 называется расширенной матрицей системы (516). 2 68 §5 Матрицы 5.7. Алгебры над полем. Векторное пространство 𝐴 над полем 𝕜 называется 𝕜алгеброй1 , если на нём имеется билинейная операция умножения 𝐴 × 𝐴 → 𝐴. Это требование включает в себя перестановочность умножения векторов на константы с умножением в алгебре: ∀ 𝜆 ∈ 𝕜 , ∀ 𝑎, 𝑏 ∈ 𝐴 (𝜆𝑎)𝑏 = 𝜆(𝑎𝑏) = 𝑎(𝜆𝑏) и стандартное правило раскрытия скобок: ∀ 𝜆1 , 𝜆2 , 𝜇1 , 𝜇2 ∈ 𝕜 и ∀ 𝑎1 , 𝑎2 , 𝑏1 , 𝑏2 ∈ 𝐴 (𝜆1 𝑎1 + 𝜇1 𝑏1 )(𝜆2 𝑎2 + 𝜇2 𝑏2 ) = 𝜆1 𝜆2 𝑎1 𝑎2 + 𝜆1 𝜇2 𝑎1 𝑏2 + 𝜇1 𝜆2 𝑏1 𝑎2 + 𝜇1 𝜇2 𝑏1 𝑏2 . Алгебра 𝐴 называется ассоциативной, если ∀ 𝑎, 𝑏, 𝑐 ∈ 𝐴 (𝑎𝑏)𝑐 = 𝑎(𝑏𝑐 ) . Алгебра 𝐴 называется коммутативной, если ∀ 𝑎, 𝑏 ∈ 𝐴 𝑎𝑏 = 𝑏𝑎. Алгебра 𝐴 называется алгеброй с единицей, если в ней есть такой элемент 𝑒 ∈ 𝐴, что 𝑒𝑎 = 𝑎𝑒 = 𝑎 для всех 𝑎 ∈ 𝐴. Упражнение 5.8. Покажите, что 0⋅𝑎 = 0 для всех 𝑎 в любой алгебре 𝐴 и что единичный элемент единствен (если существует). Примерами коммутативных ассоциативных алгебр с единицами являются алгебра многочле нов 𝕜[𝑥1 , 𝑥2 , … , 𝑥𝑛 ] и алгебра 𝕜⟦𝕜1 , 𝕜2 , … , 𝕜𝑛 ⟧ формальных степенных рядов с коэффициента ми из поля 𝕜. Ключевыми примерами некоммутативных ассоциативных алгебр являются алгеб ры End(𝑉 ) линейных эндоморфизмов векторных пространств 𝑉 над полем 𝕜 и алгебры Mat𝑛 (𝕜) квадратных матриц размера 𝑛 × 𝑛 с элементами из поля 𝕜. Последние являются частными слу чаями первых, поскольку каждая квадратная матрица 𝐴 ∈ Mat𝑛 (𝕜) может восприниматься как эндоморфизм координатного пространства 𝕜𝑛 , действующий на столбец 𝑥 ∈ 𝕜𝑛 по правилу2 𝑥 ↦ 𝐴𝑥 . Пример 5.5 (базис матричной алгебры) Базис алгебры Mat𝑛 (𝕜) как векторного пространства над полем 𝕜 составляют матрицы 𝐸𝑖𝑗 име ющие единицу в пересечении 𝑖 й строки с 𝑗м столбцом и нули во всех остальных местах. Соот ветствующий линейный оператор 𝐸𝑖𝑗 ∶ 𝕜𝑛 → 𝕜𝑛 переводит 𝑒𝑗 в 𝑒𝑖 , а все остальные стандартные базисные векторы отображает в нуль. Из этого описания вытекает, что 𝐸𝑖𝑗 𝐸𝑘𝓁 = 𝐸𝑖𝓁 при 𝑗 = 𝑘 {0 в остальных случаях . (518) Написанная таблица умножения базисных матриц позволяет перемножать произвольные мат рицы, которые являются линейными комбинациями базисных, просто раскрывая скобки. На 2 пример, поскольку 𝐸12 = 0, мы для всех 𝛼 ∈ 𝕜 и 𝑛 ∈ ℤ имеем 𝑛 1 𝛼 1 𝛼𝑛 = (𝐸 + 𝛼𝐸12 )𝑛 = 𝐸 + 𝑛𝛼𝐸12 = , (0 1 ) (0 1 ) а из равенства (𝐸 + 𝛼𝐸12 )(𝐸 − 𝛼𝐸12 ) = 𝐸 вытекает, что −1 1 𝛼 (0 1 ) 1 2 Более торжественно: алгеброй над полем 𝕜. Как в n∘ 5.5 и n∘ 5.6 выше. = 1 −𝛼 . (0 1 ) 69 5.7. Алгебры над полем Упражнение 5.9 (центр матричной алгебры). Для алгебры 𝐴 над полем 𝕜 подалгебра 𝑍(𝐴) ≝ {𝑧 ∈ 𝐴 | ∀ 𝑎 ∈ 𝐴 𝑎𝑧 = 𝑧𝑎} называется центром алгебры 𝐴. Покажите, что 𝑍(Mat𝑛 (𝕜)) = {𝑡𝐸 | 𝑡 ∈ 𝕜} состоит из ска лярных матриц. 5.7.1. Обратимые элементы. Элемент 𝑎 ассоциативной алгебры 𝐴 с единицей 𝑒 ∈ 𝐴 на зывается обратимым, если существует такой элемент 𝑎−1 ∈ 𝐴, что 𝑎𝑎−1 = 𝑎−1 𝑎 = 𝑒. Как и в алгебре матриц1 , это требование можно ослабить до существования левого и правого обратных к 𝑎 элементов 𝑎′ , 𝑎″ ∈ 𝐴 со свойствами 𝑎′ 𝑎 = 𝑒 = 𝑎𝑎″ , ибо они автоматически будут равны: 𝑎′ = 𝑎′ 𝑒 = 𝑎′ (𝑎𝑎″ ) = (𝑎′ 𝑎)𝑎″ = 𝑒𝑎″ = 𝑎″ . Это вычисление заодно показывает, что обратный к 𝑎 элемент однозначно определяется по 𝑎, если существует. Обратимыми элементами алгебры End 𝑉 линейных эндоморфизмов 𝑉 → 𝑉 являются ли нейные изоморфизмы 𝑉 ⥲ 𝑉 . Они образуют группу преобразований пространства 𝑉 . Эта груп па обозначается GL(𝑉 ) и называется полной линейной группой пространства 𝑉 . Группа обрати мых матриц размера 𝑛 × 𝑛 обозначается GL𝑛 (𝕜) ⊂ Mat𝑛 (𝕜). Пример 5.6 (обратимость унитреугольных матриц) Диагональ, идущая из левого верхнего угла квадратной матрицы в правый нижний, называется главной. Если все стоящие под (соотв. над) главной диагональю элементы нулевые, матрица называется верхней (соотв. нижней) треугольной. Упражнение 5.10. Проверьте, что верхние и нижние треугольные матрицы являются подал гебрами2 алгебры матриц. Треугольные матрицы с единицами на главной диагонали называются унитреугольными. По кажем, что каждая верхняя унитреугольная матрица 𝐴 = (𝑎𝑖𝑗 ) обратима3 и обратная к ней матрица 𝐵 = 𝐴−1 тоже верхняя унитреугольная с наддиагональными элементами 𝑗−𝑖−1 𝑏𝑖𝑗 = ∑ 𝑠=0 (−1)𝑠+1 ∑ 𝑎𝑖𝜈1 𝑎𝜈1 𝜈2 𝑎𝜈2 𝜈3 … 𝑎𝜈𝑠−1 𝜈𝑠 𝑎𝜈𝑠 𝑗 = 𝑖<𝜈1 <…<𝜈𝑠 <𝑗 = −𝑎𝑖𝑗 + ∑ 𝑖<𝑘<𝑗 𝑎𝑖𝑘 𝑎𝑘𝑗 − ∑ 𝑎𝑖𝑘 𝑎𝑘𝓁 𝑎𝓁𝑗 + 𝑖<𝑘<𝓁<𝑗 ∑ 𝑎𝑖𝑘 𝑎𝑘𝓁 𝑎𝓁𝑚 𝑎𝑚𝑗 − ⋯ . (519) 𝑖<𝑘<𝓁<𝑚<𝑗 Для этого запишем матрицу 𝐴 в виде линейной комбинации базисных матриц4 𝐸𝑖𝑗 𝐴=𝐸+ ∑ 𝑎𝑖𝑗 𝐸𝑖𝑗 = 𝐸 + 𝑁 , 𝑖<𝑗 где матрица 𝑁 = ∑𝑖<𝑗 𝑎𝑖𝑗 𝐸𝑖𝑗 представляет собою наддиагональную часть матрицы 𝐴. В силу форм. (518) на стр. 68, коэффициент при 𝐸𝑖𝑗 в матрице 𝑁𝑘 равен нулю при 𝑗 − 𝑖 < 𝑘, а при Ср. с n∘ 5.4 на стр. 63. Т. е. замкнуты относительно сложения и умножения. 3 Причём этот факт, как и приводимое здесь доказательство, остаётся в силе для матриц с элементами в произвольном (даже некоммутативном) ассоциативном кольце с единицей. 4 См. прим. 5.5 на стр. 68. 1 2 70 §5 Матрицы 𝑗 − 𝑖 ⩾ 𝑘 представляет собою сумму всевозможных произведений1 𝑎⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ 𝑖𝜈1 𝑎𝜈1 𝜈2⋯ 𝑎𝜈𝑘−2 𝜈𝑘−1 𝑎𝜈𝑘−1 𝑗 , где 𝑖 < 𝜈1 < 𝜈2 < … 𝜈𝑘−1 < 𝑗 . 𝑘 сомножителей В частности, он заведомо зануляется, когда 𝑘 превышает размер матрицы 𝐴. Полагая 𝑥 = 𝐸 , 𝑦 = 𝑁 в равенстве2 (𝑥 + 𝑦)(𝑥 𝑚−1 − 𝑥 𝑚−2 𝑦 + ⋯ + (−1)𝑚−1 𝑦 𝑚−1 ) = 𝑥 𝑚 − 𝑦 𝑚 , при достаточно большом 𝑚 мы получим матричное равенство 𝐴(𝐸 − 𝑁 + 𝑁2 − 𝑁3 + ⋯) = 𝐸 , откуда 𝐴−1 = 𝐸 − 𝑁 + 𝑁2 − 𝑁3 + … , что и утверждалось. 5.7.2. Алгебраические и трансцендентные элементы. С каждым элементом 𝜉 ассоциатив ной 𝕜алгебры 𝐴 с единицей связан гомоморфизм вычисления ev𝜉 ∶ 𝕜[𝑡] → 𝐴 , 𝑓 (𝑥 ) ↦ 𝑓 (𝜉 ) ∈ 𝐴 . (520) Он переводит многочлен 𝑓(𝑥 ) = 𝑎0 𝑥 𝑚 + 𝑎1 𝑥 𝑚−1 + ⋯ + 𝑎𝑚−1 𝑥 + 𝑎𝑚 в результат подстановки в этот многочлен 𝑥 = 𝜉 . При этом мы считаем, что результатом такой подстановки в свободный член 𝑎0 = 𝑎0 𝑥 0 является элемент 𝑎0 𝜉0 ≝ 𝑎0 𝑒 ∈ 𝐴. Обратите внимание, что отображение (520), вопервых, линейно, а вовторых, перестановочно со сложеним и умножением. Если гомоморфизм (520) инъективен, то элемент 𝜉 ∈ 𝐴 называется трансцендентным над 𝕜. Отметим, что в этом случае алгебра 𝐴 бесконечномерна как векторное пространство над 𝕜, так все натуральные степени элемента 𝜉 линейно независимы. Если гомоморфизм (520) имеет ненулевое ядро, то элемент 𝜉 называется алгебраическим над 𝕜. Упражнение 5.11 (по алгебре). Убедитесь, что если ядро ker ev𝜉 ≠ 0, то в нём имеется един ственный многочлен 𝜇𝜉 (𝑥 ) наименьшей положительной степени3 со старшим коэффици ентом 1, и ker ev𝜉 = (𝜇𝜉 ) состоит из всех многочленов, делящихся на 𝜇𝜉 . Приведённый многочлен 𝜇𝜉 из упр. 5.11 называется минимальным многочленом элемента 𝜉 . Пример 5.7 (алгебраичность линейных эндоморфизмов) 2 Если dim 𝑉 = 𝑛, то dim End 𝑉 = 𝑛2 , и последовательные итерации 𝐹0 = Id𝑉 , 𝐹 , 𝐹2 , … , 𝐹𝑛 любого линейного оператора 𝐹 ∶ 𝑉 → 𝑉 представляют собою линейно зависимый набор век торов пространства End 𝑉 . Поэтому каждый эндоморфизм4 𝐹 удовлетворяет нетривиальному полиномиальному уравнению 𝐹𝑚 + 𝑎1 𝐹𝑚−1 + ⋯ + 𝑎𝑚−1 𝐹 + 𝑎𝑚 𝐸 = 0, где 𝑎𝑖 ∈ 𝕜. 1 Продуктивно представлять себе 𝐸𝑖𝑗 как стрелку, ведущую из числа 𝑗 в число 𝑖 на числовой прямой. Произведение 𝑘 сомножителей 𝐸𝑖𝑗 отлично от нуля если и только если конец каждой стрелки совпадает с началом предыдущей, и в этом случае такое произведение равно сумме всех перемножаемых стрелок, рассматриваемых как целочисленные векторы на числовой прямой. Таким образом, каждое ненулевое произведение 𝑘 стрелок имеет длину как минимум 𝑘 , а разложения элемента 𝐸𝑖𝑗 в произведение 𝑘 таких элементов находятся в биекции со всевозможными способами пройти из 𝑗 в 𝑖 за 𝑘 шагов. 2 Поскольку матрицы 𝐸 и 𝑁 коммутируют друг с другом, в результате этой подстановки мы получим верное матричное равенство. 3 Среди всех степеней, представленных в ker ev𝜉 . 4 В частности, любая квадратная матрица. §6. Метод Гаусса 6.1. Построение базиса в подпространстве. Рассмотрим 𝑛мерное координатное векторное пространство 𝕜𝑛 , векторы которого будем записывать в виде строк (𝑥1 , … , 𝑥𝑛 ). Сопоставим каждому набору векторов 𝑤1 , … , 𝑤𝑚 ∈ 𝕜𝑛 матрицу размера 𝑚 × 𝑛, по строкам которой выписа ны координаты этих векторов и которую мы будем называть матрицей координат векторов 𝑤𝑖 . Метод Гаусса позволяет построить в линейной оболочке 𝑈 произвольного заданного набора век торов 𝑤1 , … , 𝑤𝑚 ∈ 𝕜𝑛 базис 𝑢1 , … , 𝑢𝑟 , матрица координат которого имеет приведённый сту пенчатый вид. Последнее по определению означает, что в каждой строке этой матрицы самый левый ненулевой элемент равен единице, располагается строго правее, чем в предыдущей стро ке и является единственным ненулевым элементом своего столбца. Например, матрица ⎛0 ⎜0 ⎜ ⎜0 ⎜0 ⎜ ⎝0 1 ∗ 1 ∗ ∗ ∗ ∗ 1 ∗ ∗ ∗ 1 ∗⎞ ∗⎟ ⎟ ∗⎟ ∗⎟ ⎟ 0⎠ (61) является приведённой ступенчатой при любом выборе элементов, стоящих на отмеченных звёз дочками местах. Упражнение 6.1. Убедитесь, что ненулевые строки любой приведённой ступенчатой матрицы линейно независимы и, тем самым, образуют базис своей линейной оболочки. Столбцы, содержащие самые левые ненулевые координаты базисных векторов 𝑢1 , … , 𝑢𝑟 назы ваются базисными столбцами приведённой ступенчатой матрицы. Их номера 𝑗1 , … , 𝑗𝑟 строго возрастают, а сами они образуют единичную подматрицу размера 𝑟 × 𝑟. В матрице (61) базис ными являются столбцы с номерами 2, 4, 7 и 9. Упражнение 6.2. Убедитесь, что базисные столбцы линейно независимы и образуют базис в линейной оболочке столбцов приведённой ступенчатой матрицы. Базис с приведённой ступенчатой матрицей координат строится в линейной оболочке векто ров 𝑤1 , … , 𝑤𝑚 путём последовательных замен подходящих пар векторов 𝑤𝑖 , 𝑤𝑗 их линейными комбинациями 𝑤𝑖′ = 𝑎𝑤𝑖 + 𝑏𝑤𝑗 , 𝑤𝑗′ = 𝑐𝑤𝑖 + 𝑑𝑤𝑗 так, чтобы линейная оболочка новых векторов 𝑤𝑖′ , 𝑤𝑗′ оставалась такой же, как у 𝑤𝑖 , 𝑤𝑗 , но в матрице координат новых векторов становилось больше нулей в левом нижнем углу. Упражнение 6.3. Убедитесь, что при 𝑎𝑑 − 𝑏𝑐 ≠ 0 линейная оболочка векторов 𝑤𝑖′ = 𝑎𝑤𝑖 + 𝑏𝑤𝑗 и 𝑤𝑗′ = 𝑐𝑤𝑖 + 𝑑𝑤𝑗 остаётся такой же, как у векторов 𝑤𝑖 и 𝑤𝑗 . В классическом методе Гаусса принято использовать замены следующих трёх типов: 1) 𝑤𝑖′ = 𝑤𝑖 + 𝜆𝑤𝑗 𝑤𝑗′ = 𝑤𝑗 2) 𝑤𝑖′ = 𝑤𝑗 𝑤𝑗′ = 𝑤𝑖 3) 𝑤𝑖′ = 𝜚𝑤𝑖 𝑤𝑗′ = 𝑤𝑗 (c произвольым 𝜆 ∈ 𝕜) (с ненулевым 𝜚 ∈ 𝕜) . При этих заменах исходные векторы линейно выражаются через преобразованные как 1) 𝑤𝑖 = 𝑤𝑖′ − 𝜆𝑤𝑗′ 𝑤𝑗 = 𝑤𝑗′ 2) 𝑤𝑖 = 𝑤𝑗′ 𝑤𝑗 = 𝑤𝑖′ 3) 𝑤𝑖 = 𝜚−1 𝑤𝑖′ 𝑤𝑗 = 𝑤𝑗′ , 71 72 §6 Метод Гаусса а матрица координат испытывает следующие элементарные преобразования строк 1) к одной из строк прибавляется другая строка, умноженная на число 2) две строки меняются местами (62) 3) одна из строк умножается на ненулевое число. Теорема 6.1 (о преобразовании к приведённому ступенчатому виду) Каждая матрица 𝐴 ∈ Mat𝑚×𝑛 (𝕜) элементарными преобразованиями строк может быть пре вращена в приведённую ступенчатую матрицу 𝐴red . Ненулевые строки матрицы 𝐴red образуют базис в линейной оболочке строк матрицы 𝐴. Доказательство. Удобно разбить процесс на последовательные шаги, соответствующие столб цам матрицы 𝐴. Будем предполагать, что после выполнения (𝑘 − 1)го шага та часть матри цы, что находится слева от 𝑘ого столбца, имеет приведённый ступенчатый вид и 𝑠 ненулевых строк. При 𝑘 = 1 это требование означает, что 𝑠 = 0, и не накладывает никаких ограниче ний на матрицу. При 𝑘 > 1 ненулевые 𝑠 строк слева от 𝑘ого столбца суть верхние 𝑠 строк и 0 ⩽ 𝑠 ⩽ 𝑘 − 1. Очередной 𝑘тый шаг вычисления состоит в следующем. Если все элементы 𝑘 го столбца, расположенные строго ниже 𝑠й строки, нулевые, то можно переходить к (𝑘 + 1)му шагу. Если же в 𝑘том столбце имеется ненулевой элемент 𝑎, расположенный строго ниже 𝑠той строки, то мы умножаем содержащую его строку на 𝑎−1 , а затем меняем её местами с (𝑠 + 1)ой строкой. При этом левые (𝑘 − 1) столбцов матрицы не изменятся, а (𝑠 + 1)я строка примет вид 0 … 0 0 1 ⏟⏟⏟⏟⏟⏟⏟⏟⏟ ∗∗…∗∗. ⏟⏟⏟⏟⏟ 𝑘−1 𝑛−𝑘 Теперь для каждого 𝑖 ≠ 𝑠 + 1 вычтем из 𝑖 й строки полученной матрицы (𝑠 + 1)ую строку, умноженную на элемент, стоящий в пересечении 𝑖 й строки и 𝑘го столбца. Это не изменит ле вые (𝑘 − 1) столбцов матрицы и обнулит все элементы 𝑘того столбца за исключением стоящей (𝑠 + 1)ой строке единицы. В результате мы попадаем в исходное положение для (𝑘 + 1)го шага. Последнее утверждение предложения вытекает из упр. 6.1 и сделанного выше замечания, что элементарные преобразования строк не меняют линейной оболочки строк матрицы. Пример 6.1 Построим в координатном пространстве ℚ5 базис линейной оболочки строк матрицы ⎛ 2 −4 −8 2 −4⎞ ⎜−1 1 3 0 1⎟ . ⎜−1 −1 1 2 −1⎟ ⎟ ⎜ 2 1 1⎠ ⎝−1 Для этого умножим последнюю строку на −1 и поменяем местами с первой: 0 −2 −1 −1⎞ ⎛ 1 ⎜−1 1 3 1⎟ . ⎜−1 −1 1 2 −1⎟ ⎜ ⎟ 2 −4⎠ ⎝ 2 −4 −8 (63) 73 6.2. Отыскание обратной матрицы Теперь обнулим первый столбец ниже первой строки, прибавляя надлежащие кратности пер вой строки ко второй, третьей и четвёртой строкам: 0 −2 −1 −1⎞ ⎛1 ⎜0 1 1 −1 0⎟ . ⎜0 −1 −1 1 −2⎟ ⎜ ⎟ 4 −2⎠ ⎝0 −4 −4 Далее обнулим второй столбец ниже второй строки, добавив подходящие её кратности к ниж ним двум строкам: ⎛1 0 −2 −1 −1⎞ ⎜0 1 1 −1 0⎟ . ⎜0 0 0 −2⎟ ⎜ ⎟ 0 −2⎠ ⎝0 0 Наконец, делим третью строку на −2 и зануляем последний столбец вне третьей строки, добав ляя к первой и четвёртой строкам подходящие кратности третьей: ⎛1 ⎜0 ⎜0 ⎜ ⎝0 0 −2 −1 0⎞ 1 1 −1 0⎟ . 0 1⎟ ⎟ 0 0⎠ (64) Верхние три строки этой приведённой ступенчатой матрицы составляют базис в линейной обо лочке 𝑈 ⊂ ℚ5 строк исходной матрицы (63). В частности, dim 𝑈 = 3. 6.2. Отыскание обратной матрицы. Каждое из перечисленных в форм. (62) на стр. 72 эле ментарных преобразований строк 𝑚 × 𝑛 матрицы 𝐴 можно осуществить, умножая матрицу 𝐴 слева на квадратную матрицу 𝑆, которая получается из единичной матрицы 𝐸 размера 𝑚 × 𝑚 тем же самым элементарным преобразованием строк, что требуется произвести в матрице 𝐴. Преобразование строк, обратное к тому, что осуществляется левым умножением на матрицу 𝑆, тоже задаётся левым умножением на некоторую 𝑚 × 𝑚 матрицу 𝑇. Применяя обратные друг другу преобразования 𝑆 и 𝑇 к единичной 𝑚 × 𝑚 матрице 𝐸 , мы получаем равенство 𝑇𝑆𝐸 = 𝐸 , означающее, что 𝑚 × 𝑚 матрицы 𝑆 и 𝑇 обратны друг другу. Мы заключаем, что приведённая сту пенчатая матрица 𝐴red , которая получается из матрицы 𝐴 элементарными преобразованиями строк, имеет вид 𝐴red = 𝑆𝑘 … 𝑆1 𝐴, где все матрицы 𝑆1 , … , 𝑆𝑘 ∈ Mat𝑚×𝑚 (𝕜) обратимы. Для квадратной 𝑚 × 𝑚 матрицы 𝐴 приведённая ступенчатая матрица 𝐴red либо единичная, либо содержит нулевые строки. В первом случае rk 𝐴 = 𝑚 и матрица 𝐴 обратима по сл. 5.1 на стр. 65, причём из равенства 𝐴red = 𝐸 = 𝑆𝑘 … 𝑆1 𝐴 вытекает, что 𝐴−1 = 𝑆𝑘 … 𝑆1 = 𝑆𝑘 … 𝑆1 𝐸 полу чается из единичной матрицы 𝐸 той же самой цепочкой элементарных преобразований строк, что превращает матрицу 𝐴 в матрицу 𝐸 . Во втором случае rk 𝐴 < 𝑚 и матрица 𝐴 необратима по тому же сл. 5.1. Итак, если приписать справа к квадратной матрице 𝐴 единичную матрицу 𝐸 того же разме ра 𝑚 × 𝑚 и применить к получившейся матрице 𝐴 𝐸 размера 𝑚 × 2𝑚 метод Гаусса, то либо на выходе получится матрица 𝐸 𝐵 , что означает обратимость матрицы 𝐴 и равенство 𝐴−1 = 𝐵, либо в процессе вычислений мы придём к матрице 𝑁 𝐶 с необратимой матрицей 𝑁, что озна чает необратимость матрицы 𝐴, ибо будь она обратима, матрица 𝑁 = 𝑆𝑘 … 𝑆1 𝐴 тоже была бы обратимой. 74 §6 Метод Гаусса Пример 6.2 Выясним обратима ли матрица ⎛ 6 ⎜ 1 𝐴=⎜ 1 ⎜ − ⎝ 1 3 −2 1⎞ 4 1 1⎟ 1 3 −1⎟ ⎟ 0 −2 1⎠ Для этого применим метод Гаусса к матрице ⎛ 6 ⎜ 1 ⎜ 1 ⎜ ⎝−1 1 3 −2 1 4 1 1 1 3 −1 0 −2 1 1 1 0⎞ 0⎟ . 0⎟ ⎟ 1⎠ Меняем знак нижней строки, после чего меняем её местами с верхней: ⎛1 ⎜1 ⎜1 ⎜ ⎝6 1 2 −1 4 1 1 1 3 −1 3 −2 1 1 0 −1⎞ 0⎟ 1 0⎟ ⎟ 0⎠ и обнуляем первый столбец ниже первой строки, отнимая из всех строк надлежащие кратности первой строки: 2 −1 0 0 0 −1⎞ ⎛1 0 ⎜0 4 −1 2 0 1 0 1⎟ . ⎜0 1 1 0 0 0 1 1⎟ ⎟ ⎜ 7 1 0 0 6⎠ ⎝0 3 −14 Теперь переставляем вторую и третью строки и обнуляем нижние два элемента второго столб ца: 2 −1 0 0 0 −1⎞ ⎛1 0 ⎜0 1 1 0 0 0 1 1⎟ (65) ⎜0 0 −5 2 0 1 −4 −3⎟ ⎟ ⎜ 7 1 0 −3 3⎠ ⎝0 0 −17 Чтобы избежать вычислений с дробями, отклонимся от классического метода Гаусса и умножим нижние две строки слева на матрицу1 −1 −5 2 (−17 7) = 7 −2 . (17 −5) 1 0 −1⎞ 1 1⎟ 2 −7 22 27⎟ ⎟ 5 −17 53 66⎠ Получим ⎛1 ⎜0 ⎜0 ⎜ ⎝0 1 2 −1 1 1 1 ⎛1 ⎜0 Это равносильно умножению всей матрицы на ⎜ ⎜ ⎝0 1 7 17 0⎞ 0⎟ −2⎟ ⎟ −5⎠ 75 6.3. Решение систем линейных уравнений Остаётся вычесть из второй строки третью, а из первой — четвёртую и удвоенную третью: ⎛1 ⎜0 ⎜0 ⎜ ⎝0 1 1 1 1 −3 9 11⎞ −2 7 −21 −26⎟ 2 −7 22 27⎟ ⎟ 5 −17 53 66⎠ Мы заключаем, что матрица 𝐴 обратима и 𝐴−1 9 11⎞ ⎛ 1 −3 ⎜−2 7 −21 −26⎟ =⎜ . 2 −7 22 27⎟ ⎜ ⎟ 53 66⎠ ⎝ 5 −17 Упражнение 6.4. Проверьте результат умножением этой матрицы на исходную матрицу 𝐴. 6.3. Решение систем линейных уравнений. В n∘ 5.6 на стр. 66 мы сопоставили системе линей ных уравнений ⎧ 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 𝑏1 ⎪ ⎪ 𝑎21 𝑥1 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛 = 𝑏2 ⎨ ⋯⋯⋯⋯⋯ ⎪ ⎪𝑎 𝑥 + 𝑎 𝑥 + ⋯ + 𝑎 𝑥 = 𝑏 ⎩ 𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 𝑚 (66) матрицу 𝐶 = 𝐴 𝑏 размера 𝑚 × (𝑛 + 1), которая получается приписыванием столбца 𝑏 = (𝑏𝑖 ) правых частей системы (66) к 𝑚 × 𝑛 матрице 𝐴 = (𝑎𝑖𝑗 ), составленной из коэффициентов ле вых частей уравнений (66). Перечисленным в форм. (62) на стр. 72 элементарным преобразо ваниям строк матрицы 𝐶 на языке уравнений отвечают следующие три типа преобразований системы (66): 1) почленое сложение одного из уравнений с другим, умноженным на константу 2) перестановка двух уравнений друг с другом 3) умножение обеих частей некоторого уравнения на ненулевую константу. (67) Так как исходная система может быть получена из преобразованной системы аналогичным эле ментарным преобразованием, обратным к проделанному, исходная и преобразованная систе ма эквивалентны в том смысле, что у них одно и то же пространство решений. Таким образом, метод Гаусса преобразует систему уравнений (66) с матрицей 𝐶 = 𝐴 𝑏 в эквивалентную ей систему уравнений с приведённой ступенчатой матрицей 𝐶red . Пусть базисные столбцы1 мат рицы 𝐶red имеют номера 𝑗1 < 𝑗2 < … < 𝑗𝑟 . Если 𝑗𝑟 = 𝑛 + 1, то 𝑟тое уравнение системы имеет вид 0 = 1, и система несовместна. Если же 𝑗𝑟 ⩽ 𝑛, то систему можно переписать в виде 𝑥𝑗1 = 𝛽1 − 𝛼1𝑖1 𝑥𝑖1 − 𝛼1𝑖2 𝑥𝑖2 − ⋯ − 𝛼1𝑖𝑛−𝑟 𝑥𝑖𝑛−𝑟 𝑥𝑗2 = 𝛽2 − 𝛼2𝑖1 𝑥𝑖1 − 𝛼2𝑖2 𝑥𝑖2 − ⋯ − 𝛼2𝑖𝑛−𝑟 𝑥𝑖𝑛−𝑟 ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ (68) 𝑥𝑗𝑟 = 𝛽𝑟 − 𝛼𝑟𝑖1 𝑥𝑖1 − 𝛼𝑟𝑖2 𝑥𝑖2 − ⋯ − 𝛼𝑟𝑖𝑛−𝑟 𝑥𝑖𝑛−𝑟 , 1 Т. е. столбцы, в которых расположены самые левые ненулевые элементы строк матрицы 𝐶red , см. стр. 71. 76 §6 Метод Гаусса где {𝑖1 , … , 𝑖𝑛−𝑟 } = {1, … , 𝑛} ∖ {𝑗1 , … , 𝑗𝑟 }. Переменные 𝑥𝑖1 , … , 𝑥𝑖𝑛−𝑟 , находящиеся вне базисных столбцов приведённой ступенчатой матрицы, называются свободными, так как могут прини мать любые значения. Стоящие в базисных столбцах переменные 𝑥𝑗1 , … , 𝑥𝑗𝑟 называются свя занными, поскольку для любого набора значений свободных переменных есть ровно один набор значений связанных переменных, дополняющий указанные значения свободных переменных до решения системы (66). Эти единственные значения задаются формулами (68), которые, таким образом, доставляют параметрическое описание всех решений системы (66). Это описание согласуется с качественным описанием пространства решений из n∘ 5.6 на стр. 66. А именно, подставляя в правую часть (68) нулевые значения 𝑥𝑖1 = ⋯ = 𝑥𝑖𝑟 = 0, мы получаем точку 𝑝 ∈ 𝕜𝑛 с координатами 𝛽1 , … , 𝛽𝑟 на местах с номерами 𝑗1 , … , 𝑗𝑟 и нуле выми остальными координатами. Она удовлетворяет уравнениям (66), и каждое решение си стемы (66) имеет вид 𝑝 + 𝑣 , где вектор 𝑣 пробегает векторное подпространство ker 𝐹𝐴 ⊂ 𝕜𝑛 решений однородной системы 𝐴𝑥 = 0, которая в развёрнутом виде выглядит как ⎧ 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 0 ⎪ ⎪ 𝑎21 𝑥1 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛 = 0 ⎨ ⋯⋯⋯⋯⋯ ⎪ ⎪𝑎 𝑥 + 𝑎 𝑥 + ⋯ + 𝑎 𝑥 = 0 , ⎩ 𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 (69) и эквивалентна системе 𝐴red 𝑥 = 0, которую тоже можно переписать в виде 𝑥𝑗1 = −𝛼1𝑖1 𝑥𝑖1 − 𝛼1𝑖2 𝑥𝑖2 − ⋯ − 𝛼1𝑖𝑛−𝑟 𝑥𝑖𝑛−𝑟 𝑥𝑗2 = −𝛼2𝑖1 𝑥𝑖1 − 𝛼2𝑖2 𝑥𝑖2 − ⋯ − 𝛼2𝑖𝑛−𝑟 𝑥𝑖𝑛−𝑟 (610) ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 𝑥𝑗𝑟 = −𝛼𝑟𝑖1 𝑥𝑖1 − 𝛼𝑟𝑖2 𝑥𝑖2 − ⋯ − 𝛼𝑟𝑖𝑛−𝑟 𝑥𝑖𝑛−𝑟 . Базис в векторном пространстве решений системы (610) составляют векторы 𝑢1 , … , 𝑢𝑛−𝑟 , ко торые получаются следующим образом. Для каждого 𝑘 = 1, … , (𝑛 − 𝑟) подставим в правую часть (610) значения 𝑥𝑖𝑘 = 1 и 𝑥𝑖𝜈 = 0 при 𝜈 ≠ 𝑘. Получим вектор с координатами −𝛼1𝑖𝑘 , … , −𝛼𝑟𝑖𝑘 на местах с номерами 𝑗1 , … , 𝑗𝑟 , координатой 1 на 𝑖𝑘 м месте, и остальными 𝑛 − 𝑟 − 1 координатами равными нулю. Это и есть 𝑘й базисный вектор 𝑢𝑘 . Пример 6.3 Решим методом Гаусса следующую систему уравнений над полем ℚ: ⎧𝑥1 + 2𝑥2 + 2𝑥3 + 𝑥4 + 5𝑥5 + 3𝑥6 = 6 ⎪ ⎪ − 2𝑥1 − 4𝑥2 − 3𝑥3 − 9𝑥5 − 5𝑥6 = −10 ⎪ ⎨3𝑥1 + 6𝑥2 + 4𝑥3 − 𝑥4 + 13𝑥5 + 7𝑥6 = 14 ⎪ − 𝑥 − 2𝑥 − 5𝑥 − 7𝑥 − 8𝑥 − 6𝑥 = −12 1 2 3 4 5 6 ⎪ ⎪ − 3𝑥 − 6𝑥 − 7𝑥 − 5𝑥 − 16𝑥 − 9𝑥 − 2𝑥 = −17 ⎩ 1 2 3 4 5 6 7 Расширенная матрица этой системы вид 2 2 1 5 3 6 ⎛ 1 ⎜ −2 −4 −3 −9 −5 0 −10 ⎜ 6 4 −1 13 7 14 ⎜ 3 ⎜ −1 −2 −5 −7 −8 −6 0 −12 ⎜ ⎝ −3 −6 −7 −5 −16 −9 −2 −17 ⎞ ⎟ ⎟ ⎟. ⎟ ⎟ ⎠ (611) 77 6.3. Решение систем линейных уравнений Обнуляем первый столбец вне первой строки, прибавляя ко всем строкам надлежащие кратно сти первой: ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ 1 6 2 −4 −6 1 2 2 1 5 3 1 2 1 1 0 −2 −4 −2 −2 0 −3 −6 −3 −3 0 −1 −2 −1 0 −2 ⎞ ⎟ ⎟ ⎟. ⎟ ⎟ ⎠ Обнуляем третий столбец вне второй строки, прибавляя ко всем строкам надлежащие кратно сти второй: ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ 1 2 0 −3 1 2 3 1 1 1 1 −2 2 2 3 ⎞ ⎟ ⎟ ⎟. ⎟ ⎟ ⎠ Удаляем нулевые строки и обнуляем шестой столбец вне нижней строки, прибавляя ко второй и тртьей строкам надлежащие кратности нижней строки: 2 −1 ⎞ ⎛ 1 2 0 −3 3 0 ⎜ 0 0 1 2 1 0 2 −1 ⎟ . ⎜ ⎟ 1 − 2 3 ⎠ ⎝ Система уравнений, отвечающая этой приведённой ступенчатой матрице может быть записана в виде ⎧𝑥1 = −1 − 2𝑥2 + 3𝑥4 − 3𝑥5 − 2𝑥7 ⎪ ⎨𝑥3 = −1 − 2𝑥4 − 𝑥5 − 2𝑥7 ⎪𝑥 = 3 + 2𝑥 . ⎩ 6 7 (612) Придавая свободным переменным 𝑥2 , 𝑥4 , 𝑥5 , 𝑥7 произвольные значения и вычисляя соответ ствующие значения связанных переменных 𝑥1 , 𝑥3 , 𝑥6 по формулам (612) получаем параметри ческое описание всех решений исходной системы (611). На геометрическом языке эти решения заметают в ℚ7 аффинное пространство 𝑝 + 𝑈, где точка 𝑝 = (−1, 0, −1, 0, 0, 3, 0) получается подстановкой 𝑥2 = 𝑥4 = 𝑥5 = 𝑥7 = 0 в (612), а векторное подпространство 𝑈 ⊂ ℚ7 имеет базис из векторов 𝑢1 = (−2, 1, 0, 0, 0, 0, 0) , 𝑢2 = (3, 0, −2, 1, 0, 0, 0) , 𝑢3 = (−3, 0, −1, 0, 1, 0, 0) , 𝑢4 = (−2, 0, −2, 0, 0, 1, 2) , координаты которых получаются подстановкой в однородные версии формул (612) ⎧𝑥1 = −2𝑥2 + 3𝑥4 − 3𝑥5 − 2𝑥7 ⎪ ⎨𝑥3 = −2𝑥4 − 𝑥5 − 2𝑥7 ⎪𝑥 = 2𝑥 . ⎩ 6 7 значений (𝑥2 , 𝑥4 , 𝑥5 , 𝑥7 ) = (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1). 78 §6 Метод Гаусса 6.4. Построение базиса в ядре и образе линейного отображения. Пусть линейное отображе ние 𝐹 ∶ 𝑈 → 𝑊 имеет матрицу 𝐴 = 𝐹𝒘𝒖 ∈ Mat𝑚×𝑛 (𝕜) в некоторых базисах 𝒖 = (𝑢1 , … , 𝑢𝑛 ) и 𝒘 = (𝑤1 , … , 𝑤𝑚 ) пространств 𝑈 и 𝑊 . Тогда образ вектора 𝑣 = 𝒖𝑥 со столбцом координат 𝑥 = (𝑥1 , … , 𝑥𝑛 )𝑡 в базисе 𝒖 равен 𝐹 (𝒖𝑥 ) = 𝐹 (𝒖)𝑥 = 𝒘𝐹𝒘𝒖 𝑥 и имеет в базисе 𝒘 столбец ко ординат 𝐹𝒘𝒖 𝑥 = 𝐴𝑥 . Тем самым ядро ker 𝐹 состоит из всех таких векторов 𝒖𝑥 , координатный столбец 𝑥 которых в базисе 𝒖 является решением системы однородных уравнений 𝐴𝑥 = 0. Для описания этих решений матрицу 𝐴 следует преобразовать к приведённому ступенчатому ви ду 𝐴red , после чего базис в пространстве решений находится описанным выше способом. Поскольку матрица 𝐴red = 𝑆𝐴 получается умножением матрицы 𝐴 слева на некорую об ратимую 𝑚 × 𝑚матрицу 𝑆, матрица 𝐴red = 𝐹𝒆𝒖 является матрицей отображения 𝐹 в прежнем базисе 𝒖 пространства 𝑈, но в другом базисе 𝒆 = 𝒘𝑆−1 пространства 𝑊 . В самом деле, матрица −1 = 𝑆 и по форм. (514) на стр. 65 𝐹𝒆𝒖 = 𝐶𝒆𝒘 𝐹𝒘𝒖 = 𝑆𝐴 = 𝐴red . Тем самым, перехода1 𝐶𝒆𝒘 = 𝐶𝒘𝒆 образ оператора 𝐹 состоит из векторов 𝒆𝑦, столбец координат 𝑦 которых в новом базисе 𝒆 про странства 𝑊 лежит в линейной оболочке столбцов матрицы 𝐴red . Как мы видели в упр. 6.2 на стр. 71, базисные столбцы матрицы 𝐴red образуют базис в линейной оболочке её столбцов. Это означает, что образы 𝐹 (𝑢𝑗1 ), … , 𝐹 (𝑢𝑗𝑟 ) тех базисных векторов пространства 𝑈, номера которых совпадают с номерами базисных столбцов приведённой ступенчатой матрицы 𝐴red , составляют базис в im 𝐹 . Пример 6.4 (вариация прим. 6.1 на стр. 72) Пусть линейное отображение 𝐹 ∶ ℚ5 → ℚ4 имеет в стандартных базисах матрицу ⎛ 2 −4 −8 2 −4⎞ ⎜−1 1 3 0 1⎟ 𝐴=⎜ −1 −1 1 2 −1⎟ ⎟ ⎜ 2 1 1⎠ ⎝−1 из прим. 6.1 на стр. 72. Методом Гаусса мы преобразуем её к приведённому ступенчатому виду 𝐴red ⎛1 0 −2 −1 0⎞ = ⎜0 1 1 −1 0⎟ ⎟ ⎜ 0 1⎠ ⎝0 0 и заключаем, что базис в образе оператора 𝐹 составляют векторы 𝐹 (𝑒1 ), 𝐹 (𝑒2 ), 𝐹 (𝑒5 ), коорди наты которых в стандартном базисе пространства ℚ4 суть первый, второй и пятый столбцы исходной матрицы 𝐴. Ядро оператора 𝐹 составляют векторы, столбец координат 𝑥 которых в стандартном базисе пространства ℚ5 решает систему 𝐴red 𝑥 = 0. Параметрическое представле ние решений задаётся формулами ⎧𝑥1 = 2𝑥3 + 𝑥4 ⎪ ⎨𝑥2 = −𝑥3 + 𝑥4 ⎪𝑥 = 0 . ⎩ 5 а базис в пространстве решений составляют векторы (2, −1, 1, 0, 0), (1, 1, 0, 1, 0), координаты которых получаются подстановкой в предыдущие формулы значений (𝑥3 , 𝑥4 ) = (1, 0) , (0, 1). 1 См. n∘ 5.3 на стр. 62. 6.5. Построение базиса в фактор пространстве 79 6.5. Построение базиса в фактор пространстве. Пусть 𝑟мерное векторное подпространство 𝑈 ⊂ 𝕜𝑛 порождается строками матрицы 𝐴 и пусть базисные столбцы приведённой ступенча той матрицы 𝐴red , полученной из 𝐴 элементарными преобразованиями строк, имеют номера 𝑗1 , … , 𝑗𝑟 . Покажем, что классы [𝑒𝑖1 ], … , [𝑒𝑖𝑛−𝑟 ] стандартных базисных векторов пространства 𝕜𝑛 с дополнительными к 𝑗1 , … , 𝑗𝑟 номерами 𝑖1 , … , 𝑖𝑛−𝑟 образуют базис фактор пространства 𝕜𝑛∕𝑈. Для этого обозначим через 𝐸𝐼 и 𝐸𝐽 координатные подпространства, натянутые на дополнитель ные наборы базисных векторов 𝑒𝑖1 , … , 𝑒𝑖𝑛−𝑟 и 𝑒𝑗1 , … , 𝑒𝑗𝑟 . Проекция 𝜋𝐽 ∶ 𝕜𝑛 ↠ 𝐸𝐽 простран ства 𝕜𝑛 на подпространство 𝐸𝐽 вдоль подпространства 𝐸𝐼 переводит строки приведённой сту пенчатой матрицы 𝐴red в точности в базисные векторы 𝑒𝑗1 , … , 𝑒𝑗𝑟 . Следовательно, ограничение этой проекции на подпространство 𝑈 ⊂ 𝕜𝑛 является изоморфизмом между 𝑈 и 𝐸𝐽 и, в частно сти, имеет нулевое ядро 𝑈 ∩ ker 𝜋𝐽 = 𝑈 ∩ 𝐸𝐼 = 0. Но тогда и ограничение отображения факто ризации 𝜋𝑈 ∶ 𝕜𝑛 ↠ 𝕜𝑛 ∕𝑈 на подпространство 𝐸𝐼 ⊂ 𝕜𝑛 тоже имеет нулевое ядро, ибо последнее также равно 𝐸𝐼 ∩ ker 𝜋𝑈 = 𝐸𝐼 ∩ 𝑈. Поскольку dim 𝐸𝐼 = 𝑛 − 𝑟 = dim 𝕜𝑛 ∕ 𝑈, отображение фак торизации изоморфно отображает подпространство 𝐸𝐼 на фактор 𝕜𝑛 ∕ 𝑈. Поэтому образы [𝑒𝑖 ] базисных векторов 𝑒𝑖 составят базис в 𝕜𝑛 ∕ 𝑈. Пример 6.5 (ещё одна вариация прим. 6.1 на стр. 72) Пусть подпространство 𝑈 ⊂ ℚ5 порождено строками матрицы ⎛ 2 −4 −8 2 −4⎞ ⎜−1 1 3 0 1⎟ 𝐴=⎜ −1 −1 1 2 −1⎟ ⎟ ⎜ 2 1 1⎠ ⎝−1 из прим. 6.1 на стр. 72. Базисные столбцы приведённой ступенчатой матрицы ⎛1 0 −2 −1 0⎞ 𝐴red = ⎜0 1 1 −1 0⎟ , ⎜ ⎟ 0 1⎠ ⎝0 0 имеют номера 1, 2, 5, а базис в факторе ℚ5∕𝑈 составляют классы [𝑒3 ]𝑈 и [𝑒4 ]𝑈 базисных векторов 𝑒3 , 𝑒4 c дополнительными к 1, 2, 5 номерами. 6.6. Расположение подпространства относительно базиса. В этом разделе мы покажем, что в каждом подпространстве 𝑈 ⊂ 𝕜𝑛 существует единственный базис с приведённой ступенча той матрицей координат. Отсюда вытекает, в частности, что приведённая ступенчатая матри ца 𝐴red , полученная из матрицы 𝐴 элементарными преобразованиями строк, не зависит от вы бора цепочки преобразований и даже собственно от матрицы 𝐴, а зависит только от линейной оболочки строк матрицы 𝐴. Предложение 6.1 Для каждого векторного подпространства 𝑈 ⊂ 𝕜𝑛 размерности 𝑟 множество {1, … , 𝑛} можно1 так разбить в объединение двух непересекающихся дополнительных подмножеств 𝐼 = {𝑖1 , … , 𝑖𝑛−𝑟 } и 𝐽 = {𝑗1 , … , 𝑗𝑟 } = {1, … , 𝑛} ∖ 𝐼 , чтобы линейные оболочки 𝐸𝐼 = span(𝑒𝑖1 , … , 𝑒𝑖𝑛−𝑟 ) и 𝐸𝐽 = span(𝑒𝑗1 , … , 𝑒𝑗𝑟 ) стандартных базис ных векторов 𝑒𝜈 ∈ 𝕜𝑛 удовлетворяли следующим эквивалентным условиям: 1 Как правило, многими способами. 80 §6 Метод Гаусса 1) подпространства 𝑈 и 𝐸𝐼 имеют нулевое пересечение 𝑈 ∩ 𝐸𝐼 = 0 2) ограничение на подпространство 𝑈 проекции 𝑝 ∶ 𝑉 ↠ 𝐸𝐽 , (𝑥1 , … , 𝑥𝑛 ) ↦ (𝑥𝑗1 , … , 𝑥𝑗𝑟 ), пространства 𝑉 на подпространство 𝐸𝐽 вдоль подпространства 𝐸𝐼 является изоморфиз мом между 𝑈 и 𝐸𝐽 3) ограничение на подпространство 𝐸𝐼 отображения факторизации 𝜋 ∶ 𝑉 ↠ 𝑉∕𝑈, 𝑣 ↦ [𝑣 ]𝑈 , является изоморфизмом между 𝐸𝐼 и 𝑉 ∕ 𝑈 4) в подпространстве 𝑈 найдутся 𝑟 таких векторов 𝑢1 , … , 𝑢𝑟 , что 𝑢𝜈 − 𝑒𝑗𝜈 ∈ 𝐸𝐼 при всех 1 ⩽ 𝜈 ⩽ 𝑟. При выполнении этих условий векторы 𝑢1 , … , 𝑢𝑟 из условия (4) автоматически образуют базис подпространства 𝑈 и однозначно определяются подпространством 𝑈 и выбором разложения {1, … , 𝑛} = 𝐼 ⊔ 𝐽 обладающего свойствами (1) – (4). Доказательство. Пусть векторы 𝑣1 , … , 𝑣𝑟 ∈ 𝑈 образуют базис подпространства 𝑈. По лемме о замене1 некоторые 𝑟 векторов 𝑒𝑗1 , … , 𝑒𝑗𝑟 стандартного базиса в 𝕜𝑛 можно заменить вектора ми 𝑣𝑗 так, чтобы полученный в результате набор 𝑣1 , … , 𝑣𝑟 , 𝑒𝑖1 , … , 𝑒𝑖𝑛−𝑟 остался базисом в 𝕜𝑛 . В таком случае линейная оболочка 𝐸𝐼 = span(𝑒𝑖1 , … , 𝑒𝑖𝑛−𝑟 ) оставшихся базисных векторов облада ет свойством (1) и, тем самым, существует. Покажем теперь, что условия (1) – (4) эквивалент ны друг другу. В n∘ 6.5 выше мы видели, что ядро ограничения отображения 𝑝 на подпростран ство 𝑈 и ядро ограничения отображения 𝜋 на подпространство 𝐸𝐼 оба равны 𝑈 ∩ 𝐸𝐼 . Из усло вия (1) вытекает, что ker 𝑝|𝑈 = ker 𝜋|𝐸𝐼 = 𝑈 ∩ 𝐸𝐼 = 0. Поэтому оба ограничения 𝑝|𝑈 ∶ 𝑈 → 𝐸𝐽 и 𝜋|𝐸𝐼 ∶ 𝐸𝐼 → 𝑉 ∕ 𝑈 инъективны. Так как dim 𝑈 = 𝑟 = dim 𝐸𝐽 и dim 𝐸𝐼 = 𝑛 − 𝑟 = dim 𝑉 ∕ 𝑈, оба ограничения — изоморфизмы. Таким образом, (1) влечёт (2) и (3). Наоборот, каждое из условий (2), (3) влечёт равенство 0 = ker 𝑝|𝑈 = ker 𝜋|𝐸𝐼 = 𝑈 ∩ 𝐸𝐼 , т. е. условие (1). Условие (4) утверждает, что 𝑟 векторов 𝑢1 , … , 𝑢𝑟 из 𝑟мерного подпространства 𝑈 переводятся проекцией 𝑝 в стандартные базисные векторы 𝑟мерного координатного подпространства 𝐸𝐽 , что равносиль но условию (2). Наконец, если условия (1)(4) выполняются, то ограничение 𝑝|𝑈 ∶ 𝑈 → 𝐸𝐽 явля ется изоморфизмом, и в 𝑈 есть единственный базис 𝑢1 , … , 𝑢𝑟 , переводимый эти изоморфизмом в стандартный базис 𝑒𝑗1 , … , 𝑒𝑗𝑟 пространства 𝐸𝐽 . Замечание 6.1. Векторное подпространство 𝑈 ⊂ 𝕜𝑛 размерности 𝑟 может иметь нулевое пере сечение сразу с несколькими и даже со всеми2 (𝑛 − 𝑟)мерными координатными подпростран ствами 𝐸𝐼 . На координатном языке условие (4) в предл. 6.1 означает, что матрица координат векторов 𝑢1 , … , 𝑢𝑟 содержит в столбцах с номерами 𝑗1 , … , 𝑗𝑟 единичную подматрицу размера 𝑟 × 𝑟. Ниже мы увидим, что метод Гаусса строит в подпространстве 𝑈 удовлетворяющий этому условию базис с лексикографически минимальным3 возможным набором номеров 𝑗1 , … , 𝑗𝑟 . 1 См. лем. 4.2 на стр. 48. Над бесконечным полем 𝕜 «случайное» 𝑟 мерное подпространство 𝑈 ⊂ 𝑉 почти наверняка будет именно таким. 3 Напомню, что лексикографический порядок на множестве 𝑟 буквенных слов 𝑥1 … 𝑥𝑟 , составленных из букв некоего упорядоченного алфавита 𝑋, представляет собою стандартное упорядочение всех этих слов по алфавиту, при котором слово 𝑤1 меньше слова 𝑤2 если первая слева различающаяся буква этих слов в слове 𝑤1 меньше, чем в слове 𝑤2 . 2 6.6. Расположение подпространства относительно базиса 81 6.6.1. Комбинаторный тип подпространства. Лексикографически минимальный набор индексов 𝑗1 , … , 𝑗𝑟 , для которого выполняются условия предл. 6.1, называется комбинаторным типом подпространства 𝑈 ⊂ 𝕜𝑛 . Комбинаторный тип имеет следующее альтернативное описа ние. Для каждого 𝑘 = 0, 1, … , 𝑛 обозначим через 𝑉>𝑘 линейную оболочку стандартных базисных векторов 𝑒𝑘+1 , … , 𝑒𝑛 . Получаем убывающую цепочку вложенных подпространств: 𝑉 = 𝑉>0 ⊃ 𝑉>1 ⊃ ⋯ ⊃ 𝑉>(𝑛−1) ⊃ 𝑉>𝑛 = 0 . Положим 𝑊⩽𝑘 = 𝑉 ∕ 𝑉>𝑘 и обозначим через 𝜋𝑘 ∶ 𝕜𝑛 ↠ 𝑊⩽𝑘 , 𝑣 ↦ [𝑣 ], отображение фактори зации. Базис пространства 𝑊⩽𝑘 составляют классы [𝑒1 ], … , [𝑒𝑘 ] первых 𝑘 стандартных базис ных векторов по модулю последних 𝑛 − 𝑘 базисных векторов, и проекция 𝜋𝑘 переводит вектор (𝑥1 , … , 𝑥𝑛 ) ∈ 𝕜𝑛 в вектор с координатами (𝑥1 , … , 𝑥𝑘 ) в базисе [𝑒1 ], … , [𝑒𝑘 ], т. е. попросту сти рает последние 𝑛 − 𝑘 координат. При 𝑘 = 0 мы имеем нулевое отображение 𝜋0 ∶ 𝕜𝑛 → 0, а при 𝑘 = 𝑛 — тождественное отображение 𝜋𝑛 = Id𝕜𝑛 ∶ 𝕜𝑛 ⥲ 𝕜𝑛 . При 𝑘 ⩾ 1 фактор 𝑊⩾𝑘 ∕ 𝕜 [𝑒𝑘 ] пространства 𝑊⩾𝑘 по одномерному подпространству, порождённому базисным классом [𝑒𝑘 ], ра вен 𝑊⩽(𝑘−1) , и проекция 𝜋𝑘−1 ∶ 𝕜𝑛 ↠ 𝑊⩽(𝑘−1) является композицией проекции 𝜋𝑘 ∶ 𝕜𝑛 ↠ 𝑊⩽𝑘 с последующей проекцией 𝑊⩽𝑘 ↠ 𝑊⩽(𝑘−1) , ядро которой одномерно. Поэтому для каждого 𝑟мер ного подпространства 𝑈 ⊂ 𝕜𝑛 размерности 𝑑𝑘 = dim 𝜋𝑘 (𝑈) образуют нестрого возрастающую последовательность 𝑑0 , 𝑑1 , … , 𝑑𝑛 с 𝑑0 = 0, 𝑑𝑛 = 𝑟 и приращениями 𝑑𝑘 − 𝑑𝑘−1 ⩽ 1. Последнее вытекает из того, что подпространство 𝜋𝑘−1 (𝑈) является образом подпространства 𝜋𝑘 (𝑈) при линейном отображении 𝑊⩾𝑘 ↠ 𝑊⩾(𝑘−1) с одномерным ядром, пересечение которого с 𝜋𝑘 (𝑈) либо нулевое, либо одномерное. Предложение 6.2 Для данного подпространства 𝑈 ⊂ 𝕜𝑛 размерности 𝑟 следующие три набора из 𝑟 возрастающих натуральных чисел совпадают друг с другом: 1) набор 𝑘1 , … , 𝑘𝑟 тех значений 𝑘 ⩾ 1, для которых 𝑑𝑘 > 𝑑𝑘−1 в последовательности раз мерностей 𝑑𝑘 = dim 𝜋𝑘 (𝑈). 2) набор номеров 𝑗1 , … , 𝑗𝑟 базисных столбцов приведённой ступенчатой матрицы, полу ченной методом Гаусса из матрицы координат1 любого конечного набора векторов, по рождающего подпространство 𝑈 3) лексикографически наименьший набор индексов 𝑗1min , … , 𝑗𝑟min , удовлетворяющий усло виям предл. 6.1 на стр. 79, означающим, что в 𝑈 есть базис, матрица координат которого имеет единичную 𝑟 × 𝑟 подматрицу в столбцах с номерами 𝑗1min , … , 𝑗𝑟min Доказательство. Ненулевые строки 𝑢1 , … , 𝑢𝑟 приведённой ступенчатой матрицы из (2) состав ляют в пространстве 𝑈 базис, удовлетворяющий условиям предл. 6.1 для 𝐽 = {𝑗1 , … , 𝑗𝑟 }. Так как проекции 𝜋𝑘 (𝑢𝜈 ) векторов 𝑢𝜈 с 𝑗𝜈 ⩽ 𝑘 линейно независимы в силу ступенчатости матрицы их координат, а векторы 𝑢𝜇 с 𝑗𝜇 > 𝑘 лежат в ker 𝜋𝑘 , первые векторы составляют базис в 𝜋𝑘 (𝑈), а по следние — базис в ker 𝜋𝑘 |𝑈 = 𝑈 ∩ 𝑉>𝑘 . Поэтому 𝑗1 , … , 𝑗𝑟 суть в точности те номера 𝑘, для которых 𝑑𝑘 > 𝑑𝑘−1 . Это доказывает совпадение последовательностей (1) и (2). Докажем теперь совпа дение последовательностей (2) и (3). Пусть матрица координат базисных векторов 𝑤1 , … , 𝑤𝑟 пространства 𝑈 содержит единичную подматрицу в столбцах с номерами 𝑗1min , … , 𝑗𝑟min . Так как 1 Напомню, что всюду в этом параграфе мы пишем координаты по строкам. 82 §6 Метод Гаусса проекции 𝜋𝑘 (𝑤𝜈 ) векторов 𝑤𝜈 с 𝑗𝜈min ⩽ 𝑘 линейно независимы, количество таких векторов при каждом 𝑘 не превышает размерности dim 𝜋𝑘 (𝑈), которая по уже доказанному равна количеству векторов 𝑢𝜈 с 𝑗𝜈 ⩽ 𝑘. Иными словами, при каждом 𝑘 = 1, … , 𝑛 количество чисел 𝑗𝜈min , не превы шающих 𝑘, не больше количества чисел 𝑗𝜈 , не превышающих 𝑘. Тем самым, набор 𝑗1min , … , 𝑗𝑟min не может быть лексикографически меньше набора 𝑗1 , … , 𝑗𝑟 . Следствие 6.1 В каждом подпространстве 𝑈 ⊂ 𝕜𝑛 существует единственный базис с приведённой ступенчатой матрицей координат 𝑀𝑈 , и сопоставление подпространству 𝑈 этой матрицы 𝑀𝑈 устанавливает биекцию между приведёнными ступенчатыми матрицами, имеющими 𝑟 ненулевых строк, и 𝑟 мерными подпространствами в 𝕜𝑛 . Упражнение 6.5. Убедитесь, что приведённые ступенчатые матрицы из 𝑟 ненулевых строк с номерами базисных столбцов 𝑗1 , … , 𝑗𝑟 образуют в пространстве Mat𝑟×𝑛 (𝕜) аффинное под 𝑟 пространство размерности 𝑟(𝑛 − 𝑟) − ∑𝜈=1 (𝑗𝜈 − 𝜈 + 1) и докажите тождество (𝑞𝑛 − 1)(𝑞𝑛−1 − 1) ⋯ (𝑞𝑛−𝑟+1 − 1) = 𝑞|𝛱∖ 𝜆| , ∑ (𝑞𝑟 − 1)(𝑞𝑟−1 − 1) ⋯ (𝑞 − 1) 𝜆⊆𝛱 где суммирование происходит по всем различным диаграммам Юнга1 𝜆, умещающимся в прямоугольник 𝛱 размера 𝑟 × (𝑛 − 𝑟), а показатель |𝛱 ∖ 𝜆| равен количеству клеток в до полнении диаграммы до прямоугольника (пустая диаграмма 𝜆 = ∅ и весь прямоугольник 𝜆 = 𝛱 при этом тоже учитываются). 1 См. пример 1.3 на стр. 7 лекции http://gorod.bogomolovlab.ru/ps/stud/algebra1/1314/lec01.pdf. §7. Двойственность 7.1. Двойственные пространства. Линейные отображения 𝑉 → 𝕜 принято называть линейны ми функционалами1 или ковекторами. Они образуют векторное пространство, которое обозна чается 𝑉∗ ≝ Hom𝕜 (𝑉 , 𝕜) и называется двойственным или сопряжённым к пространству 𝑉 . Пример 7.1 (линейные функционалы на координатном пространстве) Каждый линейный функционал 𝜉 ∶ 𝕜𝑛 → 𝕜 однозначно задаётся набором своих значений 𝜉𝑖 = 𝜉 (𝑒𝑖 ) ∈ 𝕜 на стандартных базисных векторах 𝑒𝑖 пространства 𝕜𝑛 . Значение функционала 𝜉 на произволь ном векторе 𝑣 = 𝑒1 𝑥1 + ⋯ + 𝑒𝑛 𝑥𝑛 при этом равно 𝜉 (𝑣) = 𝜉 (𝑒1 ⋅ 𝑥1 + ⋯ + 𝑒𝑛 ⋅ 𝑥𝑛 ) = 𝜉 (𝑒1 ) ⋅ 𝑥1 + ⋯ + 𝜉 (𝑒𝑛 ) ⋅ 𝑥𝑛 = 𝜉1 𝑥1 + ⋯ + 𝜉𝑛 𝑥𝑛 . Наоборот, для любого набора из 𝑛 констант 𝜉1 , … , 𝜉𝑛 ∈ 𝕜 эта формула задаёт линейный функ ционал 𝜉 ∶ 𝕜𝑛 → 𝕜. Если записывать векторы 𝑣 пространства 𝕜𝑛 в виде координатных столб ∗ цов высоты 𝑛, то двойственное пространство 𝕜𝑛 удобно представлять себе как 𝑛мерное ко ординатное пространство,состоящее из строк ширины 𝑛. При этом действие ковекторастроки ∗ 𝜉 ∈ 𝕜𝑛 на векторстолбец 𝑣 ∈ 𝕜𝑛 заключается в матричном умножении: 𝜉 (𝑣) = 𝜉𝑣. Пример 7.2 (степенные ряды как функционалы на многочленах) Этот пример является бесконечномерной версией предыдущего. Кольцо многочленов 𝕜[𝑥 ] яв ляется векторным пространством над 𝕜 со счётным базисом из мономов 𝑥 𝑘 , где 𝑘 ⩾ 0 и 𝑥 0 = 1. Каждый линейный функционал 𝜓 ∶ 𝕜[𝑥 ] → 𝕜 однозначно задаётся последовательностью своих значений 𝜓𝑘 = 𝜓(𝑥 𝑘 ) на базисных векторах пространства 𝕜[𝑥 ] и действует на произвольный многочлен 𝑎(𝑥 ) = 𝑎0 + 𝑎1 𝑥 + ⋯ + 𝑎𝑚 𝑥 𝑚 по правилу deg 𝑎 𝜓(𝑎) = ∑ 𝑎𝑘 𝜓𝑘 = 𝜓0 𝑎0 + 𝜓1 𝑎1 + ⋯ + 𝜓𝑚 𝑎𝑚 , где 𝑚 = deg 𝑎 . (71) 𝑘=0 Каждая бесконечная последовательность чисел 𝜓𝑖 ∈ 𝕜 задаёт по этой формуле линейный функ ционал 𝜓 ∶ 𝕜[𝑥 ] → 𝕜. Бесконечную последовательность элементов 𝜓𝑖 поля 𝕜 удобно кодировать производящей функцией — формальным степенным рядом 𝛹 (𝑡) = ∑𝑖⩾0 𝜓𝑖 𝑡𝑖 ∈ 𝕜⟦𝑡⟧. Таким об разом, двойственное к 𝕜[𝑥 ] векторное пространство 𝕜[𝑥 ]∗ изоморфно пространству формаль ных степенных рядов 𝕜⟦𝑡⟧. При этом изоморфизме каждый степенной ряд 𝛹 (𝑡) = ∑𝑖⩾0 𝜓𝑖 𝑡𝑖 задаёт линейный функционал 𝜓 ∶ 𝕜[𝑥 ] → 𝕜, переводящий многочлен 𝑎 ∈ 𝕜[𝑥 ] в число (71). Например, функционал вычисления ev𝛼 ∶ 𝕜[𝑥 ] → 𝕜, 𝑓 ↦ 𝑓(𝛼 ), сопоставляющий многочленам их значения в точке 𝛼 ∈ 𝕜 и действующий на базисные мономы по правилу 𝑥 𝑛 ↦ 𝛼 𝑛 , задаётся степенным рядом 1 𝐸𝛼 (𝑡) = 𝛼 𝑛 𝑡𝑛 = ∈ 𝕜⟦𝑡⟧ . ∑ 1 − 𝛼𝑡 𝑛⩾0 Отметим, что все функционалы вычисления линейно независимы, так как равенство 𝜆𝑘 𝜆1 𝜆2 + +⋯+ =0 1 − 𝛼1 𝑡 1 − 𝛼2 𝑡 1 − 𝛼𝑘 𝑡 1 А также линейными формами. 83 84 §7 Двойственность в кольце 𝕜⟦𝑡⟧ после приведения к общему знаменателю превращается в равенство 𝜆1 ∏ (1 − 𝛼𝜈 𝑡) + 𝜆2 𝜈≠1 ∏ (1 − 𝛼𝜈 𝑡) + ⋯ + 𝜆𝑘 𝜈≠2 ∏ (1 − 𝛼𝜈 𝑡) = 0 𝜈≠𝑘 в кольце многочленов 𝕜[𝑡], подставляя в которое 𝑡 = 1 ∕ 𝛼𝑖 , мы заключаем, что 𝜆𝑖 = 0 для каждого 𝑖 = 1, … , 𝑘. В частности, в пространстве ℝ⟦𝑡⟧ ≃ ℝ[𝑥 ]∗ , двойственном к счётномерному пространству ℝ[𝑥 ], имеется несчётное линейно независимое множество векторов. Упражнение 7.1. Покажите, что векторное пространство 𝕜⟦𝑡⟧ не порождается линейно ника ким счётным множеством векторов ни над каким полем 𝕜. Пример 7.3 (функционалы вычисления функций на множестве) Пусть 𝑋 — любое множество, и 𝑉 = 𝕜𝑋 — пространство всех функций 𝑋 → 𝕜, как в прим. 4.1 на стр. 49. С каждой точкой 𝑥 ∈ 𝑋 связан функционал вычисления1 ev𝑥 ∶ 𝕜𝑋 → 𝕜, 𝑓 ↦ 𝑓(𝑥 ), переводящий функцию 𝑓 ∶ 𝑋 → 𝕜 в её значение 𝑓(𝑥 ) ∈ 𝕜 в точке 𝑥 . Функционалы вычисления линейно независимы, поскольку вычисляя обе части равенства 𝜆1 ev𝑥1 + ⋯ + 𝜆𝑚 ev𝑥𝑚 = 0 на дельтафункции 𝛿𝑥𝑖 ∶ 𝑋 → 𝕜, равной нулю во всех точках множества 𝑋 кроме точки 𝑥𝑖 , где она равна единице, мы заключаем, что 𝜆𝑖 = 0 для каждого 𝑖 = 1, … , 𝑚. 7.1.1. Двойственные базисы. С каждым базисом 𝒆 = (𝑒1 , … , 𝑒𝑛 ) конечномерного вектор ного пространства 𝑉 связан набор координатных функционалов 𝒆∗ = (𝑒1∗ , … , 𝑒𝑛∗ ), лежащих в двойственном пространстве 𝑉∗ . По определению, функционал 𝑒𝑖∗ ∶ 𝑉 → 𝕜 сопоставляет каждо му вектору пространства 𝑉 его 𝑖 ю координату в базисе 𝒆, т. е. 𝑒𝑖∗ (𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 ) ≝ 𝑥𝑖 . Таким образом, значения функционала 𝑒𝑖∗ на базисных векторах 𝑒𝑗 суть 𝑒𝑖∗ (𝑒𝑗 ) = 1 при 𝑗 = 𝑖 {0 при 𝑗 ≠ 𝑖 . (72) Упражнение 7.2. Убедитесь, что все отображения 𝑒𝑖∗ ∶ 𝑉 → 𝕜 линейны. Из формулы (72) вытекает, что ковекторы 𝑒1∗ , … , 𝑒𝑛∗ линейно независимы: вычисляя обе части равенства 𝜆1 𝑒1∗ + ⋯ + 𝜆𝑛 𝑒𝑛∗ = 0 на базисном векторе 𝑒𝑖 , мы заключаем, что 𝜆𝑖 = 0 для каж дого 𝑖 = 1, … , 𝑛. С другой стороны, каждый линейный функционал 𝜑 ∶ 𝑉 → 𝕜 линейно выра жается через координатные функционалы 𝑒𝑖∗ — коэффициентами этого линейного выражения являются значения функционала 𝜑 на соответствующих базисных векторах пространства 𝑉 , по скольку для любого вектора 𝑣 = 𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 выполняется равенство 𝜑(𝑣) = 𝜑(𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 ) = 𝑥1 𝜑(𝑒1 ) + ⋯ + 𝑥𝑛 𝜑(𝑒𝑛 ) = 𝑒1∗ (𝑣)𝜑(𝑒1 ) + ⋯ + 𝑒𝑛∗ (𝑣)𝜑(𝑒𝑛 ) , (73) как раз и означающее, что 𝜑 = 𝑒1∗ ⋅ 𝜑(𝑒1 )+⋯+ 𝑒𝑛∗ ⋅ 𝜑(𝑒𝑛 ) в пространстве 𝑉∗ . Таким образом, коор динатные функционалы 𝑒𝑖∗ образуют базис векторного пространства 𝑉∗ . Этот базис называется двойственным к базису из векторов 𝑒𝑖 в 𝑉 . В частности, в противовес прим. 7.2, для конечно мерного пространства 𝑉 выполняется равенство dim 𝑉∗ = dim 𝑉 . Упражнение 7.3. Пусть dim 𝑉 = 𝑛, а векторы 𝑣1 , … , 𝑣𝑛 ∈ 𝑉 и ковекторы 𝜑1 , … , 𝜑𝑛 ∈ 𝑉∗ таковы, что 𝜑𝑖 (𝑣𝑖 ) = 1 и 𝜑𝑖 (𝑣𝑗 ) = 0 при 𝑖 ≠ 𝑗. Покажите, что векторы 𝑣𝑖 образуют базис в 𝑉 , а ковекторы 𝜑𝑖 — двойственный базис в 𝑉∗ . 1 Обозначение ev происходит от «evaluation». 85 7.1. Двойственные пространства Пример 7.4 (формула Тейлора) Пусть поле 𝕜 имеет характеристику нуль1 . Зафиксируем число 𝑎 ∈ 𝕜 и для каждого 𝑖 = 0, 1, … , 𝑛 рассмотрим на пространстве 𝕜[𝑥 ]⩽𝑛 многочленов степени не выше 𝑛 функционал 𝜑𝑖 ∶ 𝕜[𝑥 ]⩽𝑛 → 𝕜 , 𝑓 ↦ 𝑓(𝑖) (𝑎) , сопоставляющий многочлену значение его 𝑖 й производной в точке 𝑎. При 𝑖 = 0 мы полагаем 𝜑0 (𝑓) = ev𝑎 (𝑓) = 𝑓(𝑎). Функционалы 𝜑0 , 𝜑1 , … , 𝜑𝑛 и многочлены 𝑓𝑘 (𝑥 ) = (𝑥 − 𝑎)𝑘 ∕ 𝑘!, где 𝑘 = 0, 1, … , 𝑛 и 0! ≝ 1, удовлетворяют условиям упр. 7.3, т. е. 𝜑𝑖 (𝑓𝑖 ) = 1 и 𝜑𝑖 (𝑓𝑗 ) = 0 при 𝑖 ≠ 𝑗. Следовательно, многочлены 𝑓𝑖 образуют в 𝕜[𝑥 ]⩽𝑛 базис, в котором координатами каждого многочлена служат его значение и значения первых 𝑛 его производных в точке 𝑎. Поэтому для любого многочлена 𝑔 степени не выше 𝑛 имеет место формула Тэйлора 𝑔(𝑥 ) = 𝑔(𝑎) + 𝑔′ (𝑎) ⋅ (𝑥 − 𝑎) + 𝑔″ (𝑎) ⋅ (𝑥 − 𝑎)𝑛 (𝑥 − 𝑎)2 + ⋯ + 𝑔(𝑛) (𝑎) ⋅ , 2 𝑛! (74) и для любого набора чисел 𝑏0 , 𝑏1 , … , 𝑏𝑛 ∈ 𝕜 существует единственный такой многочлен 𝑔 сте пени не выше 𝑛, что 𝑔(𝑖) (𝑎) = 𝑏𝑖 при всех 𝑖 = 0, 1, … , 𝑛, причём 𝑔 задаётся явной формулой 𝑛 𝑔(𝑥 ) = ∑ 𝑏𝑘 (𝑥 − 𝑎)𝑘 ∕ 𝑘! . 𝑘=0 7.1.2. Канонический изоморфизм 𝑽 ≃ 𝑽∗∗ . Каждый вектор 𝑣 ∈ 𝑉 задаёт на двойствен ном к 𝑉 пространстве 𝑉∗ функционал вычисления ev𝑣 ∶ 𝑉∗ → 𝕜, 𝜑 ↦ 𝜑(𝑣 ). Поскольку число 𝜑(𝑣) ∈ 𝕜 линейно зависит как от 𝑣 ∈ 𝑉 , так и от 𝜑 ∈ 𝑉∗ , сопоставление вектору 𝑣 функционала вычисления ev𝑣 задаёт каноническое2 линейное вложение ev ∶ 𝑉 ↪ 𝑉∗∗ , 𝑣 ↦ ev𝑣 . (75) Упражнение 7.4. Убедитесь, что отображение (75) инъективно3 . Если пространство 𝑉 конечномерно, то согласно упр. 7.3 каждый базис 𝑒1 , … , 𝑒𝑛 пространства 𝑉 переводится отображением (75) в двойственный к базису 𝑒1∗ , … , 𝑒𝑛∗ пространства 𝑉∗ базис про странства 𝑉∗∗ . Тем самым, для конечномерного пространства 𝑉 отображение (75) канонически отождествляет 𝑉∗∗ с 𝑉 , т. е. каждая линейная форма 𝑉∗ → 𝕜 представляет собою функционал вы числения значений ковекторов из 𝑉∗ на однозначно задаваемом этой формой векторе 𝑣 ∈ 𝑉 , и любой базис 𝜺 = (𝜀1 , … , 𝜀𝑛 ) пространства 𝑉∗ состоит из координатных функционалов для од нозначно задаваемого этим базисом базиса 𝜺∗ = (𝜀1∗ , … , 𝜀𝑛∗ ) в 𝑉 . Таким образом, двойственные конечномерные пространства 𝑉 и 𝑉∗ играют по отношению друг к другу совершенно симмет ричные роли: каждое из них является пространством линейных функционалов на другом. Дабы подчеркнуть симметрию между векторами и ковекторами, мы будем называть число ⟨ 𝜑 , 𝑣 ⟩ ≝ 𝜑(𝑣) = ev𝑣 (𝜑) ∈ 𝕜 свёрткой ковектора 𝜑 с ветором 𝑣 . Свёртка является билинейным отображением 𝑉∗ × 𝑉 → 𝕜 , 1 (𝜑 , 𝑣 ) ↦ ⟨ 𝜑 , 𝑣 ⟩ . Т. е. сумма любого числа единиц поля 𝕜 отлична от нуля. Т. е. не требующее выбора базиса. 3 Для любого, в том числе и бесконечномерного векторного пространства 𝑉 . 2 (76) 86 §7 Двойственность Для координатного пространства 𝑉 = 𝕜𝑛 в обозначениях из прим. 7.1 на стр. 83 свёртка ковек ∗ торастроки 𝜉 = (𝜉1 , 𝜉2 , … , 𝜉𝑛 ) ∈ 𝕜𝑛 с векторомстолбцом 𝑥 = (𝑥1 , 𝑥2 , … , 𝑥𝑛 )𝑡 ∈ 𝕜𝑛 задаётся матричным произведением ⟨ 𝜉 , 𝑥 ⟩ = 𝜉𝑥 = 𝜉1 𝑥1 + ⋯ + 𝜉𝑛 𝑥𝑛 . Обратите внимание, что правая часть этого равенства абсолютно симметрична по буквам 𝜉 и 𝑥 . 7.2. Двойственность между подпространствами. Каждое множество ковекторов 𝑀 ⊂ 𝑉∗ мож но воспринимать как систему однородных линейных уравнений ⟨ 𝜉 , 𝑥 ⟩ = 0 на неизвестный вектор 𝑥 ∈ 𝑉 с левыми частями 𝜉 , пробегающими множество 𝑀. Пространство1 всех решений такой системы обозначается Ann(𝑀) ≝ {𝑣 ∈ 𝑉 | ⟨ 𝜉 , 𝑣 ⟩ = 0 ∀ 𝜉 ∈ 𝑀} и называется аннулято ром множества ковекторов 𝑀 ⊂ 𝑉∗ . Двойственным образом, для любого множества векторов 𝑁 ⊂ 𝑉 положим Ann(𝑁) ≝ {𝜑 ∈ 𝑉∗ | ⟨ 𝜑 , 𝑣 ⟩ = 0 ∀ 𝑣 ∈ 𝑁}. Это множество всех линейных функ ционалов, ядро которых содержит 𝑁, или — на двойственном языке — пространство решений системы однородных линейных уравнений ⟨ 𝑦 , 𝑣 ⟩ = 0 на неизвестный ковектор 𝑦 ∈ 𝑉∗ с ле выми частями 𝑣 , пробегающими множество 𝑁 ⊂ 𝑉 . В частности, аннулятор любого множества векторов является векторным подпространством в 𝑉∗ . Упражнение 7.5. Убедитесь, что аннулятор любого множества 𝑋 векторов или ковекторов сов падает с аннулятором линейной оболочки span(𝑋). Предложение 7.1 Для любых2 векторного пространства 𝑉 и подпространства 𝑈 ⊂ 𝑉 имеются канонические изо морфизмы (𝑉 ∕ 𝑈)∗ ≃ Ann 𝑈 и 𝑉∗ ∕ Ann 𝑈 ≃ 𝑈∗ . Доказательство. Чтобы задать первый изоморфизм, обозначим через 𝜋 ∶ 𝑉 ↠ 𝑉 ∕ 𝑈, 𝑣 ↦ [𝑣 ]𝑈 , отображение факторизации и сопоставим линейному функционалу 𝜉 ∶ 𝑉 ∕ 𝑈 → 𝕜 композицию 𝜉𝜋 ∶ 𝑉 → 𝕜, 𝑣 ↦ 𝜉 ([𝑣]𝑈 ). Получим линейное отображение 𝐹 ∶ (𝑉 ∕ 𝑈)∗ → 𝑉∗ , 𝜉 ↦ 𝜉 ∘ 𝜋, у ко торого ker 𝐹 = 0 и im 𝐹 ⊆ Ann 𝑈. Обратное отображение 𝐹−1 ∶ Ann 𝑈 → (𝑉 ∕ 𝑈)∗ сопоставляет зануляющемуся на подпространстве 𝑈 линейному функционалу 𝜓 ∶ 𝑉 → 𝕜 линейный функци онал 𝜓 ∶ 𝑉 ∕ 𝑈 → 𝕜, действующий по правилу 𝜓([𝑣 ]𝑈 ) = 𝜓(𝑣 ). Упражнение 7.6. Убедитесь, что это правило корректно и что 𝜉𝜋 = 𝜉 для всех 𝜉 ∈ (𝑉 ∕ 𝑈)∗ , а 𝜓𝜋 = 𝜓 для всех 𝜓 ∈ Ann 𝑈 ⊂ 𝑉∗ . Чтобы задать второй изоморфизм, рассмотрим линейное отображение 𝐺 ∶ 𝑉∗ → 𝑈∗ , 𝜉 ↦ 𝜉 |𝑈 , которое сопоставляет линейному функционалу 𝜉 ∶ 𝑉 → 𝕜 его ограничение на подпростран ство 𝑈 ⊂ 𝑉 . По построению, ker 𝐺 = Ann 𝑈. Отображение 𝐺 сюрьективно, поскольку каждый функционал 𝜓 ∶ 𝑈 → 𝕜 можно продолжить до функционала 𝜑 ∶ 𝑉 → 𝕜 с ограничением 𝜑|𝑈 = 𝜓. Упражнение 7.7. Убедитесь в этом. Канонический изоморфизм 𝑉∗∕ker 𝐺 ⥲ im 𝐺 из прим. 4.9 на стр. 57 — это нужный нам изомор физм 𝑉∗ ∕ Ann 𝑈 ⥲ 𝑈∗ . Следствие 7.1 Если векторное пространство 𝑉 конечномерно, то для любого подпространства 𝑈 ⊂ 𝑉 выпол няется равенство dim 𝑈 + dim Ann 𝑈 = dim 𝑉 . 1 Будучи пересечением ядер линейных отображений 𝜉 ∶ 𝑉 → 𝕜 по всем 𝜉 ∈ 𝑀, аннулятор любого множества 𝑀 ⊂ 𝑉∗ является векторным подпространством в 𝑉 . 2 В том числе бесконечномерных. 7.2. Двойственность между подпространствами 87 Доказательство. В силу предл. 7.1 dim Ann 𝑈 = dim(𝑉∕𝑈)∗ = dim(𝑉∕𝑈), а по предл. 4.8 на стр. 58 dim(𝑉 ∕ 𝑈) = dim 𝑉 − dim 𝑈. Упражнение 7.8. Пусть векторы 𝑢1 , … , 𝑢𝑘 составляют базис в 𝑈, а векторы 𝑤1 , … , 𝑤𝑚 допол ∗ няют их до базиса в 𝑉 . Обозначим через 𝑢1∗ , … , 𝑢𝑘∗ , 𝑤1∗ , … , 𝑤𝑚 двойственный базис1 в 𝑉∗ . ∗ ∗ Покажите, что ковекторы 𝑤1 , … , 𝑤𝑚 образуют базис в Ann 𝑈. Следствие 7.2 Для любого векторного подпространства 𝑈 ⊂ 𝑉 выполняется равенство Ann Ann 𝑈 = 𝑈. Доказательство. По определению аннуляторов, 𝑈 ⊂ Ann Ann 𝑈. С другой стороны, по сл. 7.1 dim Ann Ann 𝑈 = dim 𝑉∗ − dim Ann 𝑈 = dim 𝑉∗ − dim 𝑉 + dim 𝑈 = dim 𝑈. Замечание 7.1. Если в сл. 7.1 и сл. 7.2 взять в качестве 𝑉 двойственное пространство 𝑉∗ и отож дествить двойственное к 𝑉∗ пространство 𝑉∗∗ с исходным пространством 𝑉 при помощи кано нического изоморфизма из n∘ 7.1.2, то мы получим для любого подпространства 𝑈 ⊂ 𝑉∗ равен ства dim 𝑈 + dim Ann 𝑈 = dim 𝑉 и Ann Ann 𝑈 = 𝑈. Замечание 7.2. На языке линейных уравнений сл. 7.2 утверждает, что любая линейная форма, которая зануляется на всех решениях некоторой системы однородных линейных уравнений, яв ляется линейной комбинацией этих уравнений, а сл. 7.1 означает, что каждое подпространство коразмерности 𝑚 в 𝑉 можно задать системой из 𝑚 линейно независимых линейных уравне ний, и наоборот, множество решений всякой системы из 𝑚 линейно независимых уравнений на пространстве 𝑉 представляет собою векторное подпространство коразмерности 𝑚 в 𝑉 . Упражнение 7.9. Покажите, что Ann Ann 𝑁 = span 𝑁 для любого подмножества 𝑁 ⊂ 𝑉 . Пример 7.5 (теорема о ранге матрицы) Столбцы 𝑎1 , … , 𝑎𝑛 произвольной матрицы 𝐴 ∈ Mat𝑚×𝑛 (𝕜) являются векторами координатно го пространства 𝕜𝑚 . Обозначим через 𝑈 ⊂ 𝕜𝑚 их линейную оболочку. Каждый максимальный по включению линейно независимый набор столбцов матрицы 𝐴 является базисом в 𝑈 и со стоит ровно из dim 𝑈 = rk 𝐴 векторов. В 𝑖 й строке матрицы 𝐴 стоят вычисленные на векторах ∗ 𝑎1 , … , 𝑎𝑛 значения базисного ковектора 𝑒𝑖∗ ∈ 𝕜𝑚 из двойственного к стандартному базису ∗ в 𝕜𝑚 базиса в 𝕜𝑚 . Согласно предл. 7.1, ограничения функционалов 𝑒1∗ , … , 𝑒𝑛∗ на подпростран ство 𝑈 линейно порождают двойственное к 𝑈 пространство 𝑈∗ . Поэтому любой максимальный по включению линейно независимый набор функционалов 𝑒𝑖∗ |𝑈 составляет базис в 𝑈∗ и тоже состоит из dim 𝑈∗ = dim 𝑈 = rk 𝐴 векторов. Но каждый линейный функционал 𝑒𝑖∗ |𝑈 однознач но определяется набором своих значений на порождающих пространство 𝑈 векторах 𝑎1 , … , 𝑎𝑛 . В частности, ограничения функционалов 𝑒𝑖∗1 , … , 𝑒𝑖∗𝑘 на подпространство 𝑈 линейно зависимы если и только если линейно зависимы наборы этих значений, т. е. соответствующие строки мат рицы 𝐴. Мы заключаем, что максимальный по включению линейно независимый набор строк матрицы 𝐴 также состоит из rk 𝐴 строк. 1 См. n∘ 7.1.1 на стр. 84. 88 §7 Двойственность Теорема 7.1 Соответствие 𝑈 ↔ Ann 𝑈 задаёт биекцию между подпространствами дополнительных размер ностей в двойственных пространствах 𝑉 и 𝑉∗ . Эта биекция оборачивает включения: 𝑈 ⊂ 𝑊 ⟺ Ann 𝑈 ⊃ Ann 𝑊 , и переводит суммы подпространств в пересечения, а пересечения — в суммы. Доказательство. Обозначим через 𝒮 (𝑉 ) множество всех подпространств векторного простран ства 𝑉 . Равенство Ann Ann 𝑈 = 𝑈 означает, что отображения, сопоставляющие подпростран ству его аннулятор в двойственном пространстве 𝑈↦Ann 𝑈 𝒮 (𝑉 ) l , 𝒮 (𝑉 ∗ ) Ann 𝑊↤𝑊 обратны друг другу, и следовательно, биективны. Импликация 𝑈 ⊂ 𝑊 ⇒ Ann 𝑈 ⊃ Ann 𝑊 оче видна. Если взять в ней в качестве 𝑈 и 𝑊 , соответственно, подпространства Ann 𝑊 и Ann 𝑈 и воспользоваться равенствами Ann Ann 𝑊 = 𝑊 и Ann Ann 𝑈 = 𝑈, получим обратную импли кацию Ann 𝑈 ⊃ Ann 𝑊 ⇒ 𝑈 ⊂ 𝑊 . Равенство ⋂ 𝜈 Ann 𝑈𝜈 = Ann ( 𝑈𝜈 ) ∑ (77) 𝜈 тоже очевидно: любая линейная форма, зануляющаяся на каждом из подпространств 𝑈𝜈 , зану ляется и на их линейной оболочке, а форма, зануляющаяся на сумме подпространств, зануляет ся и на каждом подпространстве в отдельности. Если взять в (77) в качестве подпространств 𝑈𝜈 пространства Ann 𝑈𝜈 , получаем равенство ⋂𝜈 𝑈𝜈 = Ann (∑𝜈 Ann 𝑈𝜈 ). Беря в нём аннуляторы обеих частей, приходим к равенству Ann(⋂𝜈 𝑊𝜈 ) = ∑𝜈 Ann 𝑊𝜈 . Следствие 7.3 Две системы однородных линейных уравнений 𝐴𝑥 = 0 и 𝐵𝑥 = 0 на переменный векторстолбец 𝑥 ∈ 𝕜𝑛 имеют одно и то же пространство решений если и только если приведённые ступенча тые матрицы 𝐴red и 𝐵red этих систем совпадают друг с другом с точностью до добавления или удаления нулевых строк. Доказательство. Обозначим через 𝑈 и 𝑊 линейные оболочки строк матриц 𝐴 и 𝐵 в простран ∗ стве 𝕜𝑛 ковекторовстрок ширины 𝑛. Согласно упр. 7.9 пространства решений систем уравне ний 𝐴𝑥 = 0 и 𝐵𝑥 = 0 суть не что иное как лежащие в пространстве векторовстолбцов 𝕜𝑛 высо ты 𝑛 аннуляторы Ann 𝑈 и Ann 𝑊 пространств 𝑈 и 𝑊 . По теор. 7.1 равенство Ann 𝑈 = Ann 𝑊 пространств решений равносильно равенству 𝑈 = 𝑊 линейных оболочек строк матриц 𝐴 и 𝐵. По сл. 6.1 на стр. 82 эти линейные оболочки совпадают если и только если совпадают их базисы с приведёнными ступенчатыми матрицами координат. 7.3. Двойственные линейные отображения. С каждым линейным отображением векторных пространств 𝐹 ∶ 𝑈 → 𝑊 канонически связано двойственное отображение 𝐹∗ ∶ 𝑊∗ → 𝑈∗ , 𝜉 ↦ 𝜉∘𝐹, (78) 89 7.3. Двойственные линейные отображения действующее между двойственными пространствами в противоположном к 𝐹 направлении и переводящее линейную форму 𝜉 ∶ 𝑊 → 𝕜 в линейную форму 𝐹∗ 𝜉 , значение которой на векторе 𝑣 ∈ 𝑈 равно 𝐹∗ 𝜉 (𝑣) ≝ 𝜉 (𝐹𝑣). Упражнение 7.10. Убедитесь, что композиция 𝐹 ∘ 𝜉 является линейной формой на 𝑈 и что отоб ражение 𝐹∗ линейно. На языке свёрток между векторами и ковекторами1 связь между двойственными операторами описывается равенством ⟨ 𝐹∗ 𝜉 , 𝑣 ⟩ = ⟨ 𝜉 , 𝐹𝑣 ⟩ для всех 𝑣 ∈ 𝑊 и 𝜉 ∈ 𝑈∗ , (79) из которого видно, что операторы 𝐹 и 𝐹∗ играют симметричные роли по отношению друг к другу: двойственный к оператору 𝐹∗ ∶ 𝑊∗ → 𝑈∗ оператор 𝐹∗∗ ∶ 𝑈∗∗ → 𝑊∗∗ превращается в оператор 𝐹 ∶ 𝑈 → 𝑊 при канонических отождествлениях 𝑈∗∗ ≃ 𝑈 и 𝑊∗∗ ≃ 𝑊 из n∘ 7.1.2 на стр. 85. Упражнение 7.11. Убедитесь в этом. Предложение 7.2 Для двойственных операторов 𝐹 ∶ 𝑈 → 𝑊 и 𝐹∗ ∶ 𝑊∗ → 𝑈∗ имеют место равенства (1) ker 𝐹 = Ann im(𝐹∗ ) (2) ker(𝐹∗ ) = Ann im 𝐹 (3) im(𝐹∗ ) = Ann ker 𝐹 (4) im 𝐹 = Ann ker(𝐹∗ ) . Доказательство. Вектор 𝐹 (𝑣 ) ∈ 𝑊 нулевой если и только если все линейные функционалы 𝜉 ∶ 𝑊 → 𝕜 принимают на нём нулевое значение, т. е. ⟨ 𝜉 , 𝐹𝑣 ⟩ = 0 для всех 𝜉 ∈ 𝑊∗ . В силу (79) это требование равносильно требованию ⟨ 𝐹∗ 𝜉 , 𝑣 ⟩ = 0 для всех 𝜉 ∈ 𝑊∗ , которое означает, что 𝑣 ∈ Ann im 𝐹∗ . Это доказывает равенство (1). Равенство (2) представляет собою равенство (1), написанное для оператора 𝐹∗ в роли 𝐹 и оператора 𝐹∗∗ = 𝐹 в роли 𝐹∗ . Равенства (3) и (4) полу чаются из равенства (1) и (2) взятием аннуляторов обеих частей. Следствие 7.4 Векторные пространства im 𝐹 ⊂ 𝑈 и im(𝐹∗ ) ⊂ 𝑊∗ канонически двойственны друг другу. Свёрт ка вектора 𝐹𝑣 ∈ im 𝐹 с ковектором 𝐹∗ 𝜉 ∈ im 𝐹∗ задаётся формулой ⟨ 𝐹∗ 𝜉 , 𝐹𝑣 ⟩ ≝ ⟨ 𝐹∗ 𝜉 , 𝑣 ⟩ = ⟨ 𝜉 , 𝐹𝑣 ⟩ . (710) Доказательство. В прим. 4.9 на стр. 57 и предл. 7.1 на стр. 86 были построены канонические изоморфизмы im 𝐹 ≃ 𝑈 ∕ ker 𝐹 и (𝑈 ∕ ker 𝐹 )∗ ≃ Ann ker 𝐹 , последний из которых спаривает ко вектор 𝜂 ∈ Ann ker 𝐹 ⊂ 𝑈∗ с вектором [𝑢] ∈ 𝑈 ∕ ker 𝐹 по правилу ⟨ 𝜂 , [𝑢] ⟩ = ⟨ 𝜂 , 𝑢 ⟩, а первый отождествляет класс [𝑢] ∈ 𝑈 ∕ ker 𝐹 с вектором 𝐹 (𝑢) ∈ im 𝐹 . Равенство (3) из предл. 7.2 утвер ждает, что каждый 𝜂 ∈ Ann ker 𝐹 однозначно записывается в виде 𝐹∗ 𝜉 , где 𝜉 ∈ 𝑊∗ . Собирая всё это вместе и пользуясь равенством ⟨ 𝐹∗ 𝜉 , 𝑢 ⟩ = ⟨ 𝜉 , 𝐹𝑢 ⟩, мы заключаем, что свёртка ковек тора 𝜂 = 𝐹∗ 𝜉 ∈ im 𝐹∗ = Ann ker 𝐹 ⊂ 𝑈∗ с вектором 𝐹𝑢 ∈ im 𝐹 , который представляет класс [𝑢] ∈ 𝑈 ∕ ker 𝐹 при изоморфизме im 𝐹 ≃ 𝑈 ∕ ker 𝐹 , задаётся формулой (710). Упражнение 7.12. Убедитесь непосредственно, что формула (710) корректна, т. е. результат свёртки не зависит от выбора ковектора 𝜉 ∈ 𝑊∗ и вектора 𝑣 ∈ 𝑈, использованных для записи элементов из im 𝐹∗ и im 𝐹 . 1 См. формулу (76) на стр. 85. 90 §7 Двойственность Следствие 7.5 Векторное пространство ker 𝐹 ⊂ 𝑈 канонически двойственно фактор пространству 𝑈∗ ∕ im 𝐹∗ , а пространство ker 𝐹∗ ⊂ 𝑊∗ — фактор пространству 𝑊 ∕ im 𝐹 . Свёртки между ними задаются формулами ⟨ 𝜓 + 𝐹 ∗ (𝑊 ∗ ) , 𝑣 ⟩ ≝ ⟨ 𝜓 , 𝑣 ⟩ и ⟨ 𝜉 , 𝑤 + 𝐹 (𝑈 ) ⟩ ≝ ⟨ 𝜉 , 𝑤 ⟩ , (711) где 𝜓 + 𝐹∗ (𝑊∗ ) ∈ 𝑈∗ ∕ im(𝐹∗ ), 𝑣 ∈ ker 𝐹 , 𝜉 ∈ ker 𝐹∗ , 𝑤 + 𝐹 (𝑈) ∈ 𝑊 ∕ im 𝐹 . Упражнение 7.13. Проверьте корректность определений (711), т. е. независимость правых ча стей от выбора представителей 𝜓 и 𝑤 в классах 𝜓 + 𝐹∗ (𝑊∗ ) и 𝑤 + 𝐹 (𝑈), и докажите сл. 7.5 по образцу сл. 7.4. Замечание 7.3. Принимая во внимание двойственности из сл. 7.5, фактор по образу линейного отображения 𝐹 часто называют коядром отображения 𝐹 и обозначают coker(𝐹 ) ≝ 𝑊 ∕ im 𝐹 . В этих обозначениях первые два утверждения из сл. 7.5 записываются равенствами (ker 𝐹 )∗ = coker(𝐹∗ ) и (coker 𝐹 )∗ = ker(𝐹∗ ) . Предложение 7.3 Пусть отображение 𝐹 ∶ 𝑈 → 𝑊 имеет в некоторых базисах 𝒖 = (𝑢1 , … , 𝑢𝑛 ) и 𝒘 = (𝑤1 , … , 𝑤𝑚 ) пространств 𝑈 и 𝑊 матрицу1 𝐹𝒘𝒖 = (𝑓𝑖𝑗 ). Тогда матрица 𝐹𝒖∗∗ 𝒘∗ = (𝑓𝑖𝑗∗ ) двойственного отоб ∗ ∗ ражения 𝐹∗ ∶ 𝑊∗ → 𝑈∗ в двойственных базисах 𝒖∗ = (𝑢1∗ , … , 𝑢𝑛 ) и 𝒘∗ = (𝑤1∗ , … , 𝑤𝑚 ) про ∗ ∗ 2 странств 𝑊 и 𝑈 является транспонированной к матрице отображения 𝐹 : 𝑡 , 𝐹𝒖∗∗ 𝒘∗ = 𝐹𝒘𝒖 т. е. 𝑓𝑖𝑗∗ = 𝑓𝑗𝑖 . Доказательство. Число 𝑓𝑖𝑗∗ равно 𝑖 й координате ковектора 𝐹∗ (𝑤𝑗∗ ) в базисе 𝒖∗ , т. е. свёртке этого ковектора с базисным вектором3 𝑢𝑖 : 𝑓𝑖𝑗∗ = ⟨ 𝐹∗ 𝑤𝑗∗ , 𝑢𝑖 ⟩ = ⟨ 𝑤𝑗∗ , 𝐹𝑢𝑖 ⟩ = ⟨ 𝑤𝑗∗ , ∑ 𝑤𝑘 ⋅ 𝑓𝑘𝑖 ⟩ = 𝑘 ∑ ⟨ 𝑤𝑗∗ , 𝑤𝑘 ⟩ ⋅ 𝑓𝑘𝑖 = 𝑓𝑗𝑖 , 𝑘 что и утверждалось. Пример 7.6 (ещё раз о ранге матрицы) Каждая матрица 𝐴 = (𝑎𝑖𝑗 ) ∈ Mat𝑚×𝑛 (𝕜) является матрицей линейного отображения 𝐹𝐴 ∶ 𝕜𝑛 → 𝕜𝑚 , 𝑥 ↦ 𝐴𝑥 , и линейная оболочка столбцов матрицы 𝐴 совпадает с образом im 𝐹𝐴 этого отображения, т. е. rk 𝐴 = dim im 𝐹𝐴 . Согласно предл. 7.3, двойственное отображение 𝐹𝐴∗ ∶ 𝕜𝑚 ∗ → 𝕜𝑛 ∗ задаётся в двойственных базисах транспонированной матрицей 𝐴𝑡 , откуда rk 𝐴𝑡 = dim im 𝐹𝐴∗ = 𝑚 − dim ker 𝐹𝐴∗ = 𝑚 − dim Ann im 𝐹𝐴 = dim im 𝐹𝐴 = rk 𝐴 , что даёт ещё одно доказательство теоремы о ранге матрицы4 . См. n∘ 5.1 на стр. 59. См. обсуждение перед упр. 5.4 на стр. 62 из n∘ 5.2. 3 См. форм. (73) на стр. 84 и сопутствующее обсуждение. 4 Ср. с теор. 5.1 на стр. 66 и прим. 7.5 на стр. 87. 1 2 91 7.4. Отступление о бесконечномерии 7.4. Отступление о бесконечномерии. Этот раздел относится скорее к теории множеств, чем к линейной алгебре. В нём изложена стандартная машинерия, позволяющая отбросить пред положения о конечномерности, которые для упрощения первого знакомства с предметом были сделаны нами в теореме о базисе1 . 7.4.1. Отношения порядка. Множество 𝑋 называется частично упорядоченным если между некоторыми парами элементов 𝑥 , 𝑦 ∈ 𝑋 установлено такое отношение 𝑥 ⩽ 𝑦, что для всех 𝑥 , 𝑦, 𝑧 ∈ 𝑋 из 𝑥 ⩽ 𝑦 и 𝑦 ⩽ 𝑧 вытекает, что 𝑥 ⩽ 𝑧, а одновременное выполнение условий 𝑥 ⩽ 𝑦 и 𝑦 ⩽ 𝑥 равносильно равенству 𝑥 = 𝑦. Запись 𝑥 < 𝑦 означает, что 𝑥 ⩽ 𝑦 и 𝑥 ≠ 𝑦. Например, пусть 𝑋 = 2𝑀 является множеством всех подмножеств некоторого множества 𝑀. Отношение нестрого включения 𝑥 ⊆ 𝑦 подмножества 𝑥 ⊆ 𝑀 в подмножество 𝑦 ⊆ 𝑀 задаёт на множестве 2𝑀 частичный порядок. Запись 𝑥 ⊂ 𝑦 означает строгое включение. Частичный порядок на множестве 𝑋 называется линейным, если для любой пары элементов 𝑥 , 𝑦 ∈ 𝑋 выполняется неравенство 𝑥 ⩽ 𝑦 или неравенство 𝑦 ⩽ 𝑥 . Например, множество раци ональных чисел ℚ со стандартным отношением неравенства между числами линейно упорядо чено, а множество 2𝑀 всех подмножеств множества 𝑀 с отношением включения не является линейно упорядоченным, если в 𝑀 не меньше двух элементов. Линейно упорядоченное множество 𝑋 называется вполне упорядоченным, если каждое непу стое подмножество 𝑆 ⊂ 𝑋 содержит такой элемент 𝑠∗ ∈ 𝑆, что 𝑠∗ ⩽ 𝑠 для всех 𝑠 ∈ 𝑆. Этот эле мент автоматически единствен и называется начальным элементом подмножества 𝑆. Напри мер, множество натуральных чисел ℕ со стандартным отношением неравенства между числа ми вполне упорядочено, как и любое дизъюнктное объединение вида ℕ ⊔ ℕ ⊔ ℕ ⊔ …, в котором все элементы каждой копии множества ℕ полагаются строго большими всех элементов всех предыдущих копий. Пустое множество тоже вполне упорядочено. Напротив, множество ℚ ⊃ ℕ со стандартным отношением неравенства между числами не является вполне упорядоченным. Вполне упорядоченные множества замечательны тем, что их элементы можно рекурсивно перебрать точно так же, как и элементы множества ℕ. А именно, пусть некоторое зависящее от элемента 𝑥 вполне упорядоченного множества 𝑋 утверждение 𝛷 (𝑥 ) истинно для начального элемента 𝑥∗ множества 𝑋, и пусть для каждого 𝑥 ∈ 𝑋 истинность утверждения 𝛷 (𝑦) при всех 𝑦 < 𝑥 влечёт за собою истинность утверждения 𝛷 (𝑥 ). Тогда 𝛷 (𝑥 ) истинно для всех 𝑥 ∈ 𝑋. Упражнение 7.14. Убедитесь в этом. Такой способ доказательства утверждения 𝛷 (𝑥 ) для всех 𝑥 ∈ 𝑋 называется трансфинитной индукцией. Используемые для индуктивного перехода специальные подмножества [𝑥) ≝ {𝑦 ∈ 𝑋 | 𝑦 < 𝑥} называются начальными интервалами частично упорядоченного множества 𝑋. Элемент 𝑥 ∈ 𝑋 называется точной верхней гранью начального интервала [𝑥 ) ⊂ 𝑋. Отметим, что начальный элемент 𝑥∗ ∈ 𝑋 является точной верхней гранью пустого начального интервала [𝑥∗ ) = ∅. Упражнение 7.15. Покажите, что собственное подмножество 𝐼 ⊊ 𝑋 тогда и только тогда являет ся начальным интервалом вполне упорядоченного множества 𝑋, когда [𝑦) ⊂ 𝐼 для каждого 𝑦 ∈ 𝐼 , и в этом случае точная верхняя грань интервала 𝐼 однозначно восстанавливается по 𝐼 как начальный элемент дополнения 𝑋 ∖ 𝐼 . 1 См. теор. 4.1 на стр. 48. 92 §7 Двойственность 7.4.2. Лемма Цорна. Рассмотрим произвольное частично упорядоченное множество 𝑃 и обозначим через 𝒲 (𝑃) множество всех подмножеств 𝑊 ⊂ 𝑃, которые вполне упорядочены име ющимся на 𝑃 отношением 𝑥 ⩽ 𝑦. Множество 𝒲 (𝑃) непусто и содержит пустое подмножество ∅ ⊂ 𝑃, а также все конечные линейно упорядоченные подмножества1 𝐿 ⊂ 𝑃 и, в частности, все элементы множества 𝑃. Лемма 7.1 Не существует такого отображения 𝜚 ∶ 𝒲 (𝑃) → 𝑃, что 𝜚(𝑊 ) > 𝑤 для всех 𝑊 ∈ 𝒲 (𝑃) и 𝑤 ∈ 𝑊 . Доказательство. Пусть такое отображение 𝜚 существует. Назовём вполне упорядоченное под множество 𝑊 ⊂ 𝑃 𝜚рекурсивным, если 𝜚([𝑦)) = 𝑦 для всех 𝑦 ∈ 𝑊 . Например, множество {𝜚(∅), 𝜚({𝜚(∅)}), 𝜚({𝜚(∅), 𝜚({𝜚(∅)})})} 𝜚рекурсивно и может неограниченно расширяться вправо. Любые два различных 𝜚рекурсив ных вполне упорядоченных подмножества с общим начальным элементом таковы, что одно из них является начальным интервалом другого. Упражнение 7.16. Докажите это. Обозначим через 𝑈 ⊂ 𝑃 объединение всех 𝜚рекурсивных вполне упорядоченных подмножеств в 𝑃 с начальным элементом 𝜚(∅). Упражнение 7.17. Убедитесь, что подмножество 𝑈 ⊂ 𝑃 вполне упорядочено и 𝜚рекурсивно. Поскольку элемент 𝜚(𝑈) строго больше всех элементов из 𝑈, он не лежит в 𝑈. С другой стороны, множество 𝑊 = 𝑈 ∪ {𝜚(𝑈)} вполне упорядочено, 𝜚рекурсивно, и его начальным элементом является 𝜚(∅). Следовательно, 𝑊 ⊂ 𝑈, откуда 𝜚(𝑈) ∈ 𝑈. Противоречие. Предложение 7.4 (лемма Цорна) Пусть каждое линейно упорядоченное2 подмножество 𝐿 частично упорядоченного множества 𝑃 имеет в 𝑃 верхнюю грань3 . Тогда в 𝑃 есть такой (возможно не единственный) элемент 𝑝∗ ∈ 𝑃, что неравенство 𝑝∗ ⩽ 𝑥 выполняется в 𝑃 только для 𝑥 = 𝑝∗ . Доказательство. Если требуемого элемента 𝑝∗ нет, то для любого 𝑝 ∈ 𝑃 имеется такой элемент 𝑝′ ∈ 𝑃, что 𝑝 < 𝑝′ . Тогда для каждого вполне упорядоченного подмножества 𝑊 ⊂ 𝑃 найдётся такой элемент 𝑤∗ ∈ 𝑃, что 𝑤 < 𝑤∗ для всех 𝑤 ∈ 𝑊 . Сопоставляя каждому 𝑊 ∈ 𝒲 один из таких элементов 𝑤∗ , мы получаем отображение 𝜚 ∶ 𝒲 → 𝑃, которого не может быть по лем. 7.1. 7.4.3. Теоремы о базисах. Подмножество 𝐵 векторного пространства 𝑉 называется порож дающим, если каждый вектор 𝑣 ∈ 𝑉 записывается в виде 𝑣 = 𝜆1 𝑏1 + 𝜆2 𝑏2 + ⋯ + 𝜆𝑛 𝑏𝑛 , где 𝑛 ∈ ℕ , 𝑏𝑖 ∈ 𝐵 , 𝜆𝑖 ∈ 𝕜 . Иначе можно сказать, что каждый вектор 𝑣 ∈ 𝑉 допускает линейное разложение 𝑣= ∑ 𝜆𝑏 𝑏 , где 𝜆𝑏 ∈ 𝕜 , (712) 𝑏∈𝐵 1 Линейно упорядоченные подмножества частично упорядоченного множества называются цепями. Как будет видно из доказательства, слово «линейно» можно заменить на слово «вполне», что делает утверждение более сильным, но классическая формулировка леммы Цорна именно такова. 3 Т. е. найдётся такой элемент 𝑤∗ ∈ 𝑃, что 𝑤 ⩽ 𝑤∗ для всех 𝑤 ∈ 𝑊. 2 93 7.4. Отступление о бесконечномерии в котором лишь конечное число коэффициентов 𝜆𝑏 отлично от нуля. Порождающее подмноже ство 𝐵 ⊂ 𝑉 называется базисом пространства 𝑉 , если для каждого 𝑣 ∈ 𝑉 разложение (712) единственно, то есть равенство ∑𝑏∈𝐵 𝜆𝑏 𝑏 = ∑𝑏∈𝐵 𝜇𝑏 𝑏, в котором лишь конечное число коэф фициентов 𝜆𝑏 , 𝜇𝑏 отлично от нуля, равносильно тому, что 𝜆𝑏 = 𝜇𝑏 при всех 𝑏 ∈ 𝐵. Непустое множество 𝐴 ⊂ 𝑉 называется линейно независимым если равенство 𝜆1 𝑎1 + 𝜆2 𝑎2 + ⋯ + 𝜆𝑛 𝑎𝑛 = 0 , где 𝑛 ∈ ℕ , 𝑎𝑖 ∈ 𝐴 , 𝜆𝑖 ∈ 𝕜 , возможно только когда все 𝜆𝑖 = 0. Упражнение 7.18. Убедитесь в том, что множество 𝐸 ⊂ 𝑉 является базисом если и только если оно линейно независимо и порождает 𝑉 . Теорема 7.2 (существование базиса) В каждом отличном от нуля векторном пространстве 𝑉 для любого1 линейно независимого мно жества 𝐴 ⊂ 𝑉 и любого2 порождающего 𝑉 множества векторов 𝐵 ⊃ 𝐴 существует базис 𝐸 , со держащий 𝐴 и содержащийся в 𝐵. Доказательство. Линейно независимые множества векторов 𝑋 ⊆ 𝑉 со свойством 𝐴 ⊆ 𝑋 ⊆ 𝐵 об разуют частично упорядоченное отношением включения множество, удовлетворяющее лемме Цорна3 . В качестве верхней грани линейно упорядоченной цепи вложенных друг в друга линей но независимых наборов векторов можно взять их объединение. Оно линейно независимо, по скольку любой конечный набор его векторов лежит в какомто одном из множеств цепи, а оно линейно независимо. По лемме Цорна существует такое линейно независимое множество 𝐸 , что 𝐴 ⊆ 𝐸 ⊆ 𝐵 и для любого линейно независимого множества 𝑋 со свойством 𝐴 ⊆ 𝑋 ⊆ 𝐵 включение 𝐸 ⊆ 𝑋 влечёт равенство 𝐸 = 𝑋. Покажем, что 𝐸 линейно порождает 𝑉 . Достаточно убедиться, что каждый вектор 𝑏 ∈ 𝐵 ∖ 𝐸 линейно выражается через 𝐸 . Так как множество 𝐸 ∪{𝑏} строго больше 𝐸 , оно линейно зависимо. Поскольку само множество 𝐸 линейно независимо, любое линейное соотношение между векторами из 𝐸 ∪ {𝑏} содержит с ненулевым коэффици ентом вектор 𝑏. Тем самым, он линейно выражается через 𝐸 . Следствие 7.6 Каждое ненулевое векторное пространство имеет базис, и любой базис любого подпростран ства можно дополнить до базиса во всём пространстве. Теорема 7.3 (равномощность базисов) В каждом векторном пространстве все базисы равномощны. Доказательство. Пусть базис 𝐵 строго мощнее базиса 𝐸 . Поскольку в конечномерном простран стве это невозможно по теор. 4.1 на стр. 48, оба базиса бесконечны. Каждый вектор 𝑒 ∈ 𝐸 яв ляется линейной комбинацией конечного множества векторов 𝐵𝑒 ⊂ 𝐵. Так как множество 𝐸 бесконечно, объединение 𝐵𝐸 = ⋃𝑒∈𝐸 𝐵𝑒 всех этих конечных множеств равномощно 𝐸 . Упражнение 7.19. Убедитесь в этом. Стало быть, существует вектор 𝑏 ∈ 𝐵, не лежащий в 𝐵𝐸 . Линейно выражая 𝑏 через векторы базиса 𝐸 , а каждый из входящих в это выражение векторов 𝑒 ∈ 𝐸 — через векторы из 𝐵𝐸 , мы 1 В том числе, пустого. В том числе, совпадающего с 𝑉 . 3 См. предл. 7.4 на стр. 92. 2 94 §7 Двойственность получим линейное выражение вектора 𝑏 ∈ 𝐵 ∖ 𝐵𝐸 через векторы из 𝐵𝐸 . Тем самым, множество 𝐵 линейно зависимо. Противоречие. Следствие 7.7 Всякое более мощное, чем базис, множество векторов линейно зависимо. Теорема 7.4 (продолжение линейных отображений) Для каждого линейного отображения 𝐹 ∶ 𝑈 → 𝑊 , заданного на подпространстве 𝑈 вектор ного пространства 𝑉 , существует такое (возможно, не единственное) линейное отображение 𝐺 ∶ 𝑉 → 𝑊 , что 𝐺 |𝑈 = 𝐹 . Доказательство. Каждое линейное отображение 𝐺 ∶ 𝑉 → 𝑊 однозначно задаётся своими зна чениями на векторах любого базиса 𝐸 пространства 𝑉 , и для любого отображения множеств 𝑔 ∶ 𝐸 → 𝑊 существует единственное такое линейное отображение 𝐺 ∶ 𝑉 → 𝑊 , что 𝐺 (𝑒) = 𝑔(𝑒) для всех 𝑒 ∈ 𝐸 . Упражнение 7.20. Убедитесь в этом. Рассмотрим произвольный базис 𝐵 в 𝑈, дополним его до базиса 𝐸 = 𝐵 ⊔ 𝐶 в 𝑉 и рассмотрим лю бое отображение множеств 𝑔 ∶ 𝐸 → 𝑊 , переводящее каждый вектор 𝑏 ∈ 𝐵 в 𝐹 (𝑏). Отвечающее этому отображению линейное отображение 𝐺 ∶ 𝑉 → 𝑊 обладает нужным свойством. §8. Определители 8.1. Объём, полилинейные косые формы и определитель. Ненулевая функция от 𝑛 аргумен тов 𝜔 ∶ 𝑉 × ⋯ × 𝑉 → 𝕜 на 𝑛мерном векторном пространстве 𝑉 называется объёмом ориенти рованного 𝑛мерного параллелепипеда или формой 𝑛мерного объёма, если она обладает теми же двумя свойствами, что и форма площади из n∘ 1.3 на стр. 11, а именно1 : 1) объём не меняется при добавлений к любому из аргументов произвольной кратности любого другого аргумента: 𝜔 (… , 𝑢 + 𝜆𝑤, … , 𝑤 , …) = 𝜔 (… , 𝑢, … , 𝑤 , …) 2) при умножении любого из аргументов на число объём умножается на это число: 𝜔(… , 𝜆𝑣, …) = 𝜆 𝜔(… , 𝑣, …) . На геометрическом языке эти свойства, как и раньше, означают, что объём параллелепипеда, натянутого на векторы 𝑣1 , … , 𝑣𝑛 , как на рис. 8⋄1, умножается на 𝜆 при умножении любого реб ра на 𝜆, и не меняется при сдвиге двух противоположных (𝑛 − 1)мерных граней друг относи тельно друга в направлении какогонибудь параллельного этим граням ребра (параллельная проекция происходящего на двумерную плоскость, порождённую ребром, вдоль которого дела ется сдвиг, и ребром, соединяющим сдвигаемые грани, изображена на рис. 8⋄2). 𝜆𝑤 𝑢+ 𝜆𝑤 𝑢 v3 v1 𝑤 v2 Рис. 8⋄1. Параллелепипед. Рис. 8⋄2. Параллельный перекос. Дословно так же, как лем. 1.3 на стр. 12, доказывается Лемма 8.1 Каждая форма 𝑛мерного объёма 𝜔 автоматически обладает следующими свойствами: 1) если векторы 𝑣1 , … , 𝑣𝑛 линейно зависимы, то 𝜔(𝑣1 , … , 𝑣𝑛 ) = 0, в частности, 𝜔 кососим метрична2 , т. е. 𝜔 (… , 𝑣 , … , 𝑣 , …) = 0 2) форма 𝜔 линейна по каждому из своих аргументов при фиксированных остальных, т. е. 𝜔 (… , 𝜆𝑢 + 𝜇𝑤 , …) = 𝜆 𝜔 (… , 𝑢, …) + 𝜇 𝜔 (… , 𝑤, …) 1 (81) Здесь и далее мы обозначаем многоточиями аргументы, остающиеся неизменными в левой и правой части равенства. 2 Функция от нескольких аргументов называется кососимметричной, если она обращается в нуль, ко гда какиенибудь два аргумента совпадают. 95 96 §8 Определители 3) форма 𝜔 знакопеременна1 , т. е. 𝜔(… , 𝑢, … , 𝑤 , …) = −𝜔(… , 𝑤, … , 𝑢, …). Доказательство. Если один из векторов линейно выражается через остальные, к примеру, 𝑣1 = = 𝜆2 𝑣2 + ⋯ + 𝜆𝑛 𝑣𝑛 , то 𝜔(𝑣1 , … , 𝑣𝑛 ) = 𝜔(𝜆2 𝑣2 + ⋯ + 𝜆𝑛 𝑣𝑛 , 𝑣2 , … , 𝑣𝑛 ) = 𝜔(0, 𝑣2 , … , 𝑣𝑛 ) = = 𝜔(0 ⋅ 0, 𝑣2 , … , 𝑣𝑛 ) = 0 ⋅ 𝜔(0, 𝑣2 , … , 𝑣𝑛 ) = 0. Это доказывает свойство (1). Свойство (2) оче видно, когда оба набора аргументов в правой части равенства (81) линейно зависимы: в этом случае набор аргументов в левой части тоже линейно зависим, и обе части (81) нулевые по уже доказанному свойству (1). Поэтому без ограничения общности можно считать, что аргументы первого слагаемого в правой части (81) образуют базис пространства 𝑉 . Тогда 𝑤 = 𝜚𝑢 + 𝑣 , где 𝑣 является линейной комбинацией остальных 𝑛 − 1 аргументов, и левая часть (81) равна 𝜔 (… , 𝜆𝑢 + 𝜇𝜚𝑢 + 𝜇𝑣 , …) = 𝜔 (… , (𝜆 + 𝜇𝜚)𝑢, …) = (𝜆 + 𝜇𝜚)𝜔 (… , 𝑢, …) , а второе слагаемое правой части переписывается как 𝜇𝜔 (… , 𝜚𝑢 + 𝑣 , …) = 𝜇𝜚 ⋅ 𝜔 (… , 𝑢, …), что доказывает свойство (2). Знакопеременность следует из линейности и кососимметричности: 𝜔(… , 𝑢, … , 𝑤, …) + 𝜔(… , 𝑤, … , 𝑢, …) = = 𝜔(… , 𝑢, … , 𝑢, …) + 𝜔(… , 𝑢, … , 𝑤, …) + 𝜔(… , 𝑤, … , 𝑢, …) + 𝜔(… , 𝑤, … , 𝑤, …) = = 𝜔(… , 𝑢 + 𝑤, … , 𝑢 + 𝑤, …) = 0. 8.1.1. Кососимметричные 𝒏линейные формы. Линейная по каждому своему аргументу функция 𝑉 × ⋯ × 𝑉 → 𝕜 от 𝑘 векторов пространства 𝑉 называется 𝑘линейной формой на 𝑉 . Упражнение 8.1. Убедитесь, что 𝑘 линейные формы образуют векторное пространство отно сительно обычных операций сложения функций и умножения функций на константы, а ко сососимметричные формы составляют в нём векторное подпространство. Лемма 8.2 Любые две 𝑛линейные кососимметричные формы на 𝑛мерном векторном пространстве 𝑉 про порциональны. Доказательство. Рассмотрим 𝑛линейную кососимметричную форму 𝜔 ∶ 𝑉 × ⋯ × 𝑉 → 𝕜, за фиксируем в пространстве 𝑉 какойнибудь базис 𝒆 = (𝑒1 , … , 𝑒𝑛 ) и выразим через 𝜔(𝑒1 , … , 𝑒𝑛 ) значение формы 𝜔 на произвольных векторах (𝑣1 , … , 𝑣𝑛 ) = (𝑒1 , … , 𝑒𝑛 ) 𝐶 , где в 𝑗том столбце матрицы 𝐶 стоят координаты вектора 𝑣𝑗 в базисе 𝒆. Так как 𝜔 полилинейна по каждому аргу менту, 𝜔(𝑣1 , … , 𝑣𝑛 ) = 𝜔(∑𝑖 𝑒𝑖1 𝑐𝑖1 1 , … , ∑𝑖 𝑒𝑖𝑛 𝑐𝑖𝑛 𝑛 ) = ∑𝑖 ,…,𝑖 𝑐𝑖1 1 ⋯ 𝑐𝑖𝑛 𝑛 𝜔(𝑒𝑖1 , … , 𝑒𝑖𝑛 ). Так как 1 𝑛 1 𝑛 при совпадении какихлибо двух аргументов форма 𝜔 зануляется, в последней сумме отличны от нуля только слагаемые с попарно разными индексами 𝑖1 , … , 𝑖𝑛 . Каждый такой набор индек сов имеет вид 𝑔(1), … , 𝑔(𝑛), где 𝑔 ∶ {1, … , 𝑛} ⥲ {1, … , 𝑛} — некоторая биекция. Все такие биекции образуют группу группу перестановок2 𝑆𝑛 . В силу знакопеременности формы 𝜔 для каждой перестановки 𝑔 ∈ 𝑆𝑛 выполняется равенство 𝜔(𝑒𝑔(1) , … , 𝑒𝑔(𝑛) ) = sgn(𝑔)𝜔(𝑒1 , … , 𝑒𝑛 ), 1 Функция от нескольких аргументов называется знакопеременной, если при перестановке любых двух аргументов она умножается на −1. 2 Также называемую симметрической группой. Я надеюсь, что читатель наслышан про группу 𝑆𝑛 , чёт ность перестановок и мультипликативный гомоморфизм sgn ∶ 𝑆𝑛 → {±1} из курса алгебры. Если это не так, то все необходимые сведения можно почерпнуть из добавления в n∘ 8.4 ниже. 8.1. Объём, полилинейные косые формы и определитель 97 где sgn(𝑔) = ±1 означает знак перестановки 𝑔, равный +1 для чётных перестановок, и −1 для нечётных. Таким образом, 𝜔(𝑣1 , … , 𝑣𝑛 ) = 𝜔(𝑒1 , … , 𝑒𝑛 ) ∑ sgn(𝑔)𝑐𝑔(1)1 𝑐𝑔(2)2 ⋯ 𝑐𝑔(𝑛)𝑛 . Послед 𝑔∈𝑆𝑛 няя сумма называется определителем 𝑛 × 𝑛 матрицы 𝐶 = (𝑐𝑖𝑗 ) и обозначается det 𝐶 ≝ ∑ sgn(𝑔)𝑐𝑔(1)1 𝑐𝑔(2)2 ⋯ 𝑐𝑔(𝑛)𝑛 (82) 𝑔∈𝑆𝑛 Поскольку det 𝐶 зависит только от матрицы 𝐶 , но не от формы 𝜔, для любых двух 𝑛линейных кососимметричных форм 𝜔1 , 𝜔2 и векторов 𝑣1 , … , 𝑣𝑛 ∈ 𝑉 имеется равенство 𝜔1 (𝑣1 , … , 𝑣𝑛 ) 𝜔 (𝑒 , … , 𝑒𝑛 ) = 1 1 . 𝜔2 (𝑣1 , … , 𝑣𝑛 ) 𝜔2 (𝑒1 , … , 𝑒𝑛 ) Мы заключаем, что его левая часть не зависит от выбора векторов 𝑣𝑖 , т. е. функции 𝜔1 и 𝜔2 пропорциональны. 8.1.2. Определитель матрицы. Равенство (82) предписывает всеми возможными способа ми выбирать 𝑛 элементов матрицы 𝐶 так, чтобы в каждой строке и в каждом столбце оказалось выбрано ровно по одному элементу. Клетки, где находятся выбранные элементы, задают биек цию 𝑔 ∶ 𝑗 ↦ 𝑔(𝑗) из множества столбцов в множество строк матрицы 𝐶 . Каждую выбранную 𝑛 ку элементов следует перемножить и умножить на знак перестановки 𝑔, которую она задаёт. Полученные таким образом 𝑛! произведений складываются. Пример 8.1 Определители матриц размера 2 × 2 и 3 × 3 имеют вид det 𝑐11 (𝑐21 𝑐12 = 𝑐11 𝑐22 − 𝑐12 𝑐21 𝑐22 ) ⎛𝑐11 𝑐12 𝑐13 ⎞ det ⎜𝑐21 𝑐22 𝑐23 ⎟ = 𝑐11 𝑐22 𝑐33 + 𝑐13 𝑐21 𝑐32 + 𝑐12 𝑐23 𝑐31 − ⎜ ⎟ ⎝𝑐31 𝑐32 𝑐33 ⎠ − 𝑐11 𝑐23 𝑐32 − 𝑐13 𝑐22 𝑐31 − 𝑐12 𝑐21 𝑐33 . (83) (84) Во втором равенстве сначала выписаны тождественная и две циклических перестановки, по том — три транспозиции. Пример 8.2 (определитель треугольной матрицы) Если матрица 𝐶 верхнетреугольная1 , т. е. 𝑐𝑖𝑗 = 0 при 𝑖 > 𝑗, то единственным ненулевым сла гаемым в сумме (82) будет произведение диагональных элементов матрицы 𝐶 , отвечающее тождественной перестановке 𝑔 = Id. Таким образом, для верхнетреугольной матрицы 𝐶 опре делитель det 𝐶 = ∏𝑖 𝑐𝑖𝑖 . В частности, det 𝐸 = 1. Предложение 8.1 Для любой квадратной матрицы 𝐶 выполняется равенство det 𝐶 = det 𝐶𝑡 . 1 См. прим. 5.6 на стр. 69. 98 §8 Определители Доказательство. Суммы (82), вычисляющие det 𝐶 и det 𝐶𝑡 , состоят из одних и тех же произ ведений всевозможных 𝑛ок элементов матрицы, устанавливающих биекцию 𝑔 ∶ 𝑗 ↦ 𝑔𝑗 меж ду номерами столбцов и номерами строк, только в первой из сумм отвечающее такой биек ции произведение берётся со знаком sgn(𝑔), а во второй — со знаком sgn(𝑔−1 ). Но обратные друг другу перестановки имеют одинаковую чётность: если 𝑔 = 𝜎1 𝜎2 ⋯ 𝜎𝑚 , где все 𝜎𝑖 являются транспозициями, то 𝑔−1 = 𝜎𝑚 𝜎𝑚−1 ⋯ 𝜎1 в силу равенства 𝜎𝑖 𝜎𝑖 = Id. Предложение 8.2 Определитель линеен по каждому столбцу матрицы 𝐶 и обращается в нуль, если какието два столбца совпадают. Доказательство. Первое вытекает из формулы (82): так как каждое из суммируемых произве дений линейно зависит от каждого столбца, вся сумма тоже линейна по каждому столбцу. Если 𝑖 й столбец матрицы 𝐶 совпадает с 𝑗м, то в сумме (82) слагаемое, отвечающее перестановке 𝑔 сократится со слагаемым, отвечающим перестановке ℎ = 𝑔𝜎𝑖𝑗 , где 𝜎𝑖𝑗 меняет местами 𝑖 и 𝑗, а все остальные номера оставляет на месте. В самом деле, sgn(ℎ) = − sgn(𝑔), а отвечающие ℎ и 𝑔 произведения матричных элементов совпадают: ⋯ 𝑐ℎ(𝑖)𝑖 ⋯ 𝑐ℎ(𝑗)𝑗 ⋯ = ⋯ 𝑐𝑔(𝑗)𝑖 ⋯ 𝑐𝑔(𝑖)𝑗 ⋯ = = ⋯ 𝑐𝑔(𝑗)𝑗 ⋯ 𝑐𝑔(𝑖)𝑖 ⋯ = ⋯ 𝑐𝑔(𝑖)𝑖 ⋯ 𝑐𝑔(𝑗)𝑗 ⋯ . Следствие 8.1 Определитель 𝑛 × 𝑛матрицы является 𝑛линейной кососимметричной функцией как столбцов, так и строк. Следствие 8.2 Пространство 𝑛линейных кососимметричных форм на 𝑛мерном векторном пространстве 𝑉 одномерно. Доказательство. По лем. 8.2 на стр. 96 все 𝑛линейные кососимметричные формы на 𝑉 пропор циональны. Поэтому достаточно предъявить хотя бы одну такую форму, не равную тождествен но нулю. Зафиксируем в 𝑉 любой базис 𝑒1 , … , 𝑒𝑛 и для векторов 𝑣1 , … , 𝑣𝑛 , которые линейно вы ражаются через него по формуле (𝑣1 , … , 𝑣𝑛 ) = (𝑒1 , … , 𝑒𝑛 )⋅ 𝐶 , положим 𝜔(𝑣1 , … , 𝑣𝑛 ) = det 𝐶 . Эта форма полилинейна и кососимметрична по предл. 8.2, а в прим. 8.2 видели, что 𝜔𝒆 (𝑒1 , … , 𝑒𝑛 ) = = det 𝐸 = 1. Следствие 8.3 На каждом 𝑛мерном векторном пространстве 𝑉 существует единственная с точностью до про порциональности ненулевая форма 𝑛мерного объёма 𝜔. Если векторы 𝑒1 , … , 𝑒𝑛 образуют ба зис в 𝑉 , а векторы 𝑣1 , … , 𝑣𝑛 выражаются через него как (𝑣1 , … , 𝑣𝑛 ) = (𝑒1 , … , 𝑒𝑛 ) ⋅ 𝐶 , то 𝜔(𝑣1 , … , 𝑣𝑛 ) = 𝜔(𝑒1 , … , 𝑒𝑛 ) ⋅ det 𝐶 . Доказательство. По лем. 8.1 на стр. 95 каждая форма объёма на 𝑉 кососимметрична и 𝑛ли нейна. По предыдущему следствию 𝑛линейные кососимметричные формы на 𝑉 составляют од номерное векторное пространство. Достаточно убедиться, что любая из них является формой объёма, т. е. удовлетворяет условиям (1) и (2) из n∘ 8.1 на стр. 95. Но условие (2) является со ставной частью требования линейности формы по каждому аргументу, и в силу линейности 𝜔 (… , 𝑢 + 𝜆𝑤, … , 𝑤, …) = 𝜔 (… , 𝑢, … , 𝑤, …) + 𝜆𝜔 (… , 𝑤, … , 𝑤, …) . Изза кососимметричности второе слагаемое зануляется, что и доказывает условие (1). 8.1. Объём, полилинейные косые формы и определитель 99 8.1.3. Определитель линейного оператора. Зафиксируем на 𝑛мерном векторном простран стве 𝑉 форму объёма 𝜔. Для любого линейного оператора 𝐹 ∶ 𝑉 → 𝑉 форма 𝜔𝐹 (𝑣1 , … , 𝑣𝑛 ) ≝ 𝜔 (𝐹𝑣1 , … , 𝐹𝑣𝑛 ) полилинейна и кососимметрична. Поэтому она пропорциональна форме 𝜔. Коэффициент про порциональности 𝜔𝐹 ∕ 𝜔 равен отношению значений этих форм на элементах произвольного базиса 𝒆 = (𝑒1 , … , 𝑒𝑛 ) пространства 𝑉 и не зависит от выбора базиса. Поскольку (𝐹𝑒1 , 𝐹𝑒2 , … , 𝐹𝑒𝑛 ) = (𝑒1 , … , 𝑒𝑛 ) ⋅ 𝐹𝒆 , где 𝐹𝒆 — матрица оператора 𝐹 в базисе 𝒆, коэффициент пропорциональности 𝜔 (𝐹𝑒1 , 𝐹𝑒2 , … , 𝐹𝑒𝑛 ) 𝜔(𝑒1 , … , 𝑒𝑛 ) ⋅ det 𝐹𝑒 𝜔𝐹 = = = det 𝐹𝒆 . 𝜔 𝜔(𝑒1 , … , 𝑒𝑛 ) 𝜔(𝑒1 , … , 𝑒𝑛 ) Мы заключаем, что определитель det 𝐹𝒆 матрицы оператора не зависит от выбора базиса 𝒆, в ко тором пишется матрица, и при применении оператора 𝐹 к любому набору векторов объём на тянутого на них параллелепипеда умножается на det 𝐹𝒆 . Определитель det 𝐹𝒆 называется опре делителем линейного оператора 𝐹 ∶ 𝑉 → 𝑉 и обозначается det 𝐹 . Поскольку при последовательном выполнении операторов 𝐺 ∶ 𝑉 → 𝑉 и 𝐹 ∶ 𝑉 → 𝑉 объё мы параллелепипедов умножатся сначала на det(𝐺 ), а потом на det(𝐹 ), мы заключаем, что для любых двух линейных операторов 𝐹 , 𝐺 ∶ 𝑉 → 𝑉 выполняется равенство det(𝐹𝐺 ) = det(𝐹 ) det(𝐺 ) (85) В частности, det(𝐹𝐺 ) = det(𝐺𝐹 ). Предложение 8.3 Линейный оператор 𝐹 ∶ 𝑉 → 𝑉 биективен если и только если det 𝐹 ≠ 0. Доказательство. Если оператор 𝐹 биективен, то он обратим. Вычисляя определитель обеих ча стей в матричном равенстве 𝐹𝐹−1 = Id, получаем det 𝐹 det 𝐹−1 = 1, откуда det 𝐹 ≠ 0. Если оператор не биективен, то столбцы его матрицы 𝐹𝒆 линейно зависимы по сл. 5.1 на стр. 65, от куда det 𝐹 = det 𝐹𝒆 = 0. Следствие 8.4 Квадратная матрица 𝐴 обратима если и только если det 𝐴 ≠ 0. 8.1.4. Специальная линейная группа. Из предыдущего вытекает, что операторы опреде лителя 1 образуют в полной линейной группе GL(𝑉 ) подгруппу. Она обозначается SL(𝑉 ) и назы вается специальной линейной группой пространства 𝑉 . Геометрически, специальная линейная группа состоит из всех операторов, сохраняющих ненулевую форму объёма на 𝑉 , и это свойство не зависит от выбора формы объёма. Специальная линейная группа координатного простран ства 𝕜𝑛 состоит из матриц определителя 1 и обозначается SL𝑛 (𝕜) ⊂ GL𝑛 (𝕜). 100 §8 Определители 8.1.5. Мультипликативность определителя. Обозначим через 𝐾 = ℤ[𝑎𝑖𝑗 , 𝑏𝑖𝑗 ] кольцо мно гочленов с целыми коэффициентами от 2𝑛2 независимых переменных 𝑎𝑖𝑗 и 𝑏𝑖𝑗 , где 1 ⩽ 𝑖 , 𝑗 ⩽ 𝑛, и рассмотрим в кольце Mat𝑛 (𝐾 ) матрицы 𝐴 = (𝑎𝑖𝑗 ) и 𝐵 = (𝑏𝑖𝑗 ), элементами которых являются эти переменные. Упражнение 8.2. Покажите, что многочлен 𝑓 (𝑥1 , … , 𝑥𝑚 ) ∈ 𝕜[𝑥1 , … , 𝑥𝑚 ] над бесконечным полем 𝕜 тогда и только тогда принимает нулевое значение в каждой точке координатного аффинного пространства 𝕜𝑚 , когда все его коэффициенты нулевые. Следствие 8.5 (мультипликативность определителя) В кольце 𝐾 = ℤ[𝑎𝑖𝑗 , 𝑏𝑖𝑗 ] выполняется равенство det(𝐴𝐵) = det(𝐴) ⋅ det(𝐵). Доказательство. Поскольку поле ℚ бесконечно, многочлен det(𝐴𝐵) − det(𝐴) ⋅ det(𝐵) является нулевым если и только если он принимает нулевое значение во всех точках аффинного про 2 странства ℚ2𝑛 с координатами 𝑎𝑖𝑗 , 𝑏𝑖𝑗 , т. е. тогда и только тогда, когда равенство det(𝐴𝐵) = = det(𝐴) ⋅ det(𝐵) выполняется для всех рациональных матриц 𝐴 и 𝐵. Но для таких матриц оно превращается в равенство (85) для линейных операторов 𝐹 ∶ ℚ𝑛 → ℚ𝑛 , 𝑥 ↦ 𝐴𝑥 , и 𝐺 ∶ ℚ𝑛 → ℚ𝑛 , 𝑥 ↦ 𝐵𝑥 , имеющих в стандартном базисе координатного пространства ℚ𝑛 матрицы 𝐴 и 𝐵. 8.1.6. Правило Крамера. Для векторов 𝑣1 , … , 𝑣𝑛 ∈ 𝕜𝑛 обозначим через det(𝑣1 , … , 𝑣𝑛 ) опре делитель матрицы, составленной из координат этих векторов. Поскольку определитель не меня ется при транспонировании, не имеет значения, как записываются координаты — по строкам или по столбцам. Непосредственным обобщением лем. 1.2 на стр. 11 является Предложение 8.4 (первое правило Крамера) Векторы 𝑣1 , … , 𝑣𝑛 образуют базис в 𝕜𝑛 если и только если det(𝑣1 , … , 𝑣𝑛 ) ≠ 0, и тогда 𝑖 тая координата произвольного вектора 𝑤 = 𝑥1 𝑣1 + ⋯ + 𝑥𝑛 𝑣𝑛 в этом базисе равна 𝑥𝑖 = det (𝑣1 , … , 𝑣𝑖−1 , 𝑤, 𝑣𝑖+1 , … , 𝑣𝑛 ) . det(𝑣1 , … , 𝑣𝑛 ) (86) Доказательство. По предл. 5.2 на стр. 64 векторы 𝑣1 , … , 𝑣𝑛 ∈ 𝕜𝑛 образуют базис если и только если матрица их координат обратима, что равносильно условию det(𝑣1 , … , 𝑣𝑛 ) ≠ 0 по сл. 8.4 на стр. 99. Если 𝑣1 , … , 𝑣𝑛 образуют базис, то у каждого 𝑤 ∈ 𝕜𝑛 есть единственное разложение 𝑤 = 𝑥1 𝑒1 + ⋯ + 𝑥𝑛 𝑒𝑛 . Применяя к обеим частям этого равенства линейный функционал 𝑉 → 𝕜, 𝑢 ↦ det (𝑣1 , … , 𝑣𝑖−1 , 𝑢, 𝑣𝑖+1 , … , 𝑣𝑛 ) , получаем равенство det (𝑣1 , … , 𝑣𝑖−1 , 𝑤, 𝑣𝑖+1 , … , 𝑣𝑛 ) = 𝑥𝑖 ⋅ det(𝑣1 , … , 𝑣𝑛 ). Пример 8.3 (уравнение гиперплоскости) Пусть 𝑛 точек 𝑝1 , … , 𝑝𝑛 в аффинном координатном пространстве 𝕜𝑛 не лежат в одном (𝑛 − 2) мерном аффинном подпространстве. Тогда, согласно предл. 4.4 на стр. 54 через них проходит единственная гиперплоскость. Точка 𝑥 лежит в этой гиперплоскости если и только если вектор ⃖⃖⃖⃖⃖ 𝑝𝑛 𝑥⃗ = 𝑥 − 𝑝𝑛 линейно выражается через 𝑛 − 1 векторов ⃖⃖⃖⃖⃖ 𝑝𝑛 𝑝⃗1 , ⃖⃖⃖⃖⃖ 𝑝𝑛 𝑝⃗2 , … , ⃖⃖⃖⃖⃖ 𝑝𝑛 𝑝⃗𝑛−1 , что равносильно 101 8.2. Присоединённая матрица равенству det (𝑥 − 𝑝𝑛 , 𝑝1 − 𝑝𝑛 , 𝑝2 − 𝑝𝑛 , … , 𝑝𝑛−1 − 𝑝𝑛 ) = 0. В силу полилинейности определи теля, это соотношение представляет собою неоднородное линейное уравнение на 𝑥 , которое можно переписать как det (𝑥 , 𝑝1 − 𝑝𝑛 , 𝑝2 − 𝑝𝑛 , … , 𝑝𝑛−1 − 𝑝𝑛 ) = det (𝑝𝑛 , 𝑝1 , 𝑝2 , … , 𝑝𝑛−1 ). На пример, в трёхмерном аффинном координатном пространстве 𝕜3 плоскость 𝑝 + 𝜆𝑢 + 𝜇𝑣 , прохо дящая через точку 𝑝 параллельно векторам 𝑢, 𝑤 , задаётся неоднородным линейным уравнением det(𝑥, 𝑢, 𝑣) = det(𝑝, 𝑢, 𝑣). 8.2. Присоединённая матрица. Для квадратной матрицы 𝐶 = (𝑐𝑖𝑗 ) обозначим через 𝐶𝑖𝑗 под матрицу размера (𝑛 − 1) × (𝑛 − 1), которая получается из 𝐶 удалением 𝑖 й строки и 𝑗го столбца. Число (−1)𝑖+𝑗 det 𝐶𝑖𝑗 называется алгебраическим дополнением к элементу 𝑐𝑖𝑗 матрицы 𝐶 . Транс понированная к матрице из алгебраических дополнений матрица ∨ 𝐶∨ = (𝑐𝑖𝑗 ), ∨ где 𝑐𝑖𝑗 = (−1)𝑖+𝑗 det 𝐶𝑗𝑖 , называется присоединённой1 к матрице 𝐶 . Предложение 8.5 (формула для обратной матрицы) 1 Если матрица 𝐶 ∈ Mat𝑛 (𝕜) обратима, то 𝐶−1 = 𝐶∨ . det 𝐶 Доказательство. Если матрица 𝐶 обратима, то её столбцы 𝑣1 , … , 𝑣𝑛 образуют базис 𝒗 коорди натного пространства 𝕜𝑛 . Стандартный базис 𝒆 = (𝑒1 , … , 𝑒𝑛 ) пространства 𝕜𝑛 выражается че рез него по формуле 𝒆 = 𝒗 𝐶−1 . Таким образом, 𝑖 й элемент 𝑗го столбца матрицы 𝐶−1 является коэффициентом при 𝑣𝑖 в разложении вектора 𝑒𝑗 по базису 𝒗. По правилу Крамера он равен det (𝑣1 , … , 𝑣𝑖−1 , 𝑒𝑗 , 𝑣𝑖+1 , … , 𝑣𝑛 ) . det 𝐶 В числителе стоит определитель матрицы, имеющей в 𝑖 м столбце ровно один ненулевой эле мент — единицу, стоящую в 𝑗й строке. Переставим её в верхний левый угол, сделав 𝑖 − 1 транс позиций столбцов и 𝑗 − 1 транспозиций строк: det (𝑣1 , … , 𝑣𝑖−1 , 𝑒𝑗 , 𝑣𝑖+1 , … , 𝑣𝑛 ) = (−1)𝑖−1 det (𝑒𝑗 , 𝑣1 , … , 𝑣𝑖−1 , 𝑣𝑖+1 , … , 𝑣𝑛 ) = ⎛1 𝑐𝑗,1 ⎜0 𝑐1,2 ⎜⋮ ⋮ ⎜ 𝑖+𝑗−2 = (−1) det ⎜0 𝑐𝑗−1,2 ⎜0 𝑐𝑗+1,2 ⎜⋮ ⋮ ⎜ 𝑐 ⎝ 𝑛,1 ⋯ 𝑐𝑗,𝑖−1 ⋯ 𝑐1,𝑖−1 ⋮ ⋮ ⋯ 𝑐𝑗−1,𝑖−1 ⋯ 𝑐𝑗+1,𝑖−1 ⋮ ⋮ ⋯ 𝑐𝑛,𝑖−1 𝑐𝑗,𝑖+1 𝑐1,𝑖+1 ⋮ 𝑐𝑗−1,𝑖+1 𝑐𝑗+1,𝑖+1 ⋮ 𝑐𝑛,𝑖+1 ⋯ 𝑐𝑗,𝑛 ⎞ ⋯ 𝑐1,𝑛 ⎟ ⋮ ⋮ ⎟ ⎟ ⋯ 𝑐𝑗−1,𝑛 ⎟ . ⋯ 𝑐𝑗+1,𝑛 ⎟ ⋮ ⋮ ⎟⎟ ⋯ 𝑐𝑛,𝑛 ⎠ Ненулевой вклад в этот определитель дают только перестановки, оставляющие 1 на месте. Сум ма произведений матричных элементов, отвечающих таким перестановкам, равна определите лю (𝑛 − 1) × (𝑛 − 1)матрицы, получающейся удалением 𝑗й строки и 𝑖 го столбца из матрицы 𝐶 . ∨ Тем самым, det (𝑣1 , … , 𝑣𝑖−1 , 𝑒𝑗 , 𝑣𝑖+1 , … , 𝑣𝑛 ) = 𝑐𝑖𝑗 . 1 Поанглийски adjunct. 102 §8 Определители Пример 8.4 Матрицы размеров 2 × 2 и 3 × 3 с определителем 1 обращаются по формулам 𝑎 (𝑐 ⎛𝑐11 ⎜𝑐21 ⎜ ⎝𝑐31 𝑐12 𝑐22 𝑐32 𝑐13 ⎞ 𝑐23 ⎟ ⎟ 𝑐33 ⎠ −1 −1 𝑏 𝑑) = 𝑑 (−𝑐 −𝑏 𝑎) (𝑐12 𝑐23 − 𝑐13 𝑐22 )⎞ ⎛ (𝑐22 𝑐33 − 𝑐23 𝑐32 ) −(𝑐12 𝑐33 − 𝑐13 𝑐31 ) ⎜ = −(𝑐21 𝑐33 − 𝑐23 𝑐31 ) (𝑐11 𝑐33 − 𝑐13 𝑐31 ) −(𝑐11 𝑐23 − 𝑐13 𝑐21 )⎟ ⎜ ⎟ (𝑐11 𝑐22 − 𝑐12 𝑐21 )⎠ ⎝ (𝑐21 𝑐32 − 𝑐22 𝑐31 ) −(𝑐11 𝑐32 − 𝑐12 𝑐32 ) Для матриц с отличным от единицы определителем все матричные элементы в правых частях надо поделить на определитель матрицы из левой части. Следствие 8.6 (крайне важное тождество) Обозначим через 𝐾 = ℤ[𝑐𝑖𝑗 ] кольцо многочленов от 𝑛2 переменных 𝑐𝑖𝑗 , где 1 ⩽ 𝑖 , 𝑗 ⩽ 𝑛, а через 𝐶 = (𝑐𝑖𝑗 ) ∈ Mat𝑛 (𝐾 ) матрицу, элементами которой являются эти переменные. В кольце Mat𝑛 (𝐾) матриц с элементами из 𝐾 выполняется равенство 𝐶 ⋅ 𝐶∨ = 𝐶∨ ⋅ 𝐶 = det(𝐶 ) ⋅ 𝐸 . (87) Доказательство. Приравнивая соответственные матричные элементы в правой и левой части равенства (87), мы получаем набор из 𝑛2 равенств между многочленами с целыми коэффици ентами от переменных 𝑐𝑖𝑗 . Чтобы доказать каждое такое равенство, достаточно проверить, что оно превращается в верное числовое равенство для всех наборов из 𝑛2 численных значений 2 𝑐𝑖𝑗 ∈ ℝ из некоторого всюду плотного подмножества в ℝ𝑛 . Упражнение 8.3 (по анализу). Убедитесь в этом, а также в том, что для любого ненулевого многочлена 𝑓 ∈ ℝ[𝑥1 , … , 𝑥𝑚 ] множество 𝒟(𝑓) = {𝑝 ∈ ℝ𝑚 | 𝑓(𝑝) ≠ 0} всюду плотно в ℝ𝑚 . Таким образом, достаточно проверить равенство (87) для всех числовых матриц 𝐶 ∈ Mat𝑛 (ℝ), имеющих det 𝐶 ≠ 0, что и было сделано в предл. 8.5. Следствие 8.7 (разложение определителя по 𝑖 й строке или 𝑖 у столбцу) В кольце 𝑛 × 𝑛 матриц Mat𝑛 (𝐾 ) с элементами из кольца 𝐾 = ℤ[𝑐𝑖𝑗 ] выполняется равенство 𝑛 det 𝐶 = ∑ 𝑛 (−1) 𝑘=1 𝑘+𝑖 𝑐𝑖𝑘 det 𝐶𝑖𝑘 = ∑ (−1)𝑘+𝑖 𝑐𝑘𝑖 det 𝐶𝑘𝑖 . 𝑘=1 Доказательство. Соотношения получаются приравниванием (𝑖 , 𝑖 )тых диагональных элементов матриц из правой и левой части (87). Пример 8.5 Раскладывая определитель 3 × 3 по первому столбцу, получаем ⎛𝑐11 det ⎜𝑐21 ⎜ ⎝𝑐31 𝑐12 𝑐22 𝑐32 𝑐13 ⎞ 𝑐23 ⎟ = 𝑐11 (𝑐22 𝑐33 − 𝑐23 𝑐32 ) − 𝑐21 (𝑐12 𝑐33 − 𝑐13 𝑐32 ) + 𝑐31 (𝑐12 𝑐23 − 𝑐13 𝑐22 ) . ⎟ 𝑐33 ⎠ что согласуется с прямым вычислением из прим. 8.1. 103 8.2. Присоединённая матрица 8.2.1. Тождество Гамильтона – Кэли. Для любого коммутативного кольца 𝐾 с единицей кольцо 𝑛 × 𝑛 матриц Mat𝑛 (𝐾 [𝑡]) с элементами из кольца многочленов 𝐾 [𝑡] совпадает с коль цом многочленов Mat𝑛 (𝐾 )[𝑡] от переменной 𝑡 с коэффициентами в кольце матриц Mat𝑛 (𝐾 ), поскольку каждую матрицу, в клетках которой стоят многочлены от 𝑡, можно записать как мно гочлен от 𝑡 с матричными коэффициентами и наоборот. Например, 3𝑡2 + 2𝑡 ( 2𝑡 + 3 𝑡3 − 1 0 1 3 0 2 0 0 −1 = 𝑡3 + 𝑡2 +𝑡 + . ) ( ) ( ) ( ) ( 𝑡 +𝑡−1 0 1 0 0 2 1 3 −1) 3 Определение 8.1 Для матрицы 𝐴 = (𝑎𝑖𝑗 ) ∈ Mat𝑛 (𝐾 ) многочлен 𝜒𝐴 (𝑡) ≝ det(𝑡𝐸 − 𝐴) = 𝑡𝑛 − 𝜎1 (𝐴) ⋅ 𝑡𝑛−1 + ⋯ + (−1)𝑛−1 𝜎𝑛−1 (𝐴) ⋅ 𝑡 + (−1)𝑛 𝜎𝑛 (𝐴) ∈ 𝐾 [𝑡] называется характеристическим многочленом матрицы 𝐴. Коэффициент при 𝑡𝑛−𝑘 в характери стическом многочлене обозначается через (−1)𝑘 𝜎𝑘 (𝐴). Упражнение 8.4. Убедитесь, что число 𝜎𝑘 (𝐴) ∈ 𝐾 равно сумме определителей всех таких 𝑘 × 𝑘 подматриц матрицы 𝐴, главная диагональ которых является подмножеством главной диа гонали матрицы 𝐴. В частности, 𝜎1 (𝐴) = tr(𝐴) и 𝜎𝑛 (𝐴) = det 𝐴. Теорема 8.1 (тождество Гамильтона – Кэли) Пусть, как и выше, 𝐾 = ℤ[𝑎𝑖𝑗 ] является кольцом многочленов от 𝑛2 переменных 𝑎𝑖𝑗 . Тогда в кольце матриц Mat𝑛 (𝐾 ) для матрицы 𝐴 = (𝑎𝑖𝑗 ) выполняется равенство 𝜒𝐴 (𝐴) = 0. Доказательство. Подставляя в форм. (87) на стр. 102 вместо 𝐶 матрицу 𝑡𝐸 − 𝐴, где 𝐸 — единич ная матрица размера 𝑛 × 𝑛, заключаем, что в кольце Mat𝑛 (𝐾 [𝑡]) выполняется равенство det(𝑡𝐸 − 𝐴) ⋅ 𝐸 = (𝑡𝐸 − 𝐴)(𝑡𝐸 − 𝐴)∨ , где (𝑡𝐸 − 𝐴)∨ — присоединённая1 к (𝑡𝐸 − 𝐴) матрица. Перепишем это равенство в виде равенства между многочленами от 𝑡 с коэффициентами в кольце матриц Mat𝑛 (𝐾 ): 𝑡𝑛 ⋅ 𝐸 − 𝜎1 (𝐴) 𝑡𝑛−1 ⋅ 𝐸 + ⋯ + (−1)𝑛 𝜎𝑛 (𝐴) ⋅ 𝐸 = (𝑡𝐸 − 𝐴) (𝑡𝑚 ⋅ 𝐴∨𝑚 + ⋯ + 𝑡 ⋅ 𝐴∨1 + 𝐴∨0 ) , где 𝐴∨0 , 𝐴∨1 , … , 𝐴∨𝑚 ∈ Mat𝑛 (𝐾 ) — некоторые матрицы. Подставляя в него 𝑡 = 𝐴, получаем в кольце Mat𝑛 (𝐾 ) равенство 𝜒𝐴 (𝐴) ⋅ 𝐸 = 0, откуда 𝜒𝐴 (𝐴) = 0. 8.2.2. Однородные системы из 𝒏 линейных уравнений на 𝒏+1 неизвестных. Простран ство решений системы из 𝑛 линейных уравнений ⎧ 𝑎10 𝑥0 + 𝑎11 𝑥1 + ⋯ + 𝑎1𝑛 𝑥𝑛 = 0 ⎪ ⎪ 𝑎20 𝑥0 + 𝑎21 𝑥1 + ⋯ + 𝑎2𝑛 𝑥𝑛 = 0 ⎨ ⋯⋯⋯⋯⋯ ⎪ ⎪𝑎 𝑥 + 𝑎 𝑥 + ⋯ + 𝑎 𝑥 = 0 ⎩ 𝑛0 1 𝑛1 1 𝑛𝑛 𝑛 1 См. n∘ 8.2 на стр. 101. (88) 104 §8 Определители на 𝑛 + 1 неизвестных (𝑥0 , 𝑥1 , … , 𝑥𝑛 ), рассматриваемых как векторстолбец координатного про странства 𝕜𝑛+1 , является аннулятором линейной оболочки строк матрицы ⎛ 𝑎1,0 ⎜𝑎 𝐴 = ⎜ 2,0 ⋮ ⎜ ⎝𝑎𝑛,0 𝑎1,1 𝑎2,1 ⋯ 𝑎𝑛,1 ⋯ 𝑎1,𝑛 ⎞ ⋯ 𝑎2,𝑛 ⎟ ⋯ ⋮ ⎟ ⎟ ⋯ 𝑎𝑛,𝑛 ⎠ ∗ в двойственном координатном пространстве 𝕜𝑛+1 . Если строки этой матрицы линейно неза висимы, пространство решений системы (88) одномерно, и базисный вектор в этом подпро странстве можно указать явно. Для этого обозначим через ⎛ 𝑎1,0 ⎜𝑎 𝐴𝑖 ≝ (−1)𝑖 det ⎜ 2,0 ⋮ ⎜ ⎝𝑎𝑛,0 ⋯ 𝑎1,𝑖−1 ⋯ 𝑎2,𝑖−1 ⋯ ⋮ ⋯ 𝑎𝑛,𝑖−1 𝑎1,𝑖+1 𝑎2,𝑖+1 ⋮ 𝑎𝑛,𝑖+1 ⋯ 𝑎1,𝑛 ⎞ ⋯ 𝑎2,𝑛 ⎟ ⋯ ⋮ ⎟ ⎟ ⋯ 𝑎𝑛,𝑛 ⎠ (89) определитель 𝑛 × 𝑛 матрицы, получающихся из 𝐴 выкидыванием 𝑖 го столбца. Предложение 8.6 (второе правило Крамера) Уравнения (88) линейно независимы если и только если вектор 𝑎 = (𝐴0 , 𝐴1 , … , 𝐴𝑛 ) ≠ 0, и в этом случае вектор 𝑎 порождает одномерное пространство решений системы (88). Доказательство. Допишем к матрице 𝐴 сверху ещё одну копию её 𝑖 той строки. Определитель получившейся матрицы размера (𝑛 + 1)×(𝑛 + 1) равен нулю. Раскладывая его по верхней строке, получаем 𝑎𝑖0 𝐴0 + 𝑎𝑖1 𝐴1 + ⋯ + 𝑎𝑖𝑛 𝐴𝑛 = 0. Тем самым, вектор 𝑎 = (𝐴0 , 𝐴1 , … , 𝐴𝑛 ) в любом слу чае является решением системы (88). Если строки матрицы 𝐴 линейно зависимы, то и строки всех матриц (89) линейно зависимы с теми же самыми коэффициентами. Поэтому все компо ненты вектора 𝐴 в таком случае нулевые. Если же ковекторы 𝛼𝑖 = (𝑎𝑖,0 , 𝑎𝑖,1 , … , 𝑎𝑖,𝑛 ) линейно ∗ ∗ независимы в 𝕜𝑛+1 , то по лемме о замене1 их можно дополнить до базиса в 𝕜𝑛+1 одним из стандартных базисных ковекторов 𝑒𝑖∗ . Определитель матрицы ⎛ 0 ⎜ 𝑎10 ⎜ ⋮ ⎜ ⎝𝑎𝑛0 ⋯ 0 1 ⋯ ⋯ 𝑎1𝑖 ⋮ ⋮ ⋮ ⋯ ⋯ 𝑎𝑛𝑖 0 ⋯ 0 ⎞ ⋯ ⋯ 𝑎𝑛𝑖 ⎟ , ⋮ ⋮ ⋮ ⎟ ⎟ ⋯ ⋯ 𝑎𝑛𝑛 ⎠ в строки которой записаны координаты базисных ковекторов 𝑒𝑖∗ , 𝛼1 , … , 𝛼𝑛 , отличен от нуля. Раскладывая его по первой строке, видим, что он равен (−1)𝑖 𝐴𝑖 , откуда 𝐴𝑖 ≠ 0. Пример 8.6 (пересечение аффинных плоскостей в 𝕜3 ) Две непараллельные плоскости, заданные в трёхмерном аффинном координатном простран стве уравнениями 𝑎1 𝑥 + 𝑎 2 𝑦 + 𝑎 3 𝑧 = 𝑐 { 𝑏1 𝑥 + 𝑏2 𝑦 + 𝑏3 𝑧 = 𝑑 1 См. лем. 4.2 на стр. 48. 8.3. Геометрическое отступление: объём и барицентрические координаты 105 с непропорциональными левыми частями (𝑎1 , 𝑎2 , 𝑎3 ) и (𝑏1 , 𝑏2 , 𝑏3 ), пересекаются по прямой с вектором скорости 𝑣 = ( 𝑎2 𝑏3 − 𝑎3 𝑏2 , −𝑎1 𝑏3 + 𝑎3 𝑏1 , 𝑎1 𝑏2 − 𝑎2 𝑏1 ), который является базис ным решением системы однородных уравнений 𝑎1 𝑥 + 𝑎 2 𝑦 + 𝑎 3 𝑧 = 0 { 𝑏1 𝑥 + 𝑏2 𝑦 + 𝑏3 𝑧 = 0 . Если, скажем, первая компонента вектора 𝑣 ненулевая, то эта прямая проходит через точку 𝑝 с координатами (0, 𝑝2 , 𝑝3 ), где 𝑝2 = 𝑐𝑏3 − 𝑑𝑎3 , 𝑎2 𝑏3 − 𝑏2 𝑎3 𝑝3 = 𝑎2 𝑑 − 𝑏2 𝑐 𝑎2 𝑏3 − 𝑏2 𝑎3 это единственное решение системы неоднородных уравнений 𝑎2 𝑦 + 𝑎3 𝑧 = 𝑐 { 𝑏2 𝑦 + 𝑏3 𝑧 = 𝑑 . 8.3. Геометрическое отступление: объём и барицентрические координаты. Пусть в аффин ном пространстве 𝔸𝑛 = 𝔸(𝑉 ) задан набор из 𝑛 + 1 не лежащих в одной гиперплоскости точек 𝑝0 , 𝑝1 , … , 𝑝𝑛 . Поместим это 𝔸𝑛 внутрь (𝑛 +1)мерного аффинного пространства 𝔸𝑛+1 = 𝔸(𝕜⊕𝑉 ) в качестве аффинной гиперплоскости 𝛱 = (1, 0) + 𝑉 , проходящей через точку (1, 0) ∈ 𝕜 ⊕ 𝑉 и имеющей направляющее векторное подпространство 𝑉 ⊂ 𝕜 ⊕ 𝑉 . Рассмотрим в 𝔸𝑛+1 аффинный координатный репер с началом в точке 𝑜 = (0, 0) ∈ 𝕜 ⊕ 𝑉 и базисными векторами 𝑒0 = ⃖⃖⃖ 𝑜𝑝⃗0 , 𝑛 𝑒1 = ⃖⃖⃖ 𝑜𝑝⃗1 , … , 𝑒𝑛 = ⃖⃖⃖ 𝑜𝑝⃗𝑛 . Гиперплоскость 𝛱 = 𝔸 проходит через концы этих базисных векторов и задаётся уравнением 𝑥0 + 𝑥1 + … + 𝑥𝑛 = 1. Координаты (𝑥0 , 𝑥1 , … , 𝑥𝑛 ) точки 𝑎 ∈ 𝛱 в таком репере суть не что иное как барицентрические координаты1 точки 𝑎 относительно точек 𝑝𝑖 , по скольку их сумма равна 1 и центр тяжести точек 𝑝𝑖 , взятых с весами 𝑥𝑖 , оказывается в точке 𝑎, так как 𝑥0 ⃖⃖⃖ 𝑎𝑝⃗0 + 𝑥1 ⃖⃖⃖ 𝑎𝑝⃗1 + ⋯ + 𝑥𝑛 ⃖⃖⃖ 𝑎𝑝⃗𝑛 = ⃖⃖⃖ 𝑜𝑎⃗ ⋅ ∑ 𝑥𝑖 − ∑ 𝑥𝑖 𝑒𝑖 = 0. Тем самым, мы получаем биек 𝑛 цию между точками 𝑎 ∈ 𝔸 и наборами весов (𝑥0 , 𝑥1 , … , 𝑥𝑛 ) с суммой ∑ 𝑥𝑖 = 1. Основным результатом этого раздела является Предложение 8.7 Барицентрические координаты (𝑥0 , 𝑥1 , … , 𝑥𝑛 ) точки 𝑎 ∈ 𝔸𝑛 относительно набора не лежащих в одной гиперплоскости точек 𝑝0 , 𝑝1 , … , 𝑝𝑛 ∈ 𝔸𝑛 равны отношениям объёмов пар 𝑛мерных ориентированных параллелепипедов, первый из которых натянут на векторы, идущие из точ ки 𝑎 во все точки 𝑝𝜈 кроме 𝑝𝑖 , а второй — на векторы, идущие из точки 𝑝𝑖 во все остальные точки 𝑝𝜈 : det (⃖⃖⃖ 𝑎𝑝⃗0 , … , ⃖⃖⃖ 𝑎𝑝⃗𝑖−1 , ⃖⃖⃖ 𝑎𝑝⃗𝑖+1 , … , ⃖⃖⃖ 𝑎𝑝⃗𝑛 ) 𝑥𝑖 = . (810) det (⃖⃖⃖⃖ 𝑝𝑖 𝑝⃗0 , … , ⃖⃖⃖⃖ 𝑝𝑖 𝑝⃗𝑖−1 , ⃖⃖⃖⃖ 𝑝𝑖 𝑝⃗𝑖+1 , … , ⃖⃖⃖⃖ 𝑝𝑖 𝑝⃗𝑛 ) ⃖⃖⃖⃗ в базисе из векторов 𝑒𝑖 = 8.3.1. Неформальный комментарий. Координата 𝑥𝑖 вектора 𝑜𝑎 ⃖⃖⃖⃗𝑖 вычисляется по правилу Крамера: = 𝑜𝑝 𝑥𝑖 = 1 Ср. с n∘ 1.6.1 на стр. 20. ⃖⃖⃖⃗0 , … , 𝑜𝑝 ⃖⃖⃖⃗𝑖−1 , 𝑜𝑎 ⃖⃖⃖⃗, 𝑜𝑝 ⃖⃖⃖⃗𝑖+1 , … , ⃖⃖⃖ 𝜔 (𝑜𝑝 𝑜𝑝⃗𝑛 ) . ⃖⃖⃖⃗0 , … , 𝑜𝑝 ⃖⃖⃖⃗𝑛 ) 𝜔 (𝑜𝑝 (811) 106 §8 Определители Над полем ℝ стоящие в числителе и знаменателе этой формулы объёмы параллелепипедов мож но заменить на объёмы пирамид, отсекаемых от этих параллелепипедов гиперплоскостью 𝛱, как на. рис. 8⋄3 ниже. Основания этих (𝑛 + 1)мерных лежат в гиперплоскости 𝛱 и представ ляют собою 𝑛мерные пирамиды с вершинами в точках 𝑝0 , … , 𝑝𝑖−1 , 𝑎, 𝑝𝑖+1 , … , 𝑝𝑛 и в точках 𝑝0 , … , 𝑝𝑛 соответственно. Поскольку пирамиды имеют общую вершину 𝑜, их (𝑛 + 1)мерные объёмы относятся также, как 𝑛мерные объёмы их оснований, что и даёт нужную формулу. Рис. 8⋄3. Барицентрические координаты как отношения объёмов То, что над полем ℝ отношение объёма пирамиды, натянутой на линейно независимые векто ры, к объёму параллелепипеда, натянутого на те же векторы, не зависит от векторов, а зависит только от размерности их линейной оболочки, можно увидеть следующим образом. Опреде лим 𝑛мерную «ступенчатую пирамиду высоты» 𝑘 как стопку 𝑛мерных кубиков со стороной 1, лежащих в положительном гипероктанте пространства ℝ𝑛 на плоскости 𝑥𝑛 = 0 так, что дни ща кубиков самого нижнего слоя образуют (𝑛 − 1)мерную ступенчатую пирамиду высоты 𝑘 в плоскости 𝑥𝑛 = 0, днища кубиков следующего, второго снизу этажа образуют (𝑛 − 1)мерную ступенчатую пирамиду высоты 𝑘 − 1 в плоскости 𝑥𝑛 = 1 и т. д. вплоть до единственного само го верхнего кубика, лежащего на плоскости 𝑥𝑛 = 𝑘 − 1. Обозначим объём такой пирамиды1 через 𝛱𝑘𝑛 . Например, при 𝑛 = 2 двумерная ступенчатая пирамида высоты 𝑘 имеет вид ⎧ ⎪ 𝑘⎨ ⎪ ⎩ ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ 𝑘 и состоит из 𝛱𝑘2 = 𝑘(𝑘 + 1)∕ 2 квадратиков2 . Трёхмерная пирамида высоты 𝑘 имеет на нижнем этаже 𝛱𝑘2 кубиков, надстраивающих предыдущую картинку вверх вдоль третьей координатной 1 2 Т. е. число кубиков, из которых она состоит. 𝑘+1 По этой причине число 𝛱𝑘2 = ( ) часто называют 𝑘 тым треугольным числом и обозначают 𝑇𝑘 . 2 8.3. Геометрическое отступление: объём и барицентрические координаты 107 оси, её второй этаж состоит из 𝛱𝑘2−1 кубиков, надстраивающих вверх такую же двумерную пи рамидку высоты 𝑘 − 1 и т. д. Таким образом, трёхмерная пирамида состоит из 𝛱𝑘3 = 𝛱12 + ⋯ + 𝛱𝑘2 = 𝑘(𝑘 + 1)(𝑘 + 2)∕ 6 трёхмерных кубиков. Упражнение 8.5 (по анализу и комбинаторике). Убедитесь, что 𝛱𝑘𝑛 ≝ 𝛱1𝑛−1 + 𝛱2𝑛−1 + ⋯ + 𝛱𝑘𝑛−1 = ( 𝑛+𝑘−1 ) 𝑛 и выведите отсюда, что объём вещественного 𝑛мерного параллелепипеда в 𝑛! раз больше объёма 𝑛мерной пирамиды с вершинами в какойнибудь вершине этого параллелепипеда и всех вершинах, соединённые с нею ребром. ⃖⃖⃖⃗0 , 𝑜𝑝 ⃖⃖⃖⃗1 , вдвое больше площади Например, площадь параллелограмма, натянутого на векторы 𝑜𝑝 ⃖⃖⃖⃗0 , 𝑜𝑝 ⃖⃖⃖⃗1 , треугольника 𝑜𝑝1 𝑝2 , а объём трёхмерного параллелепипеда, натянутого на векторы 𝑜𝑝 ⃖⃖⃖ 𝑜𝑝⃗2 , вшестеро больше объёма тетраэдра 𝑜𝑝1 𝑝2 𝑝3 и т. д. Поэтому над произвольным полем 𝕜 ха рактеристики нуль уместно называть величину 𝜔(⃖⃖⃖ 𝑜𝑝⃗1 , … , ⃖⃖⃖ 𝑜𝑝⃗𝑛 )∕ 𝑛! объёмом ориентированного 𝑛мерного симплекса [𝑜𝑝1 … 𝑝𝑛 ] с вершинами в точках 𝑜, 𝑝1 , … , 𝑝𝑛 . Такой симплекс представля ет собою пирамиду, которая отрезается от натянутого на векторы ⃖⃖⃖ 𝑜𝑝⃗1 , … , ⃖⃖⃖ 𝑜𝑝⃗𝑛 параллелепипе да с вершиной в точке 𝑜 гиперплоскостью, проходящей через вершины 𝑝1 , … , 𝑝𝑛 . Из лем. 8.3 ниже вытекает, что объёмы (𝑛 + 1)мерных пирамид с общей вершиной и лежащими в одной 𝑛мерной гиперплоскости основаниями относятся точно также, как 𝑛мерные объёмы этих ос нований. И хотя доказательство этой леммы, как и доказательство предл. 8.7, совершенно не используют объёмы пирамид и работают над любым полем, описанную только что картинку всётаки полезно держать в голове. Лемма 8.3 Для любого 𝑘мерного подпространства 𝑈 в 𝑚мерном векторном пространстве 𝑊 и таких век торов 𝑢1 , … , 𝑢𝑘 , 𝑣1 , … , 𝑣𝑘 ∈ 𝑈 и 𝑤1 , … , 𝑤𝑚−𝑘 ∈ 𝑊 , что векторы 𝑤1 , … , 𝑤𝑚−𝑘 , 𝑢1 , … , 𝑢𝑘 состав ляют базис пространства 𝑊 , выполняется равенство 𝜔 (𝑣 , 𝑣 , … , 𝑣𝑘 ) 𝜔𝑚 (𝑤1 , … , 𝑤𝑚−𝑘 , 𝑣1 , … , 𝑣𝑘 ) = 𝑘 1 2 , 𝜔𝑚 (𝑤1 , … , 𝑤𝑚−𝑘 , 𝑢1 , … , 𝑢𝑘 ) 𝜔𝑘 (𝑢1 , 𝑢2 , … , 𝑢𝑘 ) (812) в котором 𝜔𝑘 и 𝜔𝑚 суть любые ненулевые формы 𝑘мерного и 𝑚мерного объёмов в простран ствах 𝑈 и 𝑊 соответственно. Доказательство. Из сделанных предположений вытекает, что векторы 𝑢1 , … , 𝑢𝑘 линейно неза висимы и составляют базис в 𝑈. Согласно предл. 8.4 на стр. 100, 𝜔𝑚 (𝑤1 , … , 𝑤𝑚−𝑘 , 𝑢1 , … , 𝑢𝑘 ) ≠ 0 и 𝜔𝑘 (𝑢1 , 𝑢2 , … , 𝑢𝑘 ) ≠ 0 . Определим на подпространстве 𝑈 ещё одну форму объёма 𝜔′ равенством 𝜔′ (𝑣1′ , … , 𝑣𝑘′ ) ≝ 𝜔𝑚 (𝑤1 , … , 𝑤𝑚−𝑘 , 𝑣1′ , … , 𝑣𝑘′ ) для любых векторов 𝑣1′ , … , 𝑣𝑘′ ∈ 𝑈. Упражнение 8.6. Убедитесь, что это действительно ненулевая форма объёма на 𝑈. 108 §8 Определители Поскольку ненулевая форма объёма единственна с точностью до пропорциональности и отлич на от нуля на базисе 𝑢1 , … , 𝑢𝑘 , 𝜔𝑘 (𝑣1 , 𝑣2 , … , 𝑣𝑘 ) 𝜔′ (𝑣 , 𝑣 , … , 𝑣𝑘 ) 𝜔 (𝑤 , … , 𝑤𝑚−𝑘 , 𝑣1 , … , 𝑣𝑘 ) = ′ 1 2 = 𝑚 1 . 𝜔𝑘 (𝑢1 , 𝑢2 , … , 𝑢𝑘 ) 𝜔 (𝑢1 , 𝑢2 , … , 𝑢𝑘 ) 𝜔𝑚 (𝑤1 , … , 𝑤𝑚−𝑘 , 𝑢1 , … , 𝑢𝑘 ) 8.3.2. Доказательство предл. 8.7. Для каждого 𝜈 ≠ 𝑖 подставим в числитель дроби из фор ⃖⃖⃖⃗𝜈 = 𝑜𝑎 ⃖⃖⃖⃗ + 𝑎𝑝 ⃖⃖⃖⃗𝜈 и, пользуясь тем, что объём полилинеен и зануляется мулы (811) разложения 𝑜𝑝 на линейно зависимых векторах, преобразуем этот числитель к виду ⃖⃖⃖⃗0 , … , 𝑎𝑝 ⃖⃖⃖⃗𝑖−1 , 𝑜𝑎 ⃖⃖⃖⃗, 𝑎𝑝 ⃖⃖⃖⃗𝑖+1 , … , ⃖⃖⃖ 𝜔 (𝑎𝑝 𝑎𝑝⃗𝑛 ) . ⃖⃖⃖⃗𝜈 = 𝑜𝑝 ⃖⃖⃖⃗𝑖 + 𝑝 ⃖⃖⃖⃖ ⃗𝜈 для всех 𝜈 ≠ 𝑖 , преобразуем его в Аналогично, подставляя в знаменатель 𝑜𝑝 𝑖𝑝 ⃖⃖⃖⃖ ⃗0 , … , 𝑝 ⃖⃖⃖⃖ ⃗𝑖−1 , 𝑜𝑝 ⃖⃖⃖⃖⃗𝑖 , 𝑝 ⃖⃖⃖⃖ ⃗𝑖+1 , … , 𝑝 ⃖⃖⃖⃖ ⃗𝑛 ) . 𝜔 (𝑝 𝑖𝑝 𝑖𝑝 𝑖𝑝 𝑖𝑝 ⃖⃖⃖⃗𝑖 отличается от 𝑜𝑎 ⃖⃖⃖⃗ на линейную комбинацию векторов 𝑝 ⃖⃖⃖⃖ ⃗𝜈 , знаменатель равен Так как 𝑜𝑝 𝑖𝑝 ⃖⃖⃖⃖ ⃗0 , … , 𝑝 ⃖⃖⃖⃖ ⃗𝑖−1 , 𝑜𝑎 ⃖⃖⃖⃗, 𝑝 ⃖⃖⃖⃖ ⃗𝑖+1 , … , 𝑝 ⃖⃖⃖⃖ ⃗𝑛 ) , 𝜔 (𝑝 𝑖𝑝 𝑖𝑝 𝑖𝑝 𝑖𝑝 a 𝑥𝑖 = ⃖⃖⃖⃗0 , … , 𝑎𝑝 ⃖⃖⃖⃗𝑖−1 , 𝑜𝑎 ⃖⃖⃖⃗, 𝑎𝑝 ⃖⃖⃖⃗𝑖+1 , … , 𝑎𝑝 ⃖⃖⃖⃗𝑛 ) 𝜔 (𝑎𝑝 ⃖⃖⃖⃖ ⃗0 , … , 𝑝 ⃖⃖⃖⃖ ⃗𝑖−1 , 𝑜𝑎 ⃖⃖⃖⃗, 𝑝 ⃖⃖⃖⃖ ⃗𝑖+1 , … , 𝑝 ⃖⃖⃖⃖ ⃗𝑛 ) 𝜔 (𝑝 𝑖𝑝 𝑖𝑝 𝑖𝑝 𝑖𝑝 . ⃖⃖⃖⃗, 𝑢𝜈 = 𝑝 ⃖⃖⃖⃖ ⃗𝜈 и Остаётся применить лем. 8.3 для 𝑘 = 𝑛, 𝑈 = 𝑉 , 𝑚 = 𝑛 + 1, 𝑊 = 𝕜 ⊕ 𝑉 , 𝑤1 = 𝑜𝑎 𝑖𝑝 𝑣𝜈 = ⃖⃖⃖ 𝑎𝑝⃗𝜈 , где 𝜈 пробегает отличные от 𝑖 значения от 0 до 𝑛. 8.4. Комбинаторное отступление: длина и знак перестановки. Перестановку (𝑔1 , … , 𝑔𝑛 ) чи сел (1, … , 𝑛) можно воспринимать как биективное отображение 𝑔 ∶ {1, … , 𝑛} ⥲ {1, … , 𝑛} , 𝑖 ↦ 𝑔𝑖 . Все такие биекции образуют группу преобразований, которая обозначается 𝑆𝑛 и называется 𝑛той симметрической группой. Назовём пару возрастающих чисел 𝑖 < 𝑗 инверсной для пере становки 𝑔 = (𝑔1 , … , 𝑔𝑛 ) ∈ 𝑆𝑛 , если 𝑔𝑖 > 𝑔𝑗 . Таким образом, каждая перестановка 𝑔 ∈ 𝑆𝑛 разбивает множество всех 𝑛(𝑛 − 1) ∕ 2 возрастающих пар 1 ⩽ 𝑖 < 𝑗 ⩽ 𝑛 на два непересекаю щихся подмножества — инверсные пары и неинверсные пары. Количество 𝓁(𝑔) инверсных пар перестановки 𝑔 называется числом инверсий или длиной перестановки 𝑔. Упражнение 8.7. Найдите max 𝓁(𝑔) по всем 𝑔 ∈ 𝑆𝑛 и укажите все перестановки на которых он достигается. Число sgn(𝑔) ≝ (−1)𝓁(𝑔) называется знаком перестановки 𝑔. Перестановка 𝑔 называется чёт ной, если sgn(𝑔) = 1 и нечётной, если sgn(𝑔) = −1. Перестановка, меняющая местами какиелибо два элемента 𝑖 , 𝑗 и оставляющая все осталь ные элементы на месте, обозначается 𝜎𝑖𝑗 и называется транспозицией 𝑖 го и 𝑗го элементов. Упражнение 8.8. Убедитесь, что каждая перестановка 𝑔 ∈ 𝑆𝑛 является композицией транспо зиций. Обратите внимание, что разложение перестановки в композицию транспозиций не единствен но: например, транспозицию 𝜎13 = (3, 2, 1) ∈ 𝑆3 иначе можно записать как 𝜎12 𝜎23 𝜎12 или как 109 8.4. Комбинаторное отступление: длина и знак перестановки 𝜎23 𝜎12 𝜎23 . Тем не менее чётность количества транспозиций, в композицию которых расклады вается данная перестановка 𝑔, не зависит от способа разложения и совпадает с чётностью числа инверсных пар перестановки 𝑔, т. е. все чётные перестановки являются композициями чётного числа транспозиций, а нечётные — нечётного. Это вытекает из следующей леммы. Лемма 8.4 sgn(𝑔𝜎𝑖𝑗 ) = − sgn(𝑔) для любой перестановки 𝑔 = (𝑔1 , … , 𝑔𝑛 ) и любой транспозиции 𝜎𝑖𝑗 . Доказательство. Перестановки 𝑔 = (𝑔1 , … , 𝑔𝑖−1 , 𝒈𝑖 , 𝑔𝑖+1 , … , 𝑔𝑖−1 , 𝒈𝑗 , 𝑔𝑗+1 , … , 𝑔𝑛 ) 𝑔𝜎𝑖𝑗 = (𝑔1 , … , 𝑔𝑖−1 , 𝒈𝑗 , 𝑔𝑖+1 , … , 𝑔𝑖−1 , 𝒈𝑖 , 𝑔𝑗+1 , … , 𝑔𝑛 ) (813) отличаются друг от друга транспозицией элементов 𝑔𝑖 и 𝑔𝑗 , стоящих на 𝑖 том и 𝑗том местах перестановки 𝑔. В этих двух перестановках пара (𝑖 , 𝑗), а также 2(𝑗 − 𝑖 − 1) пар вида (𝑖 , 𝑚) и (𝑚, 𝑗) с произвольным 𝑚 из промежутка 𝑖 < 𝑚 < 𝑗 имеют противоположную инверсность, а инверс ность всех остальных пар одинакова. Следствие 8.8 Если перестановка 𝑔 является композицией 𝑚 транспозиций, то sgn(𝑔) = (−1)𝑚 и чётность перестановки совпадает с чётностью числа 𝑚. Доказательство. Тождественная перестановка не имеет инверсных пар и, стало быть, чётна. В силу леммы, перестановка получающаяся из тождественной умножением на 𝑚 транспозиций, имеет чётность (−1)𝑚 . Упражнение 8.9. Убедитесь, что sgn(𝑔ℎ) = sgn(𝑔) sgn(ℎ), т. е. отображение sgn ∶ 𝑆𝑛 → {±1} является гомоморфизмом групп. 1 2 3 4 5 6 7 8 9 2 9 6 1 8 3 5 7 4 Рис. 8⋄4. sgn(2, 9, 6, 1, 8, 3, 5, 7, 4) = +1 (всего 18 пересечений). Пример 8.7 (правило ниточек) Чётность числа инверсных пар может быть определена следующим наглядным способом, из вестным как правило ниточек1 . Запишем исходные числа и их перестановку друг под другом, как на рис. 8⋄4, и соединим одинаковые числа нитями так, чтобы ни одна из нитей не вылеза ла за пределы прямоугольника, образованного четырьмя угловыми числами, и чтобы все точки 1 Этот способ не слишком эффективен, когда требуется отыскать знак конкретной перестановки длин ного набора чисел — обычно быстрее бывает разложить перестановку в композицию непересекающихся циклов и воспользоваться тем, что циклы чётной длины нечётны, а циклы нечётной длины чётны. Одна ко правило ниточек часто оказывается полезным при анализе абстрактных перестановок. 110 §8 Определители пересечения нитей были простыми двойными1 . Тогда чётность числа инверсных пар равна чёт ности числа точек пересечения нитей. Упражнение 8.10. Докажите это и найдите при помощи правила ниточек чётность тасующей перестановки (𝑖1 , … , 𝑖𝑘 , 𝑗1 , … , 𝑗𝑚 ), где номера в каждом из наборов (𝑖1 , … , 𝑖𝑘 ) и (𝑗1 , … , 𝑗𝑚 ) возрастают слева направо. 8.5. Алгебраическое отступление: грассмановы многочлены. Полезным алгебраическим ин струментом для работы с кососимметричными формами и определителями является алгебра 𝕜 ⟨𝜉1 , 𝜉2 , … , 𝜉𝑛 ⟩ грассмановых многочленов от переменных 𝜉1 , … , 𝜉𝑛 с коэффициентами из по ля 𝕜. Она определяется также, как и обычная алгебра многочленов, вот только грассмановы переменные 𝜉𝑖 не коммутируют, но антикоммутируют2 друг с другом, т. е. ∀ 𝑖 , 𝑗 𝜉𝑖 ∧ 𝜉𝑗 = −𝜉𝑗 ∧ 𝜉𝑖 и ∀ 𝑖 𝜉𝑖 ∧ 𝜉𝑖 = 0 , (814) где символ «∧» обозначает кососимметричное грассманово умножение, дабы отличать его от обычного коммутативного. Поскольку квадраты грассмановых переменных равны нулю, вся кий ненулевой грассманов моном линеен по каждой входящей в него переменной. Иначе гово ря, базис векторного пространства 𝕜 ⟨𝜉1 , 𝜉2 , … , 𝜉𝑛 ⟩ над 𝕜 образуют грассмановы мономы 𝜉𝐼 ≝ 𝜉𝑖1 ∧ 𝜉𝑖2 ∧ … ∧ 𝜉𝑖𝑚 , (815) занумерованные всевозможными наборами возрастающих номеров 𝐼 = (𝑖1 , … , 𝑖𝑛 ) ⊆ {1, … , 𝑛}, включая 𝐼 = ∅, для которого 𝜉∅ ≝ 1. Перестановка переменных в базисном мономе (815) рав носильна его умножению на знак этой перестановки: 𝜉𝑖𝑔(1) ∧…∧ 𝜉𝑖𝑔(𝑚) = sgn(𝑔)⋅ 𝜉𝑖1 ∧ 𝜉𝑖2 ∧…∧ 𝜉𝑖𝑚 для всех 𝑔 ∈ 𝑆𝑛 . Перемножаются мономы (815) по правилу 𝜉𝐼 ∧ 𝜉𝐽 = sgn(𝐼, 𝐽) ⋅ 𝜉𝐼⊔𝐽 если 𝐼 ∩ 𝐽 = ∅ {0 если 𝐼 ∩ 𝐽 ≠ ∅ , (816) где sgn(𝐼 , 𝐽) = ±1 означает знак тасующей перестановки, которая расставляет в порядке воз растания номера 𝑖1 , … , 𝑖𝑚 , 𝑗1 , … , 𝑗𝑘 , среди которых 𝑖1 , … , 𝑖𝑚 и 𝑗1 , … , 𝑗𝑘 по отдельности строго возрастают. Для дополнительных наборов 𝐼 = (𝑖1 , … , 𝑖𝑛 ) и 𝐽 = {1, … , 𝑛} ∖ 𝐼 этот знак был вы числен в упр. 8.10 на стр. 110 и равен (−1)𝑖1 +⋯+𝑖𝑚 +𝑚(𝑚+1)∕2 . Однородные грассмановы многочлены степени 𝑘 образуют векторное пространство раз 𝑛 мерности ( ), базис в котором составляют мономы (815), отвечающие всевозможным 𝑘эле 𝑘 ментным подмножествам 𝐼 . Размерность всей грассмановой алгебры dim 𝕜 ⟨𝜉1 , 𝜉2 , … , 𝜉𝑛 ⟩ = 2𝑛 . Грассмановы мономы произвольных степеней 𝑚 и 𝑘 коммутируют друг с другом по правилу 𝑘𝑚 (𝜉𝑖1 ∧ 𝜉𝑖2 ∧ … ∧ 𝜉𝑖𝑚 )∧(𝜉𝑗1 ∧ 𝜉𝑗2 ∧ … ∧ 𝜉𝑗𝑘 ) = (−1) (𝜉𝑗1 ∧ 𝜉𝑗2 ∧ … ∧ 𝜉𝑗𝑘 )∧(𝜉𝑖1 ∧ 𝜉𝑖2 ∧ … ∧ 𝜉𝑖𝑚 ) , ибо при переносе каждой из 𝑘 переменных 𝜉𝑗 через 𝑚 переменных 𝜉𝑖 происходит 𝑚 транспози ций. Поэтому для любых двух однородных грассмановых многочленов 𝜂 и 𝜔 𝜂 ∧ 𝜔 = (−1)deg 𝜂 deg 𝜔 𝜔 ∧ 𝜂 . 1 (817) Т. е. в каждой точке пересечения встречается ровно две нити, причём их касательные в точке пере сечения различны. 2 Если char 𝕜 ≠ 2 соотношения 𝜉𝑖 ∧ 𝜉𝑖 = 0 вытекают из соотношений 𝜉𝑖 ∧ 𝜉𝑗 = −𝜉𝑗 ∧ 𝜉𝑖 и могут быть опущены. Однако когда char 𝕜 = 2 именно соотношения на квадраты 𝜉𝑖 ∧ 𝜉𝑖 = 0 отличает грассмановы переменные от обычных коммутативных. 8.5. Алгебраическое отступление: грассмановы многочлены 111 В частности, каждый однородный многочлен чётной степени коммутирует со всеми грассмано выми многочленами. Отметим также, что единственный с точностью до знака моном старшей степени 𝜉top ≝ 𝜉1 ∧ 𝜉2 ∧ … ∧ 𝜉𝑛 аннулируется умножением на любой грассманов многочлен с нулевым свободным членом. Упражнение 8.11. Опишите центр1 грассмановой алгебры. 8.5.1. Грассманова алгебра векторного пространства. Если в векторном пространстве 𝑉 выбран базис 𝑒1 , … , 𝑒𝑛 , алгебра грассмановых многочленов 𝕜 ⟨𝑒1 , 𝑒2 , … , 𝑒𝑛 ⟩ от базисных век торов пространства 𝑉 обозначается 𝛬𝑉 и называется грассмановой (или внешней) алгеброй век торного пространства 𝑉 . Не апеллирующие к выбору базиса название и обозначение вызваны тем, что пространство однородных грассмановых многочленов степени 1 канонически отож дествляется с пространством 𝑉 и не зависит от выбора базиса, а пространство однородных грас смановых многочленов степени 𝑘 является линейной оболочкой всевозможных произведений 𝑣1 ∧ 𝑣2 ∧ … ∧ 𝑣𝑘 из 𝑘 произвольных векторов 𝑣𝑖 ∈ 𝑉 и тоже не зависит от выбора базиса. Обозна чая пространство однородных грассмановых многочленов степени 𝑘 через 𝛬𝑘 𝑉 , мы получаем разложение алгебры 𝛬𝑉 в прямую сумму векторных пространств 𝑛 𝛬𝑉 = ⨁ 𝛬𝑘 𝑉 , 𝑘=0 где 𝛬0 𝑉 ≝ 𝕜 ⋅ 1 обозначает одномерное пространство констант, тоже не зависящее от базиса. Пример 8.8 (грассмановы квадратичные формы) Покажем, что каждый ненулевой однородный грассманов многочлен второй степени 𝜔 ∈ 𝛬2 𝑉 на конечномерном пространстве 𝑉 над любым полем 𝕜 в подходящем базисе 𝒆 пространства 𝑉 может быть записан в нормальном виде Дарбу 𝑒1 ∧ 𝑒2 + 𝑒3 ∧ 𝑒4 + … + 𝑒2𝑟−1 ∧ 𝑒2𝑟 . (818) Для этого рассмотрим произвольный базис 𝒖 и перенумеруем его векторы так, чтобы 𝜔 = 𝑢1 ∧ (𝛼2 𝑢2 + … + 𝛼𝑛 𝑢𝑛 ) + 𝑢2 ∧ (𝛽3 𝑢3 + … + 𝛽𝑛 𝑢𝑛 ) + (члены без 𝑢1 и 𝑢2 ) , где коэффициент 𝛼2 ≠ 0 и вектор 𝑣2 ≝ 𝛼2 𝑢2 + … + 𝛼𝑛 𝑢𝑛 ≠ 0. Перейдём к новому базису 𝒗 из векторов 𝑣𝑖 = 𝑢𝑖 при 𝑖 ≠ 2 и вектора 𝑣2 . Упражнение 8.12. Убедитесь, что это действительно базис. Подставляя в предыдущую формулу 𝑢2 = (𝑣2 − 𝛼3 𝑣3 − … − 𝛼𝑛 𝑣𝑛 ) ∕ 𝛼2 , получаем 𝜔 = 𝑣1 ∧ 𝑣2 + 𝑣2 ∧ (𝛾3 𝑣3 + … + 𝛾𝑛 𝑣𝑛 ) + (члены без 𝑣1 и 𝑣2 ) = = (𝑣1 − 𝛾3 𝑣3 − … − 𝛾𝑛 𝑣𝑛 ) ∧ 𝑣2 + (члены без 𝑣1 и 𝑣2 ) для некоторых 𝛾3 , … , 𝛾𝑛 ∈ 𝕜. Переходя к базису 𝒘 из векторов 𝑤1 = 𝑣1 − 𝛾3 𝑣3 − … − 𝛾𝑛 𝑣𝑛 и 𝑤𝑖 = 𝑣𝑖 при 𝑖 ≠ 1, получаем 𝜔 = 𝑤1 ∧ 𝑤2 + (члены без 𝑤1 и 𝑤2 ), после чего процесс может быть продолжен по индукции. 1 Т. е. подалгебру, состоящую из всех грассмановых многочленов, которые коммутируют со всеми грассмановыми многочленами. 112 §8 Определители Предложение 8.8 Над полем 𝕜 характеристики char 𝕜 ≠ 2 однородный грассманов многочлен 𝜔 ∈ 𝛬2 𝑉 тогда и только тогда разложим в произведение 𝑢 ∧ 𝑤 двух векторов 𝑢, 𝑤 ∈ 𝑉 , когда 𝜔 ∧ 𝜔 = 0. Доказательство. Если 𝜔 = 𝑢 ∧ 𝑤 , то 𝜔 ∧ 𝜔 = 𝑢 ∧ 𝑤 ∧ 𝑢 ∧ 𝑤 = 0. Чтобы получить обратное, выберем в 𝑉 базис 𝒆, в котором 𝜔 = 𝑒1 ∧ 𝑒2 + 𝑒3 ∧ 𝑒4 + ⋯. Если в этой сумме есть хотя бы два слагаемых, то базисный моном 𝑒1 ∧ 𝑒2 ∧ 𝑒3 ∧ 𝑒4 войдёт в 𝜔 ∧ 𝜔 с ненулевым коэффициентом 2, а значит, 𝜔 ∧ 𝜔 ≠ 0. Таким образом, равенство 𝜔 ∧ 𝜔 = 0 влечёт равенство 𝜔 = 𝑒1 ∧ 𝑒2 . 8.5.2. Линейные замены переменных. Если векторы 𝒖 = (𝑢1 , 𝑢2 , … , 𝑢𝓁 ) линейно выраже ны через векторы 𝒘 = (𝑤1 , 𝑤2 , … , 𝑤𝑘 ) по формуле 𝒖 = 𝒘 𝐶 , где 𝐶 = (𝑐𝑖𝑗 ) ∈ Mat𝑘×𝓁 (𝕜), то их грассмановы произведения 𝑢𝐽 = 𝑢𝑗1 ∧ 𝑢𝑗2 ∧ … ∧ 𝑢𝑗𝑚 линейно выражаются через грассмановы произведения 𝑤𝐼 = 𝑤𝑖1 ∧ 𝑤𝑖2 ∧ … ∧ 𝑤𝑖𝑚 по формулам 𝑢𝐽 = 𝑢𝑗1 ∧ 𝑢𝑗2 ∧ … ∧ 𝑢𝑗𝑚 = ( 𝑤 𝑐 ∧ 𝑤 𝑐 ∧ … ∧ ( 𝑤𝑖𝑚 𝑐𝑖𝑚 𝑗𝑚 ) = ∑ 𝑖1 𝑖1 𝑗1 ) (∑ 𝑖2 𝑖2 𝑗2 ) ∑ 𝑖1 = 𝑤 ∧ ∑ 𝑖1 1⩽𝑖1 <𝑖2 <⋯<𝑖𝑛 ⩽𝑛 𝑖2 𝑤𝑖2 ∧ … ∧ 𝑤𝑖𝑛 ⋅ ∑ 𝑖𝑚 𝑔∈𝑆𝑚 sgn(𝑔) 𝑐𝑖𝑔(1) 𝑗1 𝑐𝑖𝑔(2) 𝑗2 … 𝑐𝑖𝑔(𝑛) 𝑗𝑛 = ∑ 𝑤𝐼 ⋅ 𝑐𝐼𝐽 , 𝐼 где 𝑐𝐼𝐽 = det 𝐶𝐼𝐽 обозначает определитель 𝑚 × 𝑚подматрицы 𝐶𝐼𝐽 ⊂ 𝐶 , сосредоточенной в пе ресечениях столбцов с номерами из 𝐽 и строк с номерами из 𝐼 , а суммирование происходит по всем наборам 𝐼 = (𝑖1 , … , 𝑖𝑚 ) из 𝑚 строго возрастающих номеров. Определитель 𝑐𝐼𝐽 = det 𝐶𝐼𝐽 называется 𝐼𝐽тым минором 𝑚того порядка в матрице 𝐶 . Таким образом, 𝐼𝐽тый элемент мат рицы, выражающей грассманов моном 𝑢𝐽 через грассмановы мономы 𝑤𝐼 равен 𝐼𝐽тому минору 𝑚того порядка в матрице выражающей векторы 𝒖 через векторы 𝒘. В частности, если набо ры векторов 𝒆 = (𝑒1 , 𝑒2 , … , 𝑒𝑛 ) и 𝒇 = (𝑓1 , 𝑓2 , … , 𝑓𝑛 ) оба являются базисами пространства 𝑉 , то базисные грассмановы мономы 𝑒𝐽 пространства 𝛬𝑚 𝑉 выражаются через базисные мономы 𝑓𝐼 𝑚 𝑚 при помощи матрицы перехода размера ( ) × ( ), у которой в позиции 𝐼𝐽 стоит 𝐼𝐽тый минор 𝑛 𝑛 𝑚 (𝑐𝐼𝐽 ) матрицы 𝐶𝒇𝒆 , выражающей 𝒆 через 𝒇. Эта матрица обозначается 𝛬 𝐶𝒇𝒆 и называется 𝑚 той внешней степенью матрицы 𝐶𝒇𝒆 . 8.5.3. Соотношения Лапласа. Для набора 𝐽 = (𝑗1 , … , 𝑗𝑚 ) ⊂ {1, … , 𝑛} возрастающих номе ров мы полагаем deg 𝐽 ≝ 𝑚, |𝐽| ≝ 𝑗1 + … + 𝑗𝑚 , и обозначаем дополнительный к 𝐽 набор номе ров через 𝐽 ̂ = (𝑗1̂ , … , 𝑗𝑛̂ −𝑚 ) = {1, … , 𝑛} ∖ 𝐽 . Рассмотрим произвольную квадратную матрицу 𝐴 ∈ Mat𝑛×𝑛 (𝕜), столбцы которой обозначим 𝛼1 , … , 𝛼𝑛 и будем воспринимать их как векторы координатного пространства 𝕜𝑛 . Матрица 𝐴 является матрицей перехода от этих векторов к стандартному базису 𝑒1 , … , 𝑒𝑛 пространства 𝕜𝑛 . Для любых двух мультииндексов 𝐼 , 𝐽 одинако вой степени deg 𝐼 = deg 𝐽 = 𝑚 грассмановы мономы 𝛼𝐽 = 𝛼𝑗1 ∧ … ∧ 𝛼𝑗𝑚 и 𝛼𝐼̂ = 𝛼𝑖 ̂ ∧ … ∧ 𝛼𝑖 ̂ имеют дополнительные степени 𝑚 и 𝑛 − 𝑚 и перемножаются по правилу1 𝛼𝐽 ∧ 𝛼𝐼̂ = (−1)|𝐽|+ 𝑚(𝑚+1) 2 𝛼1 ∧ 𝛼2 ∧ … ∧ 𝛼𝑛 {0 1 при 𝐼 = 𝐽 при 𝐼 ≠ 𝐽 . Выражая мономы 𝛼𝐽 и 𝛼𝐼̂ в левой части (819) через базисные мономы 𝑒𝐾 , получаем (∑ 𝑒𝐾 𝑎𝐾𝐽 ) ∧ (∑ 𝑒𝐿 𝑎𝐿𝐼̂ ) = (−1) 𝐾 1 𝑚(𝑚+1) 2 𝐿 См. форм. (816) на стр. 110 и упр. 8.10 на стр. 110 𝑒1 ∧ 𝑒2 ∧ … ∧ 𝑒𝑛 ∑ 𝐾 (−1)|𝐾| 𝑎𝐾𝐽 𝑎𝐾̂ 𝐼̂ , 𝑛−𝑚 (819) 8.5. Алгебраическое отступление: грассмановы многочлены 113 где 𝐾 пробегает все возрастающие мультииндексы длины deg 𝐾 = 𝑚. Так как правая часть (819) 𝑚(𝑚+1) +|𝐽| при 𝐼 = 𝐽 равна (−1) 2 det 𝐴 ⋅ 𝑒1 ∧ 𝑒2 ∧ … ∧ 𝑒𝑛 , для любых двух наборов 𝐽, 𝐼 из 𝑚 строк произвольной квадратной матрицы 𝐴 выполняются соотношения Лапласа det 𝐴 при 𝐼 = 𝐽 (−1)|𝐾|+|𝐽| 𝑎𝐾𝐽 𝑎𝐾̂ 𝐼̂ = ∑ {0 при 𝐼 ≠ 𝐽 , 𝐾 (820) где суммирование идёт по всем наборам 𝐾 из 𝑚 = deg 𝐾 строк матрицы 𝐴. При 𝐼 = 𝐽 соотношение (820) даёт формулу для вычисления определителя1 det 𝐴 = (−1)|𝐾|+|𝐽| 𝑎𝐾𝐽 𝑎𝐾̂ 𝐽̂ ∑ (821) 𝐾 через всевозможные миноры 𝑎𝐾𝐽 порядка 𝑚, сосредоточенные в 𝑚 фиксированных столбцах матрицы 𝐴 с номерами 𝐽, и дополнительные к ним миноры 𝑎𝐽̂𝐾̂ порядка 𝑛 − 𝑚, равные опреде лителям матриц, получающихся из 𝐴 вычёркиванием всех строк и столбцов, которые высекают минор 𝑎𝐾𝐽 . Произведение (−1)|𝐾|+|𝐽| 𝑎𝐾̂ 𝐽̂ называется алгебраическим дополнением к минору 𝑎𝐾𝐽 и обозначается 𝑎̂𝐾𝐽 . Упражнение 8.13. Для любых матриц 𝐴 ∈ Mat𝑛 (𝕜), 𝐶 ∈ Mat𝑚 (𝕜), 𝐵 ∈ Mat𝑛×𝑚 (𝕜) покажите, 𝐴 𝐵 = det 𝐴 ⋅ det 𝐶 . что det (0 𝐶 ) ̂ = 0 и называется теоремой об умножении При 𝐼 ≠ 𝐽 соотношение (820) имеет вид ∑𝐾 𝑎𝐾𝐽 𝑎𝐼𝐾 на чужие алгебраические дополнения, поскольку его левая часть отличается от левой части фор ̂ , а на мулы (821) тем, что миноры 𝑎𝐾𝐽 умножаются не на свои алгебраические дополнения 𝑎𝐾𝐽 ̂ к минорам 𝑎𝐼𝐾 , сосредоточенным в другом наборе столбцов 𝐼 ≠ 𝐽. дополнения 𝑎𝐼𝐾 Если согласованно занумеровать все 𝑚элементные подмножества и все (𝑛 −𝑚)элементные подмножества в множестве {1, … , 𝑛} так, чтобы дополнительные подмножества 𝐽 и 𝐽 ̂ имели одинаковые номера, то соотношения Лапласа можно записать одним равенством 𝛬𝑚 𝐴 ⋅ 𝛬𝑛−𝑚 𝐴𝑡̂ = det 𝐴 ⋅ 𝐸 𝑛 (822) 𝑛 на матрицы размера ( ) × ( ), в котором (𝐼𝐽)тый элемент матрицы 𝛬𝑛−𝑚 𝐴𝑡̂ равен 𝑚 𝑚 ̂ = (−1)|𝐽|+|𝐼| 𝑎𝐽̂𝐼̂ . 𝑎𝐽𝐼 Упражнение 8.14. Установите транспонированный вариант соотношений Лапласа ∑ 𝐾 ̂ = 𝑎𝐽𝐾 𝑎𝐼𝐾 det 𝐴 при 𝐼 = 𝐽 {0 при 𝐼 ≠ 𝐽 (823) Пример 8.9 (соотношение Плюккера) Рассмотрим 2 × 4 матрицу 𝐴 = (𝑎𝑖𝑗 ) ∈ Mat2×4 (𝕜) и обозначим через 𝐴𝑖𝑗 её 2 × 2 минор, образо ванный 𝑖 м и 𝑗м столбцами. Шесть чисел 𝐴𝑖𝑗 связаны квадратичным соотношением Плюккера 𝐴12 𝐴34 − 𝐴13 𝐴24 + 𝐴14 𝐴23 = 0 , 1 (824) С геометрической точки зрения эта формула вычисляет объём 𝑛мерного параллелепипеда через объёмы его 𝑚мерных и (𝑛 − 𝑚)мерных граней. 114 §8 Определители которое получается если разложить по первым двум строкам равный нулю определитель 4 × 4 𝐴 матрицы . (𝐴) Упражнение 8.15. Убедитесь в этом и для любых шести чисел 𝐴𝑖𝑗 , удовлетворяющих соотно шению (824), явно предъявите 2 × 4 матрицу 𝐴 с 2 × 2 минорами 𝐴𝑖𝑗 . Это согласуется с предл. 8.8 на стр. 112: если обозначить через 𝑒1 , 𝑒2 , 𝑒3 , 𝑒4 стандартный базис координатного пространства 𝕜4 , то квадратичная форма 𝜔 = ∑1⩽𝑖<𝑗⩽4 𝐴𝑖𝑗 ⋅ 𝑒𝑖 ∧ 𝑒𝑗 имеет квадрат 𝜔 ∧ 𝜔 = 2(𝐴12 𝐴34 − 𝐴13 𝐴24 + 𝐴14 𝐴23 ) ⋅ 𝑒1 ∧ 𝑒2 ∧ 𝑒3 ∧ 𝑒4 , и по предл. 8.8 соотношение (824) означает, что 𝜔 = 𝑎1 ∧ 𝑎2 для некоторых векторов 𝑎1 = 𝑎11 𝑒1 + 𝑎12 𝑒2 + 𝑎13 𝑒3 + 𝑎14 𝑒4 𝑎2 = 𝑎21 𝑒1 + 𝑎22 𝑒2 + 𝑎23 𝑒3 + 𝑎24 𝑒4 , 𝑎1𝑖 𝑎1𝑗 ⋅ 𝑒 ∧ 𝑒 имеет коэффициентами как раз 2 × 2 миноры 2 × 4 (𝑎2𝑖 𝑎2𝑗 ) 𝑖 𝑗 матрицы, составленной из координат векторов 𝑎1 и 𝑎2 . но 𝑎1 ∧ 𝑎2 = ∑1⩽𝑖<𝑗⩽4 det Пример 8.10 (определитель пучка матриц) Линейная оболочка пары непропорциональных квадратных матриц 𝐴, 𝐵 ∈ Mat𝑛×𝑛 (𝕜) называ ется пучком матриц и обозначается (𝐴𝐵). Таким образом, всякая матрица из пучка (𝐴𝐵) имеет вид 𝑡0 𝐴 + 𝑡1 𝐵, где 𝑡0 , 𝑡1 ∈ 𝕜, а её определитель det(𝑡0 𝐴 + 𝑡1 𝐵) является однородным многочленом степени 𝑛 от 𝑡0 , 𝑡1 . Покажем, что коэффициент этого многочлена при 𝑡0𝑘 𝑡1𝑛−𝑘 равен ∑ ̂ , 𝑎𝐼𝐽 𝑏𝐼𝐽 (825) 𝐼𝐽 где суммирование идёт по всем 𝑘элементным подмножествам 𝐼 , 𝐽 ⊂ {1, … , 𝑛}. Для этого обозначим через 𝑎1 , 𝑎2 , … , 𝑎𝑛 и 𝑏1 , 𝑏2 , … , 𝑏𝑛 столбцы матриц 𝐴 и 𝐵, понимаемые как векторы координатного пространства 𝕜𝑛 со стандартным базисом 𝑒1 , … , 𝑒𝑛 . Тогда (𝑡0 𝑎1 + 𝑡1 𝑏1 ) ∧ … ∧ (𝑡0 𝑎𝑛 + 𝑡1 𝑏𝑛 ) = det(𝑡0 𝐴 + 𝑡1 𝐵) 𝑒1 ∧ 𝑒2 ∧ … ∧ 𝑒𝑛 . Моном 𝑡0𝑘 𝑡1𝑛−𝑘 возникает в левой части при выборе первого слагаемого в какихнибудь 𝑘 из пе ремножаемых скобок и второго слагаемого в остальных 𝑛 − 𝑘 скобках. Если обозначить номера этих 𝑘 скобок через 𝐼 = (𝑖1 , 𝑖2 , … , 𝑖𝑘 ) то вклад в коэффициент при 𝑡0𝑘 𝑡1𝑛−𝑘 будет равен (−1) 𝑘(𝑘+1) +|𝐼| 2 𝑎𝐼 ∧ 𝑏𝐼̂ = (−1) 𝑘(𝑘+1) +|𝐼| 2 (∑ 𝑒𝐽 𝑎𝐽𝐼 ) ∧ (∑ 𝑒𝐾 𝑏𝐾𝐼̂ ) = 𝐽 = (−1) 𝑘(𝑘+1) +|𝐼| 2 ∑ 𝐾 𝑒𝐽 ∧ 𝑒𝐾 ⋅ 𝑎𝐽𝐼 𝑏𝐾𝐼̂ = 𝑒1 ∧ 𝑒2 ∧ … ∧ 𝑒𝑛 ⋅ 𝐽𝐾 (−1)|𝐼|+|𝐽| 𝑎𝐽𝐼 𝑏𝐽̂𝐼̂ . ∑ 𝐽 Полный коэффициент при 𝑡0𝑘 𝑡1𝑛−𝑘 в det(𝑡0 𝐴 + 𝑡1 𝐵) получается суммированием таких подобных слагаемых по всем наборам 𝐼 из 𝑘 возрастающих номеров, что и даёт формулу (825). В обозна чениях из (822) её можно переписать в виде 𝑛 det(𝑡0 𝐴 + 𝑡1 𝐵) = ∑ 𝑘=0 tr (𝛬𝑘 𝐴 ⋅ 𝛬𝑛−𝑘 𝐵̂ 𝑡 ) 𝑡0𝑘 𝑡1𝑛−𝑘 . (826) §9. Линейные операторы 9.1. Пространство с оператором. Пусть 𝕜 — произвольное поле, 𝑉 — конечномерное вектор ное пространство над 𝕜, а 𝐹 ∶ 𝑉 → 𝑉 — линейный эндоморфизм пространства 𝑉 . Мы будем называть пару (𝐹 , 𝑉 ) пространством с оператором или просто линейным оператором над 𝕜. Линейное отображение 𝐶 ∶ 𝑈1 → 𝑈2 между пространствами с операторами (𝐹1 , 𝑈1 ) и (𝐹2 , 𝑈2 ) называется гомоморфизмом, если 𝐹2 ∘ 𝐶 = 𝐶 ∘ 𝐹1 , т. е. диаграмма линейных отображений 𝑈1 O 𝐶 /𝑈 O2 𝐹1 𝑈1 𝐹2 𝐶 /𝑈 2 коммутативна1 . Если при этом отображение 𝐶 биективно, операторы 𝐹1 и 𝐹2 называются изо морфными или подобными. Таким образом, подобие операторов 𝐹1 и 𝐹2 означает равенство 𝐹2 = 𝐶𝐹1 𝐶−1 для некоторого обратимого линейного отображения 𝐶 . В этой ситуации также говорят, что 𝐹2 получается из 𝐹1 сопряжением посредством 𝐶 . Подпространство 𝑈 ⊂ 𝑉 называется 𝐹 инвариантным, если 𝐹 (𝑈) ⊂ 𝑈 . В этой ситуации пара (𝐹 |𝑈 , 𝑈) тоже является пространством с оператором и вложение 𝑈 ↪ 𝑉 является гомомор физмом пространств с операторами. Оператор, не имеющий инвариантных подпространств, отличных от нуля и всего пространства, называется неприводимым или простым. Упражнение 9.1. Покажите, что оператор умножения на класс [𝑡] в фактор кольце ℝ[𝑡]∕(𝑡2 + 1) неприводим. Оператор 𝐹 ∶ 𝑉 → 𝑉 называется разложимым, если пространство 𝑉 можно разложить в пря мую сумму двух ненулевых 𝐹 инвариантных подпространств, и неразложимым — в противном случае. Если оператор неприводим, то он и неразложим. Обратное неверно: Упражнение 9.2. Покажите, что при всех 𝑛 ⩾ 1 оператор умножения на класс [𝑡] в фактор кольце 𝕜[𝑡]∕(𝑡𝑛 ) приводим, но неразложим. Таким образом, над любым полем 𝕜 имеются неразложимые пространства с оператором любой размерности, и они могут быть приводимы. Каждое конечномерное разложимое пространство с оператором является прямой суммой неразложимых инвариантных подпространств. Упражнение 9.3. Покажите, что двойственные операторы2 𝐹 ∶ 𝑉 → 𝑉 , 𝐹∗ ∶ 𝑉∗ → 𝑉∗ либо оба разложимы, либо оба неразложимы. Замечание 9.1. (классификация пространств с оператором) Над произвольным полем 𝕜 каж дое конечномерное неразложимое пространство с оператором изоморфно оператору умноже ния на класс [𝑡] в кольце вычетов 𝕜[𝑡]∕(𝑝𝑚 ), где 𝑝 ∈ 𝕜[𝑡] — неприводимый приведённый мно гочлен, а 𝑚 ∈ ℕ, и все такие пространства не изоморфны друг другу при разных 𝑝 или 𝑚. Про странство 𝕜[𝑡] ∕ (𝑝𝑚 ) неприводимо если и только если 𝑚 = 1. Произвольное пространство с оператором изоморфно оператору умножения на класс [𝑡] в прямой сумме фактор колец вида3 1 Диаграмма отображений между множествами называется коммутативной, если композиции отоб ражений вдоль любых двух путей с общим началом и концом одинаковы. 2 См. n∘ 7.3 на стр. 88. 3 В сумме допускаются повторяющиеся слагаемые. 115 116 §9 Линейные операторы 𝕜[𝑡]∕(𝑝𝑚 ), и такое представление пространства с оператором единственно с точностью до пе рестановки слагаемых. Доказательства всех этих фактов обычно даются в курсе алгебры1 . Мы не собираемся использовать данную классификацию в полной общности, а все её следствия, которые нам понадобятся, будут независимо установлены нами по мере необходимости. 9.1.1. Характеристический многочлен. Пусть оператор 𝐹 ∶ 𝑉 → 𝑉 имеет матрицу 𝐹𝒗 в ка ком либо базисе 𝒗 пространства 𝑉 . Её характеристический многочлен det(𝑡𝐸 − 𝐹𝒗 ) называется характеристическим многочленом оператора 𝐹 и обозначается 𝜒𝐹 (𝑡). Он не зависит от выбора базиса, в котором пишется матрица оператора, поскольку в любом другом базисе 𝒘 = 𝒗 𝐶𝒗𝒘 −1 матрица2 𝐹𝒘 = 𝐶𝒘𝒗 𝐹𝒗 𝐶𝒗𝒘 = 𝐶𝒘𝒗 𝐹𝒗 𝐶𝒘𝒗 подобна матрице 𝐹𝒗 , а любые две подобные матрицы 𝐹 и −1 𝐺 = 𝐶𝐹𝐶 имеют равные характеристические многочлены: 𝜒𝐺 (𝑡) = det(𝑡𝐸 − 𝐺 ) = det(𝑡𝐶𝐸𝐶−1 − 𝐶𝐹𝐶−1 ) = det(𝐶 (𝑡𝐸 − 𝐹 )𝐶−1 ) = = det 𝐶 ⋅ det(𝑡𝐸 − 𝐹 ) ⋅ det−1 𝐶 = det(𝑡𝐸 − 𝐹 ) = 𝜒𝐹 (𝑡) . В частности, подобные операторы тоже имеют равные характеристические многочлены. Упражнение 9.4. Для любого многочлена 𝑓 ∈ 𝕜[𝑡] со старшим коэффициентом 1 покажи те, что характеристический многочлен оператора умножения на класс [𝑡] в фактор кольце 𝕜[𝑡]∕(𝑓) равен 𝑓. Пример 9.1 (характеристический многочлен разложимого оператора) Пусть пространство с оператором (𝐹 , 𝑉 ) является прямой суммой пространств с операторами (𝐺 , 𝑈) и (𝐻, 𝑊 ). Тогда 𝜒𝐹 (𝑡) = 𝜒𝐺 (𝑡) ⋅ 𝜒𝐻 (𝑡), поскольку в любом базисе, согласованном с разложе 𝑡𝐸 − 𝐺 нием 𝑉 = 𝑈 ⊕ 𝑊 , матрица оператора 𝑡𝐸 − 𝐹 имеет блочный вид , и результат ( 0 𝑡𝐸 − 𝐻) вытекает из упр. 8.13 на стр. 113. 9.1.2. Аннулирующие многочлены. Линейный оператор 𝐹 ∶ 𝑉 → 𝑉 , действующий в век торном пространстве 𝑉 над произвольном полем 𝕜, можно подставить вместо переменной 𝑡 в любой многочлен 𝑓(𝑡) = 𝑎0 + 𝑎1 𝑡 + ⋯ + 𝑎𝑚 𝑡𝑚 ∈ 𝕜[𝑡]. Результатом такой подстановки является линейный оператор 𝑓(𝐹 ) ≝ 𝑎0 Id𝑉 + 𝑎1 𝐹 + ⋯ + 𝑎𝑚 𝐹𝑚 ∈ End(𝑉 ). Подстановка фиксированного оператора 𝐹 ∈ End 𝑉 во всевозможные многочлены задаёт гомоморфизм 𝕜алгебр ev𝐹 ∶ 𝕜[𝑡] → End(𝑉) , 𝑓 ↦ 𝑓 (𝐹 ) , который называется гомоморфизмом вычисления многочленов на операторе 𝐹 . Многочлены, ле жащие в ядре этого гомоморфизма, т. е. такие 𝑓 ∈ 𝕜[𝑡], что 𝑓(𝐹 ) = 0, называются аннулирую щими оператор 𝐹 . Если dim 𝑉 < ∞, алгебра End 𝑉 конечномерна как векторное пространство над 𝕜, а алгебра 𝕜[𝑡] бесконечномерна. Поэтому ker ev𝐹 ≠ 0, т. е. любой оператор на конечно мерном пространстве аннулируется некоторым ненулевым многочленом. В силу тождества Га мильтона – Кэли3 примером такого многочлена является характеристический многочлен 𝜒𝐹 (𝑡). 1 Например, см. лекции http://gorod.bogomolovlab.ru/ps/stud/algebra1/2021/lec_09.pdf и http://gorod.bogomolovlab.ru/ps/stud/algebra1/2021/lec_10.pdf моего курса алгебры http://gorod.bogomolovlab.ru/ps/stud/algebra1/2021/list.html. 2 3 См. формулу (515) на стр. 65. См. n∘ 8.2.1 на стр. 103. 117 9.1. Пространство с оператором Поскольку все идеалы1 кольца 𝕜[𝑡] главные2 , идеал ker ev𝐹 = (𝜇𝐹 ) состоит из всех многочленов, делящихся на некоторый многочлен 𝜇𝐹 , который однозначно задаётся как ненулевой много член минимальной степени со старшим коэффициентом 1, такой что 𝜇𝐹 (𝐹 ) = 0 в End(𝑉 ). Упражнение 9.5 (по алгебре). Убедитесь в этом. Многочлен 𝜇𝐹 (𝑡) называется минимальным многочленом оператора 𝐹 . Пример 9.2 (отыскание минимального многочлена) Для каждого вектора 𝑣 ∈ 𝑉 и линейного оператора 𝐹 ∶ 𝑉 → 𝑉 существует такой приведённый многочлен наименьшей степени от оператора 𝐹 , который аннулирует вектор 𝑣 . Чтобы напи сать его явно, надо найти наименьшее такое 𝑘 ∈ ℕ, что вектор 𝐹𝑘 𝑣 линейно выражается через векторы 𝑣 , 𝐹𝑣 , … , 𝐹𝑘−1 𝑣 . Если это выражение имеет вид 𝐹𝑘 𝑣 = 𝜇1 𝐹𝑘−1 𝑣 + ⋯ + 𝜇𝑘−1 𝐹𝑣 + 𝜇𝑘 𝑣 , то искомый многочлен 𝜇𝑣,𝐹 (𝑡) = 𝑡𝑘 − 𝜇1 𝑡𝑘−1 − ⋯ − 𝜇𝑘−1 𝑡 − 𝜇𝑘 . Упражнение 9.6. Убедитесь, что любой аннулирующий оператор 𝐹 многочлен делится на все многочлены 𝜇𝑣,𝐹 , где 𝑣 ∈ 𝑉 . Таким образом, минимальный многочлен 𝜇𝐹 оператора 𝐹 представляет собою наименьшее об щее кратное многочленов 𝜇𝑣,𝐹 по всем 𝑣 ∈ 𝑉 . Очевидно, что для отыскания этого наименьшего общего кратного достаточно ограничиться только векторами 𝑣 из некоторого базиса 𝑒1 , … , 𝑒𝑛 пространства 𝑉 . Упражнение 9.7. Убедитесь в этом. Вычислим, к примеру, минимальный многочлен оператора 𝐹 ∶ ℚ4 → ℚ4 , заданного в стандарт ном базисе 𝑒1 , … , 𝑒4 матрицей 3⎞ ⎛−2 −3 3 ⎜4 6 −4 −4⎟ 𝐴=⎜ 1 2 0 −1⎟ ⎜ ⎟ 3 −3 −2⎠ ⎝3 Векторы3 ⎛1⎞ ⎜0⎟ 𝑒1 = ⎜ ⎟ , ⎜ ⎟ ⎝0⎠ ⎛−2⎞ ⎜4⎟ 𝐹𝑒1 = ⎜ ⎟ , 1 ⎜ ⎟ ⎝3⎠ ⎛4⎞ ⎜0⎟ 𝐹2 𝑒1 = ⎜ ⎟ 3 ⎜ ⎟ ⎝−3⎠ линейно независимы. Чтобы выяснить, выражается ли через них вектор4 ⎛−8⎞ ⎜ 16 ⎟ 𝐹3 𝑒1 = ⎜ ⎟ , 7 ⎜ ⎟ ⎝9⎠ 1 См. начало лекции http://gorod.bogomolovlab.ru/ps/stud/algebra1/1314/lec05.pdf. См. Предложение 5.1 на стр. 74 той же лекции. 3 Векторы 𝐹𝑒1 и 𝐹2 𝑒1 суть первые столбцы матриц 𝐴 и 𝐴2 . 4 Это первый столбец матрицы 𝐴3 . 2 118 §9 Линейные операторы необходимо решить неоднородную систему с расширенной матрицей ⎛1 −2 4 −8⎞ ⎜0 4 0 16 ⎟ ⎜0 1 3 7⎟ ⎜ ⎟ ⎝0 3 −3 9 ⎠ Методом Гаусса преобразуем эту матрицу к приведённому ступенчатому виду ⎛1 0 0 −4⎞ ⎜0 1 0 4 ⎟ . ⎜ ⎟ ⎝0 0 1 1 ⎠ и получаем решение (−4, 4, 1), т. е. 𝐹3 𝑒1 = −4𝑒1 + 4𝐹𝑒1 + 𝐹2 𝑒1 . Таким образом, минимальный многочлен от оператора 𝐹 , аннулирующий вектор 𝑒1 , равен 𝐹3 − 𝐹2 − 4𝐹 + 4𝐸 . Вычисляя 3 −3 −3⎞ ⎛4 ⎜0 4 0⎟ 𝐴2 = ⎜ 3 6 −2 −3⎟ ⎜ ⎟ 4⎠ ⎝−3 −3 3 9 9 ⎞ ⎛−8 −9 ⎜ 16 24 −16 −16⎟ и 𝐴3 = ⎜ , 7 14 −6 −7 ⎟ ⎜ ⎟ 9 −9 −8 ⎠ ⎝9 убеждаемся, что 𝐴3 − 𝐴2 − 4𝐴 + 4𝐸 = 0. Тем самым, 𝜇𝐹 = 𝑡3 − 𝑡2 − 4𝑡 + 4. Теорема 9.1 (теорема о разложении) Пусть линейный оператор 𝐹 ∶ 𝑉 → 𝑉 на произвольном1 векторном пространстве 𝑉 над любым полем 𝕜 аннулируется многочленом 𝑞 ∈ 𝕜[𝑡], который раскладывается в 𝕜[𝑡] в произведение 𝑞 = 𝑞1 ⋅ 𝑞2 ⋅ ⋯ ⋅ 𝑞𝑟 попарно взаимно простых многочленов 𝑞𝑖 ∈ 𝕜[𝑡]. Положим 𝑄𝑗 = 𝑞∕𝑞𝑗 . Тогда ker 𝑞𝑗 (𝐹 ) = im 𝑄𝑗 (𝐹 ) для каждого 𝑗, все эти подпространства 𝐹 инвариантны, и пространство 𝑉 является прямой суммой тех из них, что отличны от нуля. Доказательство. Так как 𝑞 (𝐹 ) = 𝑞𝑖 (𝐹 ) ∘ 𝑄𝑗 (𝐹 ) = 0, имеем включение im 𝑄𝑖 (𝐹 ) ⊂ ker 𝑞𝑖 (𝐹 ). По этому достаточно показать, что 𝑉 линейно порождается образами операторов 𝑄𝑖 (𝐹 ), а сумма ядер ker 𝑞𝑖 (𝐹 ) прямая2 , т. е. ker 𝑞𝑖 (𝐹 ) ∩ ∑𝑗≠𝑖 ker 𝑞𝑗 (𝐹 ) = 0 для всех 𝑖 . Первое вытекает из того, что нод(𝑄1 , … , 𝑄𝑟 ) = 1, а значит, существуют такие ℎ1 , … , ℎ𝑟 ∈ 𝕜[𝑡], что 1 = ∑ 𝑄𝑗 (𝑡)ℎ𝑗 (𝑡). Под ставляя в это равенство 𝑡 = 𝐹 и применяя обе части к произвольному вектору 𝑣 ∈ 𝑉 , получаем разложение 𝑣 = 𝐸𝑣 = ∑ 𝑄𝑗 (𝐹 )ℎ𝑗 (𝐹 )𝑣 ∈ ∑ im 𝑄𝑗 (𝐹 ). Второе вытекает из взаимной простоты 𝑞𝑖 и 𝑄𝑖 , в силу которой существуют такие 𝑔, ℎ ∈ 𝕜[𝑡], что 1 = 𝑔(𝑡) ⋅ 𝑞𝑖 (𝑡) + ℎ(𝑡) ⋅ 𝑄𝑖 (𝑡). Подста вим сюда 𝑡 = 𝐹 и применим обе части полученного равенства 𝐸 = 𝑔(𝐹 ) 𝑞𝑖 (𝐹 ) + ℎ(𝐹 ) ∘ 𝑄𝑖 (𝐹 ) к произвольному вектору 𝑣 ∈ ker 𝑞𝑖 (𝐹 ) ∩ ∑𝑗≠𝑖 ker 𝑞𝑗 . Так как ker 𝑞𝑗 (𝐹 ) ⊂ ker 𝑄𝑖 (𝐹 ) при всех 𝑗 ≠ 𝑖 , получим 𝑣 = 𝐸𝑣 = 𝑔(𝐹 ) 𝑞𝑖 (𝐹 ) 𝑣 + ℎ(𝐹 ) 𝑄𝑖 (𝐹 ) 𝑣 = 0, что и требовалось. Пример 9.3 (проекторы) Линейный оператор 𝜋 ∶ 𝑉 → 𝑉 называется идемпотентом или проектором, если он аннули руется многочленом 𝑡2 − 𝑡 = 𝑡(𝑡 − 1), т. е. удовлетворяет соотношению 𝜋2 = 𝜋 . По теор. 9.1 1 2 Возможно даже бесконечномерном. См. опр. 4.1 и предл. 4.1 на стр. 51. 119 9.2. Собственные подпространства образ любого идемпотента 𝜋 ∶ 𝑉 → 𝑉 совпадает с подпространством его неподвижных векто ров: im 𝜋 = ker(𝜋 − Id𝑉 ) = {𝑣 | 𝜋(𝑣 ) = 𝑣 }, и всё пространство распадается в прямую сум му 𝑉 = ker 𝜋 ⊕ im 𝜋. Тем самым, оператор 𝜋 проектирует 𝑉 на im 𝜋 вдоль ker 𝜋. Отметим, что оператор Id𝑉 − 𝜋 тоже является идемпотентом и проектирует 𝑉 на ker 𝜋 вдоль im 𝜋. Таким об разом, задание прямого разложения 𝑉 = 𝑈 ⊕ 𝑊 равносильно заданию пары идемпотентных эндоморфизмов 𝜋1 = 𝜋12 и 𝜋2 = 𝜋22 пространства 𝑉 , связанных соотношениями 𝜋1 + 𝜋2 = 1 и 𝜋1 𝜋2 = 𝜋2 𝜋1 = 0. Упражнение 9.8. Выведите из этих соотношений, что ker 𝜋1 = im 𝜋2 и im 𝜋1 = ker 𝜋2 . Пример 9.4 (инволюции) Линейный оператор 𝜎 ∶ 𝑉 → 𝑉 называется инволюцией, если 𝜎2 = Id𝑉 . Тождественная инво люция 𝜎 = Id𝑉 называется тривиальной. Если char 𝕜 ≠ 2, то аннулирующий инволюцию 𝜎 многочлен 𝑡2 − 1 = (𝑡 + 1)(𝑡 − 1) является произведением различных линейных множителей. Поэтому над таким полем 𝑉 = 𝑉+ ⊕ 𝑉− , где 𝑉+ = ker(𝜎 − 𝐸 ) = im(𝜎 + Id𝑉 ) = {𝑣 ∈ 𝑉 | 𝜎𝑣 = 𝑣} 𝑉− = ker(𝜎 + 𝐸 ) = im(𝜎 − Id𝑉 ) = {𝑣 ∈ 𝑉 | 𝜎𝑣 = −𝑣} . Произвольный вектор 𝑣 = 𝑣+ + 𝑣− пространства 𝑉 имеет в этом разложении компоненты 𝑣+ = 𝑣 + 𝜎𝑣 ∈ 𝑉+ 2 и 𝑣− = 𝑣 − 𝜎𝑣 ∈ 𝑉− . 2 9.2. Собственные подпространства. Ненулевой вектор 𝑣 ∈ 𝑉 называется собственным век тором линейного оператора 𝐹 ∶ 𝑉 → 𝑉 если 𝐹 (𝑣 ) = 𝜆𝑣 для некоторого числа 𝜆 ∈ 𝕜. Это число называется собственным значением или собственным числом оператора 𝐹 на собственном век торе 𝑣 . Собственные векторы с заданным собственным числом 𝜆 образуют вместе с нулевым вектором 𝐹 инвариантное подпространство 𝑉𝜆 ≝ {𝑣 ∈ 𝑉 | 𝐹 (𝑣) = 𝜆𝑣} = ker(𝜆 Id𝑉 − 𝐹 ) , (91) которое называется собственным подпространством оператора 𝐹 . Поскольку ker(𝜆 Id𝑉 − 𝐹 ) ≠ 0 если и только если det(𝜆 Id𝑉 − 𝐹 ) = 𝜒𝐹 (𝜆) = 0, подпространство (91) отлично от нуля тогда и только тогда, когда число 𝜆 является корнем характеристического многочлена оператора 𝐹 . Та ким образом, множество собственных чисел оператора 𝐹 есть множество корней многочлена 𝜒𝐹 в поле 𝕜. Оно называется спектром оператора 𝐹 в поле 𝕜 и обозначается Spec(𝐹 ) или Spec𝕜 (𝐹 ), если важно явно указать поле. Так как deg 𝜒𝐹 = dim 𝑉 , количество различных собственных чи сел не превышает размерности пространства: | Spec(𝐹 )| ⩽ dim 𝑉 . Над алгебраически замкну тым полем 𝕜 спектр всегда не пуст. Предложение 9.1 Над алгебраически замкнутым полем 𝕜 каждый линейный оператор обладает хотя бы одним ненулевым собственным подпространством. Предложение 9.2 Множество корней любого многочлена, аннулирующего оператор 𝐹 , содержит Spec 𝐹 . 120 §9 Линейные операторы Доказательство. Ограничение оператора 𝐹 на собственное подпространство 𝑉𝜆 является гомо тетией с коэффициентом 𝜆. Поэтому для любого многочлена 𝑔 ∈ 𝕜[𝑡] оператор 𝑔(𝐹 ) действует на 𝑉𝜆 как гомотетия с коэффициентом 𝑔(𝜆). Если 𝑔(𝜆) ≠ 0, то 𝑔(𝐹 )|𝑉𝜆 ≠ 0. Предложение 9.3 Любой набор собственных векторов с попарно различными собственными числами линейно независим. Доказательство. Пусть собственные векторы 𝑒1 , … , 𝑒𝑚 имеют попарно разные собственные числа 𝜆1 , … , 𝜆𝑚 и линейно зависимы. Рассмотрим зависимость, содержащую минимально воз можное число векторов, и перенумеруем их так, чтобы это были 𝑒1 , … , 𝑒𝑘 . Тогда 𝑘 ⩾ 2 и 𝑒𝑘 = 𝑥1 𝑒1 + 𝑥2 𝑒2 + ⋯ + 𝑥𝑘−1 𝑒𝑘−1 , где все 𝑥𝑖 ∈ 𝕜 отличны от нуля. При этом 𝜆𝑘 𝑒𝑘 = 𝐹 (𝑒𝑘 ) = ∑ 𝑥𝑖 𝐹 (𝑒𝑖 ) = ∑ 𝑥𝑖 𝜆𝑖 𝑒𝑖 . Вычитая из этого равенства предыдущее, умноженное на 𝜆𝑘 , получаем более короткую линейную зависимость 0 = 𝑥1 (𝜆1 − 𝜆𝑘 ) ⋅ 𝑒1 + 𝑥1 (𝜆1 − 𝜆𝑘 ) ⋅ 𝑒2 + ⋯ + 𝑥𝑘−1 (𝜆𝑘−1 − 𝜆𝑘 ) ⋅ 𝑒𝑘−1 с ненулевыми коэффициентами. Противоречие. Следствие 9.1 Сумма собственных подпространств с разными собственными числами является прямой. Следствие 9.2 ∑𝜆∈Spec 𝐹 dim 𝑉𝜆 ⩽ dim 𝑉 . Упражнение 9.9. Приведите пример оператора, для которого это неравенство строгое. 9.2.1. Диагонализуемые операторы. Оператор 𝐹 ∶ 𝑉 → 𝑉 называется диагонализуемым, если в 𝑉 имеется базис, в котором 𝐹 записывается диагональной матрицей. Такой базис состоит из собственных векторов оператора 𝐹 , и элементы диагональной матрицы являются собствен ными значениями оператора 𝐹 , причём каждое число 𝜆 ∈ Spec 𝐹 встречается на диагонали ров но столько раз, какова кратность корня 𝑡 = 𝜆 в характеристическом многочлене 𝜒𝐹 (𝑡) и какова размерность собственного подпространства 𝑉𝜆 . Таким образом, с точностью до перестановки диагональных элементов диагональная матрица диагонализуемого оператора 𝐹 не зависит от выбора базиса, в котором оператор 𝐹 имеет диагональную матрицу. Предложение 9.4 Следующие свойства оператора 𝐹 ∶ 𝑉 → 𝑉 эквивалентны: 1) 𝐹 диагонализуем 2) пространство 𝑉 линейно порождается собственными векторами оператора 𝐹 3) характеристический многочлен 𝜒𝐹 (𝑡) полностью раскладывается на линейные множите ли в 𝕜[𝑡], и кратность каждого корня 𝜆 многочлена 𝜒𝐹 равна размерности собственного подпространства 𝑉𝜆 4) оператор 𝐹 аннулируется многочленом, который полностью раскладывается в 𝕜[𝑡] на попарно различные линейные множители. 121 9.2. Собственные подпространства Доказательство. Эквивалентность свойств (1) и (2), а также импликация (1) ⇒ (3) очевид ны. Покажем, что (3) ⇒ (1). Из (3) вытекает, что ∑𝜆∈Spec 𝐹 dim 𝑉𝜆 = deg 𝜒𝐹 = dim 𝑉 . Поэто му 𝑉 = ⨁𝜆∈Spec 𝐹 𝑉𝜆 в силу сл. 9.1. Теперь покажем, что (3) ⇒ (4). Так как каждое собствен ное подпространство 𝑉𝜆 аннулируется оператором (𝐹 − 𝜆Id𝑉 ), всё пространство 𝑉 аннулируется композицией ∏𝜆∈Spec 𝐹 (𝐹 − 𝜆Id𝑉 ), т. е. оператор 𝐹 аннулируется многочленом ∏𝜆∈Spec 𝐹 (𝑡 − 𝜆), что и утверждается в (4). Импликация (4) ⇒ (1) следует из теоремы разложении1 : если опера тор 𝐹 аннулируется произведением ∏𝜇 (𝑡 − 𝜇), в котором 𝜇 пробегает без повторений некоторое конечное подмножество в 𝕜, то 𝑉 является прямой суммой тех подпространств ker(𝐹 − 𝜇Id), ко торые отличны от нуля, т. е. собственных подпространств оператора 𝐹 . Следствие 9.3 Если оператор 𝐹 ∶ 𝑉 → 𝑉 диагонализуем, то его ограничение на любое инвариантное подпро странство тоже диагонализуемо на этом подпространстве. Доказательство. Это вытекает из свойства (4) предл. 9.4. 9.2.2. Перестановочные операторы. Если линейные операторы 𝐹 , 𝐺 ∶ 𝑉 → 𝑉 на вектор ном пространстве 𝑉 над произвольным полем 𝕜 коммутируют друг с другом, то ядро и образ любого многочлена от оператора 𝐹 переводятся оператором 𝐺 в себя, поскольку 𝑓(𝐹 ) 𝑣 = 0 𝑣 = 𝑓(𝐹 ) 𝑤 ⇒ ⇒ 𝑓(𝐹 ) 𝐺 𝑣 = 𝐺 𝑓(𝐹 ) 𝑣 = 0 𝐺𝑣 = 𝐺 𝑓(𝐹 ) 𝑤 = 𝑓(𝐹 ) 𝐺𝑤 . В частности, все собственные подпространства 𝑉𝜆 = ker(𝐹 − 𝜆𝐸 ) инвариантны относительно любого перестановочного с 𝐹 оператора 𝐺 . Предложение 9.5 В конечномерном векторном пространстве 𝑉 над алгебраически замкнутым полем 𝕜 любое множество коммутирующих друг с другом операторов обладает общим для всех операторов собственным вектором. Над произвольным полем 𝕜 любое множество коммутирующих друг с другом диагонализуемых операторов можно одновременно диагонализовать в одном общем для всех операторов базисе. Доказательство. Индукция по dim 𝑉 . Если все операторы скалярны (что так при dim 𝑉 = 1), то доказывать нечего — подойдут, соответственно, любой ненулевой вектор и любой базис. Если среди операторов есть хоть один нескалярный оператор 𝐹 , то над замкнутым полем у него есть ненулевое собственное подпространство строго меньшей, чем 𝑉 размерности, а в диагонализу емом случае 𝑉 является прямой суммой таких собственных подпространств. Каждое собствен ное подпространство оператора 𝐹 инвариантно для всех операторов, причём если операторы диагонализуемы на всём пространстве, то их ограничения на собственные подпространства оператора 𝐹 останутся диагонализуемы по сл. 9.3. Применяя к собственному подпространству (а в диагонализуемом случае — ко всем собственным подпространствам) оператора 𝐹 предпо ложение индукции, получаем требуемое. 1 См. теор. 9.1 на стр. 118. 122 §9 Линейные операторы Пример 9.5 (конечные группы операторов) Если 𝑚 линейных операторов на конечномерном пространстве 𝑉 над алгебраически замкнутым полем 𝕜 характеристики char 𝕜 > 𝑚 образуют группу 𝐺 , то каждый из этих операторов аннули руется многочленом1 𝑡𝑚 − 1, который раскладывается в произведение 𝑚 попарно различных линейных множителей2 . Поэтому каждый оператор в группе 𝐺 диагонализуем. Все операторы из группы 𝐺 одновременно диагонализуются в одном общем базисе если и только если группа 𝐺 абелева. 9.3. Нильпотентные операторы. Оператор 𝐹 ∶ 𝑉 → 𝑉 называется нильпотентным, если он аннулируется многочленом вида 𝑡𝑚 , т. е. если 𝐹𝑚 = 0 для некоторого 𝑚 ∈ ℕ. Поскольку ми нимальный многочлен оператора 𝐹 является делителем 𝑡𝑚 и имеет степень не больше степени характеристического многочлена, которая равна dim 𝑉 , в определении нильпотентного опера тора можно без ограничения общности считать, что 𝑚 ⩽ dim 𝑉 . Упражнение 9.10. Покажите, что над алгебраически замкнутым полем 𝕜 оператор 𝐹 нильпо тентен тогда и только тогда, когда Spec 𝐹 = {0}. Определение 9.1 (жорданов базис нильпотентного оператора) Базис пространства 𝑉 с нильпотентным оператором 𝐹 ∶ 𝑉 → 𝑉 называется циклическим (или жордановым), если его векторы можно расставить в клетки некоторой диаграммы Юнга 𝜈 так, чтобы 𝐹 аннулировал все векторы самого левого столбца и переводил каждый из оставшихся векторов в соседний слева: ↭ ←•←•←•←•←•←• ←•←•←•←•←• ←•←•←• ←•←•←• ←•←• (92) Диаграмма (92) называется цикловым типом жорданова базиса. Цепочки базисных векторов, расположенные в её строках, называются жордановыми цепочками. Таким образом, матрица нильпотентного оператора в жордановом базисе состоит из расположенных вдоль главной диа гонали квадратных блоков вида ⎛0 1 0 ⎜0 0 1 ⎜ 𝐽𝑚 (0) ≝ ⎜⋮ ⋱ ⋱ ⎜0 ⋱ ⎜ ⋯ ⎝ ⋯ ⋱ ⋱ ⋱ 0⎞ ⋮⎟ ⎟ 0⎟ , 1⎟ ⎟ 0⎠ где 𝑚 ∈ ℕ — размер блока, (93) которые биективно соответствуют строкам диаграммы (92) и имеют размеры, равные длинам соответствующих строк. Все остальные элементы матрицы нулевые. 1 Поскольку порядок любого элемента конечной группы делит порядок этой группы, см. раздел 11.1.1 на стр. 149 лекции http://gorod.bogomolovlab.ru/ps/stud/algebra1/2021/lec_11.pdf. 2 Так как производная 𝑚𝑡𝑚−1 многочлена 𝑡𝑚 − 1 отлична от нуля и взаимно проста с этим много членом, она не имеет с ним общих корней. Следовательно, у многочлена нет кратных корней. Cм. раз дел 3.3.2 на стр. 39 лекции http://gorod.bogomolovlab.ru/ps/stud/algebra1/2021/lec_03.pdf. 123 9.4. Корневое разложение и функции от операторов Теорема 9.2 Каждый нильпотентный оператор 𝐹 на конечномерном векторном пространстве 𝑉 ≠ 0 обла дает жордановым базисом. Все жордановы базисы оператора 𝐹 имеют одинаковый цикловой тип1 , причём 𝑗й слева столбец диаграммы (92) состоит из dim ker 𝐹 𝑗 − dim ker 𝐹𝑗−1 клеток. Доказательство. Индукция по dim 𝑉 . Если 𝐹 = 0 (что так при dim 𝑉 = 1), то любой базис в 𝑉 является жордановым, и диаграмма Юнга (92) представляет собою один столбец высоты dim 𝑉 . Если dim 𝑉 > 1 и 𝐹 ≠ 0, то подпространство ker 𝐹 ⊂ 𝑉 отлично от нуля и от 𝑉 . Поэтому фактор 𝑊 = 𝑉 ∕ ker 𝐹 является ненулевым векторном пространством размерности строго меньшей, чем 𝑉 . Оператор 𝐹 корректно факторизуется до нильпотентного оператора 𝐹𝑊 ∶ 𝑊 → 𝑊 , [𝑣] ↦ [𝐹𝑣] . Упражнение 9.11. Убедитесь в этом. По предположению индукции, в пространстве 𝑉 существуют векторы 𝑤1 , … , 𝑤𝑚 , классы кото рых [𝑤1 ], … , [𝑤𝑚 ] по модулю ker 𝐹 образуют жорданов базис оператора 𝐹𝑊 . Образы этих векто ров 𝐹 (𝑤1 ), … , 𝐹 (𝑤𝑚 ) линейно независимы в 𝑉 , поскольку равенство 0 = 𝜆1 𝐹 (𝑤1 ) + ⋯ + 𝜆𝑚 𝐹 (𝑤𝑚 ) = 𝐹 (𝜆1 𝑤1 + ⋯ + 𝜆𝑚 𝑤𝑚 ) означает, что 𝜆1 𝑤1 + ⋯ + 𝜆𝑚 𝑤𝑚 ∈ ker 𝐹 , т. е. 𝜆1 [𝑤1 ] + ⋯ + 𝜆𝑚 [𝑤𝑚 ] = [0] в 𝑊 = 𝑉 ∕ ker 𝐹 , что возможно лишь если все 𝜆𝑖 = 0. Пусть классы [𝑤1 ], … , [𝑤𝑠 ] составляют первый столбец диаграм мы (92) для оператора 𝐹𝑊 . Тогда векторы 𝐹 (𝑤1 ), … , 𝐹 (𝑤𝑠 ) лежат в ker 𝐹 и линейно независимы. Дополняя их векторами 𝑢1 , … , 𝑢𝑟 до базиса в ker 𝐹 , получаем жорданов базис 𝑢1 , … , 𝑢𝑟 , 𝐹 (𝑤1 ), … , 𝐹 (𝑤𝑠 ), 𝑤1 , … , 𝑤𝑚 для исходного оператора 𝐹 ∶ 𝑉 → 𝑉 . Упражнение 9.12. Убедитесь в этом. Последнее утверждение теоремы вытекает из того, что жордановы базисные векторы, стоящие в первых 𝑗 столбцах диаграммы (92) для оператора 𝐹 , составляют базис в ker 𝐹 𝑗 . 9.4. Корневое разложение и функции от операторов. Для заданных числа 𝜆 ∈ 𝕜 и линейного оператора 𝐹 ∶ 𝑉 → 𝑉 множество 𝐾𝜆 ≝ {𝑣 ∈ 𝑉 | ∃ 𝑚 ∈ ℕ ∶ (𝜆 Id − 𝐹 )𝑚 𝑣 = 0} = ⋃ ker(𝜆 Id − 𝐹 )𝑚 (94) 𝑚⩾1 называется корневым подпространством оператора 𝐹 . Упражнение 9.13. Убедитесь, что 𝐾𝜆 ⊂ 𝑉 действительно является векторным подпростран ством и отлично от нуля если и только если 𝜆 ∈ Spec 𝐹 . Для каждого 𝜆 ∈ Spec 𝐹 имеется включение 𝑉𝜆 ⊆ 𝐾𝜆 , которое может быть как строгим, так и равенством. Из тождества Гамильтона – Кэли2 и теоремы разложении3 вытекает 1 Он называется цикловым типом оператора 𝐹 и обозначается 𝜈(𝐹 ). См. n∘ 8.2.1 на стр. 103. 3 См. теор. 9.1 на стр. 118. 2 124 §9 Линейные операторы Следствие 9.4 (теорема о корневом разложении) Пусть характеристический многочлен 𝜒𝐹 (𝑡) линейного оператора 𝐹 ∶ 𝑉 → 𝑉 на конечномерном векторном пространстве 𝑉 над полем 𝕜 полностью разлагается в 𝕜[𝑡] на линейные множители: 𝜒𝐹 (𝑡) = ∏𝜆∈Spec 𝐹 (𝑡 − 𝜆)𝑚𝜆 . Тогда 𝑉 = ⨁𝜆∈Spec 𝐹 𝐾𝜆 и 𝐾𝜆 = ker(𝜆 Id − 𝐹 )𝑚𝜆 для всех 𝜆 ∈ Spec 𝐹 . Доказательство. Разложение 𝜒𝐹 (𝑡) = ∏𝜆∈Spec 𝐹 (𝑡 − 𝜆)𝑚𝜆 удовлетворяет условиям теор. 9.1 на стр. 118 для 𝑞𝑖 = (𝑡 − 𝜆)𝑚𝜆 , откуда 𝑉 = ⨁𝜆∈Spec 𝐹 ker(𝜆 Id − 𝐹 )𝑚𝜆 . 9.4.1. Функции от операторов. Пусть линейный оператор 𝐹 действует на конечномерном векторном пространстве 𝑉 над полем ℝ или ℂ, которое мы обозначим через 𝕂. Всюду далее мы предполагаем, что 𝐹 аннулируется многочленом 𝛼 (𝑡) ∈ 𝕂[𝑡], который полностью разлагается над 𝕂 на линейные множители, т. е. 𝛼(𝑡) = (𝑡 − 𝜆1 )𝑚1 (𝑡 − 𝜆2 )𝑚2 ⋯ (𝑡 − 𝜆𝑠 )𝑚𝑠 , (95) где 𝜆𝑖 ≠ 𝜆𝑗 при 𝑖 ≠ 𝑗 и все 𝑚𝑖 ∈ ℕ. Мы полагаем 𝑚 = deg 𝛼 = 𝑚1 +⋯+ 𝑚𝑠 . Алгебра 𝒜 , состоящая из функций 𝑈 → 𝕂, заданных на какомнибудь подмножестве 𝑈 ⊂ 𝕂, содержащем все корни многочлена (95), называется алгебраически вычислимой на операторе 𝐹 , если 𝕂[𝑡] ⊂ 𝒜 и для каждого корня 𝜆 кратности 𝑘 многочлена (95) все функции 𝑓 ∈ 𝒜 определены в точке 𝜆 ∈ 𝕂 𝑑𝜈 𝑓 вместе с первыми 𝑘 − 1 производными 𝑓(𝜈) = 𝜈 и допускают разложение вида 𝑑𝑡 𝑓(𝑡) = 𝑓(𝜆) + 𝑓′ (𝜆) 𝑓(𝑘−1) (𝜆) (𝑡 − 𝜆 ) + ⋯ + (𝑡 − 𝜆)𝑘−1 + 𝑔𝜆 (𝑡) ⋅ (𝑡 − 𝜆)𝑘 , 1! (𝑘 − 1)! (96) где функция 𝑔𝜆 (𝑡) тоже лежит в алгебре 𝒜 . Если характеристический многочлен 𝜒𝐹 (𝑡) полностью разлагается в 𝕂[𝑡] на линейные мно жители, можно положить 𝛼 (𝑡) = 𝜒𝐹 (𝑡). Алгебра 𝒜 всех функций, определённых в 𝜀 окрестности каждого собственного числа 𝜆 ∈ Spec 𝐹 и представимых в ней суммой абсолютно сходящегося степенного ряда от (𝑡 − 𝜆), алгебраически вычислима на операторе 𝐹 . Подалгебра в 𝒜 , состо ящая из всех аналитических функций1 𝕂 → 𝕂, алгебраически вычислима на всех линейных операторах 𝐹 ∈ End(𝑉 ), характеристические многочлены которых полностью разлагаются на линейные множители в 𝕂[𝑡]. Теорема 9.3 В сделанных выше предположениях каждая алгебраически вычислимая на операторе 𝐹 ∶ 𝑉 → 𝑉 алгебра функций 𝒜 допускает единственный такой гомоморфизм 𝕂алгебр ev𝐹 ∶ 𝒜 → End 𝑉 , что ev𝐹 (𝑝) = 𝑝(𝐹 ) для всех многочленов 𝑝 ∈ 𝕂[𝑡] ⊂ 𝒜 . Определение 9.2 (гомоморфизм вычисления) Гомоморфизм ev𝐹 ∶ 𝒜 → End 𝑉 из теор. 9.3 называется вычислением функций 𝑓 ∈ 𝒜 на опе раторе 𝐹 . Линейный оператор ev𝐹 (𝑓) ∶ 𝑉 → 𝑉 , в который переходит функция 𝑓 ∈ 𝒜 при гомо морфизме вычисления, обозначается 𝑓(𝐹 ) и называется функцией 𝑓 от оператора 𝐹 . Замечание 9.2. (как относиться к функциям от операторов) Из теор. 9.3 вытекает, что для лю бого оператора 𝐹 ∈ End(𝑉 ), характеристический многочлен которого полностью разлагается на линейные множители в 𝕂[𝑡], определены такие аналитические функции, как 𝑒𝐹 или sin 𝐹 , 1 Т. е. функций, задаваемых сходящимися всюду в 𝕂 степенными рядами. 125 9.4. Корневое разложение и функции от операторов а если 𝐹 ∈ GL(𝑉 ), то и такие аналитические вне нуля функции, как ln 𝐹 или √𝐹 , причём ал гебраические свойства соответствующих операторов 𝑓(𝐹 ) в алгебре End 𝑉 будут точно такими же, как у числовых функций 𝑒𝑡 , sin 𝑡, ln 𝑡 и √𝑡. В частности, все эти функции от оператора 𝐹 коммутируют друг с другом и с 𝐹 , а также удовлетворяют соотношениям вроде ln 𝐹2 = 2 ln 𝐹 и √𝐹 √𝐹 = 𝐹 . Таким образом, функции от операторов можно использовать для отыскания опе раторов с предписанными свойствами, например, для извлечения корней из невырожденных операторов. Доказательство теор. 9.3. Пусть оператор 𝐹 аннулируется многочленом 𝛼 (𝑡) = ∏𝜆 (𝑡 − 𝜆)𝑚𝜆 , где 𝜆 = 𝜆1 , … , 𝜆𝑟 пробегает все различные корни этого многочлена, и пусть искомый гомоморфизм ev𝐹 ∶ 𝒜 → 𝕂 существует. По теореме о разложении1 пространство 𝑉 является прямой суммой 𝐹 инвариантных подпространств 𝐾𝜆 = ker(𝐹 − 𝜆Id)𝑚𝜆 , и согласно формуле (96) оператор 𝑓(𝐹 ) = 𝑓(𝜆) ⋅ 𝐸 + 𝑓′ (𝜆) ⋅ (𝐹 − 𝜆𝐸 ) + ⋯ + 𝑓(𝑚𝜆 −1) (𝜆) (𝐹 − 𝜆𝐸 )𝑚𝜆 −1 + 𝑔𝜆 (𝐹 )(𝐹 − 𝜆𝐸 )𝑚𝜆 (𝑚𝜆 − 1)! (97) действует на каждом подпространстве 𝐾𝜆 точно так же, как результат подстановки оператора 𝐹 в многочлен 𝑚𝜆 −1 𝑗𝜆 𝑓(𝑡) ≝ 𝑓(𝜆) + 𝑓′ (𝜆) ⋅ (𝑡 − 𝜆) + ⋯ + 𝑓(𝑚𝜆 −1) (𝜆) ⋅ (𝑡 − 𝜆)𝑚𝜆 −1 ∕(𝑚𝜆 − 1)! , класс которого в фактор кольце 𝕂[𝑡]∕ ((𝑡 − 𝜆)𝑚𝜆 ) называется (𝑚𝜆 − 1)й струёй функции 𝑓 ∈ 𝒜 в точке 𝜆 ∈ 𝕂. По китайской теореме об остатках существует единственный такой многочлен 𝑝𝑓(𝐹) (𝑡) ∈ 𝕂[𝑡] степени меньшей deg 𝛼(𝑡), что 𝑚𝜆 −1 𝑝𝑓(𝐹) (𝑡) ≡ 𝑗𝜆 𝑓(𝑡) (mod 𝛼(𝑡)) для всех корней 𝜆 многочлена 𝛼 . Так как операторы 𝑝𝑓(𝐹) (𝐹 ) и 𝑓(𝐹 ) одинаково действуют на каж дом подпространстве 𝐾𝜆 и 𝑉 = ⨁𝜆 𝐾𝜆 , мы имеем равенство 𝑓(𝐹 ) = 𝑝𝑓(𝐹) (𝐹 ). Поскольку много член 𝑝𝑓(𝐹) однозначно определяется по 𝑓 и 𝛼 (𝑡), гомоморфизм вычисления единствен. Остаётся убедиться, что отображение 𝑓 ↦ 𝑝𝑓(𝐹) (𝐹 ) действительно является гомоморфизмом 𝕂алгебр. Проверим сначала, что отображение 𝐽∶ 𝒜 → 𝕂[𝑡] ((𝑡 − 𝜆1 𝑓↦ )𝑚1 ×⋯× ) 𝑚1 −1 (𝑗𝜆1 𝑓, …, 𝕂[𝑡] ((𝑡 − 𝜆𝑟 )𝑚𝑟 𝑚 −1 𝑗𝜆𝑠 𝑟 𝑓) ≃ ) 𝕂[𝑡] (𝛼) (98) , сопоставляющее функции 𝑓 ∈ 𝒜 набор её струй2 во всех корнях многочлена 𝛼 , является го моморфизмом 𝕂алгебр, т. е. 𝕂линейно и удовлетворяет равенству 𝐽(𝑓𝑔) = 𝐽(𝑓)𝐽(𝑔). Первое очевидно, второе достаточно установить для каждой струи 𝑗𝜆𝑚−1 отдельно. Используя правило 1 См. теор. 9.1 на стр. 118. Мы рассматриваем этот набор как элемент прямого произведения соответствующих колец вычетов, которое по китайской теореме об остатках изоморфно фактор кольцу 𝕂[𝑡]∕(𝛼 ). 2 126 §9 Линейные операторы 𝑘 𝑘 Лейбница: (𝑓𝑔)(𝑘) = ∑𝜈=0 ( ) 𝑓(𝜈) 𝑔(𝑘−𝜈) , получаем следующие равенства по модулю (𝑡 − 𝜆)𝑚 : 𝜈 𝑚−1 𝑗𝜆𝑚−1 (𝑓𝑔) = (𝑡 − 𝜆 )𝑘 𝑘 ! (𝜈 ) 𝑓 (𝜆)𝑔(𝜇) (𝜆) = ∑ ∑ 𝜈 !𝜇 ! 𝑘 ! 𝑘=0 𝜈+𝜇=𝑘 𝑚−1 = 𝑓(𝜈) (𝜆) 𝑔(𝜇) (𝜆) (𝑡 − 𝜆)𝜈 ⋅ (𝑡 − 𝜆)𝜇 ≡ 𝑗𝜆𝑚−1 (𝑓)𝑗𝜆𝑚−1 (𝑔) . ∑ ∑ 𝜈 ! 𝜇 ! 𝑘=0 𝜈+𝜇=𝑘 Отображение 𝑓 ↦ 𝑃𝑓(𝐹) (𝐹 ) является композицией гомоморфизма (98) с гомоморфизмом вы числения многочленов ev𝐹 ∶ 𝕂[𝑡] → End 𝑉 , 𝑝 ↦ 𝑝(𝐹 ), который корректно пропускается через фактор 𝕂[𝑡]∕(𝛼 ), так как 𝛼 (𝐹 ) = 0. Определение 9.3 (интерполяционный многочлен) Многочлен 𝑝𝑓(𝐹) (𝑡) ∈ 𝕂[𝑡], принимающий на операторе 𝐹 то же самое значение, что и функ ция 𝑓 ∈ 𝒜 , называется интерполяционным многочленом для вычисления 𝑓(𝐹 ). Он однозначно определяется тем, что в каждом корне 𝜆 кратности 𝑚 аннулирующего оператор 𝑓 многочлена 𝛼 многочлен 𝑝𝑓(𝐹) (𝑡) и первые его 𝑚 − 1 производных принимают те же значения, что функция 𝑓 и её производные, т. е. многочлен 𝑝𝑓(𝐹) (𝑡) решает интерполяционную задачу с кратными узлами из прим. 4.7 на стр. 55. Если deg 𝛼 = 𝑛, отыскание коэффициентов интерполяционного много члена 𝑝𝑓(𝐹) сводится к решению системы из 𝑛 линейных уравнений на 𝑛 неизвестных. Пример 9.6 (степенная функция и рекуррентные уравнения) Задача отыскания 𝑛того члена 𝑎𝑛 числовой последовательности 𝑧 ∶ ℤ → 𝕂, 𝑛 ↦ 𝑧𝑛 , решаю щей рекуррентное уравнение 𝑧𝑛 = 𝛼1 𝑧𝑛−1 + 𝛼2 𝑧𝑛−2 + ⋯ + 𝛼𝑚 𝑧𝑛−𝑚 с начальным условием (𝑧0 , … , 𝑧𝑛−1 ) = (𝑎0 , … , 𝑎𝑛−1 ) ∈ 𝕂𝑛 , сводится вычислению 𝑛той степени матрицы сдвига ⎛0 0 ⎜1 0 ⎜ 𝑆 = ⎜0 1 ⎜⋮ ⋱ ⎜ ⎝0 ⋯ ⋯ ⋱ ⋱ ⋱ 0 𝛼𝑚 ⎞ ⋮ 𝛼𝑚−1 ⎟ ⎟ ⋮ ⎟ 𝛼2 ⎟ ⎟ 1 𝛼1 ⎠ смещающей каждый фрагмент из 𝑚 последовательных элементов на один шаг вправо: (𝑧𝑘+1 , 𝑧𝑘+2 , … , 𝑧𝑘+𝑚 ) ⋅ 𝑆 = (𝑧𝑘+2 , 𝑧𝑘+3 , … , 𝑧𝑘+𝑚+1 ) , так что член 𝑎𝑛 оказывается равным первой координате вектора (𝑎𝑛 , 𝑎𝑛+1 , … , 𝑎𝑛+𝑚−1 ) = (𝑎0 , 𝑎1 , … , 𝑎𝑚−1 ) ⋅ 𝑆𝑛 . Матрица 𝑆𝑛 = 𝑝𝑆𝑛 (𝑆) является результатом подстановки матрицы 𝑆 в интерполяционный мно гочлен 𝑝𝑆𝑛 (𝑡) ∈ 𝕂[𝑡] для вычисления на матрице 𝑆 степенной функции 𝑓(𝑡) = 𝑡𝑛 . Обратите вни мание, что deg 𝑝𝑆𝑛 < 𝑚, и коэффициенты многочлена 𝑝𝑆𝑛 находятся решением системы из 𝑚 линейных уравнений на 𝑚 неизвестных. Например, для уравнения Фиббоначчи 𝑎𝑛 = 𝑎𝑛−1 + 𝑎𝑛−2 матрица сдвига 𝑆= 0 1 . (1 1) 127 9.5. Разложение Жордана Интерполяционный многочлен для вычисления степенной функции 𝑡𝑛 на этой матрице линеен. Записывая его в виде 𝑝𝑆𝑛 (𝑡) = 𝑎𝑡 + 𝑏 с неопределёнными коэффициентами 𝑎 и 𝑏, получаем 𝑆𝑛 = 𝑎 𝑆 + 𝑏 𝐸 = 𝑏 𝑎 . (𝑎 𝑎 + 𝑏) В частности, 𝑛тое число Фиббоначчи, решающее уравнение Фиббоначчи с начальным условием (𝑎0 , 𝑎1 ) = (0, 1), равно первой координате вектора (𝑎𝑛 , 𝑎𝑛+1 ) = (0, 1)⋅ 𝑆𝑛 = (𝑎, 𝑎 + 𝑏). Матрица 𝑆 аннулируется своим характеристическим многочленом 𝜒𝑆 (𝑡) = 𝑡2 − 𝑡 tr 𝑆 + det 𝑆 = 𝑡2 − 𝑡 − 1 = (𝑡 − 𝜆+ )(𝑡 − 𝜆− ) с однократными корнями 𝜆± = (1 ± √5)∕ 2. Функция 𝑡𝑛 принимает на них значения 𝜆𝑛 ± . Коэф фициенты 𝑎 и 𝑏 находятся из системы 𝑎 𝜆+ + 𝑏 = 𝜆𝑛 + {𝑎 𝜆− + 𝑏 = 𝜆𝑛− , 𝑛 и по правилу Крамера первый из них 𝑎 = (𝜆𝑛 + − 𝜆− ) ∕ (𝜆+ − 𝜆− ). Тем самым, 𝑛 𝑎𝑛 = 𝑎 = ((1 + √5)∕ 2) − ((1 − √5)∕ 2) √5 𝑛 . 9.5. Разложение Жордана. Всюду в этом разделе речь идёт об операторах на конечномерном векторном пространстве 𝑉 над алгебраически замкнутым полем 𝕜. Теорема 9.4 (разложение Жордана) Для каждого оператора 𝐹 на конечномерном векторном пространстве 𝑉 над алгебраически за мкнутым полем 𝕜 существует единственная пара таких операторов 𝐹𝑑 и 𝐹𝑛 , что 𝐹𝑛 нильпотен тен, 𝐹𝑑 диагонализуем, 𝐹𝑑 𝐹𝑛 = 𝐹𝑛 𝐹𝑑 и 𝐹 = 𝐹𝑑 + 𝐹𝑛 . Кроме того, операторы 𝐹𝑑 и 𝐹𝑛 являются многочленами от оператора 𝐹 с нулевыми свободными членами. Доказательство. Пусть Spec 𝐹 = {𝜆1 , … , 𝜆𝑟 }. В силу алгебраической замкнутости поля 𝕜, ха рактеристический многочлен оператора 𝐹 полностью разлагается на линейные множители: 𝜒𝐹 (𝑡) = ∏𝑖 (𝑡 − 𝜆𝑖 )𝑚𝑖 , а пространство 𝑉 является прямой суммой корневых подпространств: 𝑉 = ⨁𝑖 𝐾𝑖 , где 𝐾𝑖 = ker(𝐹 − 𝜆𝑖 Id)𝑚𝑖 . Так как многочлены (𝑡 − 𝜆𝑖 )𝑚𝑖 попарно взаимно просты, по китайской теореме об остатках существуют такие многочлены 𝑓1 , … , 𝑓𝑟 ∈ 𝕜[𝑡], что 𝑓𝑖 (𝑡) ≡ 1 mod (𝑡 − 𝜆𝑖 ) 𝑚𝑖 {0 mod (𝑡 − 𝜆𝑗 )𝑚𝑗 при 𝑗 ≠ 𝑖 . Если 𝜆𝑖 ≠ 0, то многочлен 𝑡 обратим по модулю (𝑡 − 𝜆𝑖 )𝑚𝑖 . Поэтому найдётся такой многочлен 𝑚 𝑔𝑖 (𝑡), что 𝑡 ⋅ 𝑔𝑖 (𝑡) ≡ 𝜆𝑖 mod (𝑡 − 𝜆𝑖 ) 𝑖 . Если 𝜆𝑖 = 0, то положим 𝑔𝑖 (𝑡) = 0. Тогда при каждом 𝑖 𝑟 𝑚 многочлен 𝑝𝑠 (𝑡) ≝ 𝑡 ∑𝑗=1 𝑔𝑗 (𝑡)𝑓𝑗 (𝑡) ≡ 𝜆𝑖 mod (𝑡 − 𝜆𝑖 ) 𝑖 и не имеет свободного члена. Из этих сравнений вытекает, что оператор 𝐹𝑑 ≝ 𝑝𝑠 (𝐹 ) действует на каждом корневом подпространстве 𝐾𝑖 = ker(𝐹 − 𝜆𝑖 Id)𝑚𝑖 как умножение на 𝜆𝑖 и, стало быть, диагонализуем. Оператор 𝐹𝑛 ≝ 𝐹 − 𝐹𝑑 128 §9 Линейные операторы действует на 𝐾𝑖 как 𝐹 − 𝜆𝑖 Id и, тем самым, нильпотентен. Будучи многочленами от 𝐹 , операто ры 𝐹𝑑 и 𝐹𝑛 перестановочны между собою и с 𝐹 . Это доказывает существование операторов 𝐹𝑑 и 𝐹𝑛 с требемыми свойствами, включая последнее утверждение предложения. Докажем единственность. Пусть есть ещё одно разложение 𝐹 = 𝐹𝑑′ + 𝐹𝑛′ , в котором 𝐹𝑑′ диа гонализуем, 𝐹𝑛′ нильпотентен и 𝐹𝑑′ 𝐹𝑛′ = 𝐹𝑛′ 𝐹𝑑′ . Из последнего равенства вытекает, что 𝐹𝑑′ и 𝐹𝑛′ перестановочны с любым многочленом от 𝐹 = 𝐹𝑑′ + 𝐹𝑛′ , в частности, с построенными выше 𝐹𝑑 и 𝐹𝑛 . Поэтому каждое собственное подпространство 𝑉𝜆 оператора 𝐹𝑑 переводится оператором 𝐹𝑑′ в себя1 , причём 𝐹𝑑′ диагонализуем2 на каждом 𝑉𝜆 . Если бы оператор 𝐹𝑑′ имел на 𝑉𝜆 собственный вектор с собственным значением 𝜇 ≠ 𝜆, то этот вектор был бы собственным для оператора 𝐹𝑛 − 𝐹𝑛′ = 𝐹𝑑 − 𝐹𝑑′ с собственным значением 𝜆 − 𝜇 ≠ 0, что невозможно, так как оператор 𝐹𝑛 − 𝐹𝑛′ нильпотентен. Упражнение 9.14. Докажите, что разность двух перестановочных нильпотентных операторов нильпотентна. Следовательно, оператор 𝐹𝑑′ действует на каждом собственном подпространстве 𝑉𝜆 операто ра 𝐹𝑑 как умножение на 𝜆, откуда 𝐹𝑑′ = 𝐹𝑑 . Тогда и 𝐹𝑛′ = 𝐹 − 𝐹𝑑′ = 𝐹 − 𝐹𝑑 = 𝐹𝑛 . Определение 9.4 Операторы 𝐹𝑑 и 𝐹𝑛 из теор. 9.4 называются, соответственно, диагонализуемой и нильпотентной составляющими оператора 𝐹 . Замечание 9.3. Поскольку операторы 𝐹𝑑 и 𝐹𝑛 являются многочленами от 𝐹 , каждое 𝐹 инвари антное подпространство 𝑈 ⊂ 𝑉 является инвариантным для 𝐹𝑑 и 𝐹𝑛 . Следствие 9.5 (Жорданова нормальная форма) Для каждого оператора 𝐹 на конечномерном векторном пространстве 𝑉 над алгебраически за мкнутым полем 𝕜 существует такой базис, в котором матрица оператора 𝐹 состоит из располо женных на главной диагонали квадратных блоков вида3 ⎞ ⎛𝜆 1 ⎟ ⎜ 𝜆 1 ⎟ ⎜ 𝐽𝑚 (𝜆) ≝ 𝜆𝐸 + 𝐽𝑚 (0) = ⎜ ⋱ ⋱ ⎟, ⎜ 𝜆 1⎟ ⎟ ⎜ 𝜆⎠ ⎝ (99) где 𝜆 ∈ Spec 𝐹 , а 𝑚 ∈ ℕ — размер блока, а все остальные её элементы нулевые. С точностью до перестановки блоков, эта матрица не зависит от выбора базиса с таким свойством, и сум марный размер блоков с заданным 𝜆 ∈ Spec 𝐹 на диагонали равен кратности корня 𝜆 характе ристического многочлена оператора 𝐹 . Два оператора подобны если и только если их матрицы указанного вида отличаются друг от друга перестановкой блоков. Доказательство. Ограничение оператора 𝐹 = 𝐹𝑑 + 𝐹𝑛 на корневое подпространство 𝐾𝜆 имеет вид 𝜆Id+𝐹𝑛 |𝐾𝜆 . В n∘ 9.3 на стр. 122 мы видели, в пространстве 𝐾𝜆 имеется жорданов базис, в кото ром матрица нильпотентного оператора 𝐹𝑛 |𝐾𝜆 ∶ 𝐾𝜆 → 𝐾𝜆 состоит из блоков вида (99) с 𝜆 = 0, См. n∘ 9.2.2 на стр. 121. См. сл. 9.3 на стр. 121. 3 Ср. с форм. (93) на стр. 122. 1 2 9.5. Разложение Жордана 129 причём набор блоков не зависит от выбора жорданова базиса. Объединяя жордановы базисы корневых подпространств друг с другом, мы получаем требуемый базис в 𝑉 . Единственность и последнее утверждение следствия вытекают из того, что в любом базисе, где матрица операто ра 𝐹 имеет указанный вид, операторы 𝐹𝑑 и 𝐹𝑛 имеют матрицы, получающиеся из матрицы 𝐹 обнулением всех, соответственно, наддиагональных и диагональных элементов, а линейная оболочка базисных векторов, задействованных во всех клетках (99) с заданным 𝜆 ∈ Spec 𝐹 , совпадает с корневым подпространством 𝐾𝜆 , и тем самым, эти векторы образуют жорданов ба зис ограничения 𝐹𝑛 |𝐾𝜆 . Определение 9.5 (жорданов базис) Базисы пространства 𝑉 , удовлетворяющие условиям сл. 9.5, называются жордановыми, а мат рица оператора 𝐹 , о которой идёт речь в сл. 9.5, называется жордановой нормальной формой этого оператора. Пример 9.7 Рассмотрим оператор 𝐹 умножения на класс [𝑡] в кольце вычетов 𝕜[𝑡] ∕ ((𝑡 − 𝜆)𝑚 ). Поскольку 𝑡 = 𝜆 + (𝑡 − 𝜆), нильпотентная составляющая 𝐹𝑛 этого оператора представляет собою оператор умножения на класс [𝑡 − 𝜆], а диагонализуемая составляющая 𝐹𝑑 = 𝜆Id. Классы [(𝑡 − 𝜆)𝑚−1 ], [(𝑡 − 𝜆)𝑚−2 ], … , [𝑡 − 𝜆], [1] ∈ 𝕜[𝑡]∕ ((𝑡 − 𝜆)𝑚 ) (910) образуют жорданову цепочку нильпотентного оператора1 𝐹𝑛 , и в базисе из этих классов опе ратор 𝐹 = 𝜆Id + 𝐹𝑛 записывается матрицей (99) размера 𝑛 × 𝑛. Из сл. 9.5 вытекает, что над алгебраически замкнутым полем 𝕜 каждый линейный оператор на конечномерном векторном пространстве подобен оператору умножения на класс [𝑡] в прямой сумме конечного числа фак тор колец вида 𝕜[𝑡]∕ ((𝑡 − 𝜆)𝑚 ), где слагаемые могут повторяться, и жорданов базис для тако го оператора является объединением классов (910), приходящих из каждого слагаемого этой прямой суммы. Это частный случай общей классификации пространств с операторами, упомя нутой в зам. 9.1. на стр. 115. 1 См. опр. 9.1 на стр. 122. §10. Евклидова геометрия Всюду в этом параграфе речь идёт про конечномерные евклидовы векторные пространства на полем ℝ, см. §3 на стр. 33. Евклидово скалярное произведение1 векторов 𝑢 и 𝑤 обозначается через (𝑢, 𝑤 ) или через 𝑢 ⋅ 𝑤. Напомню, что оно билинейно, симметрично и положительно в том смысле, что (𝑣 , 𝑣 ) > 0 для всех 𝑣 > 0. 10.1. Ортонормальные базисы. Набор ненулевых векторов 𝑣1 , … , 𝑣𝑘 в евклидовом простран стве называется ортогональным, если все его векторы попарно перпендикулярны друг другу, т. е. (𝑣𝑖 , 𝑣𝑗 ) = 0 при 𝑖 ≠ 𝑗. Ортогональный набор автоматически линейно независим, так как скалярно умножая на вектор 𝑣𝑖 равенство −( 𝑤 𝜆1 𝑣1 + 𝜆2 𝑣2 + ⋯ + 𝜆𝑘 𝑣𝑘 = 0 , получаем 𝜆𝑖 (𝑣𝑖 , 𝑣𝑖 ) = 0, откуда все 𝜆𝑖 = 0. Ортогональный набор векторов 𝑒1 , … , 𝑒𝑘 на зывается ортонормальным, если все его векторы имеют длину 1, т. е. (𝑒𝑖 , 𝑒𝑖 ) = 1 при всех 𝑖 . Такой набор автоматически образует базис в своей ли нейной оболочке, и разложение 𝑣 = ∑ 𝑥𝑖 𝑒𝑖 про извольного вектора 𝑣 ∈ span(𝑒1 , … , 𝑒𝑘 ) по это му базису имеет коэффициенты 𝑥𝑖 = (𝑒𝑖 , 𝑣 ), а скалярное произведение векторов 𝑢 = ∑ 𝑥𝑖 𝑒𝑖 и 𝑤 = ∑ 𝑦𝑖 𝑒𝑖 равно (𝑢, 𝑤) = 𝑥1 𝑦1 + ⋯ + 𝑥𝑘 𝑦𝑘 . Упражнение 10.1. Проверьте оба эти факта. 𝑒 = | , )⋅ 𝑢 | 𝑒 = |( , 𝑢 | | )| Рис. 10⋄1. Второй шаг ортогонализации. Предложение 10.1 Пусть не все векторы 𝑢1 , … , 𝑢𝑚 ненулевые. Тогда в их линейной оболочке существует такой ор тонормальный базис 𝑒1 , … , 𝑒𝑛 , что при каждом 𝑘 линейная оболочка векторов 𝑢1 , … , 𝑢𝑘 лежит в линейной оболочке векторов 𝑒1 , … , 𝑒𝑘 . Доказательство. Выбрасывая из набора нулевые векторы, будем считать, что все 𝑢𝑖 ≠ 0. В ка честве первого вектора искомого базиса возьмём 𝑒1 = 𝑢1 ∕ |𝑢1 |. По построению |𝑒1 | = 1 и 𝑢1 лежит в одномерном пространстве, натянутом на 𝑒1 . Допустим по индукции, что для векторов 𝑢1 , … , 𝑢𝑘 уже построены такие ортонормальные векторы 𝑒1 , … , 𝑒𝑖 , что 𝑖 ⩽ 𝑘 и span(𝑒1 , … , 𝑒𝑖 ) = span(𝑢1 , … , 𝑢𝑘 ) . (101) 𝑖 Положим 𝑤𝑖+1 = 𝑢𝑘+1 − ∑ (𝑢𝑘+1 , 𝑒𝜈 ) ⋅ 𝑒𝜈 , см. рис. 10⋄1. Для каждого из уже построенных векто 𝜈=1 ров 𝑒𝑗 выполняется равенство (𝑤𝑖+1 , 𝑒𝑗 ) = (𝑢𝑘+1 , 𝑒𝑗 )−(𝑢𝑘+1 , 𝑒𝑗 )(𝑒𝑗 , 𝑒𝑗 ) = 0, т. е. вектор 𝑤𝑖+1 орто гонален подпространству (101). Если 𝑤𝑖+1 = 0, то вектор 𝑢𝑘+1 лежит в подпространстве (101) и индуктивное предположение выполнятся для наборов 𝑢1 , … , 𝑢𝑘+1 и 𝑒1 , … , 𝑒𝑖 . Если 𝑤𝑖+1 ≠ 0, полагаем 𝑒𝑖+1 = 𝑤𝑖+1 ∕ |𝑤𝑖+1 | и заключаем, что индуктивное предположение выполнятся для наборов 𝑢1 , … , 𝑢𝑘+1 и 𝑒1 , … , 𝑒𝑖+1 . 1 См. опр. 3.1 на стр. 33. 130 131 10.1. Ортонормальные базисы Следствие 10.1 В каждом конечномерном евклидовом пространстве имеется ортонормальный базис. Определение 10.1 Описанный в доказательстве предл. 10.1 способ построения ортонормального базиса в линей ной оболочке заданных векторов называется ортогонализацией Грама – Шмидта. Пример 10.1 (уравнение гиперплоскости) Линейное неоднородное уравнение 𝑎1 𝑥1 + 𝑎2 𝑥2 + ⋯ + 𝑎𝑛 𝑥𝑛 = 𝑑 на координаты 𝑥1 , … , 𝑥𝑛 отно сительно ортонормального базиса 𝑛мерного евклидова пространства 𝑉 можно переписать как уравнение на неизвестный вектор 𝑥 ∈ 𝑉 𝑎 (𝑎, 𝑥) = 𝑑 , (102) в котором вектор 𝑎 ∈ 𝑉 и число 𝑑 ∈ ℝ за даны. На геометрическом языке это урав нение гласит, что ортогональная проекция вектора 𝑥 на вектор1 𝑎 равна (𝑎 , 𝑥 ) 𝑑 𝑑 𝑎 𝑥𝑎 = 𝑎 ⋅ =𝑎⋅ = ⋅ . 2 (𝑎, 𝑎) |𝑎| |𝑎 | |𝑎 | 𝑥 𝑥 |𝑥| ⋅ cos 𝜑 = ( , ) | | = | | 𝜑 Концы векторов 𝑥 с таким свойством за метают в аффинном пространстве 𝔸(𝑉 ) 𝑂 гиперплоскость, перпендикулярную векто Рис. 10⋄2. ГМТ 𝑥 ∶ (𝑎, 𝑥 ) = 𝑑 . ру 𝑎 и удалённую от нуля на расстояние |𝑑 |∕|𝑎| вдоль вектора 𝑎, если 𝑑 > 0, и в противоположную сторону, если 𝑑 < 0 (см. рис. 10⋄2). Пример 10.2 (срединный перпендикуляр) Покажем, что в евклидовом аффинном пространстве 𝔸𝑛 ГМТ 𝑥 , равноудалённых от двух задан ных точек 𝑝0 ≠ 𝑝1 , представляет собою гиперплоскость, перпендикулярную вектору ⃖⃖⃖⃖⃗ 𝑝0 𝑝1 и про ходящую через середину (𝑝0 + 𝑝1 )∕2 отрезка [𝑝0 , 𝑝1 ]. Эта гиперплоскость называется срединным перпендикуляром к отрезку [𝑝0 , 𝑝1 ]. Равенство длин |𝑥 , 𝑝0 | = |𝑥 , 𝑝1 | равносильно равенству ска лярных произведений (⃖⃖⃖ 𝑥𝑝⃗0 , ⃖⃖⃖ 𝑥𝑝⃗0 ) = (⃖⃖⃖ 𝑥𝑝⃗1 , ⃖⃖⃖ 𝑥𝑝⃗1 ), т. е. равенству (𝑝0 − 𝑥, 𝑝0 − 𝑥) = (𝑝1 − 𝑥, 𝑝1 − 𝑥) , где буквы 𝑝0 , 𝑝1 , 𝑥 обозначают радиусвекторы соответствующих точек, выпущенные из произ вольно выбранной начальной точки 𝑂 ∈ 𝔸𝑛 . После раскрытия скобок и сокращений, получаем (𝑝0 , 𝑝0 ) − 2 (𝑝0 , 𝑥) = (𝑝1 , 𝑝1 ) − 2 (𝑝1 , 𝑥) или, что то же самое, 2 (𝑝1 − 𝑝0 , 𝑥 ) = (𝑝1 , 𝑝1 ) − (𝑝0 , 𝑝0 ) . (103) Это уравнение задаёт гиперплоскость, перпендикулярную вектору ⃖⃖⃖⃖⃗ 𝑝0 𝑝1 = 𝑝1 − 𝑝0 и проходящую через точку (𝑝0 + 𝑝1 )∕ 2, ибо последняя, очевидно, равноудалена от 𝑝0 и 𝑝1 . Упражнение 10.2. Убедитесь прямым вычислением, что 𝑥 = (𝑝0 + 𝑝1 )∕ 2 удовлетворяет урав нению (103). 1 См. предл. 3.1 и опр. 3.2 на стр. 34. 132 §10 Евклидова геометрия 10.2. Матрицы Грама. С любыми двумя наборами векторов евклидова пространства 𝑉 𝒖 = (𝑢1 , … , 𝑢𝑚 ) и 𝒘 = (𝑤1 , … , 𝑤𝑘 ) (104) можно связать таблицу их попарных скалярных произведений — матрицу 𝐺𝒖𝒘 ≝ ((𝑢𝑖 , 𝑤𝑗 )) ∈ Mat𝑚×𝑘 (ℝ) , (105) в 𝑖 й строке и 𝑗м столбце которой находится скалярное произведение (𝑢𝑖 , 𝑤𝑗 ). Матрица (105) называется матрицей Грама наборов векторов (104). Если воспринимать эти наборы векторов как матрицы с элементами из 𝑉 , а под произведением векторов 𝑎, 𝑏 ∈ 𝑉 понимать их скалярное произведение 𝑎𝑏 ≝ (𝑎, 𝑏) ∈ ℝ, то матрица Грама будет описываться равенством 𝐺𝒖𝒘 = 𝒖𝑡 𝒘 , где 𝒘 = (𝑤1 , … , 𝑤𝑘 ) это строка из векторов, а 𝒖𝑡 — столбец, транспонированный к строке 𝒖 = = (𝑢1 , … , 𝑢𝑚 ). Если наборы векторов 𝒖 и 𝒘 линейно выражаются через какието другие наборы векторов 𝒆 = (𝑒1 , … , 𝑒𝑟 ) и 𝒇 = (𝑓1 , … , 𝑓𝑠 ) по формулам 𝒖 = 𝒆 ⋅ 𝐶𝒆𝒖 и 𝒘 = 𝒇 ⋅ 𝐶𝒇𝒘 , где 𝐶𝒆𝒖 ∈ ∈ Mat𝑟×𝑚 (ℝ) и 𝐶𝒇𝒘 ∈ Mat𝑠×𝑘 (ℝ) некие матрицы, то матрица Грама 𝐺𝒖𝒘 пересчитывается через матрицу Грама 𝐺𝒆𝒇 по формуле1 𝑡 𝑡 𝑡 𝑡 𝐺𝒆𝒇 𝐶𝒇𝒘 . 𝒆 𝒇 𝐶𝒇𝒘 = 𝐶𝒆𝒖 𝐺𝒖𝒘 = 𝒖𝑡 𝒘 = (𝒆𝐶𝒆𝒖 ) 𝒇 𝐶𝒇𝒘 = 𝐶𝒆𝒖 (106) При 𝒘 = 𝒖 мы получаем таблицу умножения векторов из одного набора 𝑢1 , … , 𝑢𝑚 . В этом слу чае обозначение 𝐺𝒖𝒖 сокращается до 𝐺𝒖 ≝ ((𝑢𝑖 , 𝑢𝑗 )) ∈ Mat𝑚×𝑚 (ℝ), а правило преобразова ния (107) приобретает вид 𝑡 𝐺𝒆 𝐶𝒆𝒖 . (107) 𝐺𝒖 = 𝐶𝒆𝒖 Определитель 𝛤𝒖 ≝ det 𝐺𝒖 называется определителем Грама набора векторов 𝒖. Ортонормаль ность набора векторов 𝒆 = (𝑒1 , … , 𝑒𝑘 ) означает, что его матрица Грама 𝐺𝒆 = 𝐸 , и в этом случае определитель Грама 𝛤𝒆 = det 𝐸 = 1. Предложение 10.2 Для любого набора векторов 𝒖 = (𝑢1 , … , 𝑢𝑚 ) выполняется неравенство 𝛤𝒖 ⩾ 0, которое об ращается в равенство если и только если этот набор линейно зависим. Если набор 𝒖 линейно независим, а набор векторов 𝒆 = (𝑒1 , … , 𝑒𝑚 ) составляет ортонормальный базис в линейной оболочке span(𝑢1 , … , 𝑢𝑚 ), то 𝛤𝒖 = det2 𝐶𝒆𝒖 , где матрица 𝐶𝒆𝒖 составлена из столбцов координат векторов 𝑢𝑗 в ортонормальном базисе 𝒆. Доказательство. Если 𝜆1 𝑢1 + ⋯ + 𝜆𝑚 𝑢𝑚 = 0 для некоторого ненулевого набора констант 𝜆𝑖 , то скалярно умножая это равенство на вектор 𝑢𝜈 , мы получаем при каждом 𝜈 равенство 𝜆1 (𝑢𝜈 , 𝑢1 ) + 𝜆2 (𝑢𝜈 , 𝑢2 ) + ⋯ + 𝜆𝑚 (𝑢𝜈 , 𝑢𝑚 ) = 0 , означающее, что столбцы матрицы Грама 𝐺𝒖 = ((𝑢𝑖 , 𝑢𝑗 )) линейно зависимы с коэффициентами 𝜆1 , … , 𝜆𝑚 , откуда 𝛤𝒖 = det 𝐺𝒖 = 0. Если же векторы 𝑢1 , … , 𝑢𝑚 линейно независимы, то их линейная оболочка 𝑚мерна, и по предл. 10.1 на стр. 130 в ней имеется ортонормальный базис 𝑡 𝑡 𝒆 = (𝑒1 , … , 𝑒𝑚 ). Тогда 𝐺𝒖 = 𝐶𝒆𝒖 𝐺𝒆 𝐶𝒆𝒖 = 𝐶𝒆𝒖 𝐶𝒆𝒖 согласно формуле (107), и 𝛤𝒖 = det2 𝐶𝒆𝒖 > 0, 2 т. к. матрица перехода 𝐶𝒆𝒖 обратима и её определитель ненулевой3 . 1 См. упр. 5.3 на стр. 61 и предшествующее ему обсуждение. См. предл. 5.2 на стр. 64. 3 См. сл. 8.4 на стр. 99. 2 133 10.3. Евклидова двойственность 10.2.1. Евклидов объём и ориентация. Зафиксируем в евклидовом пространстве 𝑉 какой нибудь ортонормальный базис 𝒆 = (𝑒1 , … , 𝑒𝑛 ) и рассмотрим форму объёма 𝜔𝒆 , принимающую на этом базисе значение 1. Тогда квадрат объёма любого другого базиса 𝒖 = 𝒆𝐶𝒆𝒖 по предл. 10.2 равен определителю Грама этого базиса: 𝜔𝒆2 (𝒖) = det2 𝐶𝒆𝒖 = 𝛤𝒖 . (108) В частности, квадрат объёма любого ортонормального базиса 𝒖 равен 1. Мы заключаем, что матрица перехода 𝐶𝒆𝒖 между любыми двумя ортонормальными базисами 𝒆 и 𝒖 евклидова про странства 𝑉 имеет определитель det 𝐶𝒆𝒖 = ±1. Ортонормальные базисы 𝒆 и 𝒖 называются оди наково ориентированными, если det 𝐶𝒆𝒖 = +1, и противоположно ориентированными, если det 𝐶𝒆𝒖 = −1. Обратите внимание, что любая нечётная перестановка базисных векторов ме няет ориентацию базиса, а любая чётная — не меняет. Из сказанного вытекает, что все ортонормальные базисы евклидова пространства 𝑉 име ют одинаковый по абсолютной величине объём при любом выборе формы объёма на 𝑉 , и что на пространстве 𝑉 имеются ровно две формы объёма, принимающие на всех ортонормальных базисах значения ±1. Эти две формы объёма отличаются друг от друга знаком, и выбор одной из них в качестве стандартной формы объёма на 𝑉 называется выбором ориентации евклидова пространства 𝑉 . Ориентация координатного пространства ℝ𝑛 , принимающая на стандартном базисе значение +1, называется стандартной. Абсолютная величина объёма параллелепипеда, натянутого на произвольно заданные век торы 𝑣1 , … , 𝑣𝑛 , вычисленная относительно одной из двух ориентирующих форм, не зависит от выбора ориентации и называется евклидовым объёмом неориентированного параллелепипеда. Согласно формуле (108), квадрат евклидова объёма равен определителю Грама. Мы будем обо значать евклидов объём через Vol(𝑣1 , … , 𝑣𝑛 ) = √𝛤(𝑣1 ,…,𝑣𝑛 ) = √det (𝑣𝑖 , 𝑣𝑗 ) . (109) 10.3. Евклидова двойственность. С каждым вектором 𝑣 евклидова пространства 𝑉 связан ли нейный функционал 𝑔𝑣 ∶ 𝑉 → ℝ, 𝑢 ↦ (𝑢, 𝑣 ), скалярного умножения на этот вектор. Сопостав ление вектору 𝑣 ∈ 𝑉 линейного функционала 𝑔𝑣 задаёт линейное отображение 𝐺𝑉 ∶ 𝑉 → 𝑉∗ , 𝑣 ↦ 𝑔𝑣 , (1010) которое называется евклидовой корреляцией. Упражнение 10.3. Убедитесь в линейности функционала 𝑔𝑣 и отображения 𝐺𝑉 . Так как 𝐺𝑉 (𝑣 ) = (𝑣 , 𝑣 ) ≠ 0 для любого 𝑣 ≠ 0, ковектор 𝑔𝑣 ≠ 0 при 𝑣 ≠ 0. Поэтому отображение (1010) инъективно, а значит, является изоморфизмом векторных пространств. Таким образом, любой линейный функционал на евклидовом векторном пространстве однозначно представля ется в виде скалярного произведения с некоторым вектором. Упражнение 10.4. Убедитесь, что матрица отображения 𝐺𝑉 в произвольном базисе 𝒗 простран ства 𝑉 и двойственном ему базисе 𝒗∗ пространства 𝑉∗ совпадает с матрицей Грама 𝐺𝒗 ба зиса 𝑣 . 134 §10 Евклидова геометрия 10.3.1. Евклидово двойственный базис. Для любого базиса 𝒖 = (𝑢1 , … , 𝑢𝑛 ) в евклидовом × пространстве 𝑉 , прообразы 𝑢1× , … , 𝑢𝑛 ∈ 𝑉 координатных функционалов 𝑢1∗ , … , 𝑢𝑛∗ ∈ 𝑉∗ при изоморфизме (1010) образуют в пространстве 𝑉 базис, именуемый евклидово двойственным к × базису 𝒖 и обозначаемый 𝒖× = (𝑢1× , … , 𝑢𝑛 ). По определению, векторы этого базиса однозначно характеризуются соотношениями (𝑢𝑖 , 𝑢𝑗× ) = 0 при 𝑖 ≠ 𝑗 {1 при 𝑖 = 𝑗 . (1011) На матричном языке эти соотношения означают, что матрица Грама1 𝐺𝒖𝒖× = 𝒖𝑡 𝒖× = 𝐸 . Со гласно форм. (107) на стр. 132 матрица 𝐶𝒖𝒖× , линейно выражающая базис 𝒖× через базис 𝒖 по формуле 𝒖× = 𝒖𝐶𝒖𝒖× , удовлетворяет равенству 𝐸 = 𝐺𝒖𝒖× = 𝐺𝒖 𝐶𝒖𝒖× , т. е. обратна к матрице Грама базиса 𝒖. Тем самым, (𝑢1× , … , 𝑢𝑛× ) = (𝑢1 , … , 𝑢𝑛 ) ⋅ 𝐺𝒖−1 . (1012) Ортонормальность базиса равносильна тому, что он совпадает со своим евклидово двойствен ным. Упражнение 10.5. Убедитесь, что 𝑢𝑖×× = 𝑢𝑖 . По определению двойственного базиса2 , каждый вектор 𝑣 ∈ 𝑉 раскладывается по любому ба зису 𝑢1 , … , 𝑢𝑛 с коэффициентами, равными скалярным произведениям этого вектора с соот ветствующими векторами двойственного базиса: 𝑣= ∑ 𝑒𝑖 ⋅ (𝑣, 𝑒𝑖× ) , (1013) 𝑖 в чём легко удостовериться и непосредственно, скалярно умножив обе части этого равенства на 𝑢𝑖× для каждого 𝑖 . 10.3.2. Ортогоналы. Прообраз аннулятора Ann(𝑈) ⊂ 𝑉∗ данного подпространства 𝑈 ⊂ 𝑉 при изоморфизме (1010) обозначается через 𝑈⊥ = {𝑤 ∈ 𝑉 | ∀ 𝑢 ∈ 𝑈 (𝑢, 𝑤) = 0} и называется ортогоналом или ортогональным дополнением к 𝑈. По сл. 7.1 на стр. 86 dim 𝑈⊥ = dim Ann 𝑈 = dim 𝑉 − dim 𝑈 (1014) Из сл. 7.2 на стр. 87 и теор. 7.1 на стр. 87 вытекает, что соответствие 𝑈 ↔ 𝑈⊥ задаёт оборачи вающую включения биекцию между подпространствами дополнительных размерностей в 𝑉 , и эта биекция переводит суммы подпространств в пересечения, а пересечения — в суммы, т. е. для любых подпространств 𝑈, 𝑊 ⊂ 𝑉 выполняются равенства 𝑈⊥⊥ = 𝑈 , 1 2 (𝑈 + 𝑊 )⊥ = 𝑈⊥ ∩ 𝑊⊥ , См. формулу (105) на стр. 132. См. n∘ 7.1.1 на стр. 84. (𝑈 ∩ 𝑊 )⊥ = 𝑈⊥ + 𝑊⊥ . (1015) 135 10.4. Ортогональное проектирование, расстояния и углы 10.4. Ортогональное проектирование, расстояния и углы. Так как (𝑢, 𝑢) = 0 только для 𝑢 = 0, пересечение 𝑈 ∩ 𝑈⊥ = 0. В силу равенства (1014) подпространства 𝑈 и 𝑈⊥ дополнительны друг другу: 𝑉 = 𝑈 ⊕ 𝑈⊥ и каждый вектор 𝑣 ∈ 𝑉 допускает единственное разложение 𝑣 = 𝑣𝑈 + 𝑣𝑈⊥ , где 𝑣𝑈 ∈ 𝑈 , 𝑣𝑈⊥ ∈ 𝑈⊥ . (1016) Компоненты 𝑣𝑈 ∈ 𝑈 и 𝑣𝑈⊥ ∈ 𝑈⊥ этого разложения называются, соответственно ортогональ ной проекцией вектора 𝑣 на 𝑈 и его нормальной составляющей относительно 𝑈. Сопоставление каждому вектору 𝑣 ∈ 𝑉 ого ортогональной проекции на 𝑈 задаёт линейное отображение 𝜋𝑈 ∶ 𝑉 = 𝑈 ⊕ 𝑈⊥ ↠ 𝑈 , 𝑣 = 𝑣𝑈 + 𝑣𝑈⊥ ↦ 𝑣𝑈 , которое называется ортогональным проектированием 𝑉 на 𝑈. Предложение 10.3 Ортогональная проекция 𝑣𝑈 ∈ 𝑈 произвольного вектора 𝑣 ∈ 𝑉 на подпространство 𝑈 ⊂ 𝑉 однозначно характеризуется любым из следующих эквивалентных друг другу свойств: 1) 𝑣 − 𝑣𝑈 ∈ 𝑈⊥ 2) ∀ 𝑢 ∈ 𝑈 (𝑢, 𝑣) = (𝑢, 𝑣𝑈 ) 3) ∀ 𝑢 ∈ 𝑈 𝑢 ≠ 𝑣𝑈 ⇒ |𝑣 − 𝑢| > |𝑣 − 𝑣𝑈 | и может найдена по формуле 𝑣𝑈 = ∑ 𝑢𝑖 ⋅ (𝑣, 𝑢𝑖× ) , (1017) 𝑖 × где 𝑢1 , … , 𝑢𝑚 и 𝑢1× , … , 𝑢𝑚 — произвольные евклидово двойственные базисы в 𝑈. Доказательство. Свойства (1) и (2) очевидным образом равносильны и утверждают, что векто ры 𝑣𝑈 и 𝑣 − 𝑣𝑈 являются компонентами вектора 𝑣 в прямом разложении 𝑉 = 𝑈 ⊕ 𝑈⊥ . Поскольку для любого вектора 𝑢 = 𝑣𝑈 + 𝑤 ∈ 𝑈, где 𝑤 ∈ 𝑈 отличен от нуля, выполняется строгое нера венство (𝑣 − 𝑢, 𝑣 − 𝑢) = (𝑣𝑈⊥ − 𝑤, 𝑣𝑈⊥ − 𝑤) = (𝑣𝑈⊥ , 𝑣𝑈⊥ ) + (𝑤, 𝑤) > (𝑣𝑈⊥ , 𝑣𝑈⊥ ), ортогональная проекция 𝑣𝑈 вектора 𝑣 на подпространство 𝑈 обладает свойством (3). А так как вектор, облада ющий свойством (3), очевидным образом единствен, это свойство равносильно свойствам (1) и (2). Остаётся проверить, что вектор 𝑣𝑈 , определённый по формуле (1017), обладает свой ством (2). Поскольку свойство (2) линейно по 𝑢 ∈ 𝑈, достаточно убедиться, что оно выполня × , что очевидно: (𝑣𝑈 , 𝑢𝜈× ) = ∑𝑖 (𝑢𝑖 , 𝑢𝜈× )⋅(𝑣 , 𝑢𝑖× ) = (𝑣 , 𝑢𝜈× ) ется для базисных векторов 𝑢 = 𝑢1× , … , 𝑢𝑚 для каждого 𝜈. Следствие 10.2 В евклидовом аффинном пространстве 𝔸(𝑉 ) для любого непустого аффинного подпространства 𝛱 ⊊ 𝔸(𝑉 ) и любой точки 𝑎 ∉ 𝛱 существует единственная точка 𝑎𝛱 ∈ 𝛱, удовлетворяющая двум эквивалентным друг другу условиям: ⃖⃖⃖⃗𝛱 перпендикулярен любому вектору 𝑝𝑞 ⃖⃖⃖⃗ с 𝑝, 𝑞 ∈ 𝛱 1) вектор 𝑎𝑎 2) |𝑎𝑞 | > |𝑎𝑎𝛱 | для любой точки 𝑞 ∈ 𝛱, отличной от 𝑎𝛱 . Доказательство. Поместим начало отсчёта в какуюнибудь точку 𝑜 ∈ 𝛱 и отождествим точки ⃖⃖⃖⃗ ∈ 𝑉 . При этом аффинное подпространство 𝛱 превратится в 𝑎 ∈ 𝔸(𝑉 ) с радиусвекторами 𝑜𝑎 ⃖⃖⃖⃗ ∈ 𝑉 . векторное подпространство 𝑈 ⊂ 𝑉 , а точке 𝑎 ∈ 𝐴 сопоставится её радиус вектор 𝑣 = 𝑜𝑎 Остаётся применить к ним предл. 10.3. 136 §10 Евклидова геометрия 10.4.1. Расстояние до подпространства. Точка 𝑎𝛱 ∈ 𝛱 из сл. 10.2 называется ортогональ ной проекцией точки 𝑎 на аффинное подпространство 𝛱 ⊂ 𝔸(𝑉 ). Длина |𝑎 − 𝑎𝛱 | называется рас стоянием от точки 𝑎 до подпространства 𝛱. По свойству (1) из предл. 10.3 это расстояние равно длине |⃖⃖⃖ 𝑞𝑝⃗𝑈⊥ | ортогональной проекции вектора ⃖⃖⃖ 𝑞𝑝⃗, где 𝑞 ∈ 𝛱 — любая точка, на ортогональное дополнение 𝑈⊥ к направляющему векторному пространству 𝑈 ⊂ 𝑉 аффинного подпростран ства 𝛱. Пример 10.3 (расстояние от точки до гиперплоскости) Направляющим векторным пространством гиперплоскости 𝛱 с уравнением1 (𝑎, 𝑥 ) = 𝑑 являет ся ортогонал 𝑎⊥ к вектору 𝑎. Расстояние от произвольно заданной точки 𝑝 до гиперплоскости 𝛱 равно расстоянию между их ортогональными проекциями на одномерное подпространство, по рождённое вектором 𝑎. Точка 𝑝 проектируется в вектор 𝑎 ⋅ (𝑎, 𝑝)∕(𝑎, 𝑎), гиперплоскость 𝛱 — в вектор 𝑎 ⋅ (𝑥 , 𝑝)∕(𝑎, 𝑎) = 𝑎 ⋅ 𝑑 ∕(𝑎, 𝑎). Разность между ими имеет длину |(𝑎, 𝑝) − 𝑑 | ⋅ |𝑎|∕(𝑎, 𝑎) = |(𝑎, 𝑝) − 𝑑 |∕|𝑎| . Пример 10.4 (евклидов объём через площадь основания и высоту) Рассмотрим в евклидовом пространстве линейно независимый набор 𝒘 = (𝑣 , 𝑢1 , … , 𝑢𝑛 ) из 𝑛 + 1 векторов и обозначим через 𝑈 линейную оболочку его поднабора 𝒖 = (𝑢1 , … , 𝑢𝑛 ), состо ящего из последних 𝑛 векторов. Вектор 𝑣 единственным образом представляется в виде суммы 𝑣 = 𝑣𝑈 + 𝑣𝑈⊥ , где 𝑣𝑈 ∈ 𝑈, а вектор 𝑣𝑈⊥ лежит в одномерном ортогональном дополнении 𝑈⊥ к подпространству 𝑈 в линейной оболочке 𝑊 набора векторов 𝒘. Вектор 𝑣𝑈⊥ называется вы сотой параллелепипеда (𝑣 , 𝑢1 , … , 𝑢𝑛 ), опущенной из вершины 𝑣 на основание 𝒖. Длина этой высоты равна расстоянию от вершины 𝑣 до подпространства 𝑈 или, что то же самое, длине ор тогональной проекции 𝑣𝑈⊥ вектора 𝑣 на 𝑈⊥ . Так как вектор 𝑣𝑈 является линейной комбинацией векторов 𝑢𝑖 , в координатах относительно любого ортонормального базиса в 𝑊 квадрат ориен тированного объёма натянутого на векторы 𝒘 параллелепипеда равен det2 (𝑣, 𝑢1 , … , 𝑢𝑛 ) = det2 (𝑣 − 𝑣𝑈 , 𝑢1 , … , 𝑢𝑛 ) = det2 (𝑣𝑈⊥ , 𝑢1 , … , 𝑢𝑛 ) = 𝛤(𝑣𝑈⊥ ,𝑢1 ,…,𝑢𝑛 ) . Единственным ненулевым элементом первой строки и первого столбца определителя Грама векторов 𝑣𝑈⊥ , 𝑢1 , … , 𝑢𝑛 является стоящий в левом верхнем углу квадрат |𝑣𝑈⊥ |2 . Поэтому Vol2 (𝑣, 𝑢1 , … , 𝑢𝑛 ) = 𝛤(𝑣𝑈⊥ , 𝑢1 ,…,𝑢𝑛 ) = |𝑣𝑈⊥ |2 ⋅ 𝛤(𝑢1 ,…,𝑢𝑛 ) = |𝑣𝑈⊥ |2 ⋅ Vol2 (𝑢1 , … , 𝑢𝑛 ) . Иначе говоря, (𝑛 + 1)мерный евклидов объём параллелепипеда 𝒘 равен произведению 𝑛мер ного евклидова объёма основания 𝒖 на длину опущенной на него высоты: Vol𝑛+1 (𝑣, 𝑢1 , … , 𝑢𝑛 ) = |𝑣𝑈⊥ | ⋅ Vol𝑛 (𝑢1 , … , 𝑢𝑛 ) . (1018) Пример 10.5 (расстояние между аффинными подпространствами) Рассмотрим в аффинном пространстве 𝔸(𝑉 ), ассоциированном с евклидовым векторным про странством 𝑉 , аффинные подпространства 𝐾 = 𝑝 + 𝑈 и 𝐿 = 𝑞 + 𝑊 с направляющими вектор ными пространствами 𝑈, 𝑊 ⊂ 𝑉 . Пусть эти пространства не пересекаются2 , т. е. ⃖⃖⃖ 𝑝𝑞⃗ ∉ 𝑈 + 𝑊 . Для любых двух векторов 𝑥 = 𝑝 + 𝑢 ∈ 𝐾 и 𝑦 = 𝑞 + 𝑤 ∈ 𝐿 расстояние |𝑦 − 𝑥 | = |⃖⃖⃖ 𝑝𝑞⃗ − (𝑤 − 𝑢)| достигает своего минимума по 𝑢 ∈ 𝑈, 𝑤 ∈ 𝑊 тогда и только тогда, когда вектор 𝑤 − 𝑢 = ⃖⃖⃖ 𝑝𝑞⃗𝑈+𝑊 1 2 См. прим. 10.1 на стр. 131. См. предл. 4.3 на стр. 53. 10.4. Ортогональное проектирование, расстояния и углы 137 ⃖⃖⃖⃗ на подпространство 𝑈 + 𝑊 и этот минимум ра является ортогональной проекцией вектора 𝑝𝑞 ⃖⃖⃖⃗ и подпространством 𝑈 + 𝑊 , т. е. длине ортогональной про вен расстоянию между вектором 𝑝𝑞 екции ⃖⃖⃖ 𝑝𝑞⃗(𝑈+𝑊)⊥ вектора ⃖⃖⃖ 𝑝𝑞⃗ на подпространство (𝑈 + 𝑊 )⊥ . Это число называется расстоянием между аффинными подпространствами 𝐾 , 𝐿 и обозначается ⃖⃖⃖⃗(𝑈+𝑊)⊥ | = min𝑥∈𝐾, 𝑦∈𝐿 |𝑦 − 𝑥| |𝐾, 𝐿| = |𝑝𝑞 (1019) ⃖⃖⃖⃗ ∈ 𝑈 + 𝑊 , мы полагаем |𝐾, 𝐿| = 0, что согласуется с равенством (1019), Если 𝐾 ∩ 𝐿 ≠ ∅, т. е. 𝑝𝑞 ⃖⃖⃖⃗(𝑈+𝑊)⊥ = 0. Если векторы 𝑣1 , … , 𝑣𝑘 составляют базис подпростран так как в этом случае 𝑝𝑞 ⃖⃖⃖⃗(𝑈+𝑊)⊥ является опущенной из вершины 𝑞 высотой параллелепипеда, ства 𝑈 + 𝑊 , то вектор 𝑝𝑞 натянутого на векторы ⃖⃖⃖ 𝑝𝑞⃗, 𝑣1 , … , 𝑣𝑘 , и длину этой высоты можно вычислять при помощи фому лы (1018): |𝐾, 𝐿| = 𝛤(⃖⃖⃖⃗ Vol𝑘+1 (⃖⃖⃖ 𝑝𝑞⃗, 𝑣1 , … , 𝑣𝑘 ) 𝑝𝑞,𝑣1 ,…,𝑣𝑘 ) = , Vol𝑘 (𝑣1 , … , 𝑣𝑘 ) √ 𝛤(𝑣1 ,…,𝑣𝑘 ) (1020) где Vol𝑚 означает 𝑚мерный евклидов объём. 10.4.2. Угол между вектором и подпространством. Рассмотрим в евклидовом векторном пространстве 𝑉 векторное подпространство 𝑈 ⊂ 𝑉 и вектор 𝑣 ∈ 𝑉 , не лежащий ни в 𝑈, ни в 𝑈⊥ . Тогда абсолютная величина ориентированного угла1 0 < |∡(𝑣 , 𝑢)| < 𝜋 ∕2 между этим вектором и ненулевыми векторами 𝑢 ∈ 𝑈 достигает своего минимума на единственном с точностью до умножения на положительную константу векторе 𝑢, равном ортогональной проекции 𝑣𝑈 век тора 𝑣 на подпространство 𝑈. В самом деле, наименьшему значению угла отвечает наибольшее значение его косинуса cos(∡(𝑣, 𝑢)) = (𝑣 , 𝑢) |𝑣 | (𝑣, 𝑢) = 𝑈 = (𝑣𝑈 ∕|𝑣𝑈 |, 𝑢 ∕|𝑢|) ⋅ 𝑈 |𝑣| ⋅ |𝑢| |𝑣| ⋅ |𝑢| |𝑣 | (второе равенство выполняется в силу свойства (2) из предл. 10.3 на стр. 135). Последний со множитель в правой части не зависит от 𝑢, а первый — в силу неравенства Коши – Буняковско го – Шварца2 — не превосходит произведения длин |𝑣𝑈 ∕|𝑣𝑈 || ⋅ |𝑢 ∕|𝑢|| = 1 и в точности равен этому произведению если и только если векторы 𝑣𝑈 и 𝑢 сонаправлены. Угол 𝜑 ∈ [0, 𝜋 ∕ 2], од нозначно определяемый из равенства cos 𝜑 = |𝑣𝑈 | ∕ |𝑣 |, называется евклидовым углом между ненулевым вектором 𝑣 и подпространством 𝑈. При 𝑣 ∈ 𝑈 и 𝑣 ∈ 𝑈⊥ эта формула даёт 𝜑 = 0 и 𝜑 = 𝜋 ∕ 2, так как в этих случаях 𝑣𝑈 = 𝑣 и 𝑣𝑈 = 0 соответственно. Обратите внимание, что возникающие в последних двух крайних случаях углы попрежнему являются минимальными среди углов между вектором 𝑣 и ненулевыми векторами 𝑢 ∈ 𝑈. Так как |𝑣𝑈⊥ | = |𝑣 | ⋅ sin 𝜑, евклидов угол 𝜑 между вектором 𝑣 и подпространством 𝑈 также можно вычислять при помощи форм. (1018) на стр. 136: sin 𝜑 = |𝑣𝑈⊥ | √𝛤(𝑣,𝑢1 ,…,𝑢𝑘 ) = , |𝑣| |𝑣|√𝛤(𝑢1 ,…,𝑢𝑘 ) где 𝑢1 , … , 𝑢𝑘 — произвольный базис подпространства 𝑈. 1 2 См. формулу (39) на стр. 38. См. формулу (34) на стр. 34. (1021) 138 §10 Евклидова геометрия 10.5. Векторные произведения. Зафиксируем в 𝑛мерном евклидовом векторном простран стве 𝑉 какойнибудь ортонормальный базис 𝒆 = (𝑒1 , … , 𝑒𝑛 ) и условимся записывать векторы 𝑣 ∈ 𝑉 строками их координат в этом базисе. Сопоставим каждому набору из 𝑛 − 1 векторов 𝑣1 , … , 𝑣𝑛−1 ∈ 𝑉 матрицу 𝐴 размера (𝑛 − 1) × 𝑛, по строкам которой записаны координаты этих векторов в базисе 𝒆, и назовём векторным произведением векторов 𝑣1 , … , 𝑣𝑛−1 вектор 𝑛 [𝑣1 , … , 𝑣𝑛−1 ] ≝ ∑ 𝐴𝑖 𝑒𝑖 = (𝐴1 , … , 𝐴𝑛 ) , (1022) 𝑖=1 𝑖 я координата 𝐴𝑖 которого равна взятому со знаком (−1)𝑖−1 определителю дополнительной к 𝑖 тому столбцу (𝑛 − 1) × (𝑛 − 1)подматрицы в 𝐴, точно так же, как это было во втором прави ле Крамера из n∘ 8.2.2 на стр. 103. Векторное произведение замечательно тем, что для любого вектора 𝑢 ∈ 𝑉 выполняется равенство 𝜔𝒆 (𝑢, 𝑣1 , … , 𝑣𝑛−1 ) = (𝑢, [𝑣1 , … , 𝑣𝑛−1 ]) , (1023) где 𝜔𝒆 — единственная форма ориентированного объёма на 𝑉 , принимающая на ортонормаль ном базисе 𝒆 значение 1. Упражнение 10.6. Докажите соотношение (1023). Иначе говоря, вектор [𝑣1 , … , 𝑣𝑛−1 ] является прообразом линейного функционала 𝑉 → ℝ, 𝑢 ↦ 𝜔𝒆 (𝑢, 𝑣1 , … , 𝑣𝑛−1 ) , при изоморфизме 𝑉 ⥲ 𝑉∗ из форм. (1010) на стр. 133, сопоставляющем вектору 𝑣 ∈ 𝑉 ковектор 𝑔𝑣 ∶ 𝑉 → ℝ, 𝑢 ↦ (𝑢, 𝑣). В частности, векторное произведение не меняется при замене ортонор мального базиса 𝒆 на любой другой ортонормальный базис той же ориентации1 и меняет знак при выборе вместо 𝒆 ортонормального базиса противоположной ориентации. Геометрически, векторное произведение однозначно определяется следующими своими свойствами. Предложение 10.4 Вектор [𝑣1 , … , 𝑣𝑛−1 ] перпендикулярен векторам 𝑣1 , … , 𝑣𝑛−1 , и его длина равна евклидову объ ёму (𝑛 − 1)мерного параллелепипеда, натянутого на векторы 𝑣1 , … , 𝑣𝑛−1 . Если эта длина нену левая, то направление вектора [𝑣1 , … , 𝑣𝑛−1 ] таково, что матрица перехода от базиса [𝑣1 , … , 𝑣𝑛−1 ], 𝑣1 , … , 𝑣𝑛−1 к базису 𝒆 имеет положительный определитель. Доказательство. Подставляя в формулу (1023) вектор 𝑢 = 𝑣𝑖 , получаем (𝑣𝑖 , [𝑣1 , … , 𝑣𝑛−1 ]) = 𝜔𝒆 (𝑣𝑖 , 𝑣1 , … , 𝑣𝑛−1 ) = 0 , что доказывает первое утверждение. Подставляя 𝑢 = [𝑣1 , … , 𝑣𝑛−1 ], получаем 2 𝜔𝒆 ([𝑣1 , … , 𝑣𝑛−1 ], 𝑣1 , … , 𝑣𝑛−1 ) = |[𝑣1 , … , 𝑣𝑛−1 ]| ⩾ 0 . В силу первого утверждения вектор [𝑣1 , … , 𝑣𝑛−1 ] является высотой параллелепипеда, объём ко торого стоит в левой части последней формулы. Согласно прим. 10.4 этот объём равен произве дению длины |[𝑣1 , … , 𝑣𝑛−1 ]| на евклидов объём (𝑛 − 1)мерного параллелепипеда, натянутого на векторы 𝑣1 , … , 𝑣𝑛−1 . Отсюда вытекают второе и третье утверждения. 1 См. n∘ 10.2.1 на стр. 133. 139 10.5. Векторные произведения Следствие 10.3 Векторы 𝑣1 , … , 𝑣𝑛−1 ∈ ℝ𝑛 линейно зависимы если и только если [𝑣1 , … , 𝑣𝑛−1 ] = 0. Пример 10.6 (расстояние меду подпространствами, продолжение прим. 10.5) Формулу из прим. 10.5 для минимального расстояния между непересекающимися аффинными подпространствами 𝑝 + 𝑈 и 𝑞 + 𝑊 в евклидовом аффинном пространстве 𝔸(𝑉 ) можно переписать как 𝑞𝑝⃗, 𝑒1 , … , 𝑒𝑘 )| Vol𝑘+1 (⃖⃖⃖ 𝑞𝑝⃗, 𝑒1 , … , 𝑒𝑘 ) |det(⃖⃖⃖ = , Vol𝑘 (𝑒1 , … , 𝑒𝑘 ) |[𝑒1 , … , 𝑒𝑘 ]| где 𝑒1 , … , 𝑒𝑘 — любой базис пространства 𝑈 + 𝑊 , а определитель в правой части — это опреде литель матрицы координат указанных в нём векторов в какомнибудь ортонормальном базисе пространства 𝑉 . Пример 10.7 (векторное произведение в ℝ3 ) Векторное произведение в ℝ3 , заданное с помощью стандартного ортонормального базиса 𝒆 = = (𝑒1 , 𝑒2 , 𝑒3 ), представляет собою бинарную операцию ℝ3 × ℝ3 → ℝ3 , (𝑢, 𝑤) ↦ [𝑢, 𝑤], и часто обозначается1 𝑢 × 𝑤. Формула (1023) в этом случае утверждает, что ориентированный объём параллелепипеда, натянутого на векторы ⎛𝑎1 (𝑎, 𝑏, 𝑐 ) = (𝑒1 , 𝑒2 , 𝑒3 ) ⋅ ⎜𝑎2 ⎜ ⎝𝑎3 𝑏1 𝑏2 𝑏3 𝑐1 ⎞ 𝑐2 ⎟ , ⎟ 𝑐3 ⎠ равен скалярному произведению вектора 𝑎 = (𝑎1 , 𝑎2 , 𝑎3 ) с вектором [𝑏, 𝑐 ] ≝ (𝑏2 𝑐3 − 𝑏3 𝑐2 , − 𝑏1 𝑐3 + 𝑏3 𝑐1 , 𝑏1 𝑐2 − 𝑏2 𝑐1 ) = = 𝑏 det 2 ( (𝑏3 𝑐2 𝑏 , − det 1 (𝑏3 𝑐3 ) 𝑐1 𝑏 , det 1 (𝑏2 𝑐3 ) 𝑐1 , 𝑐2 )) (1024) в чём несложно убедиться, раскладывая по первому столбцу определитель ⎛𝑎1 𝑏1 𝑐1 ⎞ det ⎜𝑎2 𝑏2 𝑐2 ⎟ = 𝑎1 ⋅ (𝑏2 𝑐3 − 𝑏3 𝑐2 ) + 𝑎2 ⋅ (−𝑏1 𝑐3 + 𝑏3 𝑐1 ) + 𝑎3 ⋅ (𝑏1 𝑐2 − 𝑏2 𝑐1 ) = (𝑎, [𝑏, 𝑐]) . ⎜ ⎟ ⎝𝑎3 𝑏3 𝑐3 ⎠ Так как (𝑏, [𝑏, 𝑐 ]) = det(𝑏, 𝑏, 𝑐 ) = 0 и (𝑐 , [𝑏, 𝑐 ]) = det(𝑐 , 𝑏, 𝑐 ) = 0, вектор [𝑏, 𝑐 ] перпендикулярен векторам 𝑏 и 𝑐 , а квадрат его длины ([𝑏, 𝑐 ], [𝑏, 𝑐 ]) = Vol3 ([𝑏, 𝑐 ], 𝑏, 𝑐 ) = |[𝑏, 𝑐 ]| ⋅ Vol2 (𝑏, 𝑐 ), откуда |[𝑏, 𝑐 ]| = Vol2 (𝑏, 𝑐 ). Упражнение 10.7. Убедитесь, что векторное произведение ℝ3 × ℝ3 → ℝ3 кососимметрично, т. е. 𝑣 × 𝑣 = 0 для всех 𝑣 , и не ассоциативно, но удовлетворяет правилу Лебница2 𝑢 × (𝑣 × 𝑤 ) = ( 𝑢 × 𝑣 ) × 𝑤 + 𝑣 × (𝑢 × 𝑤 ) . Упражнение 10.8. Докажите для векторных произведений в ℝ3 равенства а) [𝑎, [𝑏, 𝑐 ]] = 𝑏 ⋅ (𝑎, 𝑐 ) − 𝑐 ⋅ (𝑎, 𝑏) б) [[𝑎, 𝑏], [𝑎, 𝑐 ]] = 𝑎 ⋅ det(𝑎, 𝑏, 𝑐 ) (𝑎, 𝑐 ) (𝑎, 𝑑 ) в) ([𝑎, 𝑏], [𝑐 , 𝑑 ]) = det ((𝑏, 𝑐 ) (𝑏, 𝑑 )) 1 В английской литературе векторное произведение даже и называется crossproduct. Которое часто записывают в виде [𝑢, [𝑣, 𝑤]] + [𝑣, [𝑤, 𝑢]] + [𝑤, [𝑢, 𝑣]] = 0 и называют тождеством Якоби. 2 §11. Линейные отображения евклидовых пространств Всюду в этом параграфе речь попрежнему идёт про конечномерные евклидовы векторные про странства над полем ℝ. 11.1. Ортогональные операторы. Линейный оператор 𝐹 ∶ 𝑉 → 𝑉 на евклидовом векторном пространстве 𝑉 называется ортогональным или изометрией, если он сохраняет длины векто ров, т. е. |𝐹𝑣 | = |𝑣 | для каждого 𝑣 ∈ 𝑉 . Поскольку скалярное произведение однозначно выра жается через длины векторов по формуле (𝑢 , 𝑤 ) = 1 2 2 2 (| 𝑢 + 𝑤 | − | 𝑢 | − | 𝑤 | ) , 2 каждый ортогональный оператор 𝐹 автоматически сохраняет скалярные произведения, т. е. ∀ 𝑢, 𝑤 ∈ 𝑉 (𝐹𝑢, 𝐹𝑤) = (𝑢, 𝑤) . Сохранение скалярных произведений влечёт за собою сохранение углов между векторами и лю бых других величин, выражающихся через скалярные произведения. Например, каждый орто гональный оператор сохраняет евклидов объём параллелепипеда, равный корню из определи теля Грама1 . Поэтому определитель любого ортогонального оператора равен ±1. В частности, все ортогональные операторы обратимы и составляют в полной линейной группе простран ства 𝑉 подгруппу, которая обозначается O(𝑉 ) ⊂ GL(𝑉 ) и называется ортогональной группой евклидова пространства 𝑉 . Сохраняющие ориентацию ортогональные операторы называются собственными. Они образуют в ортогональной группе подгруппу, которая обозначается SO(𝑉 ) ≝ O(𝑉 ) ∩ SL(𝑉 ) = {𝐹 ∈ O(𝑉 ) | det 𝐹 = 1} и называется специальной или собственной ортогональной группой. Ортогональные операто ры определителя −1, меняющие ориентацию пространства на противоположную, называются несобственными. Пример 11.1 (центральная симметрия) Оператор −Id ∶ 𝑣 ↦ −𝑣 является ортогональным на любом евклидовом векторном простран стве 𝑉 . Он собственный, если dim 𝑉 чётна, и несобственный, если dim 𝑉 нечётна. Упражнение 11.1. Покажите, что ортогональная группа одномерного пространства исчерпы вается операторами ±Id. Пример 11.2 (симметрии) Как мы видели в n∘ 10.3.2 на стр. 134, с каждым векторным подпространством 𝑈 ⊂ 𝑉 связано разложение в ортогональную прямую сумму 𝑉 = 𝑈 ⊕𝑈⊥ . Обозначим через 𝑠𝑈 ∶ 𝑉 → 𝑉 линейное отображение, тождественно действующее на 𝑈 и умножающее все векторы из 𝑈⊥ на −1, т. е. переводящее произвольный вектор 𝑣 = 𝑣𝑈 + 𝑣𝑈⊥ ∈ 𝑈 ⊕ 𝑈⊥ = 𝑉 в вектор 𝑠𝑈 (𝑣) = 𝑣𝑈 − 𝑣𝑈⊥ = 𝑣 − 2𝑣𝑈⊥ . (111) Так как |𝑠𝑈 (𝑣 )|2 = |𝑢𝑣 − 𝑢𝑣⊥ |2 = |𝑢𝑣 |2 + |𝑢𝑣⊥ |2 = |𝑢𝑣 + 𝑢𝑣⊥ |2 = |𝑣 |2 , оператор 𝑠𝑈 ортогонален. Он называется симметрией относительно подпространства 𝑈. При 𝑈 = 0 получается центральная 1 См. n∘ 10.2.1 на стр. 133. 140 141 11.1. Ортогональные операторы симметрия из предыдущего прим. 11.1. В общем случае оператор 𝑠𝑈 собственный тогда и только тогда, когда коразмерность подпространства 𝑈 в 𝑉 чётна. Все операторы 𝜎𝑈 инволютивны, т. е. 2 𝜎𝑈 = Id𝑉 . 11.1.1. Отражения в гиперплоскостях. Важнейшим специальным случаем симметрии яв ляется отражение в гиперплоскости 𝑈 = 𝑢⊥ , перпендикулярной какомулибо ненулевому век тору 𝑢 ∈ 𝑉 . Оно обозначается через 𝜎𝑢 = 𝑠𝑢⊥ и действу ет по формуле σu v v 𝜎𝑢 (𝑣) = 𝑣 − 2 u −u o (u,v) (u,u) ·u u⊥ Рис. 11⋄1. Отражение в гиперплоскости 𝑢⊥ . (𝑢 , 𝑣 ) ⋅𝑢. (𝑢, 𝑢) (112) в которую превращается (111) при 𝑈⊥ = ℝ 𝑢. Два отра жения 𝜎𝑢 и 𝜎𝑤 совпадают тогда и только тогда, когда за дающие их ненулевые векторы 𝑢 и 𝑤 пропорциональны. Отражения в гиперплоскостях являются несобственны ми изометриями. Любые два различных ненулевых век тора 𝑎 ≠ 𝑏 одинаковой длины |𝑎| = |𝑏| переводятся друг в друга отражением 𝜎𝑎−𝑏 относительно срединного пер пендикуляра1 к отрезку [𝑎, 𝑏] в 𝔸(𝑉 ). Упражнение 11.2. Убедитесь в этом. Теорема 11.1 Каждый нетождественный ортогональный оператор на 𝑛мерном евклидовом векторном про странстве 𝑉 является композицией не более 𝑛 отражений в гиперплоскостях. Доказательство. Индукция по 𝑛 = dim 𝑉 . Случай 𝑛 = 1 покрывается упр. 11.1. Пусть 𝑛 > 1 и 𝐹 (𝑣 ) ≠ 𝑣 для некоторого ненулевого вектора 𝑣 . Обозначим через 𝜎 отражение, переводя щее 𝐹 (𝑣 ) в 𝑣 . Ортогональный оператор 𝐺 = 𝜎 ∘ 𝐹 оставляет вектор 𝑣 на месте и, тем самым, переводит в себя гиперплоскость 𝑣⊥ . По индукции, ограничение 𝐺 |𝑣⊥ = 𝜎𝑘 ∘⋯∘ 𝜎1 является ком позицией 𝑘 ⩽ (𝑛 − 1) отражений 𝜎𝑖 ∶ 𝑣⊥ → 𝑣⊥ в (𝑛 − 2)мерных гиперплоскостях, лежащих в 𝑣⊥ . Каждое отражение 𝜎𝑖 является ограничением на подпространство 𝑣⊥ отражения 𝜎𝑖 ∶ 𝑉 → 𝑉 в (𝑛 − 1)й гиперплоскости, порождённой вектором 𝑣 и (𝑛 − 2)мерным зеркалом отражения 𝜎𝑖 . Так как вектор 𝑣 неподвижен при всех отражениях 𝜎𝑖 , оператор 𝐺 = 𝜎𝑘 ∘ ⋯ ∘ 𝜎1 ∶ 𝑉 → 𝑉 яв ляется композицией отражений 𝜎𝑖 . Следовательно, 𝐹 = 𝜎 ∘ 𝐺 является композицией 𝑘 + 1 ⩽ 𝑛 отражений. Следствие 11.1 Всякий собственный ортогональный оператор является композицией чётного, а всякий несоб ственный — нечётного числа отражений в гиперплоскостях. Пример 11.3 (собственные изометрии трёхмерного пространства) Каждый нетождественный собственный ортогональный оператор 𝐹 в трёхмерном евклидовом векторном пространстве 𝑉 является композицией 𝐹 = 𝜎𝑢2 ∘ 𝜎𝑢1 отражений в двух различных 1 См. прим. 10.2 на стр. 131. 142 §11 Линейные отображения евклидовых пространств плоскостях 𝑢2⊥ , 𝑢1⊥ , ортогональных непропорциональным векторам 𝑢2 , 𝑢1 . Обозначим порож дённую этими векторами плоскость через 𝑈. Оператор 𝐹 тождественно действует на прямой 𝑈⊥ = 𝑢1⊥ ∩ 𝑢2⊥ = ℝ ⋅ [𝑢1 , 𝑢2 ] с вектором скорости1 [𝑢1 , 𝑢2 ]. Ортогональная этой пря мой гиперплоскость 𝑈 переводится оператором 𝐹 в се бя, и ограничение 𝐹 |𝑈 является собственным ортого нальным преобразованием этой плоскости, поскольку det 𝐹 = det 𝐹 |𝑈 . В силу предл. 3.5 на стр. 41 каждое собственное ортогональное линейное преобразование плоскости является поворотом. 𝑢1⊥ 𝑢2⊥ [𝑢1 , 𝑢2 ] Упражнение 11.3. Убедитесь, что это поворот на угол 2∡(𝑢1 𝑢2 ) по часовой стрелке, если глядеть вдоль вектора [𝑢1 , 𝑢2 ]. Мы заключаем, что собственная ортогональная груп па трёхмерного евклидова пространства исчерпывает ся поворотами вокруг прямых. Этот факт известен как теорема Эйлера. Рис. 11⋄2. Поворот. 11.1.2. Ортогональные суммы поворотов. В этом разделе мы построим для любого орто гонального оператора 𝐹 ∶ 𝑉 → 𝑉 разложение пространства 𝑉 в прямую сумму двумерных и одномерных 𝐹 инвариантных подпространств 𝑉 = 𝑈1 ⊕ ⋯ ⊕ 𝑈𝑚 , в котором все подпростран ства попарно ортогональны друг другу и 𝐹 действует на каждом двумерном подпространстве 𝑈𝑖 как поворот на некоторый угол 𝜑𝑖 ∈ (0, 𝜋), а на каждом одномерном — как Id или −Id. Отме тим, что любые два одномерных собственных подпространства с собственным числом 1 можно объединить в двумерную плоскость, на которой 𝐹 действует поворотом на нулевой угол, а лю бые два одномерных собственных подпространства с собственным числом −1 — в двумерную плоскость, на которой 𝐹 действует как поворот на угол 𝜋. Поэтому можно считать, что разло жение, о котором идёт речь, состоит из двумерных подпространств 𝑈𝑖 , на которых 𝐹 действует поворотами на углы 𝜑𝑖 ∈ [0, 𝜋], и, может быть, ещё одного или двух одномерных слагаемых, причём когда их два, то на одном из них 𝐹 действует тождественно, а на другом — умножени ем на −1. Оператор 𝐹 собственный если и только если таких одномерных слагаемых либо нет вовсе, либо оно ровно одно, и 𝐹 действует на нём тождественно. Лемма 11.1 Каждый линейный оператор 𝐹 ∶ 𝑉 → 𝑉 на конечномерном вещественном векторном простран стве обладает одномерным или двумерным инвариантным подпространством. Доказательство. Рассмотрим произвольный ненулевой вектор 𝑣 ∈ 𝑉 и образуем из него 𝑛 + 1 векторов 𝑣 , 𝐹𝑣 , 𝐹2 𝑣 , … , 𝐹𝑛 𝑣 , где 𝑛 = dim 𝑉 и 𝐹𝑘 𝑣 обозначает результат 𝑘кратного последо вательного применения оператора 𝐹 к вектору 𝑣 . Поскольку эти векторы линейно зависимы, найдутся такие 𝑎1 , 𝑎2 , … , 𝑎𝑘 ∈ ℝ, что (𝐹𝑘 + 𝑎1 𝐹𝑘−1 + ⋯ + 𝑎𝑘−1 𝐹 + 𝑎𝑘 ) 𝑣 = 0. Заключённый в скобки линейный оператор является результатом подстановки 𝑡 = 𝐹 в многочлен 𝑓(𝑡) = = 𝑡𝑘 + 𝑎1 𝑡𝑘−1 + ⋯ + 𝑎𝑘−1 𝑡 + 𝑎𝑘 ∈ ℝ[𝑡]. Такой многочлен представляет собою произведение 1 См. прим. 10.7 на стр. 139. 143 11.1. Ортогональные операторы 𝑓(𝑡) = 𝑔1 (𝑡) ⋯ 𝑔𝑚 (𝑡) линейных двучленов вида 𝑡 − 𝛼 и квадратных трёхчленов вида 𝑡2 − 𝛼𝑡 − 𝛽 с вещественными коэффициентами. Подставляя в это разложение 𝐹 и применяя полученный оператор к вектору 𝑣 , мы заключаем, что 𝑔1 (𝐹 ) ∘ ⋯ ∘ 𝑔𝑚 (𝐹 ) 𝑣 = 0. Рассмотрим наименьшее 𝑘, для которого вектор 𝑤 = 𝑔𝑘+1 (𝐹 ) ∘ ⋯ ∘ 𝑔𝑚 (𝐹 ) 𝑣 ≠ 0. Тогда 𝑔𝑘 (𝐹 ) 𝑤 = 0. Для 𝑔𝑘 (𝐹 ) = 𝐹 − 𝛼 это значит, что 𝐹 (𝑤 ) = 𝛼𝑤, т. е. одномерное подпространство ℝ 𝑤 переводится оператором 𝐹 в себя. Для 𝑔𝑘 (𝐹 ) = 𝐹2 − 𝛼𝐹 − 𝛽 получаем равенство 𝐹 (𝐹 (𝑤)) = 𝛼𝐹 (𝑤) + 𝛽𝑤 , означающее, что линейная оболочка векторов 𝑤 и 𝐹 (𝑤 ) переводится оператором 𝐹 в себя. Теорема 11.2 Каждый ортогональный линейный оператор 𝐹 на конечномерном евклидовом пространстве записывается в подходящем ортонормальном базисе матрицей, на главной диагонали которой стоят числа ±1 и 2 × 2 блоки вида cos 𝜑𝑖 ( sin 𝜑𝑖 − sin 𝜑𝑖 , cos 𝜑𝑖 ) где 0 < 𝜑𝑖 < 𝜋 , (113) а все остальные элементы равны нулю. С точностью до перестановки блоков и диагональных элементов эта матрица не зависит от выбора ортонормального базиса, в котором оператор име ет матрицу такого вида. Доказательство теор. 11.2. Разложение пространства 𝑉 в ортогональную прямую сумму 𝐹 ин вариантных одномерных и двумерных подпространств 𝑈𝑖 строится индукцией по dim 𝑉 . Случаи dim 𝑉 = 1, 2 уже были разобраны в упр. 11.1 на стр. 140 и предл. 3.5 на стр. 41 соответственно. Пусть dim 𝑉 ⩾ 3. Согласно лем. 11.1 оператор 𝐹 ∶ 𝑉 → 𝑉 переводит в себя некоторое одно мерное или двумерное подпространство 𝑈 ⊂ 𝑉 . Поскольку 𝐹 сохраняет скалярное произведе ние, ортогонал 𝑈⊥ к подпространству 𝑈 тоже переводится оператором 𝐹 в себя. По индукции, ограничения 𝐹 на 𝑈 и на 𝑈⊥ обладают нужными разложениями. Складывая эти разложения вместе, получаем требуемое разложение для 𝑉 = 𝑈 ⊕ 𝑈⊥ . Если выбрать в каждом подпростран стве 𝑈𝑖 ортонормальный базис и соединить эти базисы в один ортонормальный базис 𝒆 про странства 𝑉 , то оператор 𝐹 запишется в этом базисе матрицей 𝐹𝒆 , состоящей из расположенных на главной диагонали блоков вида (113), и, может быть, ещё нескольких диагональных эле ментов вида ±1. Поэтому характеристический многочлен оператора 𝐹 является произведением линейных множителей вида 𝑡 ± 1 и характеристических многочленов блоков (113): det 𝑡 − cos 𝜑𝑖 ( − sin 𝜑𝑖 sin 𝜑𝑖 = 𝑡2 − 2𝑡 cos 𝜑𝑖 + 1 . 𝑡 − cos 𝜑𝑖 ) Все они приведены и неприводимы. Поскольку характеристический многочлен не зависит от выбора базиса и разложение в произведение неприводимых приведённых многочленов в ℝ[𝑡] единственно с точностью до перестановки сомножителей, набор отличных от нуля и 𝜋 углов поворотов и количества стоящих на диагонали чисел +1 и −1 не зависят от способа разложения. Пример 11.4 (несобственные ортогональные операторы в трёхмерном пространстве) Согласно теор. 11.2 каждый несобственный ортогональный оператор на трёхмерном евклидо вом пространстве записывается в подходящем ортонормальном базисе матрицей ⎛− 1 ⎜ 0 cos 𝜑𝑖 ⎜ ⎝ 0 sin 𝜑𝑖 0 ⎞ − sin 𝜑𝑖 ⎟ , ⎟ cos 𝜑𝑖 ⎠ где 0 ⩽ 𝜑𝑖 ⩽ 𝜋 , 144 §11 Линейные отображения евклидовых пространств и является композицией поворота вокруг прямой с направляющим вектором 𝑒1 и отражения в перпендикулярной оси поворота плоскости 𝑒1⊥ . Пример 11.5 (движения трёхмерного евклидова аффинного пространства) Напомню1 , что эндоморфизм 𝐹 ∶ 𝔸(𝑉 ) → 𝔸(𝑉 ) аффинного пространства 𝔸(𝑉 ), ассоциированно го с евклидовым векторным пространством 𝑉 , называется движением, если он сохраняет рас стояния между точками. Каждое движение автоматически биективно и переводит прямые в прямые, а значит, является аффинным преобразованием2 , т. е. композицией 𝐹 = 𝜏𝑣 ∘ 𝐺𝑝 парал лельного переноса 𝜏𝑣 на некоторый вектор 𝑣 ∈ 𝑉 и линейного ортогонального преобразования 𝐺𝑝 ∶ 𝑉 → 𝑉 , оставляющего на месте некоторую точку 𝑝 ∈ 𝔸(𝑉 ). Пусть теперь dim 𝑉 = 3. Если движение 𝐹 собственное3 , то ортогональный оператор 𝐺𝑝 тоже собственный и являет ся поворотом 𝜚𝓁,𝜑 на угол 𝜑 (возможно, нулевой) вокруг некоторой проходящей через точку 𝑝 прямой 𝓁. Разложим вектор сдвига в сумму 𝑣 = 𝑢 + 𝑤 вектора 𝑢, параллельного прямой 𝓁, и вектора 𝑤 перпендикулярного прямой 𝓁. Композиция 𝜏𝑤 ∘ 𝜚𝓁,𝜑 переводит в себя каждую пер пендикулярную прямой 𝓁 плоскость 𝛱 и действует в ней как композиция поворота со сдвигом, т. е. как поворот на тот же угол 𝜑, но с другим центром4 , зависящим только от вектора 𝑤. Таким образом, композиция 𝜏𝑤 ∘ 𝜚𝓁,𝜑 = 𝜚𝓁′ ,𝜑 является поворотом пространства на тот же угол 𝜑, но от носительно прямой 𝓁′ , которая параллельна оси 𝓁 поворота 𝐺𝑝 . Такой поворот перестановочен со сдвигом 𝜏𝑢 вдоль оси поворота и композиция 𝐹 = 𝜏𝑣 ∘ 𝐺𝑝 = 𝜏𝑢 ∘ 𝜏𝑤 ∘ 𝜚𝓁,𝜑 = 𝜏𝑢 ∘ 𝜚𝓁′ ,𝜑 = 𝜚𝓁′ ,𝜑 ∘ 𝜏𝑢 представляет собою винтовое движение — композицию перестановочных друг с другом пово рота вокруг прямой и сдвига вдоль этой прямой. Ось винтового движения с ненулевым углом закрутки однозначно характеризуется как единственная прямая в пространстве, переводимая этим движением в себя. Итак, каждое собственное движение пространства есть винтовое дви жение — возможно, с нулевым вектором сдвига и/или нулевым углом закрутки. Если движение 𝐹 несобственное5 , то ортогональный оператор 𝐺𝑝 тоже несобственный и является либо отражением 𝜎𝛱 в проходящей через точку 𝑝 плоскости 𝛱, либо композицией та кого отражения с поворотом 𝜚𝓁,𝜑 вокруг проходящей через 𝑝 перпендикулярно плоскости 𝛱 прямой 𝓁. Раскладывая, как и выше, сдвиг 𝜏𝑣 в композицию сдвигов на перпендикулярный к плоскости 𝛱 вектор 𝑢 и параллельный 𝛱 вектор 𝑤, мы видим, что в первом случае композиция 𝜏𝑢 𝜎𝛱 = 𝜎𝛱′ является отражением в плоскости 𝛱′ = 𝛱 + 𝑢∕2, полученной из 𝛱 сдвигом на вектор6 𝑢 ∕2, и движение 𝐹 = 𝜏𝑣 ∘ 𝐺𝑝 = 𝜏𝑤 ∘ 𝜏𝑢 ∘ 𝜎𝛱 = 𝜏𝑤 ∘ 𝜎𝛱′ = 𝜎𝛱′ ∘ 𝜏𝑤 представляет собою скользящую симметрию — композицию отражения в плоскости с параллельным этой плоскости сдвигом. Во втором случае, в силу уже сказанного, 𝐹 = 𝜏𝑣 ∘ 𝐺𝑝 = 𝜏𝑤 ∘ 𝜏𝑢 ∘ 𝜎𝛱 ∘ 𝜚𝓁,𝜑 = 𝜏𝑤 ∘ 𝜎𝛱′ ∘ 𝜚𝓁,𝜑 = 𝜎𝛱′ ∘ 𝜏𝑤 ∘ 𝜚𝓁,𝜑 = 𝜎𝛱′ ∘ 𝜚𝓁′ ,𝜑 представляет собою композицию перестановочных друг с другом поворота вокруг прямой и отражения в плоскости, перпендикулярной оси поворота. В обоих случаях зеркало отражения См. n∘ 3.4 на стр. 40. См. n∘ 2.1 на стр. 22. 3 Т. е. сохраняет ориентацию. 4 См. n∘ 3.4.2 на стр. 41. 5 Т. е. меняет ориентацию на противоположную. 6 Ибо 𝜎𝛱′ ∘ 𝜎𝛱 = 𝜏𝑢 , см. n∘ 3.4.2 на стр. 41. 1 2 145 11.2. Евклидово сопряжение линейных отображений однозначно описывается как геометрическое место середин отрезков, соединяющих точки про странства с их образами при движении 𝐹 . 11.2. Евклидово сопряжение линейных отображений. С каждым линейным отображением 𝐹 ∶ 𝑈 → 𝑊 между евклидовыми пространствами 𝑈, 𝑊 связано евклидово сопряжённое отобра жение 𝐹× ∶ 𝑊 → 𝑈, которое однозначно характеризуется тем, что для всех 𝑢 ∈ 𝑈, 𝑤 ∈ 𝑊 (𝐹𝑢, 𝑤) = (𝑢, 𝐹× 𝑤) . (114) Предложение 11.1 Для любого линейного отображения евклидовых пространств 𝐹 ∶ 𝑈 → 𝑊 удовлетворяющее ра венству (114) линейное отображение 𝐹× ∶ 𝑊 → 𝑈 существует и единственно. Матрицы 𝐹𝒘𝒖 × и 𝐹𝒖𝒘 отображений 𝐹 и 𝐹× в произвольных базисах 𝒖 = (𝑢1 , … , 𝑢𝑛 ) и 𝒘 = (𝑤1 , … , 𝑤𝑚 ) про странств 𝑈 и 𝑊 связаны соотношением 𝑡 × 𝐹𝒘𝒖 𝐺𝒘 = 𝐺𝒖 𝐹𝒖𝒘 , (115) где 𝐺𝒖 = 𝒖𝑡 ⋅ 𝒖 и 𝐺𝒘 = 𝒘𝑡 ⋅ 𝒘 — матрицы Грама базисов 𝒖 и 𝒘. Доказательство. Левая часть (114) является результатом применения к вектору 𝐹𝑢 ∈ 𝑊 ли нейного функционала 𝑔𝑤 ∶ 𝑊 → ℝ, 𝑣 ↦ (𝑣 , 𝑤 ), в который переходит вектор 𝑤 ∈ 𝑊 при за даваемом евклидовой структурой на пространстве 𝑊 изоморфизме 𝐺𝑊 ∶ 𝑊 ⥲ 𝑊∗ , 𝑤 ↦ 𝑔𝑤 , из форм. (1010) на стр. 133. Композиция 𝑔𝑤 ∘ 𝐹 линейного функционала 𝑔𝑤 ∶ 𝑊 → ℝ с ли нейным отображением 𝐹 ∶ 𝑈 → 𝑊 является результатом применения к ковектору 𝑔𝑤 ∈ 𝑊∗ двойственного к 𝐹 линейного отображения1 𝐹∗ ∶ 𝑊∗ → 𝑉∗ , 𝜉 ↦ 𝜉 ∘ 𝐹 . Таким образом, в левой части (114) стоит значение ковектора 𝐹∗ (𝑔𝑤 ) = 𝐹∗ 𝐺𝑊 (𝑤) на векторе 𝑢. В правой части (114) написан результат применения к вектору 𝑢 ковектора 𝑔𝐹× 𝑤 = 𝐺𝑈 𝐹× (𝑤), в который переходит вектор 𝐹× (𝑤 ) ∈ 𝑈 при изоморфизме 𝐺𝑈 ∶ 𝑈 ⥲ 𝑈∗ , 𝑢 ↦ 𝑔𝑢 , задаваемом евклидовой структурой н пространстве 𝑈. Таким образом, равенство (114) равносильно соотношению 𝐹∗ 𝐺𝑊 = 𝐺𝑈 𝐹× , в котором 𝐺𝑈 ∶ 𝑈 ⥲ 𝑈∗ и 𝐺𝑊 ∶ 𝑊 ⥲ 𝑊∗ суть евклидовы корреляции из n∘ 10.3 на стр. 133, а ли нейное отображение 𝐹∗ ∶ 𝑊∗ → 𝑈∗ двойственно к 𝐹 . Этому соотношению удовлетворяет ровно −1 ∗ 𝐹 𝐺𝑊 ∶ 𝑊 → 𝑈. одно линейное отображение 𝐹× = 𝐺𝑈 В терминах базисов 𝒖 и 𝒘 равенство (114) равносильно 𝑚𝑛 соотношениям (𝐹𝑢𝑖 , 𝑤𝑗 ) = (𝑢𝑖 , 𝐹× 𝑤𝑗 ) на скалярные произведения базисных векторов. Они собираются в матричное равенство 𝐺𝐹(𝒖),𝒘 = 𝐺𝒖,𝐹× (𝒘) , где 𝐺𝐹(𝒖),𝒘 = 𝐹 (𝒖)𝑡 ⋅ 𝒘 — матрица Грама наборов 𝐹 (𝒖) = (𝐹𝑢1 , … , 𝐹𝑢𝑛 ) и 𝒘 = (𝑤1 , … , 𝑤𝑚 ), а 𝐺𝒖,𝐹× (𝒘) = 𝒖𝑡 ⋅ 𝐹 (𝒘) — матрица Грама наборов 𝒖 = (𝑢1 , … , 𝑢𝑛 ) и 𝐹× (𝒘) = (𝐹× 𝑤1 , … , 𝐹× 𝑤𝑚 ). × Поскольку 𝐹 (𝒖) = 𝒘 𝐹𝒘𝒖 , а 𝐹× (𝒘) = 𝒖 𝐹𝒖𝒘 , эти матрицы Грама имеют вид 𝑡 𝑡 𝐺𝐹(𝒖),𝒘 = 𝐹𝒘𝒖 𝒘𝑡 ⋅ 𝒘 = 𝐹𝒘𝒖 𝐺𝒘 × × и 𝐺𝒖,𝐹× (𝒘) = 𝒖𝑡 ⋅ 𝒖 𝐹𝒖𝒘 = 𝐺𝒖 𝐹𝒖𝒘 . Таким образом, соотношение (114) равносильно матричному равенству (115). 1 См. n∘ 7.3 на стр. 88. 146 §11 Линейные отображения евклидовых пространств × 𝑡 Замечание 11.1. Обратите внимание, что матричное равенство 𝐹𝒖𝒘 = 𝐺𝒖−1 𝐹𝒘𝒖 𝐺𝒘 согласуется с × −1 ∗ операторным равенством 𝐹 = 𝐺𝑈 𝐹 𝐺𝑊 : матрицы Грама 𝐺𝒖 и 𝐺𝒘 суть матрицы евклидовых корреляций1 𝐺𝑈 ∶ 𝑈 ⥲ 𝑈∗ и 𝐺𝑊 ∶ 𝑊 ⥲ 𝑊∗ , записанные в парах двойственных базисов 𝒖, 𝒖∗ 𝑡 и 𝒘, 𝒘∗ пространств 𝑈, 𝑈∗ и 𝑊 , 𝑊∗ , а 𝐹𝒘𝒖 = 𝐹𝒘∗∗ 𝒖∗ есть матрица двойственного к 𝐹 операто 2 ∗ ∗ ∗ ∗ ра 𝐹 ∶ 𝑊 → 𝑈 , записанная в базисах 𝒘 , 𝒖∗ . Следствие 11.2 В ортонормальных базисах 𝒖, 𝒘 пространств 𝑈, 𝑊 матрицы евклидово сопряжённых операто × 𝑡 ров 𝐹 и 𝐹× транспонированы друг другу: 𝐹𝒖𝒘 = 𝐹𝒘𝒖 . Предложение 11.2 Для любого линейного отображения 𝐹 ∶ 𝑈 → 𝑊 выполняются равенства 𝐹×× = 𝐹 , ker 𝐹× = (im 𝐹 )⊥ , im 𝐹× = (ker 𝐹 )⊥ , а для любой пары линейных отображений 𝐹 ∶ 𝑈 → 𝑉 , 𝐺 ∶ 𝑉 → 𝑊 — равенство (𝐺𝐹 )× = 𝐹× 𝐺× . Доказательство. Равенство 𝐹×× = 𝐹 вытекает из соотношения (114) и симметричности скаляр ного произведения. Вектор 𝑤 ∈ ker 𝐹× если и только если для всех 𝑢 ∈ 𝑈 выполняется равенство (𝑢, 𝐹× 𝑤) = 0, которое в силу соотношения (114) равносильно равенству (𝐹𝑢, 𝑤), т. е. ортого нальности подпространства im 𝐹 вектору 𝑤 . Поэтому ker 𝐹× = (im 𝐹 )⊥ . Написав это равенство для оператора 𝐹× в роли 𝐹 и беря ортогонал к обеим частям, получаем равенство (ker 𝐹 )⊥ = = im 𝐹× . Последнее утверждение вытекает из равенств (𝐺𝐹𝑢, 𝑤) = (𝐹𝑢, 𝐺× 𝑤) = (𝑢, 𝐹× 𝐺× 𝑤), выполненных для всех 𝑢 ∈ 𝑈, 𝑤 ∈ 𝑊 . 11.3. Самосопряжённые и антисамосопряжённые операторы. В прим. 9.4 на стр. 119 мы ви дели, что каждое пространство с линейной инволюцией является прямой суммой собственных подпространств с собственными значениями ±1. Таким образом, End(𝑉) = End+ (𝑉) ⊕ End− (𝑉) , + × End (𝑉) ≝ {𝐹 ∶ 𝑉 → 𝑉 | 𝐹 = 𝐹 } и где + End (𝑉) ≝ {𝐹 ∶ 𝑉 → 𝑉 | 𝐹× = −𝐹 } . Операторы из End+ (𝑉 ) называются самосопряжёнными и характеризуются тем, что для любых векторов 𝑢, 𝑤 ∈ 𝑉 выполняется равенство (𝐹𝑢, 𝑤) = (𝑢, 𝐹𝑤). Матрица такого оператора в орто нормальном базисе симметрична относительно главной диагонали, т. е. не меняется при транс понировании. Операторы из End− (𝑉 ) называются антисамосопряжёнными и характеризуются тем, что для любых векторов 𝑢, 𝑤 ∈ 𝑉 выполняется равенство (𝐹𝑢, 𝑤) = −(𝑢, 𝐹𝑤). Матрица такого оператора в ортонормальном базисе кососимметрична, т. е. меняет при транспониро вании знак. Разложение произвольного оператора 𝐹 в сумму самосопряжённого и антисамосо пряжённого задаётся формулой 𝐹 = (𝐹 + 𝐹× )∕ 2 + (𝐹 − 𝐹× )∕ 2. Лемма 11.2 Если (анти)самосопряжённый линейный оператор 𝐹 ∶ 𝑉 → 𝑉 переводит в себя некоторое под пространство 𝑈 ⊂ 𝑉 , то он переводит в себя и его ортогонал 𝑈⊥ . 1 2 См. упр. 10.4 на стр. 133. См. предл. 7.3 на стр. 90. 11.3. Сопряжённые и антисамосопряжённые операторы 147 Доказательство. Пусть 𝑤 ∈ 𝑈⊥ , т. е. (𝑢, 𝑤 ) = 0 для всех 𝑢 ∈ 𝑈. Тогда (𝑢, 𝐹𝑤 ) = ±(𝐹𝑢, 𝑤 ) = 0 для всех 𝑢 ∈ 𝑈, ибо 𝐹𝑢 ∈ 𝑈. Тем самым, 𝐹𝑤 ∈ 𝑈⊥ . Лемма 11.3 Собственные векторы с разными собственными значениями у самосопряжённого оператора ор тогональны друг другу. Доказательство. Если 𝐹𝑢 = 𝜆𝑢 и 𝐹𝑤 = 𝜇𝑤 , то из равенства (𝐹𝑢, 𝑤 ) = (𝑢, 𝐹𝑤 ) вытекает равен ство (𝜆 − 𝜇) ⋅ (𝑢, 𝑤) = 0. Упражнение 11.4. Покажите, что все одномерные инвариантные подпространства антисамо сопряжённого оператора содержатся в его ядре (в частности, у антисамосопряжённого опе ратора нет ненулевых вещественных собственных чисел). Теорема 11.3 (теорема о нормальном базисе) Каждый самосопряжённый оператор 𝐹 на конечномерном евклидовом пространстве можно диагонализовать в некотором ортонормальном базисе. Доказательство. Индукция по dim 𝑉 . Если dim 𝑉 = 1, доказывать нечего. Если dim 𝑉 = 2, опе ратор 𝐹 задаётся в произвольно взятом ортонормальном базисе 𝒆 симметричной матрицей 𝐹𝒆 = 𝐹𝒆𝑡 = 𝑎 𝑏 . (𝑏 𝑐 ) При 𝑎 = 𝑐 и 𝑏 = 0 эта матрица уже диагональна. Если 𝑎 ≠ 𝑐 или 𝑏 ≠ 0, характеристический многочлен det(𝑡𝐸 − 𝐹𝒆 ) = 𝑡2 − (𝑎 + 𝑐 ) ⋅ 𝑡 + (𝑎𝑐 − 𝑏2 ) оператора 𝐹 имеет дискриминант (𝑎 + 𝑐 )2 − 4(𝑎𝑐 − 𝑏2 ) = (𝑎 − 𝑐 )2 + 4𝑏2 > 0 , а значит, имеет два различных вещественных корня. Отвечающие им ненулевые собственные векторы перпендикулярны по лем. 11.3. Деля их на их длины, получаем искомый ортонормаль ный базис. При dim 𝑉 ⩾ 3 у оператора 𝐹 имеется одномерное или двумерное инвариантное подпространство 𝑈 ⊂ 𝑉 , и его ортогональное дополнение 𝑈⊥ тоже 𝐹 инвариантно по лем. 11.2. По индукции, в 𝑈 и 𝑈⊥ есть ортонормальные базисы из собственных векторов оператора 𝐹 . Объединение этих базисов даёт искомый базис в 𝑉 . Теорема 11.4 (канонический вид антисамосопряжённого оператора) Каждый антисамосопряжённый оператор 𝐹 на конечномерном евклидовом пространстве име ет в подходящем ортонормальном базисе матрицу, ненулевые элементы которой исчерпывают ся расположенными на главной диагонали 2 × 2 блоками вида (−𝑎𝑖 𝑎𝑖 , 0) где 𝑎𝑖 > 0 , причём набор этих блоков с точностью до перестановки не зависит от выбора такого базиса. Доказательство. Индукция по dim 𝑉 . Если 𝐹 = 0, что так при dim 𝑉 = 1, то доказывать нечего. Если dim 𝑉 = 2 и 𝐹 ≠ 0, то в любом ортонормальном базисе 𝒆 оператор 𝐹 имеет антисиммет ричную матрицу 0 𝑎 𝐹𝒆 = −𝐹𝒆𝑡 = . (−𝑎 0) 148 §11 Линейные отображения евклидовых пространств Меняя при необходимости знак у первого базисного вектора, можно считать, что 𝑎 > 0. При dim 𝑉 ⩾ 3 у оператора 𝐹 имеется одномерное или двумерное инвариантное подпространство 𝑈 ⊂ 𝑉 , и его ортогональное дополнение 𝑈⊥ тоже 𝐹 инвариантно по лем. 11.2. По индукции, в 𝑈 и 𝑈⊥ есть ортонормальные базисы, в которых матрицы ограничений 𝐹 |𝑈 и 𝐹 |𝑈⊥ имеют требу емый вид. Объединение этих базисов даёт искомый базис в 𝑉 . Поскольку характеристический многочлен оператора 𝐹 является произведением монома 𝑡𝑚 , где 𝑚 = dim ker 𝐹 = dim 𝑉 − rk 𝐹 , и неприводимых двучленов (𝑡2 + 𝑎𝑖2 ) по всем диагональным 2 × 2 блокам матрицы 𝐹𝒆 , набор блоков не зависит от выбора базиса в силу единственности разложения на неприводимые множители в ℝ[𝑡]. 11.4. Сингулярные числа и сингулярные направления. В этом разделе мы покажем, что каж дое линейное отображение 𝐹 ∶ 𝑈 → 𝑊 однозначно раскладывается в композицию 𝐹 = 𝐺𝑆𝑃 ортогональной проекции 𝑃 ∶ 𝑈 ↠ 𝑉 на ортогонал 𝑉 = (ker 𝐹 )⊥ ⊂ 𝑈 к ядру оператора 𝐹 , невы рожденного самосопряжённого оператора 𝑆 ∶ 𝑉 → 𝑉 , представляющего собою композицию коммутирующих друг с другом растяжений с положительными коэффициентами во взаимно перпендикулярных направлениях, и ортогонального вложения 𝐺 ∶ 𝑉 ↪ 𝑊 . Ортогональные на правления, вдоль которых растягивает подпространство 𝑉 ⊂ 𝑈 оператор 𝑆, и коэффициенты этих растяжений называются, соответственно, сингулярными направлениями и сингулярными числами линейного отображения 𝐹 . Если ker 𝐹 ≠ 0, ненулевые векторы из ker 𝐹 тоже считаются сингулярными направлениями с сингулярным числом нуль. Если ker 𝐹 = 0, то 𝑉 = 𝑈 и 𝑃 = Id𝑈 . Лемма 11.4 Для любого линейного отображения 𝐹 ∶ 𝑈 → 𝑊 между евклидовыми пространствами 𝑈, 𝑊 обе композиции 𝐹𝐹× ∈ End(𝑊 ), 𝐹× 𝐹 ∈ End(𝑈) являются самосопряжёнными линейными опе раторами с неотрицательными собственными числами. Отображение 𝐹 сюрьективно (соотв. инъективно) если и только если все собственные числа оператора 𝐹𝐹× (соотв. 𝐹× 𝐹 ) строго по ложительны. Доказательство. Каждый из операторов 𝐹𝐹× и 𝐹× 𝐹 очевидно самосопряжён и следовательно диагонализуем по теор. 11.3 на стр. 147. Если для некоторого ненулевого вектора 𝑤 ∈ 𝑊 вы полняется равенство 𝐹𝐹× 𝑤 = 𝜆𝑤, то (𝐹× 𝑤, 𝐹× 𝑤 ) = (𝐹𝐹× 𝑤, 𝑤) = 𝜆 ⋅ (𝑤, 𝑤) и либо 𝑤 ∈ ker 𝐹× и 𝜆 = 0, либо 𝜆 = (𝐹× 𝑤, 𝐹× 𝑤)∕(𝑤, 𝑤) > 0. Аналогично, если 𝐹× 𝐹𝑢 = 𝜇𝑢 для ненулевого 𝑢 ∈ 𝑈, то либо 𝜇 = 0 и 𝑢 ∈ ker 𝐹 , либо 𝜇 = (𝐹𝑢, 𝐹𝑢) ∕ (𝑢, 𝑢) > 0. Поэтому все ненулевые собствен ные числа каждого из операторов положительны. Если im 𝐹 = 𝑊 , то1 ker 𝐹× = (im 𝐹 )⊥ = 0, откуда все собственные числа оператора 𝐹𝐹× положительны. Наоборот, если im 𝐹 ≠ 𝑊 , то ker 𝐹𝐹× ⊃ ker 𝐹× = (im 𝐹 )⊥ ≠ 0. Аналогично, если ker 𝐹 = 0, то все собственные числа опе ратора 𝐹× 𝐹 строго положительны, и наоборот, если ker 𝐹 ≠ 0, то и ker 𝐹× 𝐹 ⊃ ker 𝐹 ≠ 0. Теорема 11.5 Каждое линейное отображение 𝐹 ∶ 𝑈 → 𝑊 между евклидовыми пространствами 𝑈, 𝑊 един ственным образом раскладывается в композицию 𝐹 = 𝐺𝐹 ∘ 𝑆𝐹 ∘ 𝑃𝐹 ортогональной проекции 𝑃𝐹 ∶ 𝑈 ↠ 𝑉 на ортогонал 𝑉 к ядру ker 𝐹 ⊂ 𝑈, невырожденного самосопряжённого оператора 𝑆𝐹 ∶ 𝑉 ⥲ 𝑉 с положительными собственными значениями 𝛼1 , … 𝛼𝑟 , где 𝑟 = rk 𝐹 = dim im 𝐹 = = dim 𝑉 , и изометрического вложения 𝐺𝐹 ∶ 𝑉 ↪ 𝑊 . При этом набор 𝛼12 , … 𝛼𝑟2 квадратов соб ственных чисел оператора 𝑆𝐹 является набором всех (с учётом кратностей) ненулевых собствен ных чисел оператора 𝐹× 𝐹 ∶ 𝑈 → 𝑈. 1 См. предл. 11.2 на стр. 146. 149 11.4. Сингулярные числа и сингулярные направления Доказательство. Согласно теор. 11.3 на стр. 147 в евклидовом пространстве 𝑈 имеется ортонор мальный базис, состоящий из собственных векторов 𝑢1 , … , 𝑢𝑛 самосопряжённого линейного оператора 𝐹× 𝐹 ∶ 𝑈 → 𝑈, причём все собственные значения этого оператора неотрицательны по лем. 11.4, т. е. 𝐹× 𝐹𝑢𝑖 = 𝛼𝑖2 𝑢𝑖 для некоторых вещественных 𝛼𝑖 ⩾ 0. Перенумеруем базис так, чтобы 𝛼𝑖 ≠ 0 при 1 ⩽ 𝑖 ⩽ 𝑟 и 𝛼𝑖 = 0 при 𝑖 > 𝑟. Тогда, как мы видели в доказательстве лем. 11.4, все векторы 𝑢𝑖 с 𝑖 > 𝑟 лежат в ядре отображения 𝐹 . Напротив, при 1 ⩽ 𝑖 , 𝑗 ⩽ 𝑟 равенства (𝐹𝑢𝑖 , 𝐹𝑢𝑗 ) = (𝐹× 𝐹𝑢𝑖 , 𝑢𝑗 ) = 𝛼𝑖2 (𝑢𝑖 , 𝑢𝑗 ) = 𝛼𝑖2 > 0 при 𝑖 = 𝑗 {0 при 𝑖 ≠ 𝑗 показывают, что векторы 𝑤𝑖 = 𝐹𝑢𝑖 ∕ 𝛼𝑖 образуют в пространстве 𝑊 ортонормальную систему. В частности, они линейно независимы. Так как 𝐹 (𝑢𝑗 ) = 0 при 𝑗 > 𝑟, для любого 𝑢 = ∑ 𝑥𝑖 𝑢𝑖 ∈ 𝑈 выполняется равенство 𝐹 (𝑢) = 𝛼1 𝑥1 𝑤1 + ⋯ + 𝛼𝑟 𝑥𝑟 𝑤𝑟 , т. е. векторы 𝑤𝑖 с 1 ⩽ 𝑖 ⩽ 𝑟 состав ляют ортонормальный базис в im 𝐹 , а векторы 𝑢𝑖 с 1 ⩽ 𝑖 ⩽ 𝑟 — ортонормальный базис в ор тогональном дополнении 𝑉 к ядру ker 𝐹 . Оператор 𝐹 является композицией изометрического изоморфизма 𝐺𝐹 ∶ 𝑉 ⥲ im 𝐹 , 𝑢𝑖 ↦ 𝑤𝑖 , диагонального оператора 𝑆𝐹 ∶ 𝑉 → 𝑉 , 𝑢𝑖 ↦ 𝛼𝑖 𝑢𝑖 , и ортогональной проекции 𝑃𝐹 ∶ 𝑈 ↠ 𝑉 вдоль ker 𝐹 . Если имеется какоелибо ещё разложение 𝐹 = 𝐺𝑆𝑃𝐹 , где 𝑃𝐹 ∶ 𝑈 ↠ 𝑉 — ортогональная проек ция вдоль ker 𝐹 , то из предыдущего рассуждения вытекает, что пространство 𝑉 = (ker 𝐹 )⊥ явля ется прямой ортогональной суммой всех собственных подпространств 𝑉𝑖 оператора 𝐹× 𝐹 , отве чающих ненулевым собственным значениям 𝛼𝑖2 этого оператора, а композиция 𝐺𝑆 ∶ 𝑉 ⥲ im 𝐹 совпадает с ограничением 𝐹 |𝑉 . Поскольку 𝑆× = 𝑆 как операторы 𝑉 → 𝑉 , а 𝐺× = 𝐺−1 как изо метрческие операторы im 𝐹 ⥲ 𝑉 , мы заключаем, что 𝐹× 𝐹 |𝑉 = 𝑆2 . Так как оператор 𝑆2 диаго нализуется в том же самом базисе, что и 𝑆, мы заключаем, что самосопряжённый оператор 𝑆 действует на каждом подпространстве 𝑉𝑖 умножением на 𝛼𝑖 и, тем самым, определяется по 𝐹 однозначно. А тогда и 𝐺 = 𝑆−1 ∘ 𝐹 |𝑉 ∶ 𝑉 → 𝑊 определяется однозначно. Упражнение 11.5. Убедитесь, что оператор 𝐹× ∶ 𝑊 → 𝑉 действует на построенные в доказа тельстве теор. 11.5 векторы 𝑤1 , … , 𝑤𝑟 ∈ 𝑊 по правилу 𝑤𝑖 ↦ 𝛼𝑖 𝑢𝑖 и аннулирует ортогональ ное дополнение к их линейной оболочке. Выведите отсюда, что множества всех (с учётом кратностей) ненулевых собственных чисел у операторов 𝐹× 𝐹 и 𝐹𝐹× одинаковы. Определение 11.1 (сингулярные числа и сингулярные направления) В условиях теор. 11.5 набор из dim 𝑈 неотрицательных квадратных корней 𝛼𝑖 из собственных значений самосопряжённого оператора 𝐹× 𝐹 ∶ 𝑈 → 𝑈 называется набором сингулярных чисел линейного отображения 𝐹 ∶ 𝑈 → 𝑊 между евклидовыми пространствами 𝑈, 𝑊 . Ровно rk 𝐹 из них строго положительны. Одномерные инвариантные подпространства1 оператора 𝐹× 𝐹 назы ваются сингулярными направлениями отображения 𝐹 . Пример 11.6 (этимология эпитета «сингулярный») Свяжем с отображением 𝐹 ∶ 𝑈 → 𝑊 функцию 𝜑 ∶ 𝑈 ∖ 0 → ℝ, 𝑢 ↦ (𝐹𝑢, 𝐹𝑢)∕(𝑢, 𝑢). Покажем, что её производная зануляется ровно на собственных направлениях оператора 𝐹× 𝐹 . Упражнение 11.6. Покажите, что (𝑢, 𝑢)′ (𝑣 ) = 2(𝑢, 𝑣 ) и (𝐹𝑢, 𝐹𝑢)′ (𝑣 ) = 2(𝐹𝑢, 𝐹𝑣 ) = 2(𝐹× 𝐹𝑢, 𝑣 ). Согласно правилу дифференцирования дробей, условие 𝜑′ (𝑢) = 0 равносильно тому, что для любого 𝑣 ∈ 𝑉 выполняется равенство 2(𝐹× 𝐹𝑢, 𝑣 )(𝑢, 𝑢) − 2(𝐹𝑢, 𝐹𝑢)(𝑢, 𝑣 ) = 0, означающее, что 1 Т. е. одномерные подпространства, порождённые ненулевыми собственными векторами. 150 §11 Линейные отображения евклидовых пространств 𝐹× 𝐹𝑢 = 𝑢 ⋅ (𝐹𝑢, 𝐹𝑢) ∕ (𝑢, 𝑢), т. е. что вектор 𝑢 является собственным для оператора 𝐹× 𝐹 с соб ственным значением (𝐹𝑢, 𝐹𝑢)∕(𝑢, 𝑢) = (𝐹× 𝐹𝑢, 𝑢)∕(𝑢, 𝑢). Следствие 11.3 (полярное разложение) Каждое биективное линейное преобразование 𝐹 ∈ GL(𝑉 ) евклидова пространства 𝑉 допускает единственное разложение 𝐹 = 𝐺𝐹 𝑆𝐹 , в котором оператор 𝐺𝐹 ∈ O(𝑉 ) ортогонален, а 𝑆𝐹 ∈ GL(𝑉 ) самосопряжён и имеет положительные собственные значения. Квадраты этих собственных зна чений являются собственными числами оператора 𝐹× 𝐹 . Доказательство. Поскольку оператор 𝐹 биективен, правый член его канонического разложе ния 𝐹 = 𝐺𝐹 ∘ 𝑆𝐹 ∘ 𝑃𝐹 из теор. 11.5 является тождественным отображением, а самосопряжённый оператор 𝑆𝐹 не имеет ядра. Следовательно все собственные числа оператора 𝑆𝐹 строго положи тельны. Замечание 11.2. (явные формулы для 𝐺𝐹 и 𝑆𝐹 ) Компоненты 𝐺𝐹 ∈ O(𝑉 ) и 𝑆𝐹 полярного разложе ния 𝐹 = 𝐺𝐹 ∘ 𝑆𝐹 однозначно находятся из условий 𝐺𝐹× 𝐺 = Id𝑉 и 𝑆𝐹× = 𝑆𝐹 . А именно, 𝐹× 𝐹 = 𝑆𝐹× 𝐺𝐹× 𝐺𝐹 𝑆𝐹 = 𝑆𝐹2 , откуда 𝑆𝐹 = √𝐹× 𝐹 и 𝐺𝐹 = 𝐹𝑆𝐹−1 . Отметим, что так как нуль не является собственным числом оператора 𝐹× 𝐹 , аналитическая вне нуля функция √𝑡 алгебраически вычислима на операторе 𝐹× 𝐹 при помощи стандартной интерполяционной процедуры из n∘ 9.4.1 на стр. 124. Упражнение 11.7. Покажите, что каждый невырожденный линейный оператор 𝐹 ∈ GL(𝑉 ) на евклидовом пространства 𝑉 также допускает единственное разложение 𝐹 = 𝑆𝑅 , в котором 𝑅 ∈ O(𝑉 ), а 𝑆 самосопряжён и имеет положительные собственные значения, квадраты ко торых равны собственным числам оператора 𝐹𝐹× . Пример 11.7 Найдём полярное разложение 𝐹 = 𝐺𝑆 для оператора 𝐹 ∶ ℝ3 → ℝ3 с матрицей ⎛22 ∕ 15 −4 ∕ 3 4 ∕ 15 ⎞ 𝐹 = ⎜ 4 ∕ 15 2 ∕ 3 28 ∕ 15⎟ ⎜ ⎟ 2 ∕ 3 2 ∕ 3 −1 ∕ 3 ⎠ ⎝ в стандартном базисе. Поскольку det 𝐹 = −4, оператор 𝐹 невырожден. Самосопряжённый опе ратор 𝐹× 𝐹 имеет матрицу 2 ∕ 3 ⎞ ⎛22 ∕ 15 −4 ∕ 3 4 ∕ 15 ⎞ ⎛ 8 ∕ 3 −4 ∕ 3 2 ∕ 3 ⎞ ⎛22 ∕ 15 4 ∕ 15 𝐶 = 𝐹 𝑡 𝐹 = ⎜ −4 ∕ 3 2∕3 2 ∕ 3 ⎟ ⎜ 4 ∕ 15 2 ∕ 3 28 ∕ 15⎟ = ⎜−4 ∕ 3 8 ∕ 3 2∕3 ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ 4 ∕ 15 28 ∕ 15 − 1 ∕ 3 2 ∕ 3 2 ∕ 3 − 1 ∕ 3 2 ∕ 3 2 ∕ 3 11 ∕ 3⎠ ⎝ ⎠⎝ ⎠ ⎝ у которой след tr(𝐶 ) = 9, сумма главных 2 × 2миноров det 8 ∕ 3 −4 ∕ 3 = 16/3 , (−4 ∕ 3 8 ∕ 3 ) det 8∕3 2∕3 = 28/3 , (2 ∕ 3 11 ∕ 3) det 8∕3 2∕3 = 28/3 (2 ∕ 3 11 ∕ 3) равна 24, определитель det(𝐶 ) = det2 𝐹 = 16 и характеристический многочлен det(𝑡𝐸 − 𝐶 ) = 𝑡3 − 9 𝑡2 + 24 𝑡 − 16 = (𝑡 − 1)(𝑡 − 4)2 . 11.4. Сингулярные числа и сингулярные направления 151 Так как оператор 𝐹× 𝐹 диагонализуем, он аннулируется многочленом1 (𝑡 − 1)(𝑡 − 4). Следователь но, матрица 𝐻 = √𝐶 самосопряжённого сомножителя ℎ полярного разложения 𝐹 = 𝑔ℎ имеет вид2 𝑎𝐸 + 𝑏𝐶 , где интерполяционный многочлен 𝑝(𝑡) = 𝑎 + 𝑏𝑡 для вычисления функции √𝑡 на матрице 𝐶 однозначно определяется тем, что 𝑝(1) = √1 = 1 и 𝑝(4) = √4 = 2, т. е. 𝑎 + 𝑏 = 1 и 𝑎 + 4 𝑏 = 2, откуда 𝑎 = 2 ∕ 3, 𝑏 = 1 ∕ 3. Таким образом, полярное разложение имеет вид 𝐹 = 𝐺𝐻 , где самосопряжённая матрица 𝐻 = √𝐶 равна 0 ⎞ ⎛ 8 ∕ 9 −4 ∕ 9 2 ∕ 9 ⎞ ⎛ 14/9 −4/9 2/9 ⎞ ⎛2 ∕ 3 ⎜ 0 2∕3 0 ⎟ + ⎜−4 ∕ 9 8 ∕ 9 2 ∕ 9 ⎟ = ⎜−4/9 14/9 2/9 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 2 ∕ 3⎠ ⎝ 2 ∕ 9 2 ∕ 9 11 ∕ 9⎠ ⎝ 2/9 2/9 17/9⎠ ⎝ 0 а ортогональная матрица 𝐺 = 𝐹𝐻−1 равна ⎛22/15 −4/3 4/15 ⎞ ⎛13/18 2/9 −1/9⎞ ⎛11/15 −2/3 2/15 ⎞ ⎜ 4/15 2/3 28/15⎟ ⎜ 2/9 13/18 −1/9⎟ = ⎜ 2/15 1/3 14/15⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ 2/3 −1/3 ⎠ ⎝ −1/9 −1/9 5/9 ⎠ ⎝ 2/3 2/3 −1/3 ⎠ ⎝ 2/3 Упражнение 11.8. Убедитесь, что 𝐺𝑡 𝐺 = 𝐸 . Следствие 11.4 (SVDразложение3 ) Каждая вещественная прямоугольная матрица 𝐹 ∈ Mat𝑚×𝑛 (ℝ) раскладывается в произведение 𝐹 = 𝑇𝑚 𝐷𝑇𝑛 , в котором матрицы 𝑇𝑚 ∈ O𝑚 и 𝑇𝑛 ∈ O𝑛 ортогональны, а 𝑚 × 𝑛матрица 𝐷 = (𝑑𝑖𝑗 ) диагональна и неотрицательна в том смысле, что 𝑑𝑖𝑗 = 0 при 𝑖 ≠ 𝑗, а все 𝑑𝑖𝑖 ⩾ 0. При этом ровно rk 𝐹 диагональных элементов матрицы 𝐷 отлично от нуля, и они с точностью до перестановки диагональных элементов не зависят от выбора указанного разложения. Доказательство. Будем воспринимать 𝐹 = 𝐹𝒎𝒏 как записанную в стандартных базисах 𝒏 и 𝒎 пространств 𝑈 = ℝ𝑛 и 𝑊 = ℝ𝑚 матрицу линейного оператора 𝐹 ∶ ℝ𝑛 → ℝ𝑚 . Обозначим через 𝒖 = (𝑢1 , … , 𝑢𝑛 ) ортонормальный базис пространства 𝑈, построенный в доказательстве теор. 11.5, а через 𝒘 = (𝑤1 , … , 𝑤𝑚 ) — любой ортонормальный базис пространства 𝑊 , содер жащий ортонормальный набор векторов 𝑤𝑖 = 𝐹 (𝑢𝑖 )∕𝛼𝑖 , 1 ⩽ 𝑖 ⩽ 𝑟, из доказательства теор. 11.5. Оператор 𝐹 ∶ 𝑢𝑖 ↦ 𝛼𝑖 𝑤𝑖 задаётся в базисах 𝒖 и 𝒘 диагональной матрицей 𝐷 = 𝐹𝒘𝒖 , ненуле вые диагональные элементы которой суть сингулярные числа 𝛼1 , … , 𝛼𝑛 оператора 𝐹 . Поэтому 𝐹 = 𝐹𝒎𝒏 = 𝐶𝒎𝒘 𝐹𝒘𝒖 𝐶𝒖𝒏 , где 𝐶𝒎𝒘 — ортогональная матрица перехода от базиса 𝒘 к стандартному −1 𝑡 базису 𝒎 в ℝ𝑚 , а 𝐶𝒖𝒏 = 𝐶𝒏𝒖 = 𝐶𝒏𝒖 — ортогональная матрица перехода от стандартного бази 𝑛 са 𝒏 в ℝ к базису 𝒖. Для любого другого разложения 𝐹 = 𝑇𝑚 𝐴𝑇𝑛 c ортогональными 𝑇𝑛 , 𝑇𝑚 и диагональной матрицей 𝐴 имеем 𝐹𝑡 𝐹 = 𝑇𝑛−1 𝐴𝑡 𝐴𝑇𝑛 . Поскольку подобные матрицы имеют оди наковые с точностью до перестановки собственные числа, стоящие на диагонали диагональной матрицы 𝐴𝑡 𝐴 квадраты диагональных элементов матрицы 𝐴 суть собственные числа матрицы 𝐹𝑡 𝐹 . 1 См. предл. 9.4 на стр. 120. См. n∘ 9.4.1 на стр. 124. 3 «SVD» является аббревиатурой от английского singular values decomposition. 2 152 §11 Линейные отображения евклидовых пространств 11.5. Инвариантные углы между подпространствами. Рассмотрим в евклидовом простран стве ℝ𝑘 пару векторных подпространств 𝑈, 𝑊 размерностей dim 𝑈 = 𝑛 ⩽ 𝑚 = dim 𝑊 и обозна чим через 𝜋 ∶ 𝑈 → 𝑊 ортогональную проекцию вдоль 𝑊⊥ . Пусть эта проекция имеет сингуляр ные числа 𝛼1 ⩾ 𝛼2 ⩾ ⋯ ⩾ 𝛼𝑛 . Так как |𝜋𝑢| = |𝑢| ⋅ cos ∡(𝜋𝑢, 𝑢) для всех 𝑢 ∈ 𝑈, числа 𝛼𝑖 = cos 𝜑𝑖 являются косинусами неубывающих углов 0 ⩽ 𝜑1 ⩽ 𝜑2 ⩽ ⋯ ⩽ 𝜑𝑛 ⩽ 𝜋 ∕ 2 , 𝜑𝑖 = ∡(𝑤𝑖 , 𝑢𝑖 ) , (116) между векторами 𝑢1 , … , 𝑢𝑛 некоторого ортонормального базиса 𝒖 в 𝑈 и первыми 𝑛 векторами такого ортонормального базиса 𝒘 = (𝑤1 , … , 𝑤𝑚 ) в 𝑊 , что вектор 𝜋𝑢𝑖 пропорционален векто ру 𝑤𝑖 при 1 ⩽ 𝑖 ⩽ 𝑛, причём по теор. 11.5 этот набор углов не зависит от выбора ортонормально го базиса в 𝑈, проектирующегося в ортогональный набор векторов из 𝑊 . Поэтому углы (116) называются инвариантными углами между подпространствами 𝑈, 𝑊 . Мы будем обозначать на бор инвариантных углов через ∡(𝑈, 𝑊 ) ≝ (𝜑1 , … , 𝜑𝑛 ). Предложение 11.3 Максимальное значение скалярного произведения (𝑢, 𝑤) всевозможных пар векторов 𝑢 ∈ 𝑈, 𝑤 ∈ 𝑊 единичной длины |𝑢| = |𝑤| = 1 равно максимальному сингулярному числу ортогональ ной проекции 𝜋 ∶ 𝑈 → 𝑊 вдоль 𝑊⊥ . Минимальный угол ∡(𝑢, 𝑤 ) между ненулевыми векторами 𝑢 ∈ 𝑈, 𝑤 ∈ 𝑊 достигается на сингулярном направлении 𝑢1 проекции 𝜋 с максимальным коэф фициентом растяжения 𝛼1 и его ортогональной проекцией 𝑤1 = 𝜋(𝑢1 )∕ 𝛼1 . Доказательство. Достаточно доказать второе утверждение, первое является его переформули ровкой. Пусть ортонормальные базисы 𝑢1 , … , 𝑢𝑛 ∈ 𝑈 и 𝑤1 , … , 𝑤𝑚 ∈ 𝑊 таковы, что 𝜋𝑢𝑖 = 𝛼𝑖 𝑤𝑖 при 1 ⩽ 𝑖 ⩽ 𝑛 . Так как 𝑢𝑖 = 𝑤𝑖 + 𝑤𝑖′ для некоторых векторов 𝑤1′ , … , 𝑤𝑛′ ∈ 𝑊⊥ , мы имеем при всех 𝑖 ≠ 𝑗 соот ношения ортогональности (𝑢𝑖 , 𝑤𝑗 ) = 0, из которых в силу неравенства Коши – Буняковского – Шварца1 вытекает, что для любых 𝑢 = ∑ 𝑥𝑖 𝑢𝑖 и 𝑤 = ∑ 𝑦𝑗 𝑤𝑗 длины |𝑢| = |𝑤| = 1 𝑛 (𝑢, 𝑤) = ∑ 𝑛 𝑥𝑖 𝑦𝑖 (𝑢𝑖 , 𝑤𝑖 ) = 𝑖=1 ∑ 𝛼𝑖 𝑥𝑖 𝑦𝑖 ⩽ √𝛼12 𝑥12 + ⋯ + 𝛼𝑛2 𝑥𝑛2 √𝑦12 + ⋯ + 𝑦𝑛2 ⩽ 𝑖=1 ⩽ 𝛼1 √𝑥12 + ⋯ + 𝑥𝑛2 √𝑦12 + ⋯ + 𝑦𝑛2 ⩽ 𝛼1 |𝑢| |𝑤| = 𝛼1 = (𝑢1 , 𝑤1 ) . Упражнение 11.9. Выведите существование минимального угла между ненулевыми вектора ми 𝑢 ∈ 𝑈, 𝑤 ∈ 𝑊 из компактности сферы и непрерывности скалярного произведения. Пример 11.8 (явные формулы для инвариантных углов) Если в пространствах 𝑈, 𝑊 ⊂ ℝ𝑘 заданы (не обязательно ортонормальные) базисы 𝒖 = (𝑢1 , … , 𝑢𝑛 ) = 𝒆 𝐶𝒆𝒖 1 См. прим. 3.2 на стр. 34. и 𝒘 = (𝑤1 , … , 𝑤𝑚 ) = 𝒆 𝐶𝒆𝒘 , 153 11.5. Инвариантные углы между подпространствами где 𝒆 — стандартный ортонормальный базис в ℝ𝑘 , то набор ортогональных проекций 𝒖𝑊 = (𝑢1𝑊 , … , 𝑢𝑛𝑊 ) базисных векторов пространства 𝑈 на пространство 𝑊 выражается через базис 𝒘 по формуле1 𝑡 𝑡 𝒖𝑊 = 𝒘 (𝒘× ⋅ 𝒖) = 𝒘 𝐺𝒘−1 𝐺𝒘𝒖 , где 𝐺𝒘𝒖 = 𝐶𝒆𝒘 𝐶𝒆𝒖 — взаимная матрица Грама2 наборов 𝒘 и 𝒖. Таким образом, проектор 𝜋 ∶ 𝑈 → 𝑊 имеет в базисах 𝒖 и 𝒘 матрицу 𝑡 𝛱𝒘𝒖 = 𝐺𝒘−1 𝐺𝒘𝒖 = 𝐺𝒘−1 𝐶𝒆𝒘 𝐶𝒆𝒖 . Согласно форм. (115) на стр. 145 евклидово сопряжённый к нему оператор имеет в тех же ба × 𝑡 𝑡 зисах матрицу 𝛱𝒖𝒘 = 𝐺𝒖−1 𝛱𝒘𝒖 𝐺𝒘 = 𝐺𝒖−1 𝐺𝒘𝒖 = 𝐺𝒖−1 𝐺𝒖𝒘 . Тем самым, квадраты косинусов инвари антных углов ∡(𝑈, 𝑊 ) суть собственные числа симметричной матрицы × 𝛱𝒖𝒘 𝛱𝒘𝒖 = 𝐺𝒖−1 𝐺𝒖𝒘 𝐺𝒘−1 𝐺𝒘𝒖 = 𝐺𝒖× 𝒘× 𝐺𝒘𝒖 . Пример 11.9 (индуктивное геометрическое описание инвариантных углов) Ортонормальные базисы в 𝑈 и 𝑊 , пригодные для вычисления ∡(𝑈, 𝑊 ), можно получить при помощи следующей индуктивной геометрической процедуры. Сначала выберем произвольный ортонормальный базис 𝑢1 , … , 𝑢𝑖−1 в пересечении 𝑈 ∩ 𝑊 и положим 𝑉𝑖 = (𝑈 ∩ 𝑊 )⊥ , 𝑈𝑖 = 𝑈 ∩ 𝑉𝑖 , 𝑊𝑖 = 𝑊 ∩ 𝑉𝑖 . Также положим 𝑤𝜈 = 𝑢𝜈 при 𝜈 ⩽ 𝑖 − 1. По предл. 11.3 (или по упр. 11.9) угол ∡(𝑢, 𝑤) между переменными векторами 𝑢 ∈ 𝑈𝑖 , 𝑤 ∈ 𝑊𝑖 единичной длины |𝑢| = |𝑤| = 1 достигает своего ненулевого минимума на некоторой паре векторов 𝑢𝑖 , 𝑤𝑖 . Добавим векторы 𝑢𝑖 и 𝑤𝑖 в уже имеющиеся базисы 𝑢1 , … , 𝑢𝑖−1 и 𝑤1 , … , 𝑤𝑖−1 , обозначим через 𝑉𝑖+1 ⊂ 𝑉𝑖 ортогональное дополнение к плоскости, порождённой векторами 𝑢𝑖 и 𝑤𝑖 , положим 𝑈𝑖+1 = 𝑈𝑖 ∩ 𝑉𝑖+1 , 𝑊𝑖+1 = = 𝑊𝑖 ∩ 𝑉𝑖+1 и продолжим по индукции. Предложение 11.4 Пара векторных подпространств 𝑈′ , 𝑊′ евклидова пространства тогда и только тогда перево дится ортогональным линейным преобразованием в пару подпространств 𝑈″ , 𝑊″ , когда dim 𝑈′ = dim 𝑈″ , dim 𝑊′ = dim 𝑊″ и ∡(𝑈′ , 𝑊′ ) = ∡(𝑈″ , 𝑊″ ) (117) Доказательство. Необходимость равенств (117) очевидна. Если они выполняются, то dim(𝑈′ ∩ 𝑊′ ) = dim(𝑈″ ∩ 𝑊″ ) и dim(𝑈′ + 𝑊′ ) = dim(𝑈″ + 𝑊″ ) , первое — в силу того, что dim(𝑈 ∩ 𝑊 ) совпадает с количеством равных единице сингулярных чисел ортогональной проекции 𝜋 ∶ 𝑈 → 𝑊 , второе — по предл. 4.2 на стр. 52. Поэтому су ществует такое ортогональное преобразование 𝑔 объемлющего евклидова пространства, что 𝑔(𝑈′ + 𝑊′ ) = 𝑈″ + 𝑊″ , 𝑔(𝑈′ ∩ 𝑊′ ) = 𝑈″ ∩ 𝑊″ и 𝑔(𝑊′ ) = 𝑊″ . Тем самым, можно считать, что 𝑊′ = 𝑊″ , объемлющее евклидово пространство является прямой суммой пространства 𝑊 = 𝑊′ = 𝑊″ и его ортогонального дополнения 𝑊⊥ , а подпространства 𝑈′ , 𝑈″ ⊂ 𝑊 ⊕ 𝑊⊥ 1 Как и выше, точкой обозначается произведение матриц из векторов, при вычислении которого век 𝑡 торы перемножаются скалярно. Обратите внимание, что левое произведение в формуле 𝒘 (𝒘× ⋅ 𝒖) это ×𝑡 произведение матрицы из векторов на числовую матрицу 𝒘 ⋅ 𝒖, и его не следует путать со скалярным 𝑡 𝑡 произведением матриц из векторов: равенство «𝒘 (𝒘× ⋅ 𝒖) = (𝒘 ⋅ 𝒘× ) 𝒖» категорически неверно! 2 См. формулу (105) на стр. 132. 154 §11 Линейные отображения евклидовых пространств имеют нулевое пересечение с 𝑊 и размерность dim 𝑈′ = dim 𝑈″ = dim 𝑊⊥ . В этом случае ор тогональные проекции подпространств 𝑈′ и 𝑈″ на 𝑊⊥ вдоль 𝑊 являются линейными изомор физмами. Согласно предыдущему, в пространствах 𝑈′ и 𝑈″ имеются ортонормальные базисы из векторов вида 𝑢𝑖′ = 𝑤𝑖′ + 𝑣𝑖′ и 𝑢𝑖″ = 𝑤𝑖″ + 𝑣𝑖″ , где векторы 𝑤𝑖′ и 𝑤𝑖″ составляют части двух ортонормальных базисов пространства 𝑊 , векторы 𝑣𝑖′ и 𝑣𝑖″ образуют два (возможно, не орто нормальных) базиса в 𝑊⊥ , и при всех 𝑖 и всех 𝑖 ≠ 𝑗 выполняются соотношения (𝑢𝑖′ , 𝑤𝑖′ ) = 𝛼𝑖 = (𝑢𝑖″ , 𝑤𝑖″ ) и (𝑢𝑖′ , 𝑤𝑗′ ) = 0 = (𝑢𝑖″ , 𝑤𝑗″ ) , из которых вытекает, что базисы пространства 𝑊⊥ , состоящие из векторов 𝑣𝑖′ = 𝑢𝑖′ − 𝑤𝑖′ и из векторов 𝑣𝑖″ = 𝑢𝑖″ − 𝑤𝑖″ оба ортогональны и имеют одинаковые скалярные квадраты базис ных векторов (𝑣𝑖′ , 𝑣𝑖′ ) = (𝑣𝑖″ , 𝑣𝑖″ ) = 2 − 2𝛼𝑖 . Поэтому линейное преобразование пространства 𝑊 ⊕ 𝑊⊥ , переводящее 𝑤𝑖′ в 𝑤𝑖″ , а 𝑣𝑖′ — в 𝑣𝑖″ является ортогональным. Оно переводит подпро странство 𝑈′ в подпространство 𝑈″ . §12. Выпуклая геометрия Всюду в этом параграфе речь идёт про конечномерные векторные и аффинные пространства над полем ℝ. 12.1. Выпуклые фигуры. Барицентрическая комбинация1 𝑥1 𝑝1 + ⋯ + 𝑥𝑚 𝑝𝑚 точек 𝑝𝑖 веще ственного аффинного пространства 𝔸𝑛 называется выпуклой, если все её коэффициенты 𝑥𝑖 ⩾ 0. Фигура 𝛷 ⊂ 𝔸𝑛 называется выпуклой, если она содержит все выпуклые барицентрические ком бинации любых своих точек. Из теоремы о группировании масс2 вытекает, что для выпуклости фигуры необходимо и достаточно, чтобы вмести с любыми двумя своими точками 𝑎, 𝑏 она со держала и соединяющий их отрезок [𝑎, 𝑏] ≝ {𝜆𝑎 + 𝜇𝑏 | 𝜆 + 𝜇 = 1, 𝜆, 𝜇 > 0}. Очевидно, что пересечение выпуклых фигур выпукло. Пересечение всех выпуклых фигур, содержащих дан ную фигуру 𝛷 , называется выпуклой оболочкой фигуры 𝛷 и обозначается conv 𝛷 . Иначе conv 𝛷 можно описать как множество всех выпуклых барицентрических комбинаций всевозможных конечных наборов точек фигуры 𝛷 : это множество выпукло по упр. 1.8 на стр. 16 и содержится в любом выпуклом множестве, содержащем фигуру 𝛷 . 12.1.1. Топологическое отступление. Для произвольного вещественного 𝜀 > 0 мы назы ваем 𝜀 окрестностью точки 𝑝 = (𝑝1 , 𝑝2 , … , 𝑝𝑛 ) ∈ ℝ𝑛 правильный куб с центром в 𝑝 и направ ленными вдоль стандартных координатных осей рёбрами длины 2𝜀 : 𝐵𝜀 (𝑝) ≝ {𝑥 = (𝑥1 , … , 𝑥𝑛 ) ∈ ℝ𝑛 ∶ ∀ 𝑖 |𝑥𝑖 − 𝑝𝑖 | ≤ 𝜀 } . (121) Подмножество 𝑈 ⊂ ℝ𝑛 открыто3 , если вместе с каждой точкой 𝑝 ∈ 𝑈 в 𝑈 лежит и какаянибудь её 𝜀 окрестность 𝐵𝜀 (𝑝). Кубы (121) являются шарами радиуса 𝜀 относительно supнормы ||(𝑥1 , … , 𝑥𝑛 )||sup = max |𝑥𝑖 | . 𝑖 Рассматриваемая нами топология является метрической топологией, определяемой при помо щи этой нормы. Поскольку все нормы на векторном пространстве ℝ𝑛 задают одну и ту же то пологию, данное выше определение отрытого множества не зависит от выбора системы коор динат, использованной для определения 𝜀 окрестностей. Упражнение 12.1. Докажите это непосредственно, без ссылок на курс топологии. Напомню, что точка 𝑝 называется внутренней точкой фигуры 𝛷 , если она лежит в 𝛷 вместе с некоторой своей 𝜀 окрестностью. Множество внутренних точек фигуры 𝛷 обозначатся int 𝛷 . Внутренние точки дополнения 𝔸𝑛 ∖ 𝛷 называются внешними точками фигуры 𝛷 ⊂ 𝔸𝑛 . Точки, не являющиеся ни внешними, ни внутренними, называются граничными. Множество граничных точек фигуры 𝛷 обозначатся 𝜕𝛷 . Объединение 𝛷 = 𝛷 ∪ 𝜕𝛷 называется замыканием фигуры 𝛷 . Упражнение 12.2. Покажите, что 𝑝 ∈ 𝜕𝛷 если и только если в любой 𝜀 окрестности точки 𝑝 имеются как точки фигуры 𝛷 , так и точки не лежащие в 𝛷 , и докажите, что замыкание 𝛷 является наименьшим по включению замкнутым множеством, содержащим 𝛷 . Предложение 12.1 Внутренность и замыкание любой выпуклой фигуры выпуклы. См. n∘ 1.4.2 на стр. 15. См. упр. 1.8 на стр. 16. 3 Все необходимые нам сведения из курса топологии имеются в лекции: http://gorod.bogomolovlab.ru/ps/stud/geom_ru/1617/lec_08.pdf. 1 2 155 156 §12 Выпуклая геометрия Доказательство. Первое вытекает из того, что если точки 𝑎 и 𝑏 содержатся в выпуклом множе стве 𝛷 вместе с некоторыми 𝜀 кубами 𝐵𝜀 (𝑎), 𝐵𝜀 (𝑏) ⊂ 𝛷 , то все точки отрезка [𝑎𝑏] содержатся в 𝛷 вместе с такими же 𝜀 кубами, см. рис. 12⋄1. Второе — из того, что если 𝑎 = lim 𝑎𝑘 и 𝑏 = lim 𝑏𝑘 , 𝑘→∞ 𝑘→∞ то при любых фиксированных 𝜆 и 𝜇 предел lim (𝜆𝑎𝑘 + 𝜇𝑏𝑘 ) = 𝜆 lim 𝑎𝑘 + 𝜇 lim 𝑏𝑘 = 𝜆𝑎 + 𝜇𝑏. 𝑘→∞ 𝑘→∞ 𝑘→∞ Таким образом, каждая точка отрезка [𝑎, 𝑏] является пределом последовательности точек фигу ры 𝛷 , если таковыми являются концы 𝑎, 𝑏 этого отрезка. Упражнение 12.3. Докажите, что замкнутое выпуклое множество с непустой внутренностью является замыканием множества своих внутренних точек, и приведите пример невыпук лого замкнутого множества с непустой внутренностью, которое не является замыканием множества своих внутренних точек. Пример 12.1 (симплексы) Выпуклая оболочка 𝑛 + 1 точек 𝑝0 , … , 𝑝𝑛 , не лежащих в (𝑛 − 1) мерной плоскости, называется 𝑛мерным симплексом с вершинами в этих точках и обозначается 𝑛 [𝑝0 , … , 𝑝𝑛 ] = { 𝑏 𝑛 𝑥𝑝 𝑥 = 1 , 𝑥𝑖 ⩾ 0 } . ∑ 𝑖 𝑖 | ∑ 𝑖 𝑖=0 𝛷 (122) 𝑖=0 𝑎 Одномерные, двумерные и трёхмерные симплексы суть отрезки, тре угольники и тетраэдры соответственно. В порождённом вершина ми симплекса пространстве 𝔸𝑛 , в аффинных координатах (𝑥1 , … , 𝑥𝑛 ) Рис. 12⋄1. Выпуклоость относительно репера с началом в 𝑝0 и базисными векторами ⃖⃖⃖⃖⃗ 𝑝0 𝑝𝑖 , внутренности. где 1 ⩽ 𝑖 ⩽ 𝑛, симплекс (122) задаётся системой из 𝑛 + 1 линейных неоднородных неравенств 𝑥1 ⩾ 0, … , 𝑥𝑛 ⩾ 0, 𝑥1 + ⋯ + 𝑥𝑛 ⩽ 1. Так как в точке с координатами (1 ∕ 2𝑛, … , 1 ∕ 2𝑛) все эти неравенства выполнены строго, она принадлежит симплексу вместе с некоторым 𝜀 кубом, т. е. каждый 𝑛мерный симплекс в ℝ𝑛 имеет непустую внутренность. Упражнение 12.4. Проверьте, что граница симплекса [𝑝0 , … , 𝑝𝑛 ] является объединением все возможных симплексов вида [𝑝𝜈1 , … , 𝑝𝜈𝑚 ], где 𝑚 < 𝑛 и 𝜈𝑖 ∈ {0, 1, … , 𝑛}. Лемма 12.1 Для любого открытого выпуклого множества 𝑈 в аффинном пространстве размерности 𝑛 ⩾ 2 через каждую точку 𝑝 ∉ 𝑈 можно провести не пересекающую 𝑈 прямую. Доказательство. Обозначим через 𝐶 объединение всех открытых лучей ⃖⃖⃖⃗ | 𝑢 ∈ 𝑈, 𝑡 > 0} , ] 𝑝, 𝑢) ≝ {𝑝 + 𝑡 ⋅ 𝑝𝑢 начинающихся в 𝑝 и проходящих через всевозможные точки 𝑢 ∈ 𝑈. Из рис. 12⋄2 и рис. 12⋄3 на стр. 157 очевидно, что 𝐶 является открытой выпуклой фигурой, и 𝑝 ∈ 𝜕𝐶 . Так как 𝑈 ⊂ 𝐶 , достаточно провести через 𝑝 прямую, не пересекающую 𝐶 . Из выпуклости 𝐶 следует, что лю бая проходящая через 𝑝 прямая 𝓁 либо не пересекает 𝐶 , либо пересекает 𝐶 по одному из лучей ] 𝑝, 𝑢), все точки которого являются внутренними точками 𝐶 , а все остальные отличные от 𝑝 точки прямой 𝓁 являются для 𝐶 внешними, см. рис. 12⋄2. В частности, внешние для 𝐶 точки су ществуют. Пусть 𝑞 — одна из них. Поскольку объемлющее аффинное пространство по крайней 157 12.2. Опорные полупространства мере двумерно, через 𝑞 можно провести пересекающую 𝐶 прямую, отличную от прямой (𝑞𝑝). На ней имеется отличная от 𝑝 граничная точка 𝑟 конуса 𝐶 . Тем самым, (𝑝𝑟) ∩ 𝐶 = ∅. 𝑢 ∈𝑈 [𝑢 , 𝑢 ] ⊂ 𝑈 𝑢∈𝑈 𝑐 ∈𝐶 𝑢 ∈𝑈 𝑐∈𝐶 𝑝 𝑐 ∈𝐶 𝑞 ∈ int(ℝ ∖ 𝐶 ) 𝑝 Рис. 12⋄2. Открытость 𝐶 и непустота int (𝔸𝑛 ∖ 𝐶 ). Рис. 12⋄3. Выпуклость 𝐶 . 12.2. Опорные полупространства. Мы называем аффинными функционалами на пространстве 𝔸𝑛 = 𝔸(𝑉 ) аффинные отображения1 𝑎 ∶ 𝔸𝑛 → ℝ. Если произвольно фиксировать начальную точку 𝑐 ∈ 𝔸𝑛 , то действие такого функционала на точку 𝑝 ∈ 𝔸𝑛 задаётся формулой 𝑎(𝑝) = 𝑎(𝑐 ) + 𝛼(⃖⃖⃖ 𝑐𝑝⃗) , которую мы будем коротко записывать в виде 𝑎 = 𝑎𝑐 + 𝛼 , где 𝑎𝑐 = 𝑎(𝑐 ) ∈ ℝ, а дифференциал 𝛼 = 𝐷𝑎 ∈ 𝑉∗ не зависит от 𝑐 . Ограничение аффинного функционала 𝑎 ∶ 𝔸𝑛 → ℝ на любой от резок [𝑝, 𝑞 ] ⊂ 𝔸𝑛 представляет собою «школьную линейную функцию» 𝑎(𝑥 ) = 𝛼𝑥 + 𝛽 на этом отрезке, и для неё имеются следующие исключающие друг друга возможности: она либо тож дественно нулевая, либо нигде не обращается в нуль и имеет на всём отрезке постоянный знак, либо зануляется ровно в одной точке 𝑧 ∈ [𝑝, 𝑞 ]. В последнем случае имеется дальнейшая аль тернатива: либо точка 𝑧 является одним из концов отрезка, и функционал 𝑎 имеет постоянный знак на полуинтервале [𝑝, 𝑞 ] ∖ 𝑧, либо 𝑧 ∈ (𝑎, 𝑏), а 𝑎 имеет постоянные и противоположные друг другу знаки на полуинтервалах [𝑝, 𝑧) и (𝑧, 𝑏]. Таким образом, каждый непостоянный аффин ный функционал 𝑎 ∶ 𝔸𝑛 → ℝ задаёт разбиение аффинного пространства 𝔸𝑛 в дизъюнктное объединение аффинной гиперплоскости 𝐻𝑎 = {𝑝 ∈ 𝔸𝑛 | 𝑎(𝑝) = 0} и двух выпуклых откры тых полупространств int 𝐻𝑎+ = {𝑝 ∈ ℝ𝑛 | 𝑎(𝑝) > 0} и int 𝐻𝑎− = {𝑝 ∈ ℝ𝑛 | 𝑎(𝑝) < 0}, кото рые являются внутренностями двух замкнутых полупространств 𝐻𝑎+ = {𝑝 ∈ ℝ𝑛 | 𝑎(𝑝) ⩾ 0} и 𝐻𝑎− = {𝑝 ∈ ℝ𝑛 | 𝑎(𝑝) ⩽ 0} с общей границей 𝜕𝐻𝑎+ = 𝜕𝐻𝑎− = 𝐻𝑎 . Каждый отрезок [𝑝, 𝑞 ] c 𝑝 ∈ int 𝐻+ и 𝑞 ∈ int 𝐻𝑎− пересекает гиперплоскость 𝐻𝑎 в единственной точке, и она является внутренней точкой отрезка [𝑝, 𝑞 ]. Определение 12.1 (опорные функционалы, гиперплоскости и полупространства) Аффинный функционал 𝑎 ∶ 𝔸𝑛 → ℝ называется опорным для фигуры 𝛷 ⊂ 𝔸𝑛 , если 𝐻𝑎 ∩ 𝜕𝛷 ≠ ∅ и 𝛷 ⊆ 𝐻𝑎+ . В этой ситуации гиперплоскость 𝐻𝑎 ⊂ 𝔸𝑛 и замкнутое полупространство 𝐻𝑎+ тоже называются опорными для фигуры 𝛷 . 1 См. n∘ 2.2 на стр. 24. 158 §12 Выпуклая геометрия Теорема 12.1 Для любых открытого выпуклого множества 𝑈 и не пересекающегося с ним аффинного подпро странства 𝛱 в аффинном пространстве 𝔸(𝑉 ) существует аффинная гиперплоскость, содержа щая 𝛱 и не пересекающая 𝑈. Доказательство. Поместим начало координат внутрь 𝛱 и отождествим 𝛱 с векторным подпро странством 𝑊 ⊂ 𝑉 (возможно нулевым). Обозначим через 𝐻 ⊂ 𝑉 какоенибудь максимальное по включению векторное подпространство, содержащее 𝑊 и не пересекающее 𝑈, а через 𝐻′ — любое дополнительное к 𝐻 векторное подпространство. Проекция пространства 𝑉 = 𝐻 ⊕ 𝐻′ на 𝐻′ вдоль 𝐻 переводит отрезки из 𝔸(𝑉 ) в отрезки или точки из 𝔸(𝐻′ ), а кубы из 𝔸(𝑉 ) со сто ронами, направленными вдоль базисных векторов любого базиса в 𝑉 , согласованного с разби ением 𝑉 = 𝐻 ⊕ 𝐻′ , — в аналогичные кубы в 𝔸(𝐻′ ). Поэтому множество 𝑈 спроектируется в открытое выпуклое множество 𝑈′ ⊂ 𝔸(𝐻′ ), не содержащее нуля, поскольку ядро проекции 𝐻 не пересекается с 𝑈. Если dim 𝐻′ > 1, то по лем. 12.1 в 𝐻′ найдётся одномерное подпространство 𝐿, не пересекающее 𝑈′ . Но тогда подпространство 𝐻 ⊕ 𝐿 ⊂ 𝑉 не пересекает 𝑈 и строго больше, чем 𝐻 , вопреки выбору 𝐻 . Поэтому dim 𝐻′ = 1 и 𝐻 является искомой гиперплоскостью. Теорема 12.2 Через каждую граничную точку 𝑝 любой выпуклой фигуры 𝛷 можно провести опорную гипер плоскость (возможно, не единственную). Доказательство. Если фигура 𝛷 ⊂ 𝔸𝑛 целиком лежит в какойнибудь гиперплоскости, то эта гиперплоскость и будет опорной. Если же в 𝛷 есть 𝑛 + 1 точек, не лежащих в одной гиперплос кости, то int 𝛷 ≠ ∅ согласно прим. 12.1 на стр. 156. Проведём через 𝑝 гиперплоскость 𝐻𝑎 , не пересекающую int 𝛷 . Функционал 𝑎 имеет на int 𝛷 постоянный знак, так как в противном слу чае, соединив точки разного знака отрезком, мы получим на этом отрезке нуль функционала, т. е. точку из 𝐻𝑎 ∩ int 𝛷 . Меняя, если нужно, знак у 𝑎, мы можем считать, что int 𝛷 ⊂ int 𝐻𝑎+ . Поскольку 𝛷 лежит в замыкании своей внутренности int 𝛷 , которое в свою очередь содержится в замкнутом полупространстве 𝐻𝑎+ , мы заключаем, что 𝛷 ⊂ 𝐻𝑎+ . Теорема 12.3 Всякое замкнутое выпуклое множество 𝑍 ⊂ ℝ𝑛 является пересечением своих опорных полупро странств. Доказательство. Применяя индукцию по размерности наименьшего аффинного подпростран ства, содержащего 𝑍, мы можем считать, что 𝑍 не содержится в гиперплоскости, а значит, имеет непустую внутренность. Покажем, что в этом случае каждая внешняя точка 𝑞 ∉ 𝑍 не лежит хо тя бы в одном из опорных полупространств множества 𝑍. Для этого соединим 𝑞 отрезком [𝑞 , 𝑝] с какойнибудь внутренней точкой 𝑝 ∈ int 𝑍 и проведём опорное полупространство 𝐻𝑎+ к 𝑍 в граничной точке 𝑟 ∈ [𝑞 , 𝑝] ∩ 𝜕𝑍. Поскольку 𝑟 лежит строго внутри [𝑞 , 𝑝], из 𝑎(𝑝) > 0 и 𝑎(𝑟) = 0 следует, что 𝑎(𝑞 ) < 0, т. е. 𝑞 ∉ 𝐻𝑎+ . 12.3. Грани и крайние точки. Пересечение замкнутой выпуклой фигуры 𝛷 с любой её опор ной гиперплоскостью называется гранью фигуры 𝛷 . Каждая грань фигуры 𝛷 тоже является за мкнутым выпуклым множеством. Размерностью грани называется размерность наименьшего аффинного подпространства, содержащего эту грань. Отметим, что размерность любой грани 12.3. Грани и крайние точки 159 фигуры 𝛷 ⊂ ℝ𝑛 строго меньше 𝑛. Нульмерные грани (т. е. граниточки) называются вершина ми. Под внутренними, внешними и граничными точками грани понимаются таковые точки в топологии наименьшего аффинного подпространства, содержащего эту грань. Интуитивное содержание термина «грань», основанное на опыте работы с многогранника ми, не всегда адекватно при работе с произвольными выпуклыми замкнутыми множествами. Например, у шара имеется континуальное множество граней и все они нульмерны, а у фигу ры на рис. 12⋄4, где пара отрезков гладко сопрягается с овалами, есть две одномерных грани, нульмерные грани которых не являются гранями самой фигуры. Таким образом, грань грани замкнутой выпуклой фигуры 𝛷 может не быть гранью самой фигуры 𝛷 . Точка 𝑝 ∈ 𝛷 называется крайней точкой замкнутой выпуклой фигуры 𝛷 , если она не яв ляется внутренней точкой никакого отрезка [𝑎, 𝑏] ⊂ 𝛷 . Крайняя точка не может быть внут ренней точкой никакой замкнутой выпуклой фигуры, отличной от точки. Если же точка 𝑞 является внутренней точкой какоголибо от резка [𝑎, 𝑏] ⊂ 𝛷 , то она может оказаться в грани фигуры 𝛷 только если весь отрезок [𝑎, 𝑏] лежит в этой грани, поскольку в противном случае высекающий грань функционал менял бы на концах отрезка Рис. 12⋄4. знак и не был бы опорным. Таким образом, крайние точки суть последние, нульмерные элемен ты всевозможных цепочек вида: фигура 𝛷 , грань фигуры 𝛷 , грань грани фигуры 𝛷 , грань грани грани фигуры 𝛷 и т. д., при условии, что такая цепочка действительно заканчивается нульмер ной фигурой. В частности, все вершины фигуры 𝛷 являются её крайними точками. Обратите внимание, что крайние точки всех граней замкнутой выпуклой фигуры 𝛷 являются крайними и для 𝛷 , хотя при этом они могут не быть вершинами фигуры 𝛷 . Теорема 12.4 Каждая ограниченная замкнутая выпуклая фигура является выпуклой оболочкой своих край них точек. Доказательство. Индукция по размерности фигуры. Любая внутренняя точка фигуры являет ся выпуклой комбинацией концов отрезка, высекаемого из фигуры произвольной проходящей через точку прямой. Эти концы лежат на гранях фигуры и по индукции являются выпуклыми комбинациями крайних точек этих граней. Последние являются крайними точками и для са мой фигуры. Определение 12.2 (цилиндры) Замкнутая выпуклая фигура вида 𝛷 = 𝔸(𝑈) × 𝐵 ⊂ 𝔸(𝑈) × 𝔸(𝑊 ), где dim 𝑈 > 0, а 𝐵 ⊂ 𝔸(𝑊 ) — непустая замкнутая выпуклая фигура, не содержащая аффинных подпространств положитель ной размерности, называется цилиндром с основанием 𝐵 и образующей 𝔸(𝑈). Если основание 𝐵 состоит из одной точки, цилиндр совпадает со своей образующей 𝔸(𝑈) и является аффинным пространством. Предложение 12.2 Через каждую точку 𝑝 любой замкнутой выпуклой фигуры 𝛷 ⊂ 𝔸(𝑉 ) проходит единственное максимальное по включению аффинное подпространство, целиком содержащееся в 𝛷 . Все та кие подпространства имеют одно и то же направляющее векторное пространство 𝑈 ⊂ 𝑉 . Если 𝑈 ≠ 0, то для любого дополнительного1 векторного подпространства 𝑈′ ⊂ 𝑉 замкнутая выпук 1 Т. е. такого, что 𝑈 ⊕ 𝑈′ = 𝑉 . 160 §12 Выпуклая геометрия лая фигура 𝛷 ′ = 𝛷 ∩ (𝑝 + 𝑈′ ) не содержит аффинных пространств положительной размерности, и 𝛷 = 𝔸(𝑈) × 𝛷 ′ является цилиндром с основанием 𝛷 ′ с образующей 𝔸(𝑈). Доказательство. Если аффинные подпространства 𝑝 + 𝑊1 и 𝑝 + 𝑊2 содержатся в 𝛷 , то 𝛷 содержит и аффинное подпространство 𝑝 + (𝑊1 + 𝑊2 ), т. к. для любых 𝑤1 ∈ 𝑊1 и 𝑤2 ∈ 𝑊2 точка 𝑝 + 𝑤1 + 𝑤2 является серединой отрезка с концами в точках 𝑝 + 2𝑤1 и 𝑝 + 2𝑤2 . Поэтому аффинное пространство 𝑝 + 𝑈, где 𝑈 ⊂ 𝑉 это сумма всех таких подпространств 𝑊 ⊂ 𝑉 , что 𝑝 + 𝑊 ⊂ 𝛷 , содержит все лежащие в 𝛷 аффинные подпространства, проходящие через 𝑝. Если 𝑞 + 𝑊 это максимальное содержащееся в 𝛷 аффинное подпространство, проходящее через точку 𝑞 ∉ 𝑝+𝑈, то 𝑈 ⊂ 𝑊 , так как для любого вектора 𝑢 ∈ 𝑈 точка 𝑟 = 𝑞 + 𝑢 является концом содержащегося в 𝛷 интервала [𝑝, 𝑟[= {(1 − 𝑡)𝑝 + 𝑡𝑟 | 0 ⩽ 𝑡 < 1} (см. рис. 12⋄5), ибо (1 − 𝑡)𝑝 + 𝑡(𝑞 + 𝑢) = (1 − 𝑡) (𝑝 + По той же причине 𝑊 ⊂ 𝑈. Это доказывает пер вые два утверждения и первую половину третье го. Прямое разложение 𝑉 = 𝑈 ⊕ 𝑈′ задаёт раз ложение 𝔸(𝑉 ) = (𝑝 + 𝑈) × (𝑝 + 𝑈′ ), в котором 𝑝 + 𝑈 ⊂ 𝛷 . Для любой точки 𝑞 = 𝑝 + 𝑢 + 𝑢′ ∈ 𝛷 точ ка 𝑝 + 𝑢′ = 𝑞 − 𝑢 ∈ 𝑞 + 𝑈 лежит в (𝑝 + 𝑈′ )∩ 𝛷 = 𝛷 ′ . Наоборот, для любой точки 𝑝 + 𝑢′ ∈ 𝛷 ′ ⊂ 𝛷 всё аффинное пространство 𝑝 + 𝑢′ + 𝑈 ⊂ 𝛷 . Поэтому 𝛷 ⊂ (𝑝 + 𝑈 ) × 𝛷 ′ . 𝑞 𝑡 𝑢 + 𝑡𝑞 ∈ 𝛷 . 1−𝑡 ) 𝑢 𝑟 =𝑞+𝑢 𝑥 = 𝑥(𝑡) 𝑝 𝑢 𝑝+ − 𝑢 ⃖⃖⃖⃗ ∶ ⃖⃖⃖ Рис. 12⋄5. 𝑝𝑥 𝑥𝑟⃗ = 𝑡 ∶ (1 − 𝑡). Следствие 12.1 Следующие свойства непустой замкнутой выпуклой фигуры 𝛷 эквивалентны друг другу: 1) 𝛷 является цилиндром 2) 𝛷 не имеет крайних точек 3) 𝛷 содержит аффинное подпространство положительной размерности. Доказательство. Импликация (1) ⇒ (2). Если 𝛷 цилиндр, то через любую точку 𝑝 ∈ 𝛷 прохо дит содержащееся в 𝛷 аффинное пространство положительной размерности. Поэтому никакая точка 𝑝 ∈ 𝛷 не может быть крайней. Импликация (2) ⇒ (3). Если фигура 𝛷 не совпадает с наименьшим аффинным подпростран ством, в котором она содержится, то в этом подпространстве у 𝛷 есть опорная гиперплоскость, а значит, и грань строго меньшей размерности, чем dim 𝛷 . Заменяя 𝛷 на эту грань и повторяя рассуждение, мы построим цепочку вида: фигура 𝛷 , грань фигуры 𝛷 , грань грани фигуры 𝛷 , и т. д., последний элемент в которой совпадает с наименьшим содержащим его аффинным под пространством. Если это подпространство — точка, то она крайняя. Если нет, то 𝛷 содержит аффинное подпространство положительной размерности. Импликация (2) ⇒ (3) вытекает из предл. 12.2. 161 12.4. Выпуклые многогранники 12.4. Выпуклые многогранники. Пересечение конечного числа замкнутых полупространств 𝑀 = 𝐻𝑎+1 ∩ … ∩ 𝐻𝑎+𝑚 , (123) задаваемых в аффинном пространстве 𝔸(𝑉 ) набором непостоянных аффинных функционалов 𝑎1 , 𝑎2 , … , 𝑎𝑚 ∶ 𝔸(𝑉 ) → ℝ , (124) называется выпуклым многогранником. В частности, каждая аффинная гиперплоскость 𝐻𝑎 = = 𝐻𝑎+ ∩ 𝐻𝑎− = 𝐻𝑎+ ∩ 𝐻−+𝑎 является выпуклым многогранником. Пересечение конечного мно жества выпуклых многогранников является многогранником. В частности, все аффинные под пространства, включая точку, а также пустое множество и сечения любого выпуклого много гранника любыми аффинными подпространствами являются выпуклыми многогранниками. Удобно считать, что и всё объемлющее пространство 𝔸(𝑉 ) является выпуклым многогранни ком, который мы будем называть несобственным в отличие от многогранников (123), которые будем называть собственными. 12.4.1. Координатное описание. В координатном пространстве ℝ𝑛 многогранник (123), являющийся пересечением 𝑚 аффинных полупространств, задаваемых аффинными функцио налами 𝑎𝑖 (𝑥1 , … , 𝑥𝑛 ) = 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 + 𝑏𝑖 , где 𝑖 = 1, … , 𝑚, может быть описан как множество всех решений системы линейных неоднородных неравенств ⎧ 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛 + 𝑏1 ⎪ ⎪ 𝑎21 𝑥1 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛 + 𝑏2 ⎪ ⎨ 𝑎31 𝑥1 + 𝑎32 𝑥2 + ⋯ + 𝑎3𝑛 𝑥𝑛 + 𝑏3 ⎪ ⋯⋯⋯⋯⋯ ⎪ ⎪𝑎 𝑥 + 𝑎 𝑥 + ⋯ + 𝑎 𝑥 + 𝑏 ⎩ 𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 𝑛 ⩾0 ⩾0 ⩾0 (125) ⩾ 0. Например, неравенство 1 ⩾ 0 задаёт несобственный многогранник 𝑀 = ℝ𝑛 , а неравенство −1 ⩾ 0 задаёт пустой многогранник 𝑀 = ∅. Следуя матричным обозначениям из n∘ 5.6 на стр. 66, мы будем коротко записывать систему (125) в виде 𝐴𝑥 + 𝑏 ⩾ 0, где матрица 𝐴 = 𝑛 (𝑎𝑖𝑗 ) имеет 𝑖 той строкой набор коэффициентов дифференциала 𝛼𝑖 = 𝐷𝑎𝑖 ∶ ℝ → ℝ функ 𝑛 ционала 𝑎𝑖 , столбец 𝑥 ∈ ℝ состоит из координат 𝑥1 , … , 𝑥𝑛 , а столбец 𝑏 ∈ ℝ𝑚 состоит из значений 𝑏1 , … , 𝑏𝑚 аффинных функционалов 𝑎1 , … , 𝑎𝑚 в точке 0 ∈ ℝ𝑛 . Множество реше ний системы (125) является прообразом положительного координатного гипероктанта ℝ𝑚 ⩾0 = {(𝑦1 , … , 𝑦𝑚 ) ∈ ℝ𝑚 | ∀ 𝑗 𝑦𝑗 ⩾ 0} в пространстве ℝ𝑚 при аффинном отображении 𝑎 ∶ ℝ𝑛 → ℝ𝑚 , 𝑥 ↦ 𝐴𝑥 + 𝑏 с дифференциалом 𝐷𝑎 ∶ ℝ𝑛 → ℝ𝑚 , 𝑥 ↦ 𝐴𝑥 . При замене вектора 𝑏 ∈ ℝ𝑚 вектором 𝑏′ = 𝑏 + 𝐴𝑣 с произвольным 𝑣 ∈ ℝ𝑛 многогранник 𝑀 ⊂ ℝ𝑛 параллельно сдвигается на вектор −𝑣 , поскольку 𝐴𝑥 + 𝑏′ ⩾ 0 ⟺ 𝐴𝑥 + 𝐴𝑣 + 𝑏 ⩾ 0 ⟺ 𝐴(𝑥 + 𝑣) + 𝑏 ⩾ 0 . Другими словами, перенос начала координат в ℝ𝑛 равносилен сдвигу вектора 𝑏 ∈ ℝ𝑚 на вектор из образа im 𝐴 ⊂ ℝ𝑚 линейного отображения 𝑥 ↦ 𝐴𝑥 . Поэтому многогранник 𝑀 с точностью до параллельного переноса зависит только от класса [𝑏] = 𝑏 + im 𝐴 ∈ ℝ𝑚 ∕ im 𝐴 по модулю подпространства, порождённого столбцами матрицы 𝐴. 162 §12 Выпуклая геометрия Если линейный оператор 𝐴 ∶ ℝ𝑛 → ℝ𝑚 , 𝑥 ↦ 𝐴𝑥 , имеет ненулевое ядро ker 𝐴 = {𝑥 ∈ ℝ𝑛 | 𝐴𝑥 = 0} ≠ 0 , то по предл. 6.1 на стр. 79 пространство ℝ𝑛 распадается в прямую сумму ℝ𝑛 = ℝ𝑟 ⊕ ker 𝐴, где 𝑟 = rk 𝐴 и ℝ𝑟 = 𝐸𝐼 — координатное подпространство, натянутое на такие стандартные базис ные векторы 𝑒𝑖1 , … , 𝑒𝑖𝑟 пространства ℝ𝑛 , что столбцы с номерами 𝐼 = (𝑖1 , … , 𝑖𝑟 ) составляют ба зис1 в im 𝐴, т. е. в линейной оболочке столбцов матрицы 𝐴. Многогранник 𝑀, задаваемый систе мой (125), является в этом случае цилиндром с образующей ker 𝐴 над (возможно пустым) мно гогранником 𝑀𝐼 ⊂ 𝐸𝐼 , который задаётся неравенствами 𝐴𝐼 𝑥𝐼 + 𝑏 ⩾ 0, где 𝑥𝐼 = (𝑥𝑖1 , … , 𝑥𝑖𝑟 )𝑡 — подстолбец столбца координат 𝑥 , а 𝐴𝐼 ⊂ 𝐴 — подматрица, образованная столбцами с номерами 𝑖1 , … , 𝑖𝑟 . Поскольку линейное отображение 𝐴𝐼 ∶ ℝ𝑟 → ℝ𝑚 , 𝑥𝐼 ↦ 𝐴𝐼 𝑥𝐼 , инъективно, а поло жительный координатный октант ℝ𝑚 ⩾0 не содержит аффинных подпространств положительной размерности, многогранник 𝑀𝐼 не содержит ненулевых аффинных подпространств. Мы будем называть такие многогранники приведёнными. Таким образом, многогранник (125) приведён если и только если rk 𝐴 = 𝑛. Каждый приведённый многогранник, задаваемый 𝑚 линейными неравенствами в 𝑘мер ном аффинном пространстве, представляет собою пересечение положительного гипероктанта 𝑚 𝑚 ℝ𝑚 ⩾0 координатного пространства ℝ с аффинным подпространством 𝑏 + 𝑈, где 𝑏 ∈ ℝ — 𝑚 некоторый вектор, а 𝑈 ⊂ ℝ — векторное подпространство размерности 𝑘 ⩽ 𝑚. Аффинное подпространство 𝑏 + 𝑈 = [𝑏]𝑈 представляет собою класс вектора 𝑏 в факторе ℝ𝑚 ∕𝑈 и не меня ется при сдвиге вектора 𝑏 на векторы из 𝑈. На практике подпространство 𝑈 ⊂ ℝ𝑚 обычно задаётся либо как линейная оболочка 𝑛 столбцов некоторой матрицы 𝐴 высоты 𝑚, либо двойственным образом — как пространство решений системы из 𝑛 линейных уравнений 𝑦𝐴 = 0 на строку координат 𝑦 = (𝑦1 , … , 𝑦𝑚 ) ∈ ℝ𝑚 . В первом случае система неравенств (125) задаёт в аффинном пространстве ℝ𝑛 цилиндр с образующей ker 𝐴 над многогранником 𝑀 = [𝑏]𝑈 ∩ ℝ𝑚 ⩾0 в 𝑘 мерном аффинном пространстве 𝑏 + 𝑈 ⊂ ℝ𝑚 . При этом dim 𝑀 ⩽ dim 𝑈 = rk 𝐴. 𝑚 Во втором случае многогранник 𝑀 = [𝑏]𝑈 ∩ ℝ𝑚 ⩾0 , где 𝑏 = (𝑏1 , … , 𝑏𝑚 ) ∈ ℝ — заданная 𝑚 строка, состоит из всех строк 𝑧 = 𝑏 + 𝑦 ∈ ℝ , лежащих в положительном координатном гипе роктанте ℝ𝑚 ⩾0 и удовлетворяющих системе из 𝑛 неоднородных линейных уравнений 𝑧𝐴 = 𝑏𝐴. При этом dim 𝑀 ⩽ dim 𝑈 = 𝑚 − rk 𝐴. 12.4.2. Перечисление граней. Каждый собственный непустой выпуклый многогранник 𝑀 в аффинном пространстве 𝔸(𝑉 ), ассоциированном с векторным пространством 𝑉 , имеет грани, и все они являются непустыми выпуклыми многогранниками. Сам многогранник 𝑀 является своей гранью если и только если он содержится в некоторой гиперплоскости. В этом случае мы будем называть совпадающую с 𝑀 грань несобственной, а все остальные грани 𝛤 ⊊ 𝑀 — собственными. Под размерностью выпуклого многогранника мы всегда понимаем размерность наименьшего аффинного подпространства, в котором он содержится. В частности, размерность каждой собственной грани строго меньше размерности многогранника. Грани 𝛤 ⊂ 𝑀 размер ности dim 𝛤 = dim 𝑀 − 1 называются гипергранями. Для многогранника 𝑀 = 𝐻𝑎+1 ∩ … ∩ 𝐻𝑎+𝑚 ⊂ 𝔸(𝑉 ), задаваемого 𝑚 аффинными функциона лами 𝑎1 , … , 𝑎𝑚 ∶ 𝔸(𝑉 ) → ℝ и каждого непустого подмножества 𝐼 = {𝑖1 , … , 𝑖𝑘 } ⊂ {1, … , 𝑚} 1 В качестве 𝐼 можно взять номера любого набора из 𝑟 = rk 𝐴 линейно независимых столбцов матри цы 𝐴, например, номера базисных столбцов приведённой ступенчатой матрицы, которую можно полу чить из 𝐴 элементарными преобразованиями строк. 12.4. Выпуклые многогранники 163 положим 𝐻𝐼 ≝ ⋂𝑖∈𝐼 𝐻𝑎𝑖 . Это аффинное подпространство в 𝔸(𝑉 ), возможно пустое. Для каждой грани 𝛤 = 𝐻𝑏 ∩ 𝑀, высекаемой из 𝑀 какимлибо опорным функционалом 𝑏 ∶ 𝔸(𝑉 ) → ℝ, обо значаем через 𝐼 (𝛤 ) = {𝑖 | 𝛤 ⊂ 𝐻𝑎𝑖 } множество номеров всех тех задающих многогранник 𝑀 функционалов 𝑎𝑖 , которые тождественно зануляются на грани 𝛤 . Таким образом, 𝛤 ⊂ 𝐻𝐼(𝛤) и каждый функционал 𝑎𝑗 с 𝑗 ∉ 𝐼 (𝛤 ) положителен на некотором открытом в топологии простран ства 𝐻𝐼(𝛤) подмножестве грани 𝛤 . Теорема 12.5 (перечисление граней) Для каждой грани 𝛤 ⊂ 𝑀 аффинное подпространство 𝐻𝐼(𝛤) является наименьшим по включе нию аффинным пространством, содержащим грань 𝛤 . Точка 𝑝 ∈ 𝛤 является внутренней точкой грани 𝛤 если и только если 𝑎𝑗 (𝑝) > 0 для всех 𝑗 ∉ 𝐼 (𝛤 ). Для каждого непустого подмноже ства 𝐼 ⊂ {1, … , 𝑚} пересечение 𝛤𝐼 ≝ 𝑀 ∩ 𝐻𝐼 либо пусто, либо является гранью 𝑀, и все соб ственные грани многогранника 𝑀 получаются таким образом. Доказательство. Сначала докажем первые два утверждения. Рассмотрим произвольную грань 𝛤 ⊂ 𝑀, и пусть точка 𝑝 ∈ 𝛤 такова, что 𝑎𝑗 (𝑝) > 0 для всех 𝑗 ∉ 𝐼 (𝛤). Тогда эти строгие неравенства выполняются и на некоторой кубической окрестности точки 𝑝 в аффинном пространстве 𝐻𝐼(𝛤) , и значит, точка 𝑝 содержится в грани 𝛤 вместе с этой кубической окрестностью. Поэтому под пространство 𝐻𝐼(𝛤) является наименьшим аффинным пространством, содержащим грань 𝛤 , а точка 𝑝 является внутренней точкой грани 𝛤 . Отметим, что точка 𝑝 ∈ 𝛤 , в которой 𝑎𝑗 (𝑝) > 0 для всех 𝑗 ∉ 𝐼 (𝛤 ) обязательно существует, так как для каждого 𝑗 ∉ 𝐼 (𝛤 ) есть точка 𝑝𝑗 ∈ 𝛤 , в которой 𝑎𝑗 (𝑝𝑗 ) > 0, и в качестве 𝑝 можно взять равновесный барицентр этих точек 𝑝𝑗 . Это доказывает первое утверждение теоремы. Для доказательства второго утверждения остаётся проверить, что если хоть один функционал 𝑎𝑗 c 𝑗 ∉ 𝐼 (𝛤 ) зануляется в некоторой точке 𝑝 ∈ 𝛤 , то точка 𝑝 не может быть внутренней точкой грани 𝛤 . Для этого рассмотрим такую точку 𝑞 ∈ 𝛤 , в которой 𝑎𝑗 (𝑞 ) > 0. Если бы точка 𝑝 содержалась в 𝛤 вместе с некоторой своей кубической окрестностью в пространстве 𝐻𝐼(𝛤) , то мы могли бы немного продлить отрезок [𝑞 , 𝑝] за точку 𝑝 внутри этой окрестности и получить в 𝛤 точку 𝑟 с 𝑎𝑗 (𝑟) < 0, что невозможно. Теперь рассмотрим произвольное непустое подмножество 𝐼 ⊂ {1, … , 𝑚}. Если многогран ник 𝛤𝐼 = 𝑀 ∩ 𝐻𝐼 не пуст, то сумма 𝑎𝐼 = ∑𝑖∈𝐼 𝑎𝑖 является опорным функционалом для 𝑀 и 𝛤𝐼 = 𝑀 ∩ 𝐻𝛼𝐼 . Поэтому все непустые многогранники 𝛤𝐼 являются гранями многогранника 𝑀. Покажем, что каждая собственная грань 𝛤 = 𝐻𝑏 ∩ 𝑀, высекаемая из 𝑀 произвольным опорным функционалом 𝑏, имеет вид 𝛤 = 𝛤𝐼 = 𝑀 ∩ 𝐻𝐼 для множества индексов 𝐼 = 𝐼 (𝐺 ) = {𝑖 | 𝛤 ⊂ 𝐻𝑎𝑖 }. Сначала убедимся, что 𝐼 (𝛤 ) ≠ ∅. Как мы видели в предыдущем абзаце, в грани 𝛤 имеется та кая точка 𝑝 ∈ 𝛤 , что 𝑎𝑗 (𝑝) > 0 для всех 𝑗 ∉ 𝐼 (𝛤 ). Если бы множество 𝐼 (𝛤 ) было пусто, то в такой точке 𝑝 были бы положительны сразу все задающие многогранник 𝑀 функционалы 𝑎𝑖 , а значит, они остались бы положительными и на некоторой кубической окрестности точки 𝑝 во всём про странстве 𝔸(𝑉 ). Тем самым, точка 𝑝 была бы внутренней точкой 𝑀 и не могла бы лежать ни в какой собственной грани. Мы заключаем, что 𝐼 = 𝐼 (𝛤 ) ≠ ∅ и 𝛤 ⊆ 𝐻𝐼 ∩ 𝑀 = 𝛤𝐼 . Остаётся доказать обратное включение 𝛤𝐼 ⊆ 𝛤 . Для этого рассмотрим произвольную точку 𝑞 ∈ 𝛤𝐼 и любую такую точку 𝑝 ∈ 𝛤 , в которой 𝑎𝑗 (𝑝) > 0 для всех 𝑗 ∉ 𝐼 . Тогда точка 𝑝 лежит внутри грани 𝛤 вместе с некоторой своей кубической окрестностью в пространстве 𝐻𝐼 , и отрезок [𝑞 , 𝑝] можно немного продлить за точку 𝑝 так, чтобы его новый конец 𝑟 всё ещё лежал в 𝛤 . Из соотношений 𝑏(𝑝) = 0 и 𝑏(𝑟) = 0 вытекает, что 𝑏(𝑞 ) = 0. Следовательно, каждая точка 𝑞 ∈ 𝛤𝐼 лежит в грани 𝛤 . Следствие 12.2 Любой выпуклый многогранник имеет конечное множество граней, и каждая грань любой гра 164 §12 Выпуклая геометрия ни является гранью самого многогранника. Следствие 12.3 Крайними точками любого выпуклого многогранника являются его вершины и только они. Следствие 12.4 Каждый ограниченный выпуклый многогранник имеет конечное множество вершин и совпа дает с их выпуклой оболочкой. Следствие 12.5 Непустой выпуклый многогранник 𝑀 тогда и только тогда является цилиндром1 , когда он не имеет вершин. 12.5. Выпуклые многогранные конусы. Каждое непустое конечное подмножество 𝑅 ⊂ 𝑉 за даёт в аффинном пространстве 𝔸(𝑉 ) замкнутую выпуклую фигуру 𝜎𝑅 = {𝜆1 𝑤1 + 𝜆2 𝑤2 + ⋯ + 𝜆𝑚 𝑤𝑚 | 𝜆𝑖 ∈ ℝ⩾0 , 𝑤𝑖 ∈ 𝑅 ⊂ 𝑉 } , (126) которая называется выпуклым многогранным конусом с множеством образующих 𝜎𝑅 . Упражнение 12.5. Убедитесь, что 𝜎𝑅 действительно является замкнутой выпуклой фигурой в 𝔸(𝑉 ). Каждый конус (126) не пуст, поскольку содержит нулевой вектор 0 ∈ 𝑉 . Вместе с каждым нену левым вектором 𝑣 ∈ 𝜎𝑅 в конусе 𝜎ℝ лежат и все неотрицательные кратные этого вектора, т. е. замкнутый луч [0, 𝑣 ) = ℝ⩾0 𝑣 . Поэтому любая опорная гиперплоскость 𝐻𝑎 конуса 𝜎 проходит через нуль: в противном случае из неравенства 𝑎(0) > 0 и равенства 𝑎(𝑣 ) = 0, которое долж но выполняться в некоторой точке 𝑣 ∈ 𝐻𝑎 ∩ 𝜎𝑅 ≠ ∅, вытекало бы, что 𝑎(𝑤) < 0 для всех 𝑤 ∈ [0, 𝑣)∖[0, 𝑣]. Таким образом, все опорные гиперплоскости любого конуса являются вектор ными подпространствами в 𝑉 и имеют вид 𝐻𝛼 для некоторого линейного функционала 𝛼 ∈ 𝑉∗ . Будучи замкнутой выпуклой фигурой, каждый конус 𝜎𝑅 является пересечением своих опорных полупространств 𝐻𝛼+ = {𝑣 ∈ 𝑉 | 𝛼 (𝑣 ) ⩾ 0}, по всем таким 𝛼 ∈ 𝑉∗ , что 𝛼 (𝑤) ⩾ 0 для всех 𝑤 ∈ 𝜎𝑅 и 𝐻𝛼 ∩ 𝜎𝑅 ≠ ∅. Поэтому для любого вектора 𝑢 ∉ 𝜎𝑅 найдётся такой ковектор 𝛼 ∈ 𝑉∗ , что 𝛼(𝑢) < 0, но 𝛼 (𝑤) ⩾ 0 для всех 𝑤 ∈ 𝜎𝑅 . Это наблюдение известно как лемма Фаркаша. Теорема 12.6 (теорема Фаркаша – Минковского – Вейля) Подмножество 𝜎 ⊂ 𝑉 тогда и только тогда является выпуклым многогранным конусом, когда оно является пересечением конечного числа векторных полупространств 𝐻𝛼+ = {𝑣 ∈ 𝑉 | 𝛼(𝑣) ⩾ 0} , где 𝛼 ∈ 𝑉∗ . (127) В частности, каждый выпуклый многогранный конус является выпуклым многогранником. Доказательство. Пусть подмножество 𝜎 ⊂ 𝑉 является пересечением конечного числа вектор ных полупространств (127). Тогда 𝜎 является выпуклым многогранником в 𝔸(𝑉 ), содержит нуль 0 ∈ 𝑉 , и вместе с каждой точкой 𝑝 ≠ 0 содержит весь замкнутый луч [0, 𝑝). Пересече ние многогранника 𝜎 со стандартным единичным кубом 𝐵1 (0) ⊂ 𝔸(𝑉 ) с центром в нуле явля ется ограниченным выпуклым многогранником и по сл. 12.4 совпадает с выпуклой оболочкой своих вершин, которые образуют конечное множество 𝑅 ⊂ 𝜎. Так как для каждого 𝑣 ∈ 𝜎 су ществует такое 𝜆 ⩾ 0, что 𝜆𝑣 ∈ 𝜎 ∩ 𝐵1 (0) является выпуклой комбинацией векторов из 𝑅 , сам вектор 𝑣 является неотрицательной линейной комбинацией векторов из 𝑅 , т. е. 𝜎 = 𝜎𝑅 . 1 Cм. опр. 12.2 на стр. 159. Являющиеся цилиндрами многогранники также называют призмами. 165 12.5. Выпуклые многогранные конусы Наоборот, любой многогранный конус 𝜎𝑅 ⊂ 𝑉 , как мы видели, является пересечением опор ных полупространств вида (127). Для того, чтобы неравенство 𝛼 (𝑤) ⩾ 0 выполнялось для всех 𝑤 ∈ 𝜎𝑅 , достаточно, чтобы оно выполнялось для всех 𝑤 ∈ 𝑅. Поэтому множество всех таких ковекторов 𝛼 ∈ 𝑉∗ , что 𝜎𝑅 ⊂ 𝐻𝛼+ представляет собою пересечение конечного числа векторных + полупространств 𝐻𝑤 = {𝛼 ∈ 𝑉∗ | 𝛼(𝑤) ⩾ 0}, задаваемых векторами 𝑤 ∈ 𝑅, рассматриваемыми как линейные функционалы на 𝑉∗ . По уже доказанному, такое пересечение является выпуклым многогранным конусом 𝜎𝑅∨ ⊂ 𝑉∗ , порождённым конечным множеством ковекторов 𝑅∨ ⊂ 𝑉∗ . Так как каждый ковектор 𝛼 ∈ 𝜎𝑅∨ является неотрицательной линейной комбинацией ковекто ров 𝜓 ∈ 𝑅∨ , все неравенства 𝛼 (𝑣 ) ⩾ 0, где 𝛼 ∈ 𝜎𝑅∨ , следуют из конечного набора неравенств + 𝜓(𝑣) ⩾ 0, где 𝜓 ∈ 𝑅∨ , т. е. 𝜎 = ⋂𝜓∈𝑅∨ 𝐻𝜓 . 12.5.1. Двойственные конусы. Множество линейных функционалов 𝛼 ∈ 𝑉∗ , принимаю щих неотрицательные значения на выпуклом многогранном конусе 𝜎𝑅 ⊂ 𝑉 , является пересече + нием конечного числа векторных полупространств 𝐻𝑤 ⊂ 𝑉∗ , задаваемых образующими 𝑤 ∈ 𝑅 конуса 𝜎𝑅 , рассматриваемыми как линейные функционалы на 𝑉∗ , и по теор. 12.6 представляет собою выпуклый многогранный конус 𝜎𝑅∨ ≝ {𝛼 ∈ 𝑉∗ | ∀ 𝑣 ∈ 𝜎𝑅 𝛼(𝑣) ⩾ 0} = ⋂ + 𝐻𝑤 ⊂ 𝑉∗ , 𝑤∈𝑅 порождённый конечным набором ковекторов, который мы обозначим через 𝑅∨ ⊂ 𝑉∗ . Конус 𝜎𝑅∨ = 𝜎𝑅∨ ⊂ 𝑉∗ называется двойственным к конусу 𝜎𝑅 ⊂ 𝑉 . По лемме Фаркаша исходный конус 𝜎𝑅 = {𝑣 ∈ 𝑉 | ∀ 𝛼 ∈ 𝜎𝑅∨ 𝛼(𝑣) ⩾ 0} = ⋂∨ 𝛼+ ⊂ 𝑉 𝛼∈𝑅 двойствен к своему двойственному конусу. Таким образом, для любого выпуклого многогран ного конуса 𝜎 выполняется равенство 𝜎∨∨ = 𝜎. Множество 𝑅∨ ⊂ 𝑉∗ образующих двойственного к 𝜎𝑅 конуса 𝜎𝑅∨ = 𝜎𝑅∨ состоит из таких ковекторов 𝛼1 , … , 𝛼𝑚 ∈ 𝑉∗ , что конус 𝜎𝑅 = 𝐻𝛼+1 ∩…∩ 𝐻𝛼+1 . 12.5.2. Проективный и асимптотический конусы многогранника. Вложим ℝ𝑛 со стан дартными базисом 𝑒1 , … , 𝑒𝑛 и координатами (𝑥1 , … , 𝑥𝑛 ) в этом базисе в (𝑛 + 1)мерное про странство 𝑊 = ℝ𝑛+1 с базисом 𝑒0 , 𝑒1 , … , 𝑒𝑛 и координатами (𝑥0 , 𝑥1 , … , 𝑥𝑛 ) в качестве вектор ного подпространства 𝑉 ⊂ 𝑊 , задаваемого уравнением 𝑥0 = 0, и обозначим через 𝑈 = 𝑒0 + 𝑉 аффинную гиперплоскость, заданную уравнением 𝑥0 = 1. Каждый выпуклый многогранник 𝑀 = 𝐻𝑎+1 ∩ … ∩ 𝐻𝑎+𝑚 ⊂ ℝ𝑛 , задаваемый неоднородными неравенствами 𝑏𝑖 + 𝛼𝑖1 𝑥1 + ⋯ + 𝛼𝑖𝑛 𝑥𝑛 ⩾ 0 , где 1 ⩽ 𝑖 ⩽ 𝑚, (128) на координаты (𝑥1 , … , 𝑥𝑛 ) является пересечением аффинной гиперплоскости 𝑈 с выпуклым многогранным конусом 𝑀 ⊂ 𝑊 , который задаётся в векторном пространстве 𝑊 = ℝ𝑛+1 од нородными неравенствами 𝑏0 𝑥0 + 𝛼𝑖1 𝑥1 + ⋯ + 𝛼𝑖𝑛 𝑥𝑛 ⩾ 0 , где 1 ⩽ 𝑖 ⩽ 𝑚, (129) на координаты (𝑥0 , 𝑥1 , … , 𝑥𝑛 ), см. рис. 12⋄6 на стр. 166. Конус 𝑀 называется проективным ко нусом многогранника 𝑀. Его пересечение с векторным подпространством 𝑉 ⊂ 𝑊 , которое за даётся уравнением 𝑥0 = 0 и является направляющим векторным подпространством аффинной гиперплоскости 𝑈 = 𝑒0 + 𝑉 ⊂ 𝑊 , называется асимптотическим конусом или конусом рецессии 166 §12 Выпуклая геометрия многогранника 𝑀 и обозначается 𝑀∞ ≝ 𝑀 ∩ 𝑉 . Конус 𝑀∞ описывается в векторном простран стве 𝑉 = ℝ𝑛 однородными неравенствами 𝛼𝑖1 𝑥1 + ⋯ + 𝛼𝑖𝑛 𝑥𝑛 ⩾ 0 , где 1 ⩽ 𝑖 ⩽ 𝑚 , в которые превращаются неравенства (129) при 𝑥0 = 0 и которые получаются удалением сво бодных членов из неоднородных неравенств (128). Таким образом, асимптотический конус 𝑀∞ = 𝜎𝛼∨1 ,…,𝛼𝑚 двойствен конусу 𝜎𝛼1 ,…,𝛼𝑚 ⊂ 𝑉∗ , порождённому дифференциалами 𝛼𝑖 = 𝐷𝑎𝑖 аффинных функционалов 𝑎𝑖 , задающих многогранник 𝑀. lim [0, 𝑤 ) = ℝ≥ ⋅ 𝑣 →+∞ 𝑣 [0, 𝑤 ) 𝑣 𝑀 𝑣 𝑣 𝑂 𝑝 𝑝 𝑀 𝑤 = 𝑤 + 𝑡𝑣 [0, 𝑤) 𝑤 𝑣 𝑒 𝑂 𝑝 𝑝 𝑝 𝑝 𝑉 𝑣 𝑈 =𝑒 +𝑉 Рис. 12⋄6. Конус 𝑀. 𝑉 𝑈 =𝑒 +𝑉 Рис. 12⋄7. Конус 𝑀∞ . Геометрически, проективный конус 𝑀 непустого многогранника 𝑀 является замыканием объ единения всех лучей [0, 𝑤), где 𝑤 ∈ 𝑀, а асимптотический конус 𝑀∞ образован пределами [0, 𝑣) = lim [0, 𝑤𝑡 ) таких лучей, проходящих через переменную точку 𝑤𝑡 = 𝑤 + 𝑡𝑣 ∈ 𝑀, кото 𝑡→+∞ рая стартует при 𝑡 = 0 из некоторой точки 𝑤 ∈ 𝑀 и уходит при 𝑡 → +∞ на бесконечность в направлении вектора 𝑣 ∈ 𝑉 , оставаясь всё время внутри 𝑀, см. рис. 12⋄7. Упражнение 12.6. Убедитесь в этом и покажите, что асимптотический конус 𝑀∞ непустого многогранника 𝑀 состоит из всех тех векторов 𝑣 ∈ 𝑉 , которые обладают следующими эк вивалентными свойствами1 : (1) для любой точки 𝑝 ∈ 𝑀 точка 𝑝 + 𝑣 тоже лежит в 𝑀 (2) для любой точки 𝑝 ∈ 𝑀 луч {𝑝 + 𝑡𝑣 | 𝑡 ⩾ 0} содержится в 𝑀 (3) 𝑀 содержит какойнибудь луч [𝑝, 𝑞) с направляющим вектором ⃖⃖⃖ 𝑝𝑞⃗ = 𝑣. Теорема 12.7 (теорема Минковского – Вейля) Выпуклая оболочка любого конечного набора точек в ℝ𝑛 является ограниченным выпуклым многогранником. Наоборот, всякий компактный выпуклый многогранник в ℝ𝑛 является вы пуклой оболочкой конечного множества точек, а именно — своих вершин. Доказательство. Последнее утверждение уже было установлено нами в сл. 12.4 на стр. 164. До кажем первое. Вложим ℝ𝑛 в векторное пространство 𝑊 = ℝ 𝑒0 ⊕ ℝ𝑛 в качестве аффинной ги перплоскости 𝑈 с уравнением 𝑥0 = 1, как это было объяснено выше. Выпуклая оболочка любого 1 Направления таких векторов 𝑣 называют асимптотическими или направлениями рецессии. 167 12.5. Выпуклые многогранные конусы конечного множества 𝑃 ⊂ 𝑈 ограничена, так как содержится в любом содержащем 𝑃 кубе, и высекается из аффинной гиперплоскости 𝑈 конусом 𝜎𝑃 ⊂ 𝑊 , поскольку каждая выпуклая бари центрическая комбинация ∑ 𝑥𝑖 𝑝𝑖 точек 𝑝𝑖 ∈ 𝑃 лежит в конусе 𝜎𝑃 , и наоборот, для любого нену левого вектора 𝑤 = ∑ 𝜆𝑖 𝑝𝑖 ∈ 𝜎𝑃 пересечение луча [0, 𝑤) с аффинной гиперплоскостью 𝑥0 = 1 происходит в точке 𝑤 ∕ 𝑥0 (𝑤 ) = (𝜆1 + ⋯ + 𝜆𝑘 )−1 ∑ 𝜆𝑖 𝑝𝑖 , которая является выпуклой барицен трической комбинацией точек 𝑝𝑖 , так как все 𝜆𝑖 ⩾ 0. По теор. 12.6 конус 𝜎𝑃 является выпуклым многогранником. Поэтому 𝑀 = 𝜎𝑃 ∩ 𝑈 тоже является выпуклым многогранником. Теорема 12.8 (разложение Моцкина) Всякий выпуклый многогранник 𝑀 ⊂ ℝ𝑛 раскладывается в сумму 𝑀 = conv 𝑃 + 𝑀∞ = {𝑝 + 𝑣 | 𝑝 ∈ conv 𝑃, 𝑣 ∈ 𝑀∞ } , где 𝑃 ⊂ 𝑀 — некоторое конечное подмножество, а 𝑀∞ = 𝜎𝛼∨1 ,…,𝛼𝑚 ⊂ 𝑉 — асимптотический ко нус многогранника 𝑀. Иначе говоря, каждый выпуклый многогранник является объединением семейства своих асимптотических конусов, отложенных от точек некоторого компактного вы пуклого многогранника (возможно, пустого или состоящего из одной точки). Доказательство. Как и выше, отождествим ℝ𝑛 с аффинной гиперплоскостью 𝑈, которая задаёт ся в (𝑛 + 1)мерном пространстве 𝑊 = ℝ 𝑒0 ⊕ ℝ𝑛 уравнением 𝑥0 = 1, и обозначим через 𝑉 ⊂ 𝑊 направляющее векторное подпространство гиперплоскости 𝑈, которое задаётся в 𝑊 уравнени ем 𝑥0 = 0. По теор. 12.6 на стр. 164 проективный конус 𝑀 = 𝜎𝑆 порождается некоторым ко нечным множеством векторов 𝑆 ⊂ 𝑊 . Высекаемая векторным подпространством 𝑉 ⊂ 𝑊 грань 𝑀∞ = 𝑉 ∩ 𝑀 проективного конуса 𝑀, будучи пересечением конусов с общей вершиной, также представляет собою конус 𝜎𝑅 ⊂ 𝑉 , порождённый некоторым конечным множеством векторов 𝑅 = 𝑆 ∩ 𝑉 . Умножая все не лежащие в 𝑉 образующие проективного конуса 𝑀 на положительные константы, мы можем и будем считать, что все они лежит в 𝑈, а значит, и в 𝑀. Обозначим мно жество таких образующих через 𝑃 ≝ 𝑆 ∖ 𝑅 ⊂ 𝑀 ⊂ 𝑈. Тогда 𝑀 = 𝜎𝑃⊔𝑅 = {𝑝 + 𝑟 , | 𝑝 ∈ 𝜎𝑃 , 𝑟 ∈ 𝜎𝑅 }. Луч [0, 𝑝 + 𝑟), где 𝑝 ∈ 𝜎𝑃 , 𝑟 ∈ 𝜎𝑅 , пересекает аффинную гиперплоскость 𝑈 если и только если 𝑝 ≠ 0, и в этом случае точка пересечения (𝑝 + 𝑟)∕ 𝑥0 (𝑝 + 𝑟) = (𝑝 + 𝑟)∕ 𝑥0 (𝑝) является суммой точки 𝑝 ∕ 𝑥0 (𝑝) ∈ conv 𝑃 и вектора 𝑟 ∕ 𝑥0 (𝑝) ∈ 𝜎𝑅 = 𝑀∞ . Следствие 12.6 Следующие свойства непустого многогранника 𝑀 = 𝐻𝑎+1 ∩ … ∩ 𝐻𝑎+𝑚 , задаваемого аффинными функционалами 𝑎𝑖 = 𝑏𝑖 + 𝛼𝑖 эквивалентны: 𝑀 ограничен ⟺ конус 𝑀∞ = 0 ⟺ конус 𝜎𝛼1 …𝛼𝑚 = 𝑉∗ . 12.5.3. Коасимптотический конус многогранника. Рассмотрим выпуклый многогранник 𝑀 = 𝐻𝑎+1 ∩ … ∩ 𝐻𝑎+𝑚 = {𝑥 ∈ ℝ𝑛 | 𝑏 + 𝐴𝑣 ⩾ 0} ⊂ ℝ𝑛 , 1 𝑚 как прообраз положительного гипероктанта ℝ𝑚 ⩾0 ⊂ ℝ при аффинном отображении 𝑎 ∶ ℝ𝑛 → ℝ𝑚 , 1 Ср. с n∘ 12.4.1 на стр. 161. 𝑥 ↦ 𝐴𝑥 + 𝑏 , (1210) 168 §12 Выпуклая геометрия с дифференциалом 𝐷𝑎 = 𝐴 ∶ ℝ𝑛 → ℝ𝑚 , 𝑥 ↦ 𝐴𝑥 . Двойственное к дифференциалу линейное ∗ ∗ отображение1 𝐷𝑎∗ = 𝐴𝑡 ∶ ℝ𝑛 → ℝ𝑚 , 𝑦 ↦ 𝑦𝐴, переводит стандартные базисные ковекторы ∗ 𝑚∗ 𝑒𝑖 ∈ ℝ в линейные функционалы 𝛼𝑖 = 𝐷𝑎𝑖 , координатами которых в стандартном базисе ∗ ∗ пространства ℝ𝑛 являются строки матрицы 𝐴. Ядро ker 𝐴𝑡 = {𝑦 ∈ ℝ𝑚 | 𝑦𝐴 = 0} состоит из всех линейных соотношений между функционалами2 𝛼𝑖 или, что то же самое, между стро ∗ ками матрицы 𝐴. Пересечение ядра ker 𝐴𝑡 с положительным гипероктантом ℝ𝑚 ⩾0 называется коасимптотическим конусом многогранника 𝑀 и обозначается ∗ 𝜘𝑀 ≝ ker 𝐴𝑡 ∩ ℝ𝑚 ⩾0 . Он зависит только от линейного отображения 𝐴 ∶ ℝ𝑛 → ℝ𝑚 , но не от вектора 𝑏 ∈ ℝ𝑚 . Как мы уже отмечали в n∘ 12.4.1 на стр. 161, многогранник 𝑀 ⊂ ℝ𝑛 с точностью до параллельного переноса определяется классом [𝑏]im 𝐴 = 𝑏 + im 𝐴 столбца 𝑏 ∈ ℝ𝑚 в фактор пространстве ℝ𝑚 ∕ im 𝐴, которое по сл. 7.5 на стр. 90 канонически двойственно пространству ker 𝐴𝑡 . Таким образом, класс [𝑏]im 𝐴 может рассматриваться как линейный функционал [𝑏]im 𝐴 ∶ ker 𝐴𝑡 → ℝ , 𝑦 ↦ 𝑦𝑏 . Предложение 12.3 ∨ Двойственный к коасимптотическому конус 𝜘𝑀 ⊂ ℝ𝑚 ∕im 𝐴 образован всеми такими классами 𝑏 + im 𝐴 ∈ ℝ𝑚 ∕ im 𝐴, что многогранник 𝑀 = {𝑥 ∈ ℝ𝑛 | 𝑏 + 𝐴𝑥 ⩾ 0} не пуст. Доказательство. Каждый столбец 𝑥 ∈ 𝑀 удовлетворяет неравенствам 𝐴𝑥 + 𝑏 ⩾ 0. Поэтому для ∗ любого ковектора 𝑦 = (𝑦1 , … , 𝑦𝑚 ) ∈ ℝ𝑚 , у которого все 𝑦𝑖 ⩾ 0, выполняется неравенство 𝑦(𝐴𝑥 + 𝑏) = 𝑦𝐴𝑥 + 𝑦𝑏 ⩾ 0 . (1211) Если вдобавок 𝑦𝐴 = 0, то это неравенство превращается в 𝑦𝑏 ⩾ 0. Таким образом, если 𝑀 ≠ ∅, ∨ . Наоборот, то для всех 𝑦 ∈ 𝜘𝑀 выполняется неравенство 𝑦𝑏 ⩾ 0, означающее, что [𝑏]im 𝐴 ∈ 𝜘𝑀 ∨ 3 если [𝑏]im 𝐴 ∉ 𝜘𝑀 , то по лемме Фаркаша найдётся такой 𝑧 ∈ 𝜘𝑀 , что 𝑧𝑏 < 0, и следовательно 𝑧(𝐴𝑥 + 𝑏) = 𝑧𝑏 < 0 для всех 𝑥 ∈ ℝ𝑛 . Но, как мы видели выше, при 𝑧 ∈ 𝜘𝑀 и 𝑥 ∈ 𝑀 выполняется противоположное неравенство (1211). Стало быть, 𝑀 = ∅. 12.5.4. Грани конусов. Условимся, что помимо собственных граней, высекаемых из конуса его опорными гиперплоскостями 𝐻𝛼 , где 𝛼 ∈ 𝑉∗ , у каждого конуса 𝜎 ⊂ 𝑉 имеется также и несобственная грань 𝜎 = 𝑉 ∩ 𝜎 размерности dim 𝜎, высекаемая нулевым ковектором 0 ∈ 𝑉∗ . Для каждой грани 𝛤 ⊂ 𝜎𝑅 обозначим через 𝐿(𝛤 ) ⊂ 𝑉 её линейную оболочку. Предложение 12.4 Каждая грань 𝛤 конуса 𝜎𝑅 является конусом, порождённым множеством 𝑅 ∩ 𝛤 лежащих в этой грани образующих конуса 𝜎𝑅 , причём это множество линейно порождает векторное простран ство 𝐿(𝛤 ). См. n∘ 7.3 на стр. 88. ∗ ∗ В том смысле, что строка 𝑦 = (𝑦1 , … , 𝑦𝑚 ) ∈ ℝ𝑚 лежит в ker 𝐴𝑡 если и только если в ℝ𝑛 выполняется равенство 𝑦1 𝛼1 + ⋯ + 𝑦𝑚 𝛼𝑚 = 0. 3 См. n∘ 12.5 на стр. 164. 1 2 12.5. Выпуклые многогранные конусы 169 Доказательство. По теор. 12.5 на стр. 163 каждая грань 𝛤 конуса 𝜎𝑅 представляет собою пе ресечение 𝛤 = 𝜎𝑅 ∩ 𝐿(𝛤 ) и, тем самым, тоже является конусом. Достаточно убедиться, что в представлении каждого вектора 𝑣 ∈ 𝛤 в виде неотрицательной линейной комбинации век торов из 𝑅 ненулевые коэффициенты могут иметь лишь образующие 𝑤 ∈ 𝑅 ∩ 𝛤 . Для этого представим конус 𝜎𝑅 в виде пересечения 𝜎𝑅 = ⋂𝛼∈𝑅∨ 𝐻𝛼+ полупространств, заданных конеч ным набором ковекторов 𝑅∨ ⊂ 𝑉∗ , и обозначим через 𝑅∨ (𝛤 ) = 𝑅∨ ∩ Ann 𝛤 множество всех тех ковекторов 𝛼 ∈ 𝑅∨ , которые тождественно зануляются на грани 𝛤 . Тогда по той же теор. 12.5 𝐿(𝐺 ) = Ann 𝑅∨ (𝛤). Тем самым, для каждой образующей 𝑤′ ∈ 𝑅 ∖ 𝛤 = 𝑅 ∖ 𝐿(𝛤) найдётся та кой функционал 𝛼 ∈ 𝑅∨ (𝛤 ), что 𝛼 (𝑤′ ) > 0. Если бы образующая 𝑤′ входила с положительным коэффициентом в разложение какогонибудь вектора 𝑣 ∈ 𝛤 , то значение 𝛼 (𝑣 ) было бы строго положительным, что невозможно, поскольку 𝛼 аннулирует грань 𝛤 . Упражнение 12.7. Приведите пример, показывающий, что не каждое непустое подмножество 𝐼 ⊂ 𝑅 порождает конус, являющийся гранью конуса 𝜎𝑅 . Предложение 12.5 (двойственность между гранями двойственных конусов) Для любой пары двойственных конусов 𝜎𝑅 ⊂ 𝑉 и 𝜎𝑅∨ = 𝜎𝑅∨ ⊂ 𝑉∗ при всех 0 ⩽ 𝑘 ⩽ dim 𝜎 име ется оборачивающая включения биекция между 𝑘мерными гранями конуса 𝜎𝑅 и (dim 𝑉 − 𝑘) мерными гранями конуса 𝜎𝑅∨ , переводящая каждую грань 𝛤 конуса 𝜎 в пересечение 𝜎∨ ∩ Ann 𝛤 двойственного конуса c аннулятором грани 𝛤 . В частности, одномерные рёбра каждого из ко нусов являются уравнениями (𝑛 − 1)мерных граней двойственного конуса и наоборот. Доказательство. Каждая образующая 𝑤 ∈ 𝑅 ∩ 𝛤 любой грани 𝛤 = 𝜎𝑅∩𝛤 конуса 𝜎𝑅 является опор ным функционалом для двойственного конуса 𝜎𝑅∨ = 𝜎𝑅∨ . Поэтому по теор. 12.5 на стр. 163 под пространство Ann 𝛤 = Ann(𝑅 ∩ 𝛤 ) ⊂ 𝑉∗ высекает из двойственного конуса 𝜎𝑅∨ некоторую грань. Обозначим её 𝛤∨ = 𝜎𝑅∨ ∩ Ann 𝛤 . По предл. 12.4 эта грань представляет собою конус 𝜎𝑅∨ ∩𝛤∨ , по рождённый множеством 𝑅∨ ∩ Ann 𝛤 всех аннулирующих грань 𝛤 образующих конуса 𝜎𝑅∨ , при чём множество 𝑅∨ ∩ Ann 𝛤 линейно порождает линейную оболочку 𝐿(𝛤∨ ) = Ann 𝐿(𝛤 ) грани 𝛤∨ . Так как Ann 𝛤∨ = Ann 𝐿(𝛤∨ ) = 𝐿(𝛤 ), двойственная к 𝛤∨ грань 𝛤∨∨ = 𝜎𝑅 ∩ Ann 𝛤∨ конуса 𝜎𝑅 совпадает с 𝛤 . Тем самым, отображение 𝛤 ↦ 𝛤∨ инволютивно, а значит, биективно. Замечание 12.1. В предл. 12.5 не предполагается равенства dim 𝜎𝑅 = dim 𝑉 . Например, одно мерный конус 𝜎𝑣 = {𝑡𝑣 | 𝑡 ⩾ 0} представляет собою луч, выпущенный из нуля в направлении вектора 𝑣 и имеет две грани — нульмерную грань 0 и одномерную грань, совпадающую с самим этим лучом. Двойственный ему конус 𝜎𝑣∨ = 𝐻𝑣+ ⊂ 𝑉∗ является векторным полупространством и тоже имеет две грани: 𝑛мерную грань 𝜎𝑣∨ ∩ Ann 0 = 𝐻𝑣+ ∩ 𝑉∗ = 𝐻𝑣+ и (𝑛 − 1)мерную грань 𝜎𝑣∨ ∩ Ann 𝑣 = 𝐻𝑣 . Ответы и указания к некоторым упражнениям Упр. 0.1. См. предл. 1.2 на стр. 18. Упр. 1.1. Равенство 𝐹 (0) = 0 получается прибавлением вектора −𝐹 (0) к левой и правой части равенства 𝐹 (0) = 𝐹 (0 + 0) = 𝐹 (0) + 𝐹 (0). Из равенства 0 = 𝐹 (0) = 𝐹 (𝑣 + (−𝑣 )) = 𝐹 (𝑣 ) + 𝐹 (−𝑣 ) вытекает, что −𝐹 (𝑣 ) = 𝐹 (−𝑣 ). Упр. 1.4. Ответ: 𝑣 = 𝑦1 𝑤1 + 𝑦2 𝑤2 , где 𝑦1 = 𝑐11 𝑥1 + 𝑐12 𝑥2 , 𝑦2 = 𝑐21 𝑥1 + 𝑐22 𝑥2 . Упр. 1.5. Первое следует из выкладки 0 = 𝑓 (𝑎 + 𝑏, 𝑎 + 𝑏) = 𝑓 (𝑎, 𝑏) + 𝑓 (𝑏, 𝑎), второе — из выкладки 𝑓 (𝑣 , 𝑣 ) = − 𝑓 (𝑣 , 𝑣 ). ⃖⃖⃖⃗ + ⃖⃖⃖ Упр. 1.6. Первое следует из того, что по правилу треугольника 𝑎𝑎 𝑎𝑏⃗ = ⃖⃖⃖ 𝑎𝑏⃗ для любого вектора ⃖⃖⃖ ⃖⃖⃖⃗ = 𝑑𝑐 ⃖⃖⃖⃗ имеем ⃖⃖⃖⃗ + 𝑞𝑝 ⃖⃖⃖⃗ = 𝑝𝑝 ⃖⃖⃖⃗ = 0, третье — из того, что при 𝑎𝑏 𝑎𝑏⃗ ∈ 𝑉 , второе — из того, что 𝑝𝑞 ⃖⃖⃖ ⃗ ⃖⃖⃖ ⃗ ⃖⃖⃖⃗ ⃖⃖⃖ ⃗ ⃖⃖⃖ ⃗ ⃖⃖⃖⃗ ⃖⃖⃖ ⃗ ⃖⃖⃖⃗ 𝑏𝑐 = 𝑏𝑎 + 𝑎𝑑 + 𝑑𝑐 = −𝑎𝑏 + 𝑎𝑑 + 𝑑𝑐 = 𝑎𝑑 . Если 𝜏0 = Id𝔸 , то для каждого 𝑣 ∈ 𝑉 преобразования 𝜏𝑣 и 𝜏−𝑣 обратны друг другу в силу равенств 𝜏𝑣 ∘ 𝜏−𝑣 = 𝜏−𝑣 ∘ 𝜏𝑣 = 𝜏𝑣+(−𝑣) = 𝜏0 = Id𝔸 , а значит, оба биективны. Упр. 1.8. Первое вытекает из равенства (𝜇 + 𝜈 )−1 (𝜇𝑝 + 𝜈𝑞 ) = (𝜇 + 𝜈 )−1 (∑𝑖 𝜇𝑖 𝑝𝑖 + ∑𝑗 𝜇𝑗 𝑞𝑗 ). Второе 𝑚 𝑚 𝑘𝑗 проверяется выкладкой: ∑𝑖=1 𝑦𝑖 𝑝𝑖 = ∑𝑖=1 𝑦𝑖 ∑𝑗=1 𝑥𝑖𝑗 𝑞𝑖𝑗 = ∑𝑖𝑗 𝑧𝑖𝑗 𝑞𝑖𝑗 , где 𝑧𝑖𝑗 = 𝑦𝑖 𝑥𝑖𝑗 и ∑𝑖𝑗 𝑧𝑖𝑗 = 𝑘𝑗 𝑚 = ∑𝑚 𝑖=1 𝑦𝑖 ∑𝑗=1 𝑥𝑖𝑗 = ∑𝑖=1 𝑦𝑖 = 1. Упр. 1.10. 𝑠(𝑝𝑎𝑏) ∶ 𝑠(𝑝𝑏𝑐 ) = 𝑠(⃖⃖⃖ 𝑝𝑎⃗, ⃖⃖⃖ 𝑝𝑏⃗) ∶ 𝑠(⃖⃖⃖ 𝑝𝑏⃗, ⃖⃖⃖ 𝑝𝑐⃗) = 𝑠(⃖⃖⃖ 𝑝𝑎⃗ − ⃖⃖⃖ 𝑝𝑏⃗, ⃖⃖⃖ 𝑝𝑏⃗) ∶ 𝑠(⃖⃖⃖ 𝑝𝑏⃗, ⃖⃖⃖ 𝑝𝑐⃗ − ⃖⃖⃖ 𝑝𝑏⃗) = 𝑠(⃖⃖⃖ 𝑏𝑎⃗, ⃖⃖⃖ 𝑝𝑏⃗) ∶ ⃖⃖⃖⃗, ⃖⃖⃖ ⃖⃖⃖⃗, 𝑎𝑏 ⃖⃖⃖⃗) ∶ 𝑠(𝑝𝑏 ⃖⃖⃖⃗, ⃖⃖⃖ ⃖⃖⃖⃗ ∶ ⃖⃖⃖ 𝑏𝑐⃗) = 𝑠(𝑝𝑏 𝑏𝑐⃗. ∶ 𝑠(𝑝𝑏 𝑝𝑐⃗) = 𝑎𝑏 Упр. 2.1. Вычитая 𝜓(0) из правой и левой части равенства 𝜓(0) = 𝜓(0 + 0) = 𝜓(0) + 𝜓(0), получаем 0 = 𝜓(0). Поскольку 𝜓(𝜇)+ 𝜓(−𝜇) = 𝜓(𝜇 − 𝜇) = 𝜓(0) = 0, имеет место равенство 𝜓(−𝜇) = −𝜓(𝜇). Поэтому 𝜓(𝜆 − 𝜇) = 𝜓(𝜆)+ 𝜓(−𝜇) = 𝜓(𝜆)− 𝜓(𝜇). Если 𝜓(1) ≠ 0, то аналогичным образом умножая на 𝜓(1)−1 обе части равенства 𝜓(1) = 𝜓(1 ⋅ 1) = 𝜓(1) ⋅ 𝜓(1) получаем 𝜓(1) = 1, откуда, как и выше, 𝜓(𝜇−1 ) = 𝜓(𝜇)−1 и 𝜓(𝜆 ∕ 𝜇) = 𝜓(𝜆)∕ 𝜓(𝜇) при всех 𝜆 и 𝜇 ≠ 0. Если же 𝜓(1) = 0, то 𝜓(𝜆) = = 𝜓(1 ⋅ 𝜆) = 𝜓(1) ⋅ 𝜓(𝜆) = 0 для всех 𝜆. Упр. 2.3. Обратным к 𝑥 + 𝑦√2 числом является 𝑥 𝑥2 −2𝑦2 − 𝑥2 −𝑦2𝑦2 √2, нетривиальный автоморфизм переводит 𝑥 + 𝑦√2 в 𝑥 − 𝑦√2. Упр. 2.5. Рассмотрите в координатном пространстве 𝕜2 с базисом (𝑒1 , 𝑒2 ) пару векторов (𝑓1 , 𝑓2 ) = = (𝑒1 , 𝑒2 ) 𝐴 и пару векторов (𝑔1 , 𝑔2 ) = (𝑓1 , 𝑓2 ) 𝐵 = (𝑒1 , 𝑒2 ) 𝐴𝐵. Тогда по сл. 1.2 для любой нену левой формы площади 𝑠 на 𝑉 выполняются равенства 𝑠(𝑓1 , 𝑓2 ) = 𝑠(𝑒1 , 𝑒2 ) det 𝐴, 𝑠(𝑔1 , 𝑔2 ) = 𝑠(𝑓1 , 𝑓2 ) det 𝐵, 𝑠(𝑔1 , 𝑔2 ) = 𝑠(𝑒1 , 𝑒2 ) det(𝐴𝐵), из которых вытекает, что det(𝐴) det(𝐵) = det(𝐴𝐵). Упр. 2.6. Все площади умножаются на det 𝐴, ср. с предл. 2.4 на стр. 28. Упр. 2.7. Это следует из равенства 𝑞 + 𝑤 = 𝜑(𝑞 ) = 𝑝 + 𝑢 + 𝐷𝜑 (⃖⃖⃖ 𝑝𝑞⃗). Упр. 2.8. Условие ⃖⃖⃖⃖⃗ 𝑜𝑝3 = ⃖⃖⃖⃖⃗ 𝑜𝑝1 + ⃖⃖⃖⃖⃗ 𝑜𝑝2 означает, что четырёхугольник 𝑜𝑝1 𝑝3 𝑝2 является параллело граммом, т. е. прямые (𝑝1 𝑝3 ) и (𝑝2 𝑝3 ) параллельны прямым 𝓁2 = (𝑜𝑝2 3) и 𝓁1 = (𝑜𝑝1 ) соответ ственно. Но для любой точки 𝑝1 ∈ 𝓁1 имеется единственная проходящая через 𝑝1 прямая, па раллельная прямой 𝓁2 , и она пересекает прямую 𝓁3 в единственной точке 𝑝3 . Через точку 𝑝3 проходит единственная прямая, параллельная прямой 𝓁1 , и она пересекает прямую 𝓁2 в един ственной точке 𝑝2 . Таким образом, параллелограмм 𝑜𝑝1 𝑝3 𝑝2 однозначно определяется выбором точки 𝑝1 ∈ 𝓁1 . При выборе другой точки 𝑝1′ с радиусвектором ⃖⃖⃖ 𝑜𝑝⃗′1 = 𝜆⃖⃖⃖ 𝑜𝑝⃗1 определяемый ею ′ ′ ′ параллелограмм 𝑜𝑝1 𝑝3 𝑝2 получается из параллелограмма 𝑜𝑝1 𝑝3 𝑝2 гомотетией с коэффициен том 𝜆 относительно точки 𝑜. 170 Ответы и указания к упражнениям 171 ⃖⃖⃖⃗𝑖 на 𝜆𝑜𝑝 ⃖⃖⃖⃗𝑖 , где 𝜆 ≠ 0, коэффици Упр. 2.9. При замене функции 𝑠 на 𝜆𝑠 или любого из векторов 𝑜𝑝 ент 𝜆 сократится. Неизменность двойного отношения при одновременной перестановке двух пар прямых видна непосредственно из формулы форм. (216) на стр. 31. Упр. 2.10. Всё следует из равенства [𝓁1 , 𝓁2 , 𝓁3 , 𝓁4 ] = [𝓁2 , 𝓁1 , 𝓁3 , 𝓁4 ]−1 . Упр. 3.2. (𝜆𝑎,𝑏) (𝜆𝑎,𝜆𝑎) ⋅ 𝜆𝑎 = (𝑎 , 𝑏 ) (𝑎,𝑎) ⋅ 𝑎. Упр. 3.5. Если 𝑝 ∉ 𝓁, утверждение вытекает из предл. 3.2. Если 𝑝 ∈ 𝓁, выберите 𝑝 за начало от счёта, обозначьте через 𝑒1 вектор скорости прямой 𝓁, возьмите любой вектор 𝑏, не пропорци ональный 𝓁 и положите 𝑒2 = 𝑏𝑒⊥1 . Тогда 𝑒2 ≠ 0 и перпендикулярен 𝑒1 . Поэтому прямая 𝑝 + 𝑡𝑒2 перпендикулярна 𝓁. Произвольный вектор 𝑤 = 𝑥𝑒1 + 𝑦𝑒2 перпендикулярен 𝑒1 если и только если 𝑥 = 0. Поэтому такая прямая единственна. Упр. 3.6. Рассмотрим любой ортонормальный базис 𝑒, 𝑒⊥ . Если вектор 𝑓 = 𝑥𝑒 + 𝑦𝑒⊥ образует вместе с вектором 𝑒 ортонормальный базис 𝑒, 𝑓, то (𝑒, 𝑓) = 0 влечёт 𝑥 = 0, после чего (𝑓, 𝑓) = 1 влечёт 𝑦 2 = 1, т. е. 𝑓 = ±𝑒⊥ . Упр. 3.7. Воспользуйтесь тем, что объединение биссектрис это ГМТ, равноудалённых от двух дан ных прямых. Упр. 3.8. Неравенство Коши – Буняковского – Шварца равносильно неравенству (𝑢, 𝑣)2 − (𝑢, 𝑢) ⋅ (𝑢, 𝑣) ⩾ 0 , в левой части которого стоит определитель Грама, по предл. 3.4 равный квадрату отношения площадей 𝑠(𝑢, 𝑤 )∕ 𝑠(𝑒1 , 𝑒2 ), положительному, когда 𝑢 и 𝑤 не пропорциональны, и нулевому — когда пропорциональны. Упр. 3.9. det2 (𝑎, 𝑏) = det2 (𝑎, 𝑏𝑎 + 𝑏𝑎⊥ ) = det2 (𝑎, 𝑏𝑎⊥ ) = (𝑎, 𝑎) ⋅ (𝑏𝑎⊥ , 𝑏𝑎⊥ ). Упр. 3.10. Вычислите det(𝑓 , 𝑓 ⊥ ) (𝑓 ⊥ , 𝑓 ⊥ ) и 𝑠(𝑓 , 𝑓 ⊥ ). Упр. 3.12. Равенство длин |𝑣 | = |𝑢| влечёт равенство углов ∡(𝑣 , 𝑢 + 𝑣 ) = ∡(𝑢 + 𝑣 , 𝑢). Поэтому каждый из них составляет половину от ∡(𝑣 , 𝑢). Аналогично, 2∡(𝑣 , 𝑤 + 𝑣 ) = ∡(𝑣 , 𝑤), откуда 2∡(𝑢 + 𝑣, 𝑤 + 𝑣) = ∡(𝑢, 𝑤). Упр. 3.16. Оба линейных преобразования — композиция отражений и поворот — одинаково дей ствуют на базис 𝑢1 , 𝑢2 . Упр. 3.17. Ответ: |𝑢| 2 ⋅ (1, ctg(𝜗 ∕ 2)). Упр. 3.18. Выясните, куда переходит аффинный репер (𝑜; 𝑣 , 𝑛) с началом в произвольной точке 𝑜 ∈ 𝓁 и ортонормальными базисными векторами 𝑣, 𝑛, направленными, соответственно, парал лельно и перпендикулярно прямым 𝓁𝑖 . Упр. 3.19. Импликации (в) ⇒ (б) ⇒ (а) очевидны. В n∘ 2.1.2 на стр. 23 мы видели, что если отобра жение 𝜑 ∶ ℝ → ℝ перестановочно со сложением и умножением, то оно тождественно. Поэтому (a) ⟺ (б). Так как соотношение 𝜑(𝑖 )2 = 𝜑(𝑖 2 ) = 𝜑(−1) = −1 влечёт 𝜑(𝑖 ) = ±𝑖 , из линейности 𝜑 над ℝ вытекает, что 𝜑(𝑥 + 𝑦𝑖 ) = 𝑥𝜑(1) + 𝑦𝜑(𝑖 ) = 𝑥 ± 𝑖𝑦, т. е. (б) ⇒ (в). Упр. 4.1. См. стр. 28 лекции http://gorod.bogomolovlab.ru/ps/stud/algebra1/1314/lec02.pdf. Упр. 4.4. Пусть 𝕜𝑛 = 𝑈1 ∪ 𝑈2 ∪ … ∪ 𝑈𝑚 , где гиперплоскость 𝑈 = Ann 𝜉𝑖 ⊂ 𝕜𝑛 задаётся линейным уравнением 𝜉𝑖 (𝑥1 , … , 𝑥𝑛 ) = 𝜉𝑖1 𝑥1 + 𝜉𝑖1 𝑥2 + ⋯ + 𝜉𝑖𝑛 𝑥𝑛 = 0. Произведение всех линейных форм 𝜉𝑖 (𝑥1 , … , 𝑥𝑛 ) является ненулевым многочленом 𝑚й степени от 𝑥1 , 𝑥2 , … , 𝑥𝑛 , но при этом зада ёт тождественно нулевую функцию 𝕜𝑛 → 𝕜. Индукцией по 𝑛 покажите, что над бесконечным такое невозможно. 172 Ответы и указания к упражнениям Упр. 4.5. Пусть 𝑊 ⊈ 𝑈 два подпространства в 𝑉 . Выберем вектор 𝑤 ∈ 𝑊 ∖ 𝑈. Если 𝑊 ∪ 𝑈 — подпространство, то ∀ 𝑢 ∈ 𝑈 𝑤 + 𝑢 ∈ 𝑊 ∪ 𝑈. Поскольку 𝑤 + 𝑢 ∉ 𝑈 (т. к. 𝑤 ∉ 𝑈), 𝑤 + 𝑢 ∈ 𝑊 , откуда 𝑢 ∈ 𝑊 , т. е. 𝑈 ⊂ 𝑊 . Упр. 4.7. Поскольку 𝜆1 𝐹 (𝑣1 ) + 𝜆2 𝐹 (𝑣2 ) = 𝐹 (𝜆1 𝑣1 + 𝜆2 𝑣2 ), любая линейная комбинация векторов из образа лежит в образе, а векторов из ядра — в ядре. Так как 𝐹 (⃖0⃗) = 𝐹 (0 ⋅ ⃖0⃗) = 0 ⋅ 𝐹 (⃖0⃗) = 0, ядро содержит нулевой вектор. Образ содержит нулевой вектор, поскольку 𝐹 (0) = 𝐹 (0 + 0) = = 𝐹 (0) + 𝐹 (0), откуда 0 = 𝐹 (0). Упр. 4.8. Линейность 𝐹 вытекает из того, что отображение дифференцирования 𝑑 ∕ 𝑑𝑥 ∶ 𝕜[𝑥 ] → 𝕜[𝑥 ] , 𝑔 ↦ 𝑔′ , и все отображения вычисления ev𝑎 ∶ 𝕜[𝑥 ] → 𝕜, 𝑔 ↦ 𝑔(𝑎), где 𝑎 ∈ 𝕜, линейны и композиция линейных отображений тоже линейна. Если 𝑔 ∈ ker 𝐹 , то каждое число 𝑎𝑖 ∈ 𝕜 является как минимум (𝑚𝑖 +1)кратным корнем многочлена 𝑔, и 𝑔 делится на ∏𝑖 (𝑥 −𝑎𝑖 )𝑚𝑖 +1 , что невозможно при 𝑔 ≠ 0, поскольку степень этого произведения равна 𝑚 + 1 > deg 𝑔. Упр. 4.9. Если 𝐹2 = 𝐹 , то 𝐹 (𝐹𝑣 ) = 𝐹2 𝑣 = 𝐹𝑣 для любого 𝑣 ∈ 𝑉 . Поэтому 𝐹 тождественно действует на im 𝐹 и 𝑣 − 𝐹 (𝑣 ) ∈ ker 𝐹 для любого 𝑣 ∈ 𝑉 . Тем самым, ker 𝐹 ∩ im 𝐹 = 0 и im 𝐹 + ker 𝐹 = 𝑉 , т. е. 𝑉 = ker 𝐹 ⊕ im 𝐹 , причём 𝐹 (𝑢 + 𝑤) = 𝑤 для любых 𝑢 ∈ ker 𝐹 , 𝑤 ∈ im 𝐹 . Упр. 4.10. Если 𝑣1 = 𝑣2 + 𝑢 и 𝑤1 = 𝑤2 + 𝑢′ , где 𝑢, 𝑢′ ∈ 𝑈, то 𝑣1 + 𝑤1 = (𝑣2 + 𝑤2 ) + (𝑢 + 𝑢′ ) и 𝜆𝑣1 = 𝜆𝑣2 + 𝜆𝑢. Выполнение аксиом векторного пространства наследуется из 𝑉 . Упр. 5.3. Пусть 𝐴𝐵 = 𝑃 и 𝐵𝐶 = 𝑄 . Матрицы 𝑃𝐶 и 𝐴𝑄 имеют равные (𝑖𝑗)е элементы: ∑ 𝑝𝑖𝑘 𝑐𝑘𝑗 = 𝑘 ∑ (𝑎𝑖𝓁 𝑏𝓁𝑘 )𝑐𝑘𝑗 = 𝑘𝓁 ∑ 𝑘𝓁 𝑎𝑖𝓁 (𝑏𝓁𝑘 𝑐𝑘𝑗 ) = ∑ 𝑎𝑖𝓁 𝑞𝓁𝑗 . 𝓁 Дистрибутивность проверяется аналогично. Упр. 5.4. Первое равенство очевидно. Для доказательства второго положим 𝐴𝐵 = 𝐶 , 𝐵𝑡 𝐴𝑡 = 𝐷 , 𝑡 𝑡 𝑡 𝑡 𝑎𝑘𝑖 = 𝑑𝑗𝑖 . 𝑏𝑗𝑘 = ∑ 𝑏𝑗𝑘 тогда 𝑐𝑖𝑗 = ∑ 𝑎𝑖𝑘 𝑏𝑘𝑗 = ∑ 𝑎𝑘𝑖 𝑘 𝑘 𝑘 Упр. 5.6. Поскольку (𝐴𝐵)𝑡 = 𝐵𝑡 𝐴𝑡 и 𝐸𝑡 = 𝐸 , равенство 𝐴𝐵 = 𝐸 равносильно равенству 𝐵𝑡 𝐴𝑡 = 𝐸 , и матрица 𝐵 обратна матрице 𝐴 если и только если матрица 𝐵𝑡 обратна матрице 𝐴𝑡 . Упр. 5.8. Первое доказывается выкладкой 0 ⋅ 𝑎 = (𝑏 + (−1) ⋅ 𝑏)𝑎 = 𝑏𝑎 + (−1)𝑏𝑎 = 0, второе — выкладкой 𝑒′ = 𝑒′ ⋅ 𝑒″ = 𝑒″ . Упр. 5.9. Матрица 𝐴 = ∑𝑖𝑗 𝑎𝑖𝑗 𝐸𝑖𝑗 лежит в центре алгебры Mat𝑛 (𝕜) если и только если 𝐴𝐸𝑖𝑗 = 𝐸𝑖𝑗 𝐴 для всех матричных единиц 𝐸𝑖𝑗 . В силу форм. (518) на стр. 68 это равносильно равенствам 𝑎𝑖𝑖 = 𝑎𝑗𝑗 и 𝑎𝑖𝑗 = 0 для всех 𝑖 ≠ 𝑗. Упр. 5.11. Обозначим через 𝜇𝜉 ∈ ker ev𝜉 приведённый многочлен наименьшей встречающейся в ker ev𝜉 положительной степени. Деля произвольный многочлен 𝑓 ∈ ker ev𝜉 на 𝜇𝜉 с остатком, получаем равенство 𝑓(𝑥 ) = 𝜇𝜉 (𝑥 ) ⋅ 𝑞 (𝑥 ) + 𝑟(𝑥 ), в котором многочлен 𝑟 либо нулевой, либо имеет deg 𝑟 < deg 𝜇𝜉 . Подставляя в это равенство 𝑥 = 𝜉 , убеждаемся, что 𝑟 ∈ ker ev𝜉 , и значит, имеет место первое, т. е. все 𝑓 ∈ ker ev𝜉 делятся на 𝜇𝜉 . В частности, любой приведённый многочлен наименьшей встречающейся в ker ev𝜉 положительной степени совпадает с 𝜇𝜉 . Упр. 6.1. Если матрица координат векторов 𝑢1 , … , 𝑢𝑟 содержит единичную 𝑟 × 𝑟 матрицу в столб цах с номерами 𝑗1 , … , 𝑗𝑟 , то при 𝑗𝑖 я координата вектора 𝜆1 𝑢1 + 𝜆2 𝑢2 + ⋯ + 𝜆𝑟 𝑢𝑟 равна 𝜆𝑖 каждом 𝑖 = 1, … , 𝑟. Поэтому такой вектор зануляется только когда все 𝜆𝑖 = 0. 173 Ответы и указания к упражнениям Упр. 6.2. Пусть базисными являются столбцы с номерами 𝑗1 , … , 𝑗𝑟 . Тогда в любом другом столб це могут быть отличны от нуля только числа, стоящие в первых 𝑟 строках. Если они равны 𝛼1 , … , 𝛼𝑟 , то сам столбец является линейной комбинацией 𝛼1 𝑐1 + ⋯ + 𝛼𝑟 𝑐𝑟 базисных столб цов 𝑐1 , … , 𝑐𝑟 . Упр. 6.3. Согласно форм. (513) на стр. 64 при 𝑎𝑑 − 𝑏𝑐 ≠ 0 матрица 𝑎′ ( 𝑐′ 𝑏′ 𝑎 = (𝑎𝑑 − 𝑏𝑐 )−1 (−𝑐 𝑑′ ) −𝑏 𝑑) 𝑎 𝑏 . Поэтому векторы 𝑤𝑖 , 𝑤𝑗 линейно выражаются через преобразован ( 𝑐 𝑑) ные строки 𝑤𝑖′ = 𝑎𝑤𝑖 + 𝑏𝑤𝑗 , 𝑤𝑗′ = 𝑐𝑤𝑖 + 𝑑𝑤𝑗 по формулам 𝑤𝑖 = 𝑎′ 𝑤𝑖′ + 𝑏′ 𝑤𝑗′ , 𝑤𝑗 = 𝑐 ′ 𝑤𝑖′ + 𝑑 ′ 𝑤𝑗′ . обратна к матрице Упр. 6.5. Если отнять из произвольной такой матрицы матрицу 𝐸𝐽 , имеющую единичную 𝑟 × 𝑟 подматрицу в столбцах с номерами 𝑗1 , … , 𝑗𝑟 и нули в остальных местах, то получится матри ца, у которой равны нулю все элементы в столбцах с номерами 𝑗1 , … , 𝑗𝑟 , а также, при каждом 𝑖 = 1, … , 𝑟, все элементы 𝑖 й строки в клетках с 1й по 𝑗𝑖 ю включительно. Ну а остальные 𝑟 𝑟2 +∑𝜈=1 (𝑖𝜈 −𝜈 +1) элементов могут принимать любые значения. Тождество выражает собою ра венство количества 𝑟мерных векторных подпространств в 𝑛мерном координатном простран стве над полем 𝔽𝑞 из 𝑞 элементов количеству приведённых ступенчатых матриц c 𝑟 ненулевыми строками в Mat𝑟×𝑛 (𝔽𝑞 ). Упр. 7.1. Множество всевозможных конечных 𝕜линейных комбинаций счётного множества век торов равномощно 𝕜 × ℕ — дизъюнктному объединению счётного множества одинаковых ко пий поля 𝕜, тогда как множество 𝕜⟦𝑡⟧ равномощно множеству 𝕜ℕ всевозможных отображений ℕ → 𝐾 , которое строго мощнее, чем 𝕜 × ℕ (используйте рассуждение Кантора). Упр. 7.3. Достаточно убедиться, что векторы 𝑣1 , 𝑣2 , … , 𝑣𝑛 линейно независимы. Применяя к обе им частям соотношения 𝜆1 𝑣1 + 𝜆2 𝑣2 + ⋯ + 𝜆𝑛 𝑣𝑛 = 0 функционал 𝜉𝑖 , получаем 𝜆𝑖 = 0, и так для каждого 𝑖 = 1, … , 𝑛. Упр. 7.4. Ядро ker ev = {𝑣 ∈ 𝑉 | ∀ 𝜑 ∈ 𝑉∗ 𝜑(𝑣 ) = 0} = 0, поскольку для любого ненулевого векто ра 𝑣 ∈ 𝑉 существует такой линейный функционал 𝜑 ∶ 𝑉 → 𝕜, что 𝜑(𝑣 ) ≠ 0. Например, можно дополнить вектор 𝑣 до базиса пространства 𝑉 и взять в качестве 𝜑 функционал, сопоставляю щий вектору его координату в направлении базисного вектора 𝑣 относительно этого базиса. Упр. 7.5. Если линейная форма зануляется на какомто множестве векторов, то она зануляется и всех линейных комбинациях этих векторов. Упр. 7.7. Выберем базис 𝑢1 , … , 𝑢𝑛 в 𝑈, дополним его векторами 𝑤1 , … , 𝑤𝑚 до базиса в 𝑉 и за дадимся любыми 𝑚 числами 𝑐1 , … , 𝑐𝑚 ∈ 𝕜. Существует единственный линейный функцио нал 𝜑 ∶ 𝑉 → 𝕜, принимающий на выбранных базисных векторах значения 𝜑(𝑢𝑖 ) = 𝜓(𝑢𝑖 ), 𝜑(𝑤𝑗 ) = 𝑐𝑗 , где 1 ⩽ 𝑖 ⩽ 𝑛, 1 ⩽ 𝑗 ⩽ 𝑚. Ограничение 𝜑|𝑈 = 𝜓. В бесконечномерном случае утверждение следует из теор. 7.4 на стр. 94. ∗ лежат в Ann 𝑈 и линейно независимы, так как являются частью Упр. 7.8. Ковекторы 𝑤1∗ , … , 𝑤𝑚 ∗ базиса в 𝑉 . Поскольку координатами каждого линейного функционала 𝜑 ∈ 𝑉∗ в базисе ∗ 𝑢1∗ , … , 𝑢𝑘∗ , 𝑤1∗ , … , 𝑤𝑚 являются значения 𝜑(𝑢1 ), … , 𝜑(𝑢𝑘 ), 𝜑(𝑤1 ), … , 𝜑(𝑤𝑚 ), ковектор 𝜑 ∈ Ann 𝑈 если и только если ∗ он является линейной комбинацией ковекторов 𝑤1∗ , … , 𝑤𝑚 . Тем самым, эти ковекторы линейно порождают Ann 𝑈. 174 Ответы и указания к упражнениям Упр. 7.9. По упр. 7.5 на стр. 86 Ann 𝑁 = Ann span 𝑁, откуда Ann Ann 𝑁 = Ann Ann span 𝑁 = span 𝑁. Упр. 7.11. Оператор 𝐹∗∗ ∶ 𝑈∗∗ → 𝑊∗∗ переводит функционал вычисления ev𝑢 ∶ 𝑈∗ → 𝕜 в ком позицию ev𝑢 ∘𝐹∗ ∶ 𝑊∗ → 𝕜, которая в свою очередь переводит ковектор 𝜉 ∶ 𝑊 → 𝕜 в число ev𝑢 (𝐹∗ 𝜉 ) = 𝐹∗ 𝜉 (𝑢) = 𝜉 (𝐹𝑢) = ev𝐹𝑢 (𝜉 ). Таким образом, 𝐹∗∗ (ev𝑣 ) = ev𝐹(𝑣) . Отождествления 𝑈∗∗ ≃ 𝑈 и 𝑊∗∗ ≃ 𝑊 переводят функционалы вычисления ev𝑢 ∶ 𝑈∗ → 𝕜 и ev𝑤 ∶ 𝑊∗ → 𝕜 в векторы 𝑢 ∈ 𝑈 и 𝑤 ∈ 𝑊 , на которых эти вычисления производятся. Формула 𝐹∗∗ (ev𝑣 ) = ev𝐹(𝑣) утверждает, что при этом действие оператора 𝐹∗∗ на функционалы вычисления превращается в действие 𝐹 на векторы. Упр. 7.14. Пусть множество 𝑆 ⊂ 𝑋 состоит из всех таких элементов 𝑧 ∈ 𝑋, что утверждение 𝛷 (𝑧) ложно. Если 𝑆 ≠ ∅, то в нём есть начальный элемент 𝑠∗ ∈ 𝑆. Поскольку утверждение 𝛷 (𝑦) истинно для всех 𝑦 < 𝑠∗ , утверждение 𝛹 (𝑠∗ ) тоже истинно, т. е. 𝑠∗ ∉ 𝑆. Противоречие. Упр. 7.15. Обозначим через 𝑥𝐼 начальный элемент дополнения 𝑋 ∖ 𝐼 . Начальный интервал [𝑥𝐼 ) ⊂ 𝑋 является объединением начальных интервалов [𝑦) ⊂ 𝑋 по всем 𝑦 < 𝑥 . Так как 𝐼 содержит все интервалы [𝑦) с 𝑦 < 𝑥𝐼 , мы заключаем, что 𝐼 ⊇ [𝑥𝐼 ), откуда 𝐼 = [𝑥𝐼 ). Упр. 7.16. Рассмотрим подмножество 𝑍 ⊆ 𝑊1 , состоящее из всех таких 𝑧 ∈ 𝑊1 , что начальный ин тервал [𝑧)1 в множестве 𝑊1 является одновременно начальным интервалом [𝑧)2 множества 𝑊2 . Множество 𝑍 не пусто, поскольку содержит общий начальный элемент множеств 𝑊1 и 𝑊2 . Ес ли 𝑍 ⊊ 𝑊1 и 𝑍 ⊊ 𝑊2 , то по упр. 7.15 на стр. 91 подмножество 𝑍 является начальным интервалом как в 𝑊1 , так и в 𝑊2 , что невозможно, поскольку точные верхние границы этих интервалов в 𝑊1 и 𝑊2 , с одной стороны, не лежат в 𝑍 и, стало быть, различны, а с другой стороны в силу 𝜚ре курсивности множеств 𝑊1 и 𝑊2 обе они равны 𝜚(𝑍), то есть совпадают. Тем самым, 𝑍 = 𝑊1 или 𝑍 = 𝑊2 . По упр. 7.15 в первом случае 𝑊1 является начальным интервалом в 𝑊2 , а во втором — 𝑊2 является начальным интервалом в 𝑊1 . Упр. 7.17. Каждое подмножество 𝑆 ⊂ 𝑈 имеет непустое пересечение с какимнибудь 𝜚рекурсив ным вполне упорядоченным подмножеством 𝑊 ⊂ 𝑃 с начальным элементом 𝜚(∅). По упр. 7.16 подмножество 𝑊 является начальным интервалом всех содержащих 𝑊 𝜚рекурсивных вполне упорядоченных подмножеств с начальным элементом 𝜚(∅). Поэтому начальный элемент пере сечения 𝑆 ∩ 𝑊 не зависит от выбора 𝑊 с 𝑊 ∩ 𝑆 ≠ ∅ и является начальным элементом под множества 𝑆. Каждый начальный интервал [𝑢) ⊂ 𝑈 является начальным интервалом любого содержащего 𝑢 множества 𝑊 из цепи. В силу 𝜚рекурсивности 𝑊 элемент 𝜚[𝑢) = 𝑢. Упр. 7.18. Годится дословно то же рассуждение, что и в доказательстве лем. 4.1 на стр. 47. Упр. 7.19. Очевидно, что 𝐸 вкладывается в 𝐵𝐸 , а 𝐵𝐸 вкладывается в множество ℕ×𝐸 — дизъюнктное объединение счётного множества копий множества 𝐸 , которое равномощно 𝐸 , так как 𝐸 беско нечно. Тем самым, 𝐵𝐸 вкладывается в 𝐸 . Остаётся применить теорему Кантора – Бернштейна. Упр. 7.20. Линейное отображение 𝐺 действует на каждый вектор 𝑣 = ∑𝑒∈𝐸 𝑥𝑒 𝑒 по правилу 𝐺 (𝑣 ) = = ∑𝑒∈𝐸 𝑥𝑒 𝑔(𝑒), и для любого отображения множеств 𝑔 ∶ 𝐸 → 𝑊 это правило задаёт линейное отображение 𝐺 ∶ 𝑉 → 𝑊 . Упр. 8.2. При 𝑚 = 1 ненулевой многочлен 𝑓 (𝑥1 ) ∈ 𝕜[𝑥1 ] имеет не более deg 𝑓 корней и, тем самым, не обращается в нуль почти во всех точках бесконечной прямой 𝕜1 . При 𝑚 > 1 перепи шите многочлен 𝑓(𝑥1 , … , 𝑥𝑚 ) в виде многочлена от 𝑥𝑚 с коэффициентами из 𝕜[𝑥1 , … , 𝑥𝑚−1 ] и примените индукцию по 𝑚. Упр. 8.3. Так как разность двух многочленов является непрерывной функцией, из того, что она обращается в нуль на всюду плотном подмножестве, вытекает, что она равна нулю всюду, а по 175 Ответы и указания к упражнениям скольку поле ℝ бесконечно, многочлен от 𝑛2 переменных, принимающий нулевые значения во 2 всех точках аффинного пространства ℝ𝑛 , является нулевым многочленом1 . Всюду плотность множества 𝒟(𝑓) означает, что в любой 𝜀 окрестности2 каждой точки 𝑝 ∈ ℝ𝑚 найдётся точ ка 𝑟 ≠ 𝑝, в которой 𝑓(𝑟) ≠ 0. Так как многочлен 𝑓 ненулевой, имеется точка 𝑞 ∈ ℝ𝑚 с 𝑓(𝑞 ) ≠ 0. Ограничение 𝑓 на прямую (𝑝𝑞 ), будучи ненулевым многочленом от одной переменной, обра щается в нуль лишь в конечном числе точек. 𝑛+𝑘−1 Упр. 8.5. Равенство 𝛱𝑘𝑛 = ( доказывается индукцией по 𝑛 при помощи суммирования по 𝑛 ) 𝑛+𝑘−1 𝑛 треугольнику Паскаля. При фиксированной размерности 𝑛 предел lim ( ) ∕ 𝑘 = 1 ∕ 𝑛!. 𝑘→∞ 𝑛 Упр. 8.7. max 𝓁(𝑔) = 𝑛(𝑛 − 1)/2 достигается на единственной перестановке (𝑛, 𝑛 − 1, … , 1). Упр. 8.8. Индукция по 𝑛. Каждая перестановка 𝑔 = (𝑔1 , … , 𝑔𝑛 ) является композицией 𝑔 = 𝜎 ∘ 𝑔′ транспозиции 𝜎, переставляющей между собою элементы 𝑛 и 𝑔𝑛 , и перестановки 𝑔′ = 𝜎 ∘ 𝑔, оставляющей элемент 𝑛 на месте. По индукции, 𝑔′ раскладывается в композицию транспози ций, не затрагивающих элемент 𝑛. Упр. 8.10. Если все точки пересечения двойные и трансверсальные, две нити, выходящие из эле ментов 𝑖 и 𝑗 пересекаются между собою нечётное число раз если и только если (𝑖 , 𝑗) инверсна3 . |𝐼|+ 12 𝑘(𝑘+1) Знак тасующей перестановки (𝑖1 , … , 𝑖𝑘 , 𝑗1 , … , 𝑗𝑚 ) равен (−1) , где вес |𝐼 | ≝ ∑ 𝑖𝜈 . Дей 𝜈 ствительно, нити, выходящие из чисел 𝑖1 , … , 𝑖𝑘 верхней строчки не пересекаются между собою и пересекают, соответственно, 𝑖1 − 1, 𝑖2 − 2, …, 𝑖𝑘 − 𝑘 начинающихся левее нитей, выходящих из 𝑗точек и тоже между собою не пересекающихся. Упр. 8.11. При чётном 𝑛 центр алгебры 𝕜 ⟨𝜉1 , 𝜉2 , … , 𝜉𝑛 ⟩ линейно порождается мономами чётных степеней, при нечётном 𝑛 — мономами чётных степеней и старшим мономом 𝜉1 ∧ 𝜉2 ∧ … ∧ 𝜉𝑛 , степень которого нечётна. Упр. 8.13. Разложите определитель по первым 𝑛 столбцам. Упр. 8.14. Это сразу следует из равенства det 𝐴 = det 𝐴𝑡 . Упр. 8.15. Если 𝐴12 ≠ 0, то можно взять 𝐴= 1 0 (0 𝐴12 −𝐴23 ∕ 𝐴12 𝐴13 −𝐴24 ∕ 𝐴12 . ) 𝐴14 Равенство 𝐴34 = det ( −𝐴23 ∕ 𝐴12 𝐴13 −𝐴24 ∕ 𝐴12 ) 𝐴14 эквивалентно квадратичному соотношению Плюккера4 . Упр. 9.1. Если отождествить ℝ[𝑡]∕(𝑡2 + 1) с полем ℂ, отправив классы [1] и [𝑡] в 1 и 𝑖 соответственно, умножение на класс [𝑡] превратится в умножение на 𝑖 , т. е. в поворот на угол 𝜋 ∕ 2, у которого нет инвариантных прямых. Упр. 9.2. Пусть 𝕜[𝑡] ∕ (𝑡𝑛 ) = 𝑈 ⊕ 𝑊 , где 𝑈 и 𝑊 переводятся в себя умножением на [𝑡]. Оба этих подпространства не могут целиком содержаться в образе оператора умножения на [𝑡], так как 1 См. упр. 8.2 на стр. 100. Под 𝜀 окрестностью точки 𝑝 ∈ ℝ𝑚 мы понимаем 𝑚мерный куб с центром в точке 𝑝 и стороной 2𝜀 . 3 В действительности картинку всегда можно нарисовать так, чтобы в этом случае была ровно одна точка пересечения. 4 См. формулу (824) на стр. 113. 2 176 Ответы и указания к упражнениям иначе их сумма тоже бы в нём содержалась. Поэтому в одном из них, пусть это будет 𝑈, имеется класс [𝑔] многочлена 𝑔 с ненулевым свободным членом. Тогда классы [𝑡𝑛−1 𝑔], … , [𝑡𝑔], [𝑔] ∈ 𝑈 выражаются через базис [1], [𝑡], … , [𝑡𝑛−1 ] пространства 𝕜[𝑡]∕(𝑡𝑛 ) при помощи верхнетреуголь ной матрицы, на диагонаи которой всюду стоит ненулевой свободный член многочлена 𝑔. Сле довательно, эти классы тоже образуют базис в 𝕜[𝑡]∕(𝑡𝑛 ), и значит, содержащее их подпростран ство 𝑈 совпадает со всем пространством 𝕜[𝑡]∕(𝑡𝑛 ). Упр. 9.3. Если 𝑉 = 𝑈 ⊕ 𝑊 , где 𝑈 и 𝑊 𝐹 инвариантны, то 𝑉∗ = Ann 𝑈 ⊕ Ann 𝑊 , где оба подпро странства Ann 𝑈, Ann 𝑊 тоже 𝐹∗ инвариантны: если 𝜉 ∈ Ann 𝑈, то для всех 𝑢 ∈ 𝑈 ⟨ 𝐹∗ 𝜉 , 𝑢 ⟩ = ⟨ 𝜉 , 𝐹𝑢 ⟩ = 0 , так как 𝐹𝑢 ∈ 𝑈, и значит, 𝐹∗ 𝜉 ∈ Ann 𝑈. Обратная импликация получается по двойственности в силу изоморфизма 𝑉∗∗ = 𝑉 . Упр. 9.4. Пусть 𝑓 = 𝑡𝑛 + 𝑎1 𝑡𝑛−1 +⋯+ 𝑎𝑛−1 𝑡 + 𝑎𝑛 . Напишите матрицу 𝐹 оператора умножения на 𝑡 в фактор кольце 𝕜[𝑥 ]∕(𝑓) в базисе из классов мономов 𝑡𝑛−1 , 𝑡𝑛−2 , ⋯ , 𝑡, 1 и разложите det(𝑡𝐸 − 𝐹 ) по первому столбцу. Упр. 9.5. Пусть 𝑓 (𝐹 ) = 0. Разделим 𝑓 в 𝕜[𝑡] на 𝜇𝐹 с остатком: 𝑓 (𝑡) = 𝑞 (𝑡)𝜇𝐹 (𝑡) + 𝑟(𝑡), где либо 𝑟 = 0, либо deg 𝑟 < deg 𝜇𝑓 . Подставляя в это равенство 𝑡 = 𝐹 , заключаем, что 𝑟(𝐹 ) = 0, откуда либо deg 𝑟 ⩾ deg 𝜇𝐹 по определению 𝜇𝐹 , либо 𝑟 = 0. Следовательно, 𝑓 делится на 𝜇𝐹 . Если 𝜈𝐹 — другой многочлен минимальной степени со старшим коэффициентом 1, такой что 𝜈𝐹 (𝐹 ) = 0 в End(𝑉 ), то по уже доказанному 𝜈𝐹 делится на 𝜇𝐹 , и частное имеет степень нуль, т. к. deg 𝜇𝐹 = deg 𝜈𝐹 . Поскольку старшие коэффициенты у 𝜇𝐹 и 𝜈𝐹 одинаковы, константа 𝜇𝐹 ∕ 𝜈𝐹 = 1. Упр. 9.6. Пусть 𝑓 (𝑡) = 𝜇𝑣,𝐹 (𝑡)𝑔(𝑡) + 𝑟(𝑡), где либо 𝑟 = 0, либо deg 𝑟 < deg 𝜇𝑣,𝐹 . Если 𝑓 (𝐹 ) = 0, то 𝑟(𝐹 )𝑣 = 0, что невозможно для ненулевого 𝑟 с deg 𝑟 < deg 𝜇𝑣,𝐹 по определению многочлена 𝜇𝑣,𝐹 . Поэтому 𝑟 = 0. Упр. 9.7. Если оператор 𝑞 (𝐹 ) аннулирует все векторы некоторого базиса, то он аннулирует вообще все векторы пространства. Упр. 9.9. Умножение на класс 𝑡 в факторе 𝕜[𝑡]∕ (𝑡𝑛 ) с 𝑛 ⩾ 2. Упр. 9.10. Над алгебраически замкнутым полем каждый многочлен, у которого нет ненулевых корней, имеет вид 𝑡𝑚 . Поэтому 𝜒𝐹 (𝑡) = 𝑡𝑚 , и по теореме Гамильтона – Кэли 𝐹𝑚 = 0. Упр. 9.12. Модифицируйте доказательство предл. 4.8 на стр. 58. Упр. 9.13. Для любого линейного оператора 𝐺 ∶ 𝑉 → 𝑉 подпространства 0 ⊆ ker 𝐹 ⊆ ker 𝐹2 ⊆ ker 𝐹3 ⊆ … образуют вложенную цепочку и отличны от нуля если и только если ker 𝐺 ≠ 0. Упр. 9.14. Если 𝑎𝑛 = 0, 𝑏𝑚 = 0 и 𝑎𝑏 = 𝑏𝑎, то (𝑎 − 𝑏)𝑚+𝑛−1 = 0 по формуле Ньютона. Упр. 10.4. Значение линейной формы 𝑔𝑣𝑗 на базисном векторе 𝑣𝑖 равно (𝑣𝑖 , 𝑣𝑗 ), т. е. столбец коор динат этой формы в двойственном базисе 𝒗∗ состоит из произведений (𝑣𝑖 , 𝑣𝑗 ). Упр. 10.6. Запишите все векторы строками их координат в базисе 𝒆 и разложите det(𝑢, 𝑣1 , … , 𝑣𝑛−1 ) = 𝜔(𝑢, 𝑣1 , … , 𝑣𝑛−1 ) по первой строке 𝑢. 177 Ответы и указания к упражнениям Упр. 11.1. Ортогональный оператор 𝐹 переводит базисный вектор 𝑒 в вектор 𝐹𝑒 = 𝜆𝑒 𝜆 ∈ ℝ, и (𝑒, 𝑒) = (𝐹𝑒, 𝐹𝑒) = 𝜆2 = (𝑒, 𝑒) , откуда 𝜆 = ±1. Упр. 11.2. Так как (𝑎 + 𝑏, 𝑎 − 𝑏) = (𝑎, 𝑎) − (𝑏, 𝑏) = 0, вектор (𝑎 + 𝑏)∕ 2 ∈ (𝑎 − 𝑏)⊥ . Поскольку 𝑎= 𝑎+𝑏 𝑎−𝑏 + 2 2 и 𝑏= 𝑎+𝑏 𝑎−𝑏 − , 2 2 (1212) для любого вектора 𝑤 ∈ (𝑎 − 𝑏)⊥ выполняются равенства (𝑤 , 𝑎) = (𝑤 , (𝑎 + 𝑏) ∕ 2) = (𝑤 , 𝑏). Поэтому векторы 𝑎 и 𝑏 ортогонально проектируются на гиперплоскость (𝑎 − 𝑏)⊥ в один и тот же вектор (𝑎 + 𝑏)∕2, а равенства (1212) дают ортогональные разложения векторов 𝑎 и 𝑏 в сумме 𝑉 = (𝑎 − 𝑏)⊥ ⊕ ℝ ⋅ (𝑎 − 𝑏). Упр. 11.3. Рассматриваемый поворот плоскости 𝑈 является композицией отражений относительно прямых 𝑢1⊥ ∩ 𝑈 и 𝑢2⊥ ∩ 𝑈. Упр. 11.4. Если 𝐹𝑢 = 𝜆𝑢 для ненулевого вектора 𝑢, то из равенства (𝐹𝑢, 𝑢) = −(𝑢, 𝐹𝑢) вытекает равенство 2𝜆 ⋅ (𝑢, 𝑢) = 0, возможное только при 𝜆 = 0. Упр. 11.6. (𝑢 + 𝑣 , 𝑢 + 𝑣 ) = (𝑢, 𝑢) + 2(𝑢, 𝑣 ) + 𝑜(|𝑢|), (𝐹 (𝑢 + 𝑣 ), 𝐹 (𝑢 + 𝑣 )) = (𝐹𝑢, 𝐹𝑢) + 2(𝐹𝑢, 𝐹𝑣 ) + 𝑜(|𝑢|). Упр. 11.7. Так как оператор 𝐹𝐹× самосопряжён и биективен, все его собственные числа строго положительны. Поэтому имеется единственный самосопряжённый оператор 𝑆 с положитель ными собственными значениями, квадрат которого равен1 𝐹𝐹× . Тогда 𝐹 = 𝑆𝑅 , где 𝑅 = 𝑆−1 𝐹 ортогонален, поскольку 𝑅× 𝑅 = 𝑅× 𝑆−2 𝐹 = 𝐹 𝑥 (𝐹𝐹× )−1 𝐹 = Id𝑉 . Упр. 11.9. Поскольку произведение двух компактов компактно, а функция (𝑢, 𝑤 ) непрерывна, она достигает максимума на декартовом произведении единичных сфер в 𝑈 и 𝑊 . Упр. 12.6. Если 𝑤 = 𝑒0 + 𝑣 ∈ 𝑀, то 𝑎𝑖 (𝑤 ) = 𝑎𝑖 (𝑒0 ) + 𝛼𝑖 (𝑣 ) ⩾ 0 при всех 𝑖 , поэтому 𝑤 ∈ 𝑀, а с ним и [0, 𝑤) ⊂ 𝑀. Наоборот, если 𝑤 = 𝜆𝑒0 𝑣 ∈ 𝑀, то при 𝜆 ≠ 0 из неравенств 𝑎𝑖 (𝑤) = 𝜆𝑎𝑖 (𝑒0 )+ 𝛼𝑖 (𝑣) ⩾ 0 вытекает, что точка [0, 𝑤) ∩ 𝑈𝜉 = 𝜆−1 𝑤 = 𝑒0 + 𝜆−1 𝑣 ∈ 𝑀, а при 𝜆 = 0 луч [0, 𝑣 ) ⊂ 𝑉 является пределом при 𝑠 → +∞ пересекающих многогранник 𝑀 лучей [0, 𝑤𝑠 ), где 𝑤𝑠 = 𝑤 + 𝑠𝑣 , поскольку при всех 𝑠 ⩾ 0 точка 𝑤𝑠 = 𝑤 + 𝑠𝑣 ∈ 𝑀, коль скоро 𝑤 ∈ 𝑀 и 𝛼𝑖 (𝑣 ) ⩾ 0 при всех 𝑖 , а луч [0, 𝑤𝑠 ] имеет при каждом 𝑠 > 0 ненулевой направляющий вектор 𝑣𝑠 = 𝑠−1 𝑤 + 𝑣 , стремящийся к 𝑣 при 𝑠 → ∞. Для доказательства эквивалентности свойств (1) – (3) заметим, что если 𝛼𝑖 (𝑣) < 0 хотя бы для одного функционала 𝛼𝑖 , то для всех 𝑝 ∈ 𝔸(𝑉 ) при всех 𝜆 ≫ 0 выполняется неравенство 𝑎𝑖 (𝑝 + 𝜆𝑣) = 𝑎𝑖 (𝑝) + 𝜆𝛼𝑖 (𝑣) < 0, и ни одно из свойств (1) – (3) не имеет места. Напротив, если 𝛼𝑖 (𝑣) ⩾ 0 для всех 𝑖 , то для любой точки 𝑝 ∈ 𝑀 при всех 𝜆 ⩾ 0 выполняются неравенства 𝑎𝑖 (𝑝 + 𝜆𝑣) = 𝑎𝑖 (𝑝) + 𝜆𝛼𝑖 (𝑣) ⩾ 𝑎𝑖 (𝑝) ⩾ 0, а с ними и каждое из свойств (1) – (3). Упр. 12.7. Четырёхгранный конус в ℝ3 , порождённый векторами 𝑣1 = 𝑒1 + 𝑒2 + 𝑒3 , 𝑣2 = 𝑒1 + 𝑒2 − 𝑒3 , 𝑣3 = 𝑒1 − 𝑒2 − 𝑒3 , 𝑣4 = 𝑒1 − 𝑒2 + 𝑒3 , не имеет двумерной грани, порождённой векторами 𝑣1 и 𝑣3 . 1 Так как 𝑆 и 𝑆2 диагонализуются в одном базисе, оператор 𝑆 обязан действовать на каждом собствен ном подпространстве 𝑉𝜆 оператора 𝑆2 умножением на положительный √𝜆.

ВЫСШАЯ МАТЕМАТИКА

#Лекция

Линейная алгебра и геометрия

Тебе могут подойти лекции