Линейная алгебра и геометрия

👀 906 просмотров
📌 873 загрузки

Выбери формат для чтения

Конспект лекции по дисциплине «Линейная алгебра и геометрия», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Линейная алгебра и геометрия», Word формат

Линейная алгебра и геометрия. В.В. Севостьянова 1 Линейные операторы 1.1 Понятие линейного оператора Пусть U, V — линейные пространства над полем K. Определение 1.1. Отображение ϕ : U → V называется линейным (или линейным оператором) линейных пространств U и V , если для любых v 1 , v 2 , v ∈ U и любого числа λ ∈ K выполняются следующие два условия: а) ϕ(v 1 + v 2 ) = ϕ(v 1 ) + ϕ(v 2 ), б) ϕ(λv) = λϕ(v). Примеры линейных операторов. 1. Если U = V , то простейший пример линейного оператора — тривиальный оператор ϕ(v) = v. Такой оператор называется тождественным и обозначается id или ε, т.е. ∀v : id(v) = v. 2. Пусть V = R — одномерное пространство над полем R. Пусть a — вещественное число. Тогда отображение y = ax является линейным оператором. 3. Пусть U = V — плоскость, пусть ϕ — поворот плоскости на угол α. Очевидно, что при повороте сумма векторов переходит в сумму, а растянутый в λ раз вектор сохранит свою длину. Проектирование на прямую и симметрия относительно прямой также являются линейными операторами на плоскости. 4. В трехмерном пространстве примерами линейных операторов являются (a) вращение на угол α вокруг прямой, (b) проектирование на прямую (плоскость), (c) симметрия относительно прямой (плоскости). 1 5. Рассмотрим кольцо многочленов U = V = K[x]. Мы ранее обсуждали, что оно тоже является линейным пространством. Фиксируем многочлен f (x) ∈ K[x], тогда в качестве линейного оператора можно взять следующее отображение: ¡ ¢ ϕ g(x) = f (x)g(x), ∀g(x) ∈ K[x]. Проверим, что отображение ϕ действительно является линейным оператором. ¡ ¢ ¡ ¢ ϕ g1 (x) + g2 (x) = f (x) · g1 (x) + g2 (x) = ¡ ¢ ¡ ¢ = f (x)g1 (x) + f (x)g2 (x) = ϕ g1 (x) + ϕ g2 (x) , ¡ ¢ ¡ ¢ ¡ ¢ ϕ λg(x) = f (x) · λg(x) = λf (x)g(x) = λϕ g(x) . 6. Пусть V — пространство C ∞ [a, b] бесконечно дифференцируемых функций на отрезке [a, b] и df ϕ(f ) = — dx оператор дифференцирования. 7. Пусть V — пространство C[a, b] непрерывных функций на отрезке [a, b]. Пусть A(t, s) — непрерывная функция по t, s ∈ [a, b]. Тогда Z b A(t, s)x(t)dt ϕ(x)(s) = a является интегральным оператором. Утверждение 1.2. При линейном отображении ϕ : U → V нулевой элемент из U переходит в нулевой элемент из V , а противоположный — в противоположный: ϕ(0) = 0, ϕ(−u) = −ϕ(u). Доказательство. ϕ(0) = ϕ(0 + 0) = ϕ(0) + ϕ(0) = 2ϕ(0) ⇒ ϕ(0) = 0, ¡ ¢ 0 = ϕ(0) = ϕ v + (−v) = ϕ(v) + ϕ(−v) ⇒ −ϕ(v) = ϕ(−v). 2 1.2 Матрица линейного оператора Теорема 1.3. Пусть U, V — линейные пространства над полем K размерности n. Пусть e1 , e2 , . . . , en — базис пространства U , а f 1 , f 2 , . . . , f n — 2 базис пространства V . Тогда существует единственное линейное отображение ϕ : U → V , которое на базисных векторах определено следующим образом: ϕ(ei ) = f i , i = 1, 2, . . . , n. Доказательство. Рассмотрим произвольный вектор a пространства U и разложим его по базису e1 , e2 , . . . , en : a = α1 e1 + α2 e2 + . . . + αn en . Положим ϕ(a) = α1 f 1 + α2 f 2 + . . . + αn f n . 1. Проверим, что построенное отображение является линейным оператором. Покажем, что сумма переходит в сумму. Возьмем второй вектор b ∈ U , его разложение по базису: b = β1 e1 + β2 e2 + . . . + βn en . Имеем ¡ ¢ ϕ(a + b) = ϕ (α1 e1 + α2 e2 + . . . + αn en ) + (β1 e1 + β2 e2 + . . . + βn en ) = ¡ ¢ = ϕ (α1 + β1 )e1 + (α2 + β2 )e2 + . . . + (αn + βn )en = = (α1 + β1 )ϕ(e1 ) + (α2 + β2 )ϕ(e2 ) + . . . + (αn + βn )ϕ(en ) = = (α1 + β1 )f 1 + (α2 + β2 )f 2 + . . . + (αn + βn )f n = = (α1 f 1 + α2 f 2 + . . . + αn f n ) + (β1 f 1 + β2 f 2 + . . . + βn f n ) = ϕ(a) + ϕ(b). Пусть λ ∈ K, тогда ¡ ¢ ϕ(λa) = ϕ (λα1 )e1 + (λα2 )e2 + . . . + (λαn )en = = (λα1 )ϕ(e1 ) + (λα2 )ϕ(e2 ) + . . . + (λαn )ϕ(en ) = = (λα1 )f 1 + (λα2 )f 2 + . . . + (λαn )f n = ¡ ¢ = λ α1 f 1 + α2 f 2 + . . . + αn f n = λϕ(a) 2. Проверим единственность. Предположим, что есть два линейных оператора ϕ и ψ, для которых выполнено ϕ(ei ) = f i и ψ(ei ) = f i при любых i. Тогда для произвольного вектора a имеем ψ(a) = ψ(α1 e1 + α2 e2 + . . . + αn en ) = = α1 ψ(e1 ) + α2 ψ(e2 ) + . . . + αn ψ(en ) = = α1 f 1 + α2 f 2 + . . . + αn f n = = α1 ϕ(e1 ) + α2 ϕ(e2 ) + . . . + αn ϕ(en ) = = ϕ(α1 e1 + α2 e2 + . . . + αn en ) = ϕ(a), т.е. операторы ϕ и ψ совпадают. 2 3 Пусть в линейном пространстве V выбран базис e1 , e2 , . . . , en ∈ V, и ϕ : V → V — линейный оператор. Разложим вектора ϕ(e1 ), ϕ(e2 ), . . . , ϕ(en ) по базису пространства V :  ϕ(e1 ) = α11 e1 + α21 e2 + . . . + αn1 en ,    ϕ(e2 ) = α12 e1 + α22 e2 + . . . + αn2 en , (1) . . . . . .    ϕ(en ) = α1n e1 + α2n e2 + . . . + αnn en . Рассмотрим квадратную матрицу порядка n, составленную из коэффициентов системы (1):   α11 α12 . . . α1n  α21 α22 . . . α2n   Aϕ =   ... ... ... ... . αn1 αn2 . . . αnn Определение 1.4. Матрица Aϕ называется матрицей линейного оператора ϕ в базисе e1 , e2 , . . . , en . Систему уравнений (1) можно переписать в следующей матричной форме: ¢ ¡ ϕ(e1 ), ϕ(e2 ), . . . , ϕ(en ) = (e1 , e2 , . . . , en )Aϕ . или ϕ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )Aϕ , используя обозначение e = (e1 , e2 , . . . , en ), введенное в первом параграфе этой лекции, получим ϕ(e) = eAϕ . 1.3 Изменение матрицы линейного оператора при замене базиса Рассмотрим линейный оператор ϕ : V → V . Выберем в линейном пространстве V два разных базиса e1 , e2 , . . . , en и f 1 , f 2 , . . . , f n . И пусть Aϕ и Bϕ — матрицы оператора ϕ в соответствующих базисах: ϕ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )Aϕ ; ϕ(f 1 , f 2 , . . . , f vn ) = (f 1 , f 2 , . . . , f n )Bϕ . 4 (2) Обозначим через T матрицу перехода от первого базиса ко второму, (f 1 , f 2 , . . . , f n ) = (e1 , e2 , . . . , en )T, (3) Подставим равенство (3) в (2), получим ¡ ¢ ϕ (e1 , e2 , . . . , en )T = (e1 , e2 , . . . , en )T · Bϕ . Каждый вектор-столбец в матрице (e1 , e2 , . . . , en )T — линейная комбинация векторов e1 , e2 , . . . , en , поэтому можно воспользоваться линейностью отображения ϕ, тогда ϕ(e1 , e2 , . . . , en )T = (e1 , e2 , . . . , en )T Bϕ , (e1 , e2 , . . . , en )Aϕ T = (e1 , e2 , . . . , en )T Bϕ . Вектора e1 , e2 , . . . , en образуют базис, поэтому матрица (e1 , e2 , . . . , en ) обратима и на нее можно сократить. Получаем A ϕ T = T Bϕ , Aϕ = T Bϕ T −1 . Таким образом, была доказана Теорема 1.5. Пусть Aϕ — матрица оператора ϕ, записанная в базисе e1 , e2 , . . . , en , а Bϕ — матрица оператора ϕ, записанная в базисе f 1 , f 2 , . . . , f n . Тогда имеет место равенство Aϕ = T Bϕ T −1 , где T — матрица перехода от базиса e1 , e2 , . . . , en к базису f 1 , f 2 , . . . , f n . 1.4 Подобные матрицы Рассмотрим множество квадратных матриц Mat(n, K) размера n × n с коэффициентами из поля K. Пусть A, B ∈ Mat(n, K). Определение 1.6. Матрицы A и B называются подобными, если если существует невырожденная квадратная матрица T ∈ Mat(n, K) такая, что A = T BT −1 . Обозначение для подобных матриц следующее: A ∼ B. Утверждение 1.7. Подобие матриц задает отношение эквивалентности на множестве Mat(n, K): а) A ∼ A; б) если A ∼ B, то B ∼ A; в) если A ∼ B и B ∼ C, то A ∼ C. Доказательство. 5 а). Подобие A ∼ A выполняется, поскольку A = EAE −1 , где E — единичная матрица. б). Пусть A ∼ B, тогда A = T BT −1 для некоторой матрицы T . Следовательно, T −1 AT = B, значит B ∼ A; в). Предположим A ∼ B и B ∼ C, тогда существуют матрицы T и S такие, что A = T BT −1 и B = SCS −1 . Подставим A = T SCS −1 T −1 = (T S)C(T S)−1 . Если T, S ∈ Mat(n, K), то T S ∈ Mat(n, K). Значит A ∼ C. 2 Таким образом, все квадратные матрицы из Mat(n, K) разбиваются на классы эквивалентности подобных матриц. Утверждение 1.8. Если матрицы A и B подобны, то их определители равны. Доказательство. Пусть A ∼ B, т.е. существует T , для которой выполняется A = T BT −1 . В прошлом семестре мы доказали, что det(AB) = det(A) det(B). Воспользуемся этим свойством. det(A) = det(T BT −1 ) = det(T ) det(B) det(T −1 ) = det(B), поскольку det(T ) = det(T −1 ). 2 1.5 Действия с линейными операторами Пусть U, V — два линейных пространства над полем K и пусть заданы два линейных оператора ϕ : U → V и ψ : U → V . I. Сумма линейных операторов Определение 1.9. Суммой линейных операторов ϕ и ψ называется линейный оператор ϕ + ψ, определяемый следующим образом: ∀u ∈ U (ϕ + ψ)(u) = ϕ(u) + ψ(u). Утверждение 1.10. Сумма линейных операторов является линейным оператором. Доказательство. Обозначим ξ = ϕ + ψ, покажем, что оператор ξ линейный: ξ(u + v) = (ϕ + ψ)(u + v) = ϕ(u + v) + ψ(u + v) = ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ = ϕ(u) + ϕ(v) + ψ(u) + ψ(v) = ϕ(u) + ψ(u) + ϕ(v) + ψ(v) = = (ϕ + ψ)(u) + (ϕ + ψ)(v) = ξ(u) + ξ(v), 6 ξ(λu) = ϕ(λu) + ψ(λu) = λϕ(u) + λψ(u) = ¡ ¢ = λ ϕ(u) + ψ(u) = λ(ϕ + ψ)(u) = λξ(u). 2 II. Умножение линейного оператора на число Определение 1.11. Результатом умножения линейного оператора ϕ на число λ ∈ K по определению является отображение (λϕ)(u) = ϕ(λu), ∀u. Утверждение 1.12. Отображение λϕ — линейный оператор. Доказательство. Обозначим ξ = (λϕ), тогда ¡ ¢ ξ(u1 + u2 ) = (λϕ)(u1 + u2 ) = ϕ λ(u1 + u2 ) = ϕ(λu1 + λu2 ) = = ϕ(λu1 ) + ϕ(λu2 ) = (λϕ)(u1 ) + (λϕ)(u2 ) = ξ(u1 ) + ξ(u2 ), ¡ ¢ ¡ ¢ ξ(µu) = (λϕ)(µu) = ϕ λ(µu) = ϕ µ(λu) = = µϕ(λu) = µ(λϕ)(u) = µξ(u), значит ξ — линейный оператор. 2 Рассмотрим множество L(U, V ) всех линейных операторов, определенных на линейном пространстве U над полем K со значениями в линейном пространстве V над K. Утверждение 1.13. Множество L(U, V ) является линейным пространством над полем K. Доказательство немедленно следует из утверждений 1.10 и 1.12. III. Произведение линейных операторов Снова рассмотрим два линейных оператора над полем K: ϕ : U → V, ψ : V → W. Определение 1.14. Произведением операторов ϕ и ψ называется их композиция ¡ ¢ (ψ ◦ ϕ)(u) = ψ ϕ(u) . ϕ ψ U −→ V −→ W Теорема 1.15. Произведение линейных операторов — линейный оператор. Доказательство. ¡ ¢ ¡ ¢ (ψ ◦ ϕ)(u + v) = ψ ϕ(u + v) = ψ ϕ(u) + ϕ(v) = 7 ¡ ¢ ¡ ¢ = ψ ϕ(u) + ψ ϕ(v) = (ψ ◦ ϕ)(u) + (ψ ◦ ϕ)(v), ¡ ¢ ¡ ¢ (ψ ◦ ϕ)(λu) = ψ ϕ(λu) = ψ λϕ(u) = ¡ ¢ ¡ ¢ = λψ ϕ(u) = λ (ψ ◦ ϕ)(u) . 2 Утверждение 1.16. Пусть e1 , e2 , . . . , en — базис в линейном пространстве V , пусть ϕ : V → V и ψ : V → V — два линейных оператора, а Aϕ , Aψ — их матрицы в базисе e1 , e2 , . . . , en соответственно, тогда а) Aϕ+ψ = Aϕ + Aψ ; б) Aλϕ = λAϕ ; в) Aψ◦ϕ = Aψ Aϕ . Доказательство. Покажем только свойство в. Обозначим ξ = ψ ◦ ϕ, тогда ξ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )Aξ , ¡ ¢ ξ(e1 , e2 , . . . , en ) = ψ ϕ(e1 , e2 , . . . , en ) , ¡ ¢ ξ(e1 , e2 , . . . , en ) = ψ (e1 , e2 , . . . , en )Aϕ ¡ ¢ ξ(e1 , e2 , . . . , en ) = ψ(e1 , e2 , . . . , en ) Aϕ , ¡ ¢ ξ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )Aψ Aϕ . Окончательно получаем (e1 , e2 , . . . , en )Aξ = (e1 , e2 , . . . , en )Aψ Aϕ , Aξ = Aψ Aϕ . 2 Упражнение. Докажите свойства а и б. 1.6 Ядро и образ линейного оператора Пусть ϕ : U → V — линейный оператор линейных пространств U, V над полем K. Определение 1.17. Ядром оператора ϕ называется множество элементов u ∈ U , которые при отображении ϕ переходят в ноль 0: © ª Ker(ϕ) = u ∈ U : ϕ(u) = 0 . Образом линейного оператора ϕ называется множество значений отображения ϕ: © ª Im(ϕ) = v ∈ V : ∃u ∈ U , для которого выполняется v = ϕ(u) . 8 Элемент u ∈ U , для которого имеет место v = ϕ(u) называется прообразом элемента v ∈ V . Утверждение 1.18. Ядро линейного оператора ϕ : U → V — линейное подпространство в U , а образ ϕ — линейное подпространство в V . Доказательство. 1. Покажем, что ядро линейного оператора ϕ — линейное подпространство в U . Для этого нужно показать выполнение двух свойств из определения линейного оператора. Пусть u, v ∈ Ker(ϕ), тогда по определению ядра ϕ(u + v) = ϕ(u) + ϕ(v) = 0 + 0 = 0, ϕ(λu) = λϕ(u) = λ · 0 = 0. Следовательно, u + v ∈ Ker(ϕ), λu ∈ Ker(ϕ). 2. Теперь покажем, что образ ϕ — линейное подпространство в V . Пусть теперь v 1 , v 2 ∈ Im(ϕ), тогда для векторов v 1 , v 2 существуют прообразы u1 , u2 ∈ U : v 1 = ϕ(u1 ), v 2 = ϕ(u2 ). Имеем v 1 + v 2 = ϕ(u1 ) + ϕ(u2 ) = ϕ(u1 + u2 ), следовательно, u1 + u2 — прообраз v 1 + v 2 , значит v 1 + v 2 ∈ Im(ϕ). Аналогично, если v ∈ Im(ϕ), то существует u ∈ U : v = ϕ(u). Тогда λv = λϕ(u) = ϕ(λu), следовательно, λv имеет прообраз и лежит в образе Im(ϕ). 2 Определение 1.19. Линейное отображение ϕ : U → V называется инъективным (или инъекцией), если ядро этого отображения состоит из нулевого элемента, т.е. Ker(ϕ) = {0}. Другими словами, ϕ является инъекцией, если разные вектора u1 6= u2 из U при отображении переходят в разные вектора ϕ(u1 ) 6= ϕ(u2 ) из V . Определение 1.20. Линейное отображение ϕ : U → V называется сюрьективным (или сюръекцией), если образ этого отображения совпадает с линейным пространством V , т.е. Im(ϕ) = V . Можно говорить, что линейный оператор ϕ — сюръекция, если любой вектор из V имеет прообраз. Определение 1.21. Линейный оператор ϕ : U → V называется биекцией, если ϕ одновременно является инъекцией и сюръекцией. 9 1.7 Размерность ядра и образа Теорема 1.22. Пусть ϕ : U → V — линейный оператор над полем K. Тогда dim Ker(ϕ) + dim Im(ϕ) = dim U. Доказательство. Пусть U — n-мерное линейное пространство. Имеем Ker(ϕ) — линейное подпространство в U , пусть размерность Ker(ϕ) равна k. Выберем в ядре Ker(ϕ) базис (e1 , e2 , . . . , ek ) и дополним его до базиса (e1 , e2 , . . . , ek , f 1 , f 2 , . . . , f m ) в пространстве U . Так как dim U = n, то m = n − k. Для любого вектора b из образа Im(ϕ) существует прообраз a ∈ U такой, что b = ϕ(a). Разложим вектор a по базису a = α1 e1 + α2 e2 + . . . + αk ek + β1 f 1 + β2 f 2 + . . . + βm f m . Тогда b = ϕ(a) = ϕ(α1 e1 + α2 e2 + . . . + αk ek + β1 f 1 + β2 f 2 + . . . + βm f m ) = = α1 ϕ(e1 ) + α2 ϕ(e2 ) + . . . + αk ϕ(ek ) + β1 ϕ(f 1 ) + β2 ϕ(f 2 ) + . . . + βm ϕ(f m ) = = β1 ϕ(f 1 ) + β2 ϕ(f 2 ) + . . . + βm ϕ(f m ), поскольку вектора e1 , e2 , . . . , ek лежат в ядре и значит при отображении ϕ переходят в ноль. Таким образом, мы получили, что любой вектор из образа линейно выражается через вектора ϕ(f 1 ), ϕ(f 2 ), . . . , ϕ(f m ). Осталось показать, что эти вектора линейно независимы. Предположим, что для некоторых чисел γ1 , γ2 , . . . , γm выполняется γ1 ϕ(f 1 ) + γ2 ϕ(f 2 ) + . . . + γm ϕ(f m ) = 0. Следовательно, ϕ(γ1 f 1 + γ2 f 2 + . . . + γm f m ) = 0. Но последнее означает, что линейная комбинация γ1 f 1 + γ2 f 2 + . . . + γm f m содержится в ядре Ker(ϕ). А значит может быть разложена по базису ядра, γ1 f 1 + γ2 f 2 + . . . + γm f m = α1 e1 + α2 e2 + . . . + αk ek с некоторыми числами αi . Мы получили линейную зависимость между базисными векторами (e1 , e2 , . . . , ek , f 1 , f 2 , . . . , f m ), но единственной такой зависимостью может быть только тривиальная: α1 = α2 = . . . = αk = γ1 = γ2 . . . = γm = 0. 10 Полученное заключение γ1 = γ2 . . . = γm = 0 означает, что вектора ϕ(f 1 ), ϕ(f 2 ), . . . , ϕ(f m ) линейно независимы. Итак, мы показали, что вектора ϕ(f 1 ), ϕ(f 2 ), . . . , ϕ(f m ) линейно независимы и через них выражается любой вектор b ∈ Im(ϕ), значит они образуют базис линейного пространства Im(ϕ) и dim Im(ϕ) = m. Тогда dim Ker(ϕ) + dim Im(ϕ) = k + m = k + (n − k) = n = dim U. 2 Следствие 1.23. Линейное отображение ϕ — инъекция тогда и только тогда, когда dim U = dim Im(ϕ). Доказательство. Если отображение ϕ — инъекция, то Ker(ϕ) = {0}, значит dim Ker(ϕ) = 0. Тогда dim U = dim Ker(ϕ) + dim Im(ϕ) = dim Im(ϕ). Обратно, если dim U = dim Im(ϕ), то dim Ker(ϕ) = 0 и ядро тривиально. Последнее означает, что ϕ инъективно. 2 Замечание. Если для линейного отображения ϕ : U → V имеет место dim U = dim V , то из инъективности или субъективности ϕ вытекает биективность. 1.8 Обратимый линейный оператор Пусть ϕ : V → V — линейный оператор. Напомним, что через id обозначается тождественный оператор, т.е. оператор при котором ∀v : id(v) = v. Определение 1.24. Оператор ϕ называется обратимым, если существует оператор ψ : V → V такой, что произведение операторов ϕ и ψ — тождественный оператор, т.е. ϕ ◦ ψ = ψ ◦ ϕ = id. Оператор ψ в этом случае называется обратным к оператору ϕ. Обозначение для обратного оператора к оператору ϕ следующее: ϕ−1 . Теорема 1.25. Если обратный оператор существует, то он единственен. Доказательство. Пусть ψ1 , ψ2 — два обратных оператора к оператору ϕ, т.е. ϕ ◦ ψ1 = ψ1 ◦ ϕ = id и ϕ ◦ ψ2 = ψ2 ◦ ϕ = id. Тогда ψ1 ◦ ϕ ◦ ψ2 = (ψ1 ◦ ϕ) ◦ ψ2 = id ◦ ψ2 = ψ2 , ψ1 ◦ ϕ ◦ ψ2 = ψ1 ◦ (ϕ ◦ ψ2 ) = ψ1 ◦ id = ψ1 , откуда следует, что ψ1 = ψ2 . 2 11 Пусть A и B — две матрицы оператора ϕ в двух разных базисах. Тогда по теореме 1.5 существует матрица T такая, что имеет место A = T BT −1 , то есть матрицы A и B подобны. Тогда в силу утверждения 1.8 определители матриц A и B равны. Следовательно следующее определение корректно. Определение 1.26. Определителем оператора ϕ называется определитель матрицы этого оператора в каком-нибудь базисе V . Обозначение определителя оператора ϕ очевидное: det(ϕ). Теорема 1.27. Пусть dim V = n, ϕ : V → V — линейный оператор. Следующие четыре условия эквивалентны: 1) оператор ϕ обратим, 2) Ker(ϕ) = {0}, 3) Im(ϕ) = V , 4) det(ϕ) 6= 0. Доказательство. 1 ⇒ 2) Пусть оператор ϕ обратим, покажем, что ядро оператора ϕ тривиально. Возьмем произвольный вектор a ∈ Ker(ϕ), тогда ϕ(a) = 0. Подействуем обратным оператором ϕ−1 на последнее равенство: ϕ−1 ◦ ϕ(a) = ϕ−1 (0), id(a) = 0, т.е. a = 0. Таким образом, мы показали, что каждый вектор из ядра нулевой. 2 ⇒ 3) Пусть Ker(ϕ) = {0}, покажем, что Im(ϕ) = V . По теореме 1.22 dim Ker(ϕ) + dim Im(ϕ) = dim V. Если ядро тривиально, то dim Ker(ϕ) = 0. Следовательно, dim Im(ϕ) = dim V = n. Но поскольку Im(ϕ) ⊆ V и линейные пространства Im(ϕ) и V имеют одинаковую размерность, то они совпадают. 3 ⇒ 4) Пусть теперь Im(ϕ) = V , наша цель — доказать det(ϕ) 6= 0. Доказательство проведем от противного, предположим det(ϕ) = 0. Выберем в пространстве V базис e1 , e2 , . . . , en . И пусть Aϕ — матрица оператора ϕ в выбранном базисе, то есть ¢ ¡ ϕ(e1 ), ϕ(e2 ), . . . , ϕ(en ) = ϕ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )Aϕ . Если det(Aϕ ) = 0, то определитель произведения матриц тоже равен нулю: ¡ ¢ det (e1 , e2 , . . . , en )Aϕ = det(e1 , e2 , . . . , en ) det(Aϕ ) = 0. 12 Значит ¡ ¢ det ϕ(e1 ), ϕ(e2 ), . . . , ϕ(en ) = 0 ¡ ¢ и система векторов ϕ(e1 ), ϕ(e2 ), . . . , ϕ(en ) линейно зависима и ее ранг меньше n. Так как любой вектор из образа линейно выражается через вектора этой системы, размерность образа Im(ϕ) тоже меньше n. Последнее означает, что Im(ϕ) 6= V . Мы пришли к противоречию, следовательно, предположение det(ϕ) = 0 не верно. 4 ⇒ 1) Предположим det(ϕ) 6= 0, докажем, что оператор ϕ имеет обратный. Пусть Aϕ — матрица оператора ϕ в базисе e1 , e2 , . . . , en , т.е. ϕ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )Aϕ , и det(Aϕ ) 6= 0. Следовательно матрица Aϕ обратима, и существует обратная матрица B = A−1 ϕ . Обозначим через ψ линейный оператор, определяемый условием ψ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )B. По свойству в) из утверждения 1.16 оператор ϕ ◦ ψ имеет единичную матрицу Aϕ B = E. Поскольку матрица линейного оператора однозначно определяется в данном базисе, получаем ϕ ◦ ψ = id, то есть ϕ обратим. 2 2 Собственные векторы и собственные значения линейного оператора 2.1 Определение собственных векторов и собственных значений Пусть V — линейное пространство над полем K, а ϕ : V → V — линейный оператор. Определение 2.1. Ненулевой вектор a ∈ V называется собственным вектором линейного оператора ϕ, если существует число λ ∈ K такое, что ϕ(a) = λa. В этом случае число λ называется собственным значением линейного оператора ϕ. Теорема 2.2. Число λ0 — собственное значение линейного оператора ϕ тогда и только тогда, когда det(λ0 · id − ϕ) = 0. Доказательство. 1. Покажем необходимость. Пусть λ0 — собственное значение оператора ϕ, тогда по определению существует вектор a, для которого имеет место ϕ(a) = λ0 a. Тогда λ0 a − ϕ(a) = 0, 13 (λ0 · id − ϕ)a = 0. Обозначим ψ = λ0 ·id−ϕ, тогда ψ(a) = 0, т.е. ненулевой вектор a лежит в ядре Ker(ψ). Значит ядро не является тривиальным и Ker(ψ) 6= {0}. Тогда по теореме 1.27 имеем det(ψ) = 0 или det(λ0 · id − ϕ) = 0. 2. Теперь докажем достаточность. Пусть ψ = λ0 · id − ϕ и det(ψ) = 0, покажем, что λ0 — собственное значение линейного оператора ϕ. Если det(ψ) = 0, то ядро Ker(ψ) оператора ψ не является тривиальным, следовательно, в ядре есть ненулевой вектор a, ψ(a) = 0. Тогда (λ0 · id − ϕ)a = 0, λ0 a − ϕ(a) = 0, ϕ(a) = λ0 a, т.е. λ0 — собственное значение линейного оператора ϕ. 2 2.2 Характеристический многочлен. Рассмотрим квадратную матрицу A порядка n. Как и прежде E обозначает единичную матрицу. Определение 2.3. Характеристической матрицей называется матрица вида λE − A. Здесь λ играет роль переменной. Определитель характеристической матрицы det(λE − A) — это многочлен от переменной λ с коэффициентами из поля K. Определение 2.4. Многочлен f (λ) = det(λE − A) называется характеристическим многочленом матрицы A. Примерхарактеристической матрицы: µ ¶ µ ¶ 1 2 λ − 1 −2 A= , λE − A = . 3 4 −3 λ − 4 Соответствующий характеристический многочлен имеет вид f (λ) = det(λE − A) = (λ − 1)(λ − 4) − 2 · 3 = λ2 − 5λ − 2. Характеристический многочлен f (λ) имеет степень n, равную порядку исходной матрицы. Следовательно, по следствию из теоремы Эйлера имеет ровно n комплексных корней λ1 , λ2 , . . . , λn . Определение 2.5. Будем называть корни характеристического многочлена характеристическими корнями. Напомним, что следом матрицы  a11  a21 A=  ... an1 a12 a22 ... an2 14 ... ... ... ...  a1n a2n   ...  ann называется сумма чисел, стоящих в ней на диагонали, tr(A) = a11 + a22 + . . . + ann . Теорема 2.6. След матрицы A равен сумме λ1 + λ2 + . . . + λn соответствующих характеристических корней, а определитель det(A) равен произведению характеристических корней, т.е. tr(A) = λ1 + λ2 + . . . + λn , det(A) = λ1 · λ2 · . . . · λn . Доказательство. Рассмотрим характеристический многочлен   λ − a11 −a12 . . . −a1n  −a21 λ − a22 . . . −a2n  = f (λ) = det(λE − A) = det   ... ... ... ...  −an1 −an2 . . . λ − ann = λn + p1 λn−1 + p2 λn−2 + . . . + pn . Подставим в многочлен f значение λ = 0:  −a11 −a12 . . .  −a21 −a22 . . . f (0) = pn = det   ... ... ... −an1 −an2 . . .  −a1n −a2n   = (−1)n det(A). ...  −ann С другой стороны, используя формулы Виета, получаем, что свободный член pn многочлена f (λ) равен произведению корней многочлена со знаком: pn = (−1)n λ1 · λ2 · . . . · λn . Получаем требуемое det(A) = λ1 · λ2 · . . . · λn . Аналогично, по формулам Виета имеем p1 = −(λ1 + λ2 + . . . + λn ). С другой стороны, запишем определитель матрицы λE − A в виде произведения диагональных элементов плюс все остальные слагаемые определителя, которые мы обозначим через h(λ): f (λ) = (λ − a11 )(λ − a22 ) . . . (λ − ann ) + h(λ). Каждое слагаемое в h(λ) содержит по крайней мере два множителя вида −aij , i 6= j, и, следовательно, полином h(λ) имеет степень не выше n − 2: deg(f ) 6 n − 2. Поэтому для вычисления коэффициента p1 при степени λn−1 нужно рассматривать только слагаемое (λ − a11 )(λ − a22 ) . . . (λ − ann ). Раскрывая скобки и собирая слагаемые при λn−1 получим p1 = −(a11 + a22 + . . . + ann ) = −tr(A), 15 откуда немедленно вытекает tr(A) = λ1 + λ2 + . . . + λn . 2 Теорема 2.7. Подобные матрицы имеют одинаковые характеристические многочлены. Доказательство. Пусть матрицы A и B подобны, т.е. B = T AT −1 для некоторой обратимой матрицы T . ¡ ¢ det(λE − B) = det(λE − T AT −1 ) = det λ(T ET −1 ) − T AT −1 = ¡ ¢ ¡ ¢ = det T (λE)T −1 − T AT −1 = det T (λE − A)T −1 = = det(T ) det(λE − A) det(T −1 ) = det(λE − A). Таким образом, характеристические многочлены матриц A и B равны: det(λE − B) = det(λE − A). 2 2.3 Диагонализируемось матрицы с различными собственными значениями Теорема 2.8. Пусть V — линейное пространство над полем K размерности n, а ϕ : V → V — линейный оператор. Если λ1 , λ2 , . . . , λn — попарно различные собственные значения оператора ϕ, а a1 , a2 , . . . , an — соответствующие им собственные векторы, то система векторов a1 , a2 , . . . , an является линейно независимой. Доказательство. Пусть λ1 , λ2 , . . . , λn — попарно различные собственные значения оператора ϕ и ϕ(ai ) = λi ai , i = 1, 2, . . . , n. Доказательство теоремы проведем по индукции по числу n. 1. База индукции. Пусть n = 1, по определению собственного вектора ϕ(a1 ) = λ1 a1 и a 6= 0. Очевидно, что система, состоящая из одного ненулевого вектора, является линейно независимой. 2. Предположение индукции. Пусть любая система из n − 1 или менее собственных векторов с попарно различными собственными значениями является линейно независимой. 3. Шаг индукции. Возьмем линейное пространство размерности n. Для доказательства линейной независимости векторов a1 , a2 , . . . , an достаточно показать, что если выполняется условие α1 a1 + α2 a2 + . . . + αn an = 0, (4) то все числа αi равны нулю. Подействуем линейным оператором ϕ на равенство (4): ϕ(α1 a1 + α2 a2 + . . . + αn an ) = ϕ(0) = 0, 16 α1 ϕ(a1 ) + α2 ϕ(a2 ) + . . . + αn ϕ(an ) = 0. Поскольку вектора ai являются собственными, имеем α1 λ1 a1 + α2 λ2 a2 + . . . + αn λn an = 0. (5) Умножим равенство (4) на λ1 : α1 λ1 a1 + α2 λ1 a2 + . . . + αn λ1 an = 0, и вычтем из (5), получим α2 (λ2 − λ1 )a1 + . . . + αn (λn − λ1 )an = 0. По предположению индукции любая система, содержащая n−1 вектор, а значит и система a2 , . . . , an , линейно независима, следовательно, коэффициенты любой линейной комбинации этих векторов равны нулю. Следовательно, α2 (λ2 − λ1 ) = . . . = αn (λn − λ1 ) = 0, но, так как все собственные значения λi попарно различны, получаем α2 = . . . = αn . Тогда из (4) вытекает α1 a1 = 0. Так как все собственные векторы ненулевые, то α1 тоже равно нулю. Таким образом, мы доказали, что система векторов a1 , a2 , . . . , an линейно независима. 2 Теорема 2.9. Если все характеристические корни матрицы A лежат в поле K и все они попарно различны, то матрица A подобна некоторой диагональной матрице D, причем матрица перехода T имеет коэффициенты из поля K. Доказательство. Рассмотрим линейное пространство V над полем K размерности n и выберем в нем произвольный базис e1 , e2 , . . . , en . Пусть ϕ — линейный оператор в пространстве V , который в базисе e1 , e2 , . . . , en имеет матрицу A. Пусть λ1 , λ2 , . . . , λn — попарно различные собственные значения оператора ϕ, а a1 , a2 , . . . , an — соответствующие им собственные векторы, т.е. ϕ(ai ) = λi ai , i = 1, 2, . . . , n. По предыдущей теореме 2.8 система векторов a1 , a2 , . . . , an линейно независима, а значит является базисом. Запишем матрицу оператора ϕ в базисе a1 , a2 , . . . , an : ¡ ¢ ¡ ¢ ϕ(a1 , a2 , . . . , an ) = ϕ(a1 ), ϕ(a2 ), . . . , ϕ(an ) = λ1 a1 , λ2 a2 , . . . , λn an =   λ1 0 . . . 0  0 λ2 . . . 0   = (a1 , a2 , . . . , an )   ... ... ... ... . 0 0 . . . λn 17 Таким образом, матрица линейного оператора ϕ в базисе a1 , a2 , . . . , an является диагональной и имеет следующий вид:   λ1 0 . . . 0  0 λ2 . . . 0   D=  ... ... ... ... . 0 0 . . . λn Т.к. записанные в разных базисах матрицы одного линейного оператора подобны, получаем A ∼ D, т.е. найдется T такая, что A = T DT −1 . Более того, по теореме 1.5 получаем, что T является матрицей перехода от базиса e1 , e2 , . . . , en к базису a1 , a2 , . . . , an , а значит имеет коэффициенты из поля K. 2 Пример. Рассмотрим матрицу µ ¶ 4 −2 A= . 1 1 Найдем ее характеристический многочлен: µ ¶ λ−4 2 det(λE − A) = det = λ2 − 5λ + 6 = (λ − 2)(λ − 3). −1 λ − 1 Имеем два характеристических корня λ1 = 2, λ2 = 3. Значит матрица A подобна следующей диагональной матрице: µ ¶ 2 0 D= . 0 3 2.4 Инвариантные подпространства Пусть задан линейный оператор ϕ : V → V и пусть U ⊆ V — линейное подпространство. Определение 2.10. Подпространство U ⊆ V инвариантно относительно действия линейного оператора ϕ, если для любого вектора v ∈ U выполняется ϕ(v) ∈ U . Пример. Покажем, что ядро и образ являются инвариантными подпространствами линейного оператора. Действительно, если v ∈ Ker(ϕ), то ϕ(v) = 0 ∈ Ker(ϕ). Также для любого вектора, а значит и вектора v из образа, ϕ(v) имеет прообраз v, а значит ϕ(v) ∈ Im(ϕ). Пусть U ⊆ V — инвариантное подпространство оператора ϕ, пусть dim U = m и dim V = n. Упростим матрицу оператора ϕ, для этого выберем какой-нибудь базис (e1 , e2 , . . . , em ) пространства U и дополним 18 его до базиса (e1 , e2 , . . . , em , em+1 , . . . , en ) пространства V . Так как U инвариантно для ϕ, матрица линейного оператора ϕ в базисе (e1 , e2 , . . . , en ) будет иметь вид µ ¶ A1 A0 A= , 0 A2 где на диагонали стоят квадратные матрицы A1 и A2 размера m × m и (n − m) × (n − m) соответственно. Тогда матрица A0 будет иметь размер m × (n − m). На матрицу A1 можно смотреть как на матрицу линейного оператора ϕ, ограниченного на подпространство U . Предположим, что матрица A0 оказалась нулевой, т.е. A — блочно диагональная матрица. В этом случае линейное пространство W , натянутое на базисные вектора (em+1 , em+2 , . . . , en ), тоже является инвариантным подпространством в V , а A2 — матрица оператора ϕ, ограниченного на W . В этом случае получаем, что оператор ϕ индуцировал разложение пространства V в прямую сумму инвариантных подпространств V = U ⊕ W . Таким образом, нами доказана Теорема 2.11. Линейное пространство V является прямой суммой двух подпространств U, W , инвариантных относительно линейного оператора ϕ : V → V тогда и только тогда, когда матрица этого оператора в какомлибо базисе имеет блочно диагональный вид. Замечание. Далеко не всегда можно выбрать базис в V так, чтобы матрица линейного оператора приняла блочно диагональный вид. Теорема 2.12. Всякий комплексный линейный оператор имеет одномерное инвариантное подпространство. Доказательство. Пусть A — матрица оператора ϕ : V → V в некотором базисе. По теореме Эйлера над полем комплексных чисел характеристический полином f (λ) = det(λE−A) обязательно имеет корень λ0 . Значит λ0 — собственное значение оператора ϕ, и λ0 соответствует некоторому собственному вектору v, ϕ(v) = λ0 v. Тогда одномерное линейное пространство U = {αv : α ∈ C}, в котором вектор v является базисным вектором, будет инвариантным: если u ∈ U , то u = αv, значит ϕ(u) = ϕ(αv) = αϕ(v) = αλ0 v ∈ U. 2 3 Жорданова нормальная форма Ранее мы говорили, что один и тот же линейный оператор в разных базисах записывается подобными матрицами. Возникает естественный вопрос, как 19 выбрать базис, в котором матрица линейного оператора будет иметь максимально простой вид. Иногда, например, если собственные значения оператора различны, можно выбрать базис, в котором матрица оператора будет иметь диагональный вид. Какой простейшей матрицей задается произвольный линейный оператор в подходящем базисе? Такой простейший вид матрицы называется жордановой нормальной формой (ж.н.ф.). Ответ на вопрос, как найти ж.н.ф. будет дан в настоящем параграфе. Заметим, что основной целью этого раздела будет научить читателя вычислять ж.н.ф., в то время как все результаты и теоремы будут даны без доказательств. 3.1 Жорданова матрица Рассмотрим квадратную матрицу, в которой на диагонали стоит некоторое комплексное число λ, а выше диагонали единицы:   λ 1 0 ... 0 0  0 λ 1 ... 0 0     0 0 λ ... 0 0   J = (6)  ... ... ... ... ... ... .    0 0 0 ... λ 1  0 0 0 ... 0 λ Определение 3.1. Матрица (6) называется жордановой клеткой. Определение 3.2. Жордановой матрицей называется блочно диагональная матрица, в которой на диагонали стоят жордановы клетки   J1 0 . . . 0  0 J2 . . . 0    (7)  ... ... ... ... . 0 0 . . . Jk Примеры жордановых   1 1 0 0 0 0 1 0 0 0    0 0 1 1 0 ,   0 0 0 1 0 0 0 0 0 3 матриц размера 5 × 5.    1 0 0 0 0 0 1 0 0 0      0 0 1 1 0 ,     0 0 0 1 0  0 0 0 0 3 20 1 1 3 1 3    ,       0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 0      0 0 1 0 0 ,  0 0 1 1 0 .     0 0 0 3 0 0 0 0 1 1 0 0 0 0 3 0 0 0 0 1 В первой жордановой матрице на диагонали стоят 3 жордановы клетки размерами 2,2,1 соответственно, а в последней матрице есть единственная жорданова клетка размера 5. Теорема 3.3. Пусть V — линейное пространство над полем комплексных чисел. Для любого линейного оператора ϕ : V → V найдется базис, в котором ϕ задается некоторой жордановой матрицей. Эту теорему мы оставим без доказательства. Далее, пусть в n-мерном линейном пространстве V над C выбран базис e1 , e2 , . . . , en . Любая матрица A ∈ Mat(n, C) задает линейный оператор ϕ в этом базисе по формуле ϕ(e1 , e2 , . . . , en ) = (e1 , e2 , . . . , en )A, т.е. если разложить вектора ϕ(ei ) по базису  ϕ(e1 ) = α11 e1 + α21 e2 + . . . + αn1 en ,    ϕ(e2 ) = α12 e1 + α22 e2 + . . . + αn2 en , ......    ϕ(en ) = α1n e1 + α2n e2 + . . . + αnn en , то матрица   α11 α12 . . . α1n  α21 α22 . . . α2n   A=  ... ... ... ... . αn1 αn2 . . . αnn является матрицей оператора ϕ. По теореме 3.3 оператор ϕ в некотором базисе определяется жордановой матрицей J. Тогда по теореме 1.5 матрицы A и J являются подобными. Имеет место Теорема 3.4. Всякая квадратная матрица подобна над полем комплексных чисел некоторой жордановой матрице. Более того, эта жорданова матрица определяется однозначно с точностью до порядка следования жордановых клеток на диагонали. Доказательство того факта, что две жордановы матрицы подобны тогда и только тогда, когда в них по диагонали стоят одинаковые жордановы клетки, мы опустим. 21 Определение 3.5. Жорданову матрицу, подобную матрице A, называют жордановой нормальной формой матрицы A. Пусть жорданова форма J матрицы A записана в базисе f 1 , f 2 , . . . , f n , называемом жордановым базисом. Напомним, что матрицы A и J подобны над полем C, если существует невырожденная матрица T c элементами из поля C такая, что J = T −1 AT . Здесь матрица T — матрица перехода от базиса e1 , e2 , . . . , en к базису f 1 , f 2 , . . . , f n , т.е. столбцы матрицы T — координаты жорданова базиса, записанных в координатах начального базиса e1 , e2 , . . . , en . Как найти жорданову форму произвольной матрицы с комплексными коэффициентами? В этом поможет теория λ-матриц. 3.2 λ-матрицы Определение 3.6. λ-матрицей называется квадратная n × n–матрица, элементами которой являются комплексные многочлены от λ. В прошлом семестре мы обсуждали понятие эквивалентного преобразования матрицы, его можно распространить также и на λ-матрицы. Определение 3.7. 1. Элементарным преобразованием λ-матрицы 1 рода называют прибавление к строке (столбцу) матрицы элементов другой строки (столбца), умноженных на некоторый многочлен f (λ); 2. Элементарным преобразованием λ-матрицы 2 рода называют умножение строки (столбца) матрицы на число c 6= 0. Напомним, что с помощью элементарных преобразований можно переставить местами две строки или столбца матрицы. Определение 3.8. Говорят, что две λ-матрицы одного размера эквивалентны, если из одной можно получить другую цепочкой элементарных преобразований. Определение 3.9. Канонической формой λ-матрицы называют диагональную λ-матрицу   e1 (λ) ...  0 e2 (λ) . . . 0    , C(λ) =  .. .. . . .. ..    . . . . . en (λ) в которой выполняется два условия: 22 а) старший коэффициент в многочленах {ei (λ)} равен 1; б) каждый ei (λ) делит ei+1 (λ) нацело. Многочлены ei (λ) называются инвариантными множителями. Каждый инвариантный множитель разложим в произведение линейных многочленов ei (λ) = (λ − ai1 )ki1 . . . (λ − ai,m(i) )ki,m(i) , где все корни ai,1 , . . . , ai,m(i) различны. Множители (λ − aij )kij называются элементарными делителями. Система элементарных делителей — это набор всех элементарных делителей, в котором каждый элементарный делитель встречается столько раз сколько он встречался в разложении ei (λ), 1 ≤ i ≤ n. Например, система элементарных делителей матрицы   λ−1  (λ) =  0 (λ − 1)(λ + 2) (λ − 1)(λ + 2)3 равна λ − 1, λ − 1, λ − 1, λ + 2, (λ + 2)3 . Каждая каноническая форма однозначно восстанавливается по размеру n, рангу r и системе элементарных делителей. Следующая теорема является основной в тории λ-матриц. Теорема 3.10. 1. Всякая λ-матрица A(λ) эквивалентна некоторой канонической форме C(λ). 2. Каноническая форма C(λ) находится по A(λ) однозначно. Существует алгоритм, позволяющий легко найти каноническую форму произвольной λ-матрицы A(λ). Обозначим через di (λ) наибольший общий делитель всех миноров i-го порядка в A(λ). Тогда формулы e1 (λ) = d1 (λ), e2 (λ) = d2 (λ) , d1 (λ) ..., en (λ) = dn (λ) . dn−1 (λ) (8) позволяют найти каноническую форму C(λ). Пример. Найдем каноническую форму для матрицы µ ¶ 1 + 2λ 4λ2 − 13λ + 5 A(λ) = . λ 2λ2 − 7λ + 4 Воспользуется формулами (8): d1 (λ) = 1 (так как НОД(λ, 1 + 2λ) = 1), d2 (λ) = det A(λ) = (λ − 2)2 . Тогда каноническая форма будет следующей ¶ µ 1 . C(λ) = 0 (λ − 2)2 23 Пример. Найти каноническую форму для матрицы   λ + 1 −λ2 + 6λ − 6 2λ2 + 9λ − 18 A(λ) =  λ −λ2 + 6λ − 8 λ2 + 9λ − 18  . λ λ+2 λ3 − λ2 + 4 Легко видеть, что d1 (λ) = 1. Создадим число 1 в левом верхнем углу матрицы A(λ). Для этого умножим вторую строку на -1 и прибавим к первой строке. Получаем   1 2 λ2 A(λ) ∼  λ −λ2 + 6λ − 8 λ2 + 9λ − 18  . λ λ+2 λ3 − λ2 + 4 Сохраняя 1 в левом верхнем углу, создадим два нуля в первой строке. Для этого умножим первый столбец на -2 и прибавим ко второму столбцу и затем умножим первый столбец на −λ2 и прибавим к третьему столбцу. Получаем   1 A(λ) ∼  λ (λ − 2)(4 − λ) 9(λ − 2)  . λ −(λ − 2) −λ2 + 4 Элементарными преобразованиями создадим два нуля в первом столбце:   1 A(λ) ∼  0 (λ − 2)(4 − λ) 9(λ − 2)  . −(λ − 2) −λ2 + 4 Применим формулы (8). Все ненулевые миноры второго порядка будут либо диагональными с 1 в левом верхнем углу, либо это минор ¯ ¯ ¯ (λ − 2)(4 − λ) 9(λ − 2) ¯ ¯ ¯. ¯ −(λ − 2) −λ2 + 4 ¯ Отсюда получаем d2 (λ) = λ − 2; d3 (λ) = det A(λ) = (λ − 2)2 (λ + 1)2 . Следовательно, имеем каноническую форму   1 . C(λ) =  0 λ − 2 (λ − 2)(λ + 1)2 3.3 Вычисление жордановой нормальной формы Дана матрица A. Для нахождения жордановой нормальной формы (ж.н.ф.) составим характеристическую матрицу A − λE. Рассматривая матрицу A − λE как λ-матрицу, найдём каноническую форму C(λ) и выпишем 24 систему её элементарных делителей. По каждому элементарному делителю (λ − α)k построим жорданову клетку Jα,k размера k × k с числом α по главной диагонали. Искомая ж.н.ф. J — блочно диагональная матрица с клетками Jα,k по главной диагонали. После того как найдена ЖНФ J можно приступить к построению жорданова базиса f 1 , . . . , f n . Метод нахождения жорданова базиса зависит от найденной ж.н.ф. J. Мы изложим этот метод на примерах. Ответим, что жорданов базис находится не однозначно. Пример. Найти жорданову форму J, жорданов базис и матрицу T для следующих матриц: µ ¶ µ ¶ 13 5 8 3 , b) A = a) A = −10 −3 −20 −7     4 1 1 4 1 1 c) A =  −2 1 −2  , d) A =  −5 0 −2  , −4 −2 1 −1 −1 1     12 −5 −2 −4 −1 −1 e) A =  16 −6 −4  , f ) A =  −1 −5 −1  . −8 5 6 3 5 0 Решение а). Составим характеристическую матрицу µ ¶ 8−λ 3 A − λE = . −10 −3 − λ Найдём каноническую λ-матрицу: µ ¶ 1 A − λE ∼ . 0 (λ − 2)(λ − 3) Система элементарных делителей: {λ − 2, λ − 3}. Находим ж.н.ф.: ¶ µ 2 0 J= 0 3 Перейдём к нахождению жорданова базиса f 1 , f 2 , в котором матрица оператора ϕ совпадает с J. Поскольку ϕ(f 1 , f 2 ) = (f 1 , f 2 )J, имеем ½ ϕ(f 1 ) = 2f 1 ϕ(f 2 ) = 3f 2 Здесь вектора f 1 , f 2 являются собственными для оператора ϕ с собственными значениями 2 и 3 соответственно. В нашем случае собственные 25 векторы f 1 , f 2 определяются однозначно, с точностью до умножения на константу. µ ¶ µ ¶ µ ¶ µ ¶ 2 0 1 −3 1 −3 , f1 = Ответ: J = , f2 = ,T = . 0 3 −2 5 −2 5 Решение b). Составим характеристическую матрицу µ ¶ 13 − λ 5 A − λE = −20 −7 − λ Каноническая λ-матрица A − λE ∼ µ 1 0 (λ − 3)2 ¶ имеет единственный элементарный делитель (λ − 3)2 . Жорданова форма будет следующей µ ¶ 3 1 J= . 0 3 Векторы жорданова базиса f 1 , f 2 удовлетворяют равенствам: ½ ϕ(f 1 ) = 3f 1 , ϕ(f 2 ) = f 1 + 3f 2 . (9) Пусть ε — тождественный оператор. Равенства (9) перепишем в форме ½ (ϕ − 3ε)f 1 = 0, (10) (ϕ − 3ε)f 2 = f 1 . Построение жорданова базиса можно завершить двумя способами. Способ 1. Вектор f 1 — собственный вектор с собственными значением µ ¶ 1 λ1,2 = 3. Стандартным образом получаем f 1 = . Подставия f 1 во 2 второе из уравнений (10), получаем систему уравнений для нахождения вектора f 2 : ¶ µ ¶ µ ¶µ 1 10 5 x1 = . −2 −20 −10 x2 µ ¶ . В качестве f 2 выберем любое частное решение, например f 2 = 1 5 Найденныеµ векторы¶ f 1 , f 2 удовлетворяют равенствам (9). Составим мат1 0 рицу T = . Поскольку det T 6= 0, то {f 1 , f 2 } — базис. −2 15 26 µ Ответ: J = 3 1 0 3 ¶ µ , f1 = 1 −2 ¶ µ , f2 = 1 5 ¶ µ ,T = 1 0 −2 51 ¶ Способ 2. Из равенств (9) вытекает, что (ϕ − 3)2 — нулевой оператор. можно Поэтому (ϕ−3)2 x = 0 для любого вектора x. В качестве вектора µ f2 ¶ 1 взять произвольный вектор, не пропорциональный вектору . По−2 µ ¶ µ ¶ 1 10 ложим f 2 = . Из второго из равенств (9) находим f 1 = . −20 µ ¶ 10 1 Составим T = и убедимся, что det T 6= 0. −20 0 ¶ ¶ µ ¶ µ µ µ ¶ 3 1 10 1 10 1 . , f1 = , f2 = ,T = Ответ: J = −20 0 0 3 −20 Решение c). Приведем характеристическую матрицу к каноническому виду     4−λ 1 1 1 0  A − λE =  −2 1 − λ −2  ∼  0 1 −4 −2 1 − λ 0 0 (λ − 1)(λ − 2)(λ − 3) Система элементарных делителей: {λ − 1, λ − 2, λ − 3}. Жорданова форма   1 0 0 J =  0 2 0 . 0 0 3 Жорданов базис состоит из собственных векторов f 1 , f 2 , f 3 с собственными значениями 1, 2, 3 соответственно.         1 0 0 −1 1 Ответ. J =  0 2 0 , f 1 =  2 , f 2 =  −2 , f 3 =  −1 , 1 1 0 0 3   −1 1 0 T =  2 −2 −1  . 1 0 1 Решение d). Приведем характеристическую матрицу к каноническому виду     4−λ 1 1 1 0  A − λE =  −5 −λ −2  ∼  0 1 −1 −1 1 − λ 0 0 (λ − 2)2 (λ − 3) 27 Система элементарных делителей: {(λ − 2)2 , λ − 3}. Жорданова форма   2 1 0 J =  0 2 0 . 0 0 3 Векторы жорданова базиса f 1 , f 2 , f 3 удовлетворяют равенствам   ϕ(f 1 ) = 2f 1 , ϕ(f 2 ) = f 1 + 2f 2 ,  ϕ(f 3 ) = 3f 2 . Равенства (11) перепишем в форме   (ϕ − 2ε)f 1 = 0, (ϕ − 2ε)f 2 = f 1 ,  (ϕ − 3ε)f 3 = 0. (11) (12) Векторы f 1 и f 3 — собственные векторы с собственными значениями 2 и 3 соответственно, определяются однозначно, с точностью до константы. Находим     1 f 1 =  1  , f 3 =  −1  . −1 −2 Подставляя f 1 во вторую строку формул (12), получаем уравнение для нахождения f 2 :      2 1 1 x1  −5 −2 −2   x2  =  1  . (5.8) x3 −1 −1 −1 −1 В качестве f 2 можно взять любое частное решение (5.8). Например,   −1 f2 =  2  . Составляем матрицу T и проверяем, что det T 6= 0.         2 1 0 −1 1 Ответ. J =  0 2 0 , f 1 =  1 , f 2 =  2 , f 3 =  −1 , 0 0 3 −1 −2   0 −1 1 T =  1 2 −1  . −1 0 −2 28 Решение e). Приведем характеристическую матрицу к каноническому виду     12 − λ −5 −2 1 . A − λE =  16 −6 − λ −4  ∼  0 λ − 4 −8 5 6−λ (λ − 4)2 Система элементарных делителей: {(λ − 4), (λ − 4)2 }. Жорданова форма   4 0 0 J =  0 4 1 . 0 0 4 Векторы жорданова базиса f 1 , f 2 , f 3 удовлетворяют равенствам:   ϕ(f 1 ) = 4f 1 ϕ(f 2 ) = 4f 2  ϕ(f 3 ) = f 2 + 4f 3 Равенства (13) перепишем в форме   (ϕ − 4ε)f 1 = 0 (ϕ − 4ε)f 2 = 0  (ϕ − 4ε)f 3 = f 2 (13) (14) Векторы f 1 , f 2 — собственные векторы с собственными значением 2. Система f 1 , f 2 является базисом в пространстве решений уравнения      8 −5 −2 x1      = 0  . (15) (ϕ − 4ε)x = (A − λE)x = x2 16 −10 −4 x3 −8 5 2 Три уравнения системы (15) пропорциональны уравнению 8x1 − 5x2 − 2x3 = 0. (16) Ошибочно полагать, что в качестве f 1 , f 2 можно взять произвольный базис в пространстве решений (15). Ведь у нас есть еще третье уравнение в (14), которое при произвольном выборе f 2 может не иметь решения. Заметим, что (14) вытекает, что (ϕ − 4ε)2 — нулевой оператор. Поэтому (ϕ − 4ε)2 x = 0 для любого вектора x. В качестве f 3 можно выбрать произвольный вектор, не удовлетворяющий (16). Возьмём в качестве f 3 первый вектор стандартного базиса и найдём f 2 из (14):     1 8 f 3 =  0  , f 2 = (A − 4E)f 3 =  16  −8 29 Сделаем проверку: подставим набор (8, 16, −8) в (16) и убедимся, что получается тождество. Это подтверждает, что вектор f 2 найден правильно. Осталось подобрать вектор f 1 так, чтобы он вместе с f 2 образовывал базис в пространстве решений (16). В качестве f 1 можно взять любое из фундаментальных решений. Например   1 f1 =  0  . 4 Составим матрицу T и убедимся, что det T 6= 0.         4 0 0 1 8 1 Ответ. J =  0 4 1 , f 1 =  0 , f 2 =  16 , f 3 =  0 , 0 0 4 4 −8   1 8 1 T =  0 16 0  . 4 −8 0 Решение f). Приведем характеристическую виду    −4 −1 −1 1 A − λE =  −1 −5 −1  ∼  0 3 5 0 матрицу к каноническому  . 1 0 (λ + 3)3 Единственный элементарный делитель равен (λ + 3)3 .   −3 1 0 J =  0 −3 1  . 0 0 −3 Векторы жорданова базиса f 1 , f 2 , f 3 удовлетворяют равенствам   ϕ(f 1 ) = −3f 1 ϕ(f 2 ) = f 1 − 3f 2  ϕ(f 3 ) = f 2 − 3f 3 Равенства (17) перепишем в форме   (ϕ + 3ε)f 1 = 0 (ϕ + 3ε)f 2 = f 1  (ϕ + 3ε)f 3 = f 2 (17) (18) Векторы жорданова базиса можно найти по цепочке. Сначала найти f 1 как собственный вектор с собственным значением, равным −3. Подставить 30 во второе уравнение из (18) и найти f 2 как его частное решение. Затем f 3 из третьего уравнения. Однако, есть более короткий способ. Из равенств (17) вытекает, что (ϕ + 3ε)3 — нулевой оператор. Поэтому (ϕ + 3ε)3 x = 0 для любого x. Если мы возьмём в качестве f 3 произвольный вектор и далее найдем f 2 = (ϕ + 3ε)f 3 и f 1 = (ϕ + 3ε)f 2 , то (ϕ + 3ε)f 1 = 0. Таким образом, все три равенства в (18) будут выполнены. Есть только одно ограничение в выборе f 3 : векторы f 1 , f 2 , f 3 должны образовывать базис. В частности, (ϕ + 3ε)2 f 3 6= 0. В нашем случае это условие необходимо и достаточно для того, чтобы система f 1 , f 2 , f 3 была базисом. Возьмём в качестве f 3 первый вектор стандартного базиса e1 = (1, 0, 0). Если (ϕ + 3ε)2 f 3 = 0, то заменим e1 на e2 . Если снова получается нуль, то положим f 3 = e3 . И здесь (ϕ+3ε)2 f 3 6= 0, поскольку (ϕ+3ε)2 — ненулевой оператор. Вернёмся к нашей задаче:       1 −1 −1 f 3 =  0  , f 2 = (ϕ+3ε)f 3 =  −16  , f 1 = (ϕ+3ε)f 2 =  0  . 3 1 Составим матрицу T и убедимся, что det T 6= 0.       −3 1 0 −1 −1 Ответ. J =  0 −3 1 , f 1 =  0 , f 2 =  −1 , 0 0 −1 1 3     1 −1 −1 1 f 3 =  0 , T =  0 −1 0  . 1 3 0 4 Билинейные и квадратичные формы 4.1 Линейные формы Рассмотрим линейное пространство V над полем K. Определение 4.1. Отображение f : V → K называется линейной функцией на V (или линейной формой), если выполняются два свойства а) f (v 1 + v 2 ) = f (v 1 ) + f (v 2 ), б) f (λv) = λf (v). Другими словами, линейная форма — линейный оператор со значениями в поле K. Пример линейных форм. 31 1. Фиксируем вектор a ∈ V . Линейной формой будет отображение, ставящее в соответствие произвольному вектору x ∈ V число, равное скалярному произведению векторов a и x: f (x) = (x, a). 2. Пусть V = K[x] — кольцо многочленов с коэффициентами из поля K от одной переменной, a ∈ K — число. Отображение, ставящее в соответствие произвольному многочлену h(x) ∈ K[x] его значение в ¡ ¢ точке x = a, f h(x) = h(a), является линейной формой. Пусть dim V = n. Выберем в V какой-нибудь базис (e1 , e2 , . . . , en ). Обозначим через β1 = f (e1 ), β2 = f (e2 ), . . . , βn = f (en ) скаляры, зависящие от выбора базиса. Тогда, раскладывая произвольный вектор x ∈ V по базису x = λ1 e1 + λ2 e2 + . . . + λn en , получим f (x) = f (λ1 e1 + λ2 e2 + . . . + λn en ) = = λ1 f (e1 ) + λ2 f (e2 ) + . . . + λn f (en ) = λ1 β1 + λ2 β2 + . . . + λn βn . Таким образом, мы видим, что линейная форма в заданном базисе однозначно определяется вектором (β1 , β2 , . . . , βn ). Покажем, как изменятся числа βi при замене базиса. Возьмем другой базис (e01 , e02 , . . . , e0n ) линейного пространства V . Разложим векторы нового базиса по старому базису  0 e = t11 e1 + t21 e2 + . . . + tn1 en ,    10 e2 = t12 e1 + t22 e2 + . . . + tn2 en , (19) . . .    0 en = t1n e1 + t2n e2 + . . . + tnn en . Образуем матрицу матрицу перехода  t11 t12 t t  21 22 T =  .. ..  . . tn1 tn2  . . . t1n . . . t2n   . . . ...   . . . tnn от базиса (e1 , . . . , en ) к базису (e01 , . . . , e0n ). Пусть в базисе (e01 , e02 , . . . , e0n ) линейная форма f определяется скалярами β10 , β20 , . . . , βn0 , т.е. β10 = f (e01 ), β20 = f (e02 ), . . . , βn0 = f (e0n ). Разложим вектор x по базису (e01 , e02 , . . . , e0n ): x = µ1 e01 + µ2 e02 + . . . + µn e0n . 32 Тогда f (x) = f (µ1 e01 + µ2 e02 + . . . + µn e0n ) = = µ1 f (e01 ) + µ2 f (e02 ) + . . . + µn f (e0n ) = µ1 β10 + µ2 β20 + . . . + µn βn0 . Далее, имеем β10 = f (e01 ) = f (t11 e1 + t21 e2 + . . . + tn1 en ) = = t11 f (e1 ) + t21 f (e2 ) + . . . + tn1 f (en ) = t11 β1 + t21 β2 + . . . + tn1 βn . Аналогично для любых j = 2, . . . , n выполняются такие же равенства, получаем  0 β = t11 β1 + t21 β2 + . . . + tn1 βn ,    10 β2 = t12 β1 + t22 β2 + . . . + tn2 βn , ...    0 βn = t1n β1 + t2n β2 + . . . + tnn βn . Сравните получившиеся формулы с (19), очевидно, что коэффициенты при замене получились одинаковыми. Таким образом, базисные вектора и коэффициенты линейной формы при замене базиса меняются по одним и тем же формулам. 4.2 Двойственное пространство и двойственный базис Пусть f, g — две линейные формы на линейном пространстве V , α ∈ K. Можно рассмотреть отображения (f + g)(x) := f (x) + g(x), (αf )(x) := α · f (x). Поскольку линейные формы являются линейными операторами, то из утверждений 1.10 и 1.12 следует, что отображения f + g, αf тоже являются линейными формами. Отсюда следует, что множество всех линейных форм образует линейное пространство, см. утверждение 1.13. Определение 4.2. Относительно введенных операций сложения и умножения на число линейные формы на V образуют линейное пространство V ∗ = L(V, K), называемое двойственным (или сопряженным) пространством к V . В предыдущем разделе лекций мы показали, что при заданном базисе (e1 , e2 , . . . , en ) в пространстве V имеется взаимно однозначное соответствие f 7→ (β1 , β2 , . . . , βn ) между линейными формами и n-мерными векторами (β1 , β2 , . . . , βn ). Если f 7→ (β1 , β2 , . . . , βn ) и g 7→ (γ1 , γ2 , . . . , γn ), то f + g 7→ (β1 + γ1 , β2 + γ2 , . . . , βn + γn ) и αf 7→ (αβ1 , αβ2 , . . . , αβn ). 33 Таким образом, определена биекция векторных пространств между двойственным пространством V ∗ и линейным пространством K n , состоящем из n-мерных векторов. В частности, dim V ∗ = dim K n = n. Далее мы будем отождествлять пространства V ∗ и K n и вместо отображения f 7→ (β1 , β2 , . . . , βn ) писать равенство f = (β1 , β2 , . . . , βn ). Выберем в двойственном пространстве V ∗ стандартный базис следующих линейных форм: e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en = (0, . . . , 0, 1), т.е. зададим базисные линейные формы следующим образом: ½ 1 при i = j, i e (ej ) = δij = (i, j = 1, 2, . . . , n). 0 при i 6= j Действие линейной формы ei на произвольном векторе определено так: ei (α1 e1 + α2 e2 + . . . + αn en ) = α1 ei (e1 ) + α2 ei (e2 ) + . . . + αn ei (en ) = αi . Функции (e1 , e2 , . . . , en ) очевидно линейно независимы, так как независимы соответствующие им вектора (1, 0, . . . , 0), (0, 1, . . . , 0), . . . , (0, 0, . . . , 1). Тем самым нами доказана Теорема 4.3. Пусть V — линейное векторное пространство размерности n над полем K. Тогда двойственное пространство V ∗ также имеет размерность n. Если (e1 , e2 , . . . , en ) — базис в V , а e1 , e2 , . . . , en — линейные формы на V , для которых ei (ej ) = δij , то (e1 , e2 , . . . , en ) — базис в V ∗ . Определение 4.4. Базис (e1 , e2 , . . . , en ) пространства V ∗ из формулировки теоремы 4.3 называется двойственным (или дуальным базисом) для данного базиса (e1 , e2 , . . . , en ) пространства V . Замечание. Название пространства V ∗ , двойственного к V , и базиса (e1 , e2 , . . . , en ), двойственного к (e1 , e2 , . . . , en ), связано с «двусторонней симметрией» между пространствами V и V ∗ , о которой мы еще будем говорить. Часто вместо f (x) пишут (f, x), намекая на скалярное произведение векторов f и x, правда здесь вектора берутся из разных пространств, 34 пусть и одинаковой размерности. Тем самым определяется отображение V ∗ × V → K, линейное по каждому аргументу: (f + g, x) = (f, x) + (g, x), (αf, x) = α(f, x), (f, x + y) = (f, x) + (f, y), (f, αx) = α(f, x). Разложим произвольные вектора f ∈ V ∗ и x ∈ V по базисам x = α1 e1 + α2 e2 + . . . + αn en , f = β1 e1 + β2 e2 + . . . + βn en . В этом случае легко вычислить значение f (x) = (f, x) = α1 β1 + α2 β2 + . . . + αn βn . (20) С другой стороны, получаются удобные формулы для вычисления координат вектора x в базисе (e1 , e2 , . . . , en ): αi = (ei , x). (21) Верны аналогичные формулы, вычисляющие координаты линейной формы f в базисе (e1 , e2 , . . . , en ): (22) βj = (f, ej ). Упражнение. Выведите формулы (20), (21), (22). 4.3 Билинейные формы Пусть V — линейное пространство. Определение 4.5. Отображение f : V ×V → K называется билинейным, если оно линейное по каждому аргументу, т.е. f (u + v, w) = f (u, w) + f (v, w), f (αu, v) = αf (u, v), f (u, v + w) = f (u, v) + f (u, w), f (u, αv) = αf (u, v) для всех векторов u, v, w ∈ V и любого числа α ∈ K. Замечание. Вообще говоря f (u, v) 6= f (v, u). Пример билинейных форм. 1. Пусть V — линейное пространство векторов на плоскости. Скалярное произведение f (x, y) = x1 y1 + x2 y2 — билинейная форма. 2. В случае n-мерного векторного пространства V = K n в качестве билинейной формы можно взять f (x, y) = x1 y1 + x2 y2 + . . . + xn yn . 35 3. Пусть V = Mat(n, K) — квадратные матрицы, A, B ∈ Mat(n, K), тогда f (A, B) = tr(AB) — билинейная форма. 4. Пусть V = C[a, b] — пространство непрерывных функций на отрезке [a, b], a, b ∈ R. Определим билинейную форму для g, h ∈ V : Z b f (g, h) = g(x)h(x)dx. a Упражнение. Докажите, что отображения из примеров 1–4 действительно являются билинейными формами. Выберем в V некоторый базис (e1 , e2 , . . . , en ) и выразим вектора x, y через их координаты x = x1 e 1 + x2 e 2 + . . . + xn e n , y = y 1 e1 + y 2 e2 + . . . + y n en . Воспользуемся линейностью билинейной формы f : f (x, y) = f (x1 e1 + x2 e2 + . . . + xn en , y1 e1 + y2 e2 + . . . + yn en ) = ! Ã ! Ã n n n X n n n X X X X X xi e i , y j ej = xi f e i , y j ej = xi yj f (ei , ej ) = =f i=1 j=1 i=1 = j=1 n X n X i=1 j=1 xi yj aij , (23) i=1 j=1 где aij = f (ei , ej ). Определение 4.6. Матрица  a11 a12 a a  21 22 A =  .. ..  . . an1 an2  . . . a1n . . . a2n   . . . ...   . . . ann называется матрицей билинейной формы f на V в базисе (e1 , e2 , . . . , en ). Обозначим через X вектор-столбец, а через t X — вектор-строку,   x1  x2  t  X=  . . .  , X = (x1 , x2 , . . . , xn ). xn Тогда билинейную форму можно записать в следующем виде:    a11 a12 . . . a1n y1  a a ... a  y2  2n   21 22  = t X · A · Y. (24) f (x, y) = (x1 , x2 , . . . , xn )  .. .. . . . ..     . . .  ...  yn an1 an2 . . . ann 36 Убедитесь, что (24) в точности равна (23). Обратно, если есть квадратная матрица A, то при помощи соотношения (24) можно определить билинейную форму, полагая f (ei , ej ) = aij . Таким образом, при заданном базисе (e1 , e2 , . . . , en ) векторного пространства над K имеется взаимно однозначное соответствие между квадратными n × n матрицами с элементами из K и билинейными формами на линейном пространстве размерности n. Более того, это соответствие сохраняет линейную структуру, действительно, если f (x, y) = t X · A · Y, g(x, y) = t X · B · Y, то (f + g)(x, y) = t X · (A + B) · Y, (αf )(x, y) = t X · (αA) · Y. Следовательно, имеет место биекция векторного пространства L2 (V, K) всех билинейных форм V ×V → K на векторное пространство Mat(n, K) всех квадратных матриц порядка n над K. 4.4 Изменение матрицы билинейной формы при замене базиса Пусть наряду с (e1 , e2 , . . . , en ) в пространстве V задан еще один базис (e01 , e02 , . . . , e0n ) вместе в матрицей перехода  0   e = t11 e1 + t21 e2 + . . . + tn1 en ,   t11 . . . t1n  10 e2 = t12 e1 + t22 e2 + . . . + tn2 en , T =  ... . . . ...  , ...    0 tn1 . . . tnn en = t1n e1 + t2n e2 + . . . + tnn en . Разложим вектор x по двум базисам x = x01 e01 + x02 e02 + . . . + x0n e0n . x = x1 e 1 + x2 e 2 + . . . + xn e n , Как было показано ранее   x1  x2     ...  = T xn  x01  x02   ·  . . .  или X = T · X . x0n  Пусть теперь A — матрица билинейной формы f в базисе (e1 , e2 , . . . , en ), а B — матрица той же формы в базисе (e01 , e02 , . . . , e0n ),     a11 . . . a1n b11 . . . b1n A =  ... . . . ...  , B =  ... . . . ...  , an1 . . . ann bn1 . . . bnn 37 другими словами, aij = f (ei , ej ) и bij = f (e0i , e0j ). Запишем билинейную форму f в двух базисах f (x, y) = t X · A · Y, f (x, y) = t X 0 · B · Y 0 . Подставим равенства X = T · X 0 и Y = T · Y 0 , получим f (x, y) = t X · A · Y = t (T · X 0 ) · A · (T · Y 0 ) = (t X 0 · t T ) · A · (T · Y 0 ), получаем t X 0 · B · Y 0 = f (x, y) = t X 0 · (t T · A · T ) · Y 0 . Сравнивая левую и правую части последнего равенства, имеем B = t T · A · T. Таким образом, доказана Теорема 4.7. Матрицы A и B билинейной формы f в базисах соответственно (e1 , e2 , . . . , en ) и (e01 , e02 , . . . , e0n ) связаны соотношением B = t T · A · T , где T — матрица перехода от (e1 , e2 , . . . , en ) к (e01 , e02 , . . . , e0n ). Пример. Рассмотрим билинейную форму, записанную в некотором базисе (e1 , e2 , e3 ): f (x, y) = 3x1 y1 − x1 y3 + x2 y1 + 2x2 y2 − x3 y1 + 5x3 y2 + 4x3 y3 . Матрица билинейной формы f в базисе (e1 , e2 , e3 ) будет следующей   3 0 −1 A =  1 2 0 . −1 5 4     1 2 Например, если x =  0 , y =  −1  , то 1    3 −1 2 ¡ ¢ f (x, y) = t xAy = 1 0 1  1 2 0   −1  = −1. −1 5 4 Выберем другой базис (e01 , e02 , . . . , e0n ), пусть его разложение по первому базису будет следующим  0  e1 = e1 − e3 , e02 = 2e1 + e2 ,  0 e3 = e2 − 3e3 . 38 Матрица перехода от первого базиса  1 T = 0 −1 ко второму:  2 0 1 1 . 0 −3 Тогда матрица билинейной формы в базисе (e01 , e02 , . . . , e0n ) будет следующей     1 0 −1 3 0 −1 1 2 0 B = tT · A · T =  2 1 0   1 2 0   0 1 1  = 0 1 −3 −1 5 4 −1 0 −3   13 11 10 =  9 16 8  . 28 19 23 4.5 Квадратичные формы Определение 4.8. Билинейная форма f на V называется симметрической, если для любых векторов x, y ∈ V : f (x, y) = f (y, x). Для симметрической билинейной формы в любом базисе (e1 , e2 , . . . , en ) выполняется aij = f (ei , ej ) = f (ej , ei ) = aji , т.е. матрица билинейной формы является симметрической:   a11 a12 . . . a1n  a a ... a  2n   12 22 A =  .. .. . . . ..  .  . . .  a1n a2n . . . ann Определение 4.9. Произвольная квадратная матрица называется симметрической, если она не меняется при транспонировании, т.е. t B = B. Верно и в обратную сторону, если какая-то билинейная форма f задается симметрической матрицей A, то для векторов x = x1 e1 + x2 e2 + . . . + xn en , y = y1 e1 + y2 e2 + . . . + yn en выполняется f (x, y) = n X n X xi yj aij = i=1 j=1 n X n X yj xi aji = f (y, x). j=1 i=1 Таким образом, симметрическая билинейная форма в любом базисе записывается симметрической матрицей, и если некоторая билинейная 39 форма записывается в некотором базисе симметрической матрицей, то она симметрическая. Пример симметрической билинейной формы — скалярное произведение f (x, y) = x1 y1 + x2 y2 + . . . + xn yn . Пусть f — симметрическая билинейная форма на V . Определение 4.10. Квадратичной формой g на линейном векторном пространстве V , называется линейная форма g(x) = f (x, x), полученная из симметрической билинейной формы f на V . Пусть в некотором базисе билинейная форма f на векторах x = x1 e1 + x2 e2 + . . . + xn en , y = y1 e1 + y2 e2 + . . . + yn en определяется равенством f (x, y) = n X n X xi yj aij , i=1 j=1 причем форма симметрическая, т.е. aij = aji . Тогда квадратичная форма g в этом же базисе задается однородным многочленом второй степени от n переменных g(x) = f (x, x) = n X n X xi xj aij = i=1 j=1 n X aii x2i + 2 i=1 X aij xi xj . 16i 0 ∀i. √ Сделаем замену ci = bi , тогда g = (c1 y1 )2 + (c2 y2 )2 + . . . + (ck yk )2 − (ck+1 yk+1 )2 − (ck+2 yk+2 )2 − . . . − (cr yr )2 . Обозначим ∀i zi = ci yi , получим, что квадратичная форма в своем каноническом виде 2 2 − . . . − zr2 − zk+2 g = z12 + z22 + . . . + zk2 − zk+1 имеет d+ = k положительных квадратов и d− = r − k отрицательных квадратов, d+ + d− = r. Теорема (закон инерции вещественных квадратичных форм) 4.21. Число положительных d+ и число отрицательных d− квадратов в каноническом виде вещественной квадратичной формы не зависит от способа приведения квадратичной формы к диагональному виду. Доказательство. Предположим, что в двух разных базисах есть две канонических вида квадратичной формы g(x1 , x2 , . . . , xn ): 2 2 2 g = y12 + y22 + . . . + ym − ym+1 − ym+2 − . . . − yr2 , 2 2 g = z12 + z22 + . . . + zk2 − zk+1 − zk+2 − . . . − zr2 . Покажем, что m = k. Предположим, противное m 6= k, и пусть для определенности m < k. Обозначим через T матрицу перехода из системы координат (y1 , y2 , . . . , yn ) в систему координат (x1 , x2 , . . . , xn ), а через S — матрицу перехода от (z1 , z2 , . . . , zn ) к (x1 , x2 , . . . , xn ), т.е. T · X = Y, S · X = Z,  y1 = y1 (x) = t11 x1 + t12 x2 + . . . + t1n xn ,    y2 = y2 (x) = t21 x1 + t22 x2 + . . . + t2n xn , ...    yn = yn (x) = tn1 x1 + tn2 x2 + . . . + tnn xn ; 50  z1 = z1 (x) = s11 x1 + s12 x2 + . . . + s1n xn ,    z2 = z2 (x) = s21 x1 + s22 x2 + . . . + s2n xn , ...    zn = zn (x) = sn1 x1 + sn2 x2 + . . . + snn xn . Рассмотрим линейную систему уравнений с m + n − k уравнениями и n переменными   y1 (x) = t11 x1 + t12 x2 + . . . + t1n xn = 0,     y2 (x) = t21 x1 + t22 x2 + . . . + t2n xn = 0,     ...    ym (x) = tm1 x1 + tm2 x2 + . . . + tmn xn = 0, zk+1 (x) = sk+1,1 x1 + sk+1,2 x2 + . . . + sk+1,n xn = 0,      zk+2 (x) = sk+2,1 x1 + sk+2,2 x2 + . . . + sk+2,n xn = 0,     ...    z (x) = s x + s x + . . . + s x = 0. n n1 1 n2 2 nn n Так как m < k, то число уравнений меньше числа переменных, значит система имеет ненулевое решение α = (α1 , α2 , . . . , αn ). Вычислим 2 2 2 g(α) = y12 (α) + y22 (α) + . . . + ym (α) − ym+1 (α) − ym+2 (α) − . . . − yr2 (α) = 2 2 (α) − . . . − yr2 (α) < 0, = −ym+1 (α) − ym+2 2 2 g(α) = z12 (α) + z22 (α) + . . . + zk2 (α) − zk+1 (α) − zk+2 (α) − . . . − zr2 (α) = = z12 (α) + z22 (α) + . . . + zk2 (α) > 0. Получилось, что одновременно g(α) > 0 и g(α) < 0, противоречие. Следовательно, предположение m < k было не верным, значит m = k. Последнее означает, что число положительных d+ и число отрицательных d− слагаемых в каноническом виде вещественной квадратичной формы постоянны. 2 Определение 4.22. Число положительных квадратов d+ канонического вида квадратичной формы называется положительным индексом инерции, а d− — отрицательным индексом инерции. По закону инерции вещественной квадратичной формы d+ и d− не зависят от способа приведения к канонической форме, ранг квадратичной формы равен r = d+ + d− . Определение 4.23. Число δ = d+ − d− называется сигнатурой квадратичной формы. Теорема 4.24. Две вещественные квадратичные формы от n переменных эквивалентны тогда и только тогда, когда они имеют одинаковый ранг и сигнатуру. 51 Доказательство. Пусть две вещественные квадратичные формы эквивалентны: f ∼ g. Тогда по закону инерции f и g приводятся к одной той же диагональной форме с одинаковым числом положительных d+ и отрицательных d− квадратов. Следовательно, у них одинаковые ранг r = d+ + d− и сигнатураδ = d+ − d− . В обратную сторону, если f и g имеют одинаковые ранг и сигнатуру, то из системы уравнений с неизвестными d+ и d− ½ r = d+ + d− , δ = d+ − d− однозначно находятся числа d+ и d− . Значит f и g имеют одинаковые положительный и отрицательный индексы инерции, следовательно, приводятся к одной и той же диагональной форме, т.е. f ∼ g. 2 Пример. Рассмотрим квадратичную форму g(x1 , x2 , x3 ) = x21 − 2x22 + 3x23 + 2x1 x2 − 4x1 x3 − 2x2 x3 . Применим метод Якоби для нахождения  1 1  A= 1 −2 −2 −1 Найдем главные миноры ¯ ¯1 1 D1 = 1, D2 = ¯¯ 1 −2 канонической формы:  −2 −1  . 3 ¯ ¯ ¯ ¯ 1 1 −2 ¯ ¯ ¯ ¯ ¯ = −3, D3 = ¯ 1 −2 −1 ¯ = −7. ¯ ¯ ¯ ¯ −2 −1 3 ¯ Тогда квадратичная форма эквивалентна следующей g(y1 , y2 ) = После замены 1 3 1 2 D1 2 D2 2 y1 + y2 + y3 = y12 − y22 + y32 . D1 D2 D3 3 7  z1 = yq  1,   z2 = 37 y3 , q    z = 1y 3 3 2 получим g(z1 , z2 , z3 ) = z12 +z22 −z32 . Отсюда легко получаем положительный и отрицательные индексы инерции квадратичной формы d+ = 2, d− = 1. 52 4.10 Положительно определенные квадратичные формы Особую роль теории квадратичных форм играют квадратичные формы от n переменных n X n X g(x) = aij xi xj , i=1 j=1 в которых положительный индекс инерции d+ равен n. Определение 4.25. Квадратичная форма от n переменных называется положительно определенной, если d+ = n. Канонический вид положительно определенной формы g будет следующим g(y) = y12 + y22 + . . . + yn2 , поэтому для любого ненулевого набора y = (y1 , y2 , . . . , yn ) 6= 0 выполняется g(y) > 0, что объясняет выбор названия. Теорема 4.26. Вещественная квадратичная форма положительно определена тогда и только тогда, когда g(x) > 0 для любого ненулевого вектора x. Доказательство. 1. Необходимость. Если квадратичная форма g положительно определена, то ее диагональный вид следующий: g(y) = y12 + y22 + . . . + yn2 , последнее означает, что g(y) > 0 ∀y 6= 0. 2. Достаточность. Пусть для квадратичной формы от n переменных выполняется g(x) > 0 ∀x 6= 0. Приведем форму g к диагональному виду с помощью некоторой замены  y1 = y1 (x) = t11 x1 + t12 x2 + . . . + t1n xn ,    y2 = y2 (x) = t21 x1 + t22 x2 + . . . + t2n xn , ...    yn = yn (x) = tn1 x1 + tn2 x2 + . . . + tnn xn . Для доказательства достаточно показать, что r = d+ = n, где r — ранг, а d+ — положительный индекс инерции квадратичной формы g. Рассмотрим возможные случаи. а). Предположим, что диагональный вид содержит квадратичной формы не содержит отрицательных квадратов, т.е. g(y) = y12 + y22 + . . . + yr2 . 53 Если r < n, то выберем какое-нибудь ненулевое решение α однородной системы n − r уравнений с n переменными  y1 (α) = 0,    y2 (α) = 0, ...    yr (α) = 0. Тогда при x = α 6= 0 имеем g(x) = g(α) = y1 (α)2 + y2 (α)2 + . . . + yr (α)2 = 0, что противоречит положительной определенности g. Следовательно, r = n = d+ . б). Пусть теперь диагональный вид квадратичной формы содержит также отрицательные квадраты: 2 2 − . . . − yr2 , − yk+2 g = y12 + y22 + . . . + yk2 − yk+1 т.е. d− > 0. Выберем какое-нибудь решение α 6= 0 неоднородной системы r уравнений с n переменными   y1 (α) = 0,     y2 (α) = 0,     ...    yk (α) = 0, yk+1 (α) = 1,      yk+2 (α) = 1,     ...    y (α) = 1. r Тогда g(α) = y1 (α)2 +y2 (α)2 +. . .+yk (α)2 −yk+1 (α)2 −yk+2 (α)2 −. . .−yr (α)2 = = −1 − 1 − . . . − 1 = −(r − k) < 0, что противоречит положительной определенности g. Окончательно получаем r = n = d+ . 2 Для положительно определенной квадратичной формы g(x) = n X n X aij xi xj , aij = aji i=1 j=1 54 запишем ее симметрическую матрицу  a11 a12 a a  12 22 A =  .. ..  . . a1n a2n  . . . a1n . . . a2n   . . . . ...   . . . ann В параграфе метод Якоби были введены главные миноры матрицы A ¯ ¯ ¯ a a ... a ¯ 1n ¯ ¯ 11 12 ¯ ¯ ¯ a a ... a ¯ ¯ a11 a12 ¯ 2n ¯ ¯ , . . . , Dn = ¯¯ .12 .22 . D1 = a11 , D2 = ¯¯ .. . . ... ¯¯ = det A. a12 a22 ¯ ¯ .. ¯ ¯ ¯ a1n a2n . . . ann ¯ Теорема (Сильвестра) 4.27. Вещественная квадратичная форма g от n переменных положительно определена тогда и только тогда, когда все ее главные миноры больше нуля. Доказательство. 1. Необходимость. Пусть квадратичная форма g(x) положительно определена, т.е. ∀x 6= 0 g(x) > 0. Покажем, что D1 > 0, D2 > 0, . . . , Dn > 0. Доказательство проведем методом математической индукции по числу переменных n. а). База индукции. При n = 1 квадратичная форма g(x1 ) = a11 x21 имеет один главный минор D1 = a11 . Если для любого x1 6= 0 верно g(x1 ) > 0, то a11 > 0. б). Предположим, что для любой положительно определенной квадратичной формы от n − 1 переменных n − 1 главных миноров положительны. в). Шаг индукции. Пусть g(x1 , x2 , . . . , xn ) — положительно определенная квадратичная форма от n переменных. Рассмотрим h(x1 , x2 , . . . , xn−1 ) = g(x1 , x2 , . . . , xn−1 , 0) квадратичную форму от n − 1 переменных. Если положить не все x1 , x2 , . . . , xn−1 равными нулю, то g(x1 , x2 , . . . , xn−1 , 0) > 0, т.к. квадратичная форма g — положительно определенная, следовательно, h(x1 , x2 , . . . , xn−1 ) — тоже положительно определенная. Для h выполняется предположение индукции. Значит, все главные миноры h положительны. Но все главные миноры D1 , D2 , . . . , Dn−1 для h — те же главные минор D1 , D2 , . . . , Dn−1 для g. Таким образом, получаем, что все главные миноры g, кроме последнего Dn , 55 положительны. Осталось доказать Dn > 0. Если g — положительно определенная, то ее диагональная форма после некоторого преобразования переменных X = T · Y , det T 6= 0, имеет вид g(y) = y12 + y22 + . . . + yn2 . Матрица этого диагонального вида единичная E. Тогда по теореме 4.7 имеем A = t T · E · T = t T · T . Следовательно, последний главный минор Dn = det A = det(t T · T ) = (det T )2 > 0 тоже положителен. 2. Достаточность. Пусть все главные миноры квадратичной формы g положительны D1 > 0, D2 > 0, . . . , Dn > 0, тогда по теореме Якоби существует базис, в котором квадратичная форма записывается в виде g= Dn−1 2 1 2 D1 2 y1 + y2 + . . . + y D1 D2 Dn n и, очевидно, является положительно определенной. 2 4.11 Отрицательно определенные квадратичные формы Пусть f (x, y) — билинейная форма. Определение 4.28. Вещественная квадратичная форма f (x, x) называется отрицательно определенной, если а) f (x, x) 6 0, б) f (x, x) = 0 тогда и только тогда, когда x = 0. Замечание. Квадратичная форма f (x, x) отрицательно определена тогда и только тогда, когда −f (x, x) положительно определена. Теорема (Критерий Сильвестра отрицательной определенности) 4.29. Вещественная квадратичная форма отрицательно определена тогда и только тогда, когда главные миноры чередуют знаки: D1 < 0, D2 > 0, D3 < 0, . . . Доказательство. Квадратичная форма g(x) = n X i,j=1 56 aij xi xj . отрицательно определена тогда и только тогда, когда −g(x) = n X (−aij )xi xj i,j=1 положительно определена. То есть тогда и только тогда, когда по теореме Сильвестра выполняются ¯ ¯ ¯ −a11 −a12 −a13 ¯ ¯ ¯ ¯ ¯ ¯ −a11 −a12 ¯ ¯ > 0, ¯ −a21 −a22 −a23 ¯ > 0, . . . , −a11 > 0, ¯¯ ¯ ¯ −a21 −a22 ¯ ¯ −a31 −a32 −a33 ¯ что эквивалентно D1 < 0, D2 > 0, D3 < 0, . . . 2 Задача. При каком λ следующая квадратичная форма g(x) = 4x21 + 2x1 x2 + 3x22 − 2x1 x3 − 4x2 x3 + λx23 положительно определена? Решение. Составим матрицу нашей квадратичной формы и найдём её угловые миноры:   4 1 −1 A =  1 3 −2  , −1 −2 λ ¯ ¯ ¯4 1¯ ¯ = 11 > 0, D3 = det A = 11λ − 15. D1 = 4 > 0, D2 = ¯¯ 1 3¯ Квадратичная форма g(x) положительно определена тогда и только тогда, когда 11λ − 15 > 0. Ответ. При λ > 5 5.1 15 11 . Евклидовы векторные пространства Определение и примеры евклидовых пространств Всюду в настоящем параграфе в качестве основного поля K берем поле вещественных чисел R. Определение 5.1. Евклидовым векторным пространством называется вещественное векторное пространство V с выделенной на нем симметрической билинейной формой f (x, y) такой, что соответствующая квадратичная форма f (x, x) положительно определена. 57 Обозначение Фиксированную билинейную форму на V будем обозначать f (x, y) = (x, y) и называть скалярным произведением. Немного иначе перепишем определение ¡ ¢ 5.1. Под евклидовым векторным пространством понимается пара V, (∗, ∗) , где V — векторное пространство над R, а (∗, ∗) — фиксированная билинейная форма на V , для которой ∀x, y ∈ V , α ∈ R верны следующие свойства а) (x, y) = (y, x) (симметричность); б) (x1 + x2 , y) = (x1 , y) + (x2 , y), (αx, y) = α(x, y) (линейность); в) ∀x 6= 0 (x, x) > 0, (0, x) = 0 (положительная определенность). Не случайно обозначение для билинейной формы на евклидовом векторном пространстве совпадает с обозначением для скалярного произведения двух векторов. Векторное пространство со стандартным скалярным произведением — частный случай евклидова векторного пространства, см. первый пример. Примеры. 1. Рассмотрим стандартное скалярное произведение на n-мерном векторном пространстве над R. Разложим два вектора x, y ∈ Rn по прямоугольному базису x = x1 e1 +x2 e2 +. . .+xn en , y = y1 e1 +y2 e2 +. . .+yn en , тогда скалярное произведение (x, y) = x1 y1 + x2 y2 + . . . + xn yn удовлетворяет свойствам а–в и, следовательно, задает структуру евклидова векторного пространства на Rn (проверьте это!). 2. Пусть V = R2 , а (x, y) = x1 y1 − 2x1 y2 − 2x2 y1 + 4x2 y2 . Упражнение. Покажите, что V вместе с указанной билинейной формой — евклидово векторное пространство. 3. Пусть V = Rn [x] — вещественное векторное пространство многочленов степени не выше n − 1. В качестве скалярного произведения возьмем Z b (f, g) = f (x)g(x)dx, ∀f, g ∈ Rn [x]. (26) a Упражнение. Покажите, что (26) является скалярным произведением. 5.2 Свойства нормы и скалярного произведения Пусть V — евклидово векторное пространство со скалярным произведением (x, y). 58 Определение 5.2. Длиной или нормой любого вектора x ∈ V называется неотрицательное вещественное число p ||x|| = (x, x). Поскольку по определению евклидова пространства для любого вектора x ∈ V выполняется (x, x) > 0, то определение нормы корректно. Пусть α — вещественное число, тогда p p ||αx|| = (αx, αx) = α2 (x, x) = |α| · ||x||, где |α| — модуль вещественного числа. Теорема (неравенство Коши—Буняковского) 5.3. Для любых векторов x, y евклидова (унитарного) векторного пространства справедливо |(x, y)| 6 ||x|| · ||y||. Доказательство. Пусть λ — произвольное вещественное число. Воспользуемся положительной определенностью скалярного произведения 0 6 (λx − y, λx − y) = (λx, λx) − (λx, y) − (x, λy) + (y, y) = = λ2 (x, x) − 2λ(x, y) + (y, y). Для фиксированных x и y на f (λ) = λ2 (x, x) − 2λ(x, y) + (y, y) можно смотреть как на квадратный трехчлен с переменной λ. Так как f (λ) > 0 для любых λ, то его дискриминант должен быть неположительным: ¢2 ¡ D = 2(x, y) − 4(x, x)(y, y) 6 0, откуда (x, y)2 6 (x, x)(y, y). Извлекая квадратный корень из обеих частей последнего неравенства, получим p p |(x, y)| 6 (x, x) (y, y) = ||x|| · ||y||. 2 Замечание. Если |(x, y)| = ||x|| · ||y||, то D = 0 и квадратный трехчлен имеет единственный корень λ0 . Тогда 0 = (λ0 x − y, λ0 x − y) = f (λ), следовательно, по свойству в) в определении евклидова пространства имеем λ0 x − y = 0, откуда λ0 x = y. Таким образом, лишь для коллинеарных векторов их скалярное произведение по абсолютной величине равно произведению их длин. 59 Следствие 5.4. Для любых вещественных чисел xi , yi , i = 1, 2, . . . , n, имеет место неравенство v ¯ n ¯ v u n n ¯X ¯ u X uX ¯ ¯ u xi y i ¯ 6 t x2i · t yi2 . (27) ¯ ¯ ¯ i=1 i=1 i=1 Доказательство. В качестве евклидова векторного пространства рассмотрим n-мерное векторное пространство над R со стандартным скалярным произведением (x, y) = x1 y1 + x2 y2 + . . . + xn yn . В этом евклидовом пространстве неравенство Коши—Буняковского примет вид (27). 2 Следствие 5.5. Для любых двух многочленов f (t), g(t) на отрезке [a, b] имеет место неравенство s ¯Z b ¯ sZ b Z b ¯ ¯ 2 ¯ f (t)g(t)dt¯ 6 f (t) dt · g(t)2 dt. (28) ¯ ¯ a a a Доказательство. Достаточно записать неравенство Коши—Буняковского для векторного пространства Rn [x] и скалярного произведения (26). 2 Замечание. Можно показать, что неравенство (28) также выполняется для любых непрерывных функций на отрезке [a, b]. Неравенство Коши—Буняковского означает −1 6 (x, y) 6 1. ||x|| · ||y|| (x, y) является косинусом вполне определенного угТогда отношение ||x|| · ||y|| ла ϕ: (x, y) cos ϕ = , 0 6 ϕ 6 π. ||x|| · ||y|| Именно этот угол ϕ и считается, по определению, углом между векторами x и y. Определение 5.6. Векторы x и y называются ортогональными, если угол между ними равен π/2 или, другими словами, если (x, y) = 0. Нулевой вектор ортогонален любому вектору. Обозначение ортогональных векторов: x ⊥ y. 60 Утверждение (Теорема Пифагора) 5.7. Если вектора x и y ортогональные, то ||x + y||2 = ||x||2 + ||y||2 . Доказательство. Если x ⊥ y, то (x, y) = (y, x) = 0, тогда ||x + y||2 = (x + y, x + y) = (x, x) + (x, y) + (y, x) + (y, y) = = (x, x) + (y, y) = ||x||2 + ||y||2 . 2 Утверждение (Неравенство треугольника) 5.8. ||x ± y|| 6 ||x|| + ||y||. Доказательство. Применим неравенство Коши—Буняковского: ||x ± y||2 = (x ± y, x ± y) = (x, x) ± (x, y) ± (y, x) + (y, y) = = (x, x) ± 2(x, y) + (y, y) 6 (x, x) + 2|(x, y)| + (y, y) 6 6 (x, x) + 2||x|| · ||y|| + (y, y) = ||x||2 + 2||x|| · ||y|| + ||y||2 = (||x|| + ||y||)2 . Извлекаем корень из положительных чисел, получаем ||x ± y|| 6 ||x|| + ||y||. 2 5.3 Ортогонализация базиса Определение 5.9. Базис (e1 , e2 , . . . , en ) евклидова векторного пространства называется ортогональным, если для любых i, j = 1, 2, . . . , n выполняется (ei , ej ) = 0. Другими словами, базис ортогонален, если все вектора попарно ортогональны. Определение 5.10. Базис (e1 , e2 , . . . , en ) евклидова векторного пространства называется ортонормированным, если он ортогонален и для любого i = 1, 2, . . . , n выполняется ||ei || = 1. Пример ортонормированного базиса в n-мерном векторном пространстве со стандартным скалярным произведением: e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1). Если имеется ортогональный базис (e1 , e2 , . . . , en ), то из него легко сделать ортонормированный, применяя процедуру нормирования векторов базиса. Для этого каждый вектор ei заменяется на следующий вектор 1 e0i = ei . ||ei || 61 Действительно, длина нового вектора равна 1: ¯¯ ¯¯ ¯¯ ¯ ¯ 1 1 ||e0i || = ¯¯¯¯ ei ¯¯¯¯ = ||ei || = 1. ||ei || ||ei || Утверждение 5.11. Любые ненулевые взаимно ортогональные векторы (e1 , e2 , . . . , en ) линейно независимы. Если при этом их число n равно размерности dim V векторного пространства V , то они образуют ортогональный базис. Доказательство. Покажем, что ортогональные векторы (e1 , e2 , . . . , en ) линейно независимы. Предположим, что α1 e1 + α2 e2 + . . . + αn en = 0 для некоторых чисел αi . Пусть не все αi равны нулю. Для определенности предположим α1 6= 0. Умножим скалярно на e1 обе части равенства и воспользуемся ортогональностью (ei , e1 ) = 0 ∀i 6= 1: 0 = (0, e1 ) = (α1 e1 + α2 e2 + . . . + αn en , e1 ) = = α1 (e1 , e1 ) + α2 (e2 , e1 ) + . . . + αn (en , e1 ) = α1 (e1 , e1 ). Вектор e1 очевидно ненулевой, поэтому α1 = 0. Получили противоречие, значит вектора (e1 , e2 , . . . , en ) линейно независимы. Второе утверждение очевидно следует из первого. 2 Теорема 5.12. Во всяком n-мерном евклидовом пространстве есть ортонормированные базисы. Доказательство. Скалярное произведение (x, y) по определению задает на V положительно определенную квадратичную форму g(x) = (x, x) = ||x||2 . Поэтому для нее, как для всякой положительно определенной формы, существует (см. раздел 4.10) базис (e1 , e2 , . . . , en ) пространства V , в котором она записывается в каноническом виде g(x) = x21 + x22 + . . . + x2n для вектора x = x1 e1 + x2 e2 + . . . + xn en . Соответствующее скалярное произведение будет следующим (x, y) = x1 y1 + x2 y2 + . . . + xn yn . Но в этом случае (ei , ej ) = 0 при i 6= j и (ei , ei ) = 1, т.е. (e1 , e2 , . . . , en ) — ортогональный (а здесь даже ортонормированный) базис. 2 62 Замечание. В ортонормированном базисе (e1 , e2 , . . . , en ) координаты вектора x = x1 e1 + x2 e2 + . . . + xn en можно вычислить так: (x, ei ) = xi . Другими словами, скалярное произведение вектора x на базисный вектор ei ортонормированного базиса можно понимать как проекцию вектора x на прямую, параллельную вектору ei . Т.е. координаты вектора x в ортонормированном базисе — проекции x на «оси координат». Опишем процесс построения ортонормированного базиса, эта процедура называется ортогонализацией Грама—Шмидта. Пусть V — евклидово векторное пространство. Фиксируем вектор v ∈ V . Рассмотрим множество всех векторов, ортогональных v. Очевидно если x ⊥ v, y ⊥ v, т.е. (x, v) = 0 и (y, v) = 0, то (x+y, v) = 0, значит (x+y) ⊥ v. Аналогично, если x ⊥ v, то (αx) ⊥ v для любого α ∈ R. Таким образом, множество векторов, ортогональных v образует линейное пространство. Определение 5.13. Линейное пространство всех векторов, ортогональных данному вектору v, называется ортогональным дополнением к v. Говорят, что вектор v ортогонален подпространству U ⊂ V в евклидовом пространстве V , если v ⊥ u для любого u ∈ U . Вектор v ортогонален подпространству U (обозначается v ⊥ U ) тогда и только тогда, когда v ⊥ ei ∀i = 1, 2, . . . , m, где (e1 , e2 , . . . , em ) — базис U . Напомним, линейной оболочкой системы векторов (e1 , e2 , . . . , em ) называется линейное пространство L = he1 , e2 , . . . , em i, содержащее все возможные линейные комбинации векторов e1 , e2 , . . . , em : L = {α1 e1 + α2 e2 + . . . + αm em : αi ∈ R}. Теорема (процесс ортогонализации Грама—Шмидта) 5.14. Пусть (e1 , e2 , . . . , em ) — система из m линейно независимых векторов векторного пространства V . Тогда существует ортонормированная система векторов (e01 , e02 , . . . , e0m ) такая, что линейные оболочки L = he1 , e2 , . . . , em i и L0 = he01 , e02 , . . . , e0m i совпадают. Доказательство проведем по индукции по числу векторов m. 1. База индукции. Возьмем в качестве e01 вектор λe1 , где λ = 1/||e1 ||, тогда ||e01 || = 1. Очевидно L1 = he1 i = he01 i = L01 . 2. Предположим, что для некоторого k линейно независимую систему векторов (e1 , e2 , . . . , ek ) можно ортогонализировать, т.е. существует ортонормированная система векторов (e01 , e02 , . . . , e0k ), такая, что Lk = he1 , e2 , . . . , ek i = he01 , e02 , . . . , e0k i = L0k . 63 3. Шаг индукции. Рассмотрим линейно независимую систему векторов (e1 , e2 , . . . , ek+1 ). Пусть вектора e1 , e2 , . . . , ek уже прошли процесс ортогонализации и найденные (e01 , e02 , . . . , e0k ) образуют ортонормированную систему, Lk = L0k . Вектор ek+1 не может содержаться в Lk = L0k , так как иначе ek+1 линейно выражался бы через (e1 , e2 , . . . , ek ), что невозможно в силу линейной независимости системы (e1 , e2 , . . . , ek+1 ). Обозначим v = ek+1 − λ1 e01 − λ2 e02 − . . . − λk e0k с произвольными числами λ1 , λ2 , . . . , λk . Постараемся подобрать числа λi так, чтобы вектор v был ортогонален L0k , т.е. был ортогонален всем векторам (e01 , e02 , . . . , e0k ). Для этого необходимо и достаточно выполнение условий 0 = (v, e0j ) = (ek+1 − λ1 e01 − λ2 e02 − . . . − λk e0k , e0j ) = = (ek+1 , e0j ) − λ1 (e01 , e0j ) − λ2 (e02 , e0j ) − . . . − λk (e0k , e0j ) = = (ek+1 , e0j ) − λj , так как (e01 , e02 , . . . , e0k ) — ортонормированная система. Получаем, что при λj = (ek+1 , e0j ) для любого j = 1, 2, . . . , k вектор v ортогонален системе (e01 , e02 , . . . , e0k ), т.е. ортогонален L0k . Таким образом, вектора (e01 , e02 , . . . , e0k , v) образуют ортогональную систему векторов. Для того, чтобы получить ортонормированную систему, достаточно нормировать вектор v, обозначим e0k+1 = 1 v. ||v|| Тогда система векторов (e01 , e02 , . . . , e0k , e0k+1 ) является ортонормированной. 2 Следствие 5.15. Всякая ортонормированная система векторов евклидова векторного пространства V дополняется до ортонормированного базиса V . Доказательство. Пусть dim V = n. Ранее мы показывали, что произвольную линейно независимую систему векторов (e1 , e2 , . . . , em ) можно дополнить до базиса (e1 , e2 , . . . , em , em+1 , . . . , en ). Пусть система векторов (e1 , e2 , . . . , em ) ортонормированная, тогда для построения ортонормированного базиса достаточно применить процесс ортогонализации к векторам em+1 , . . . , en , не затрагивая вектора e1 , e2 , . . . , em . 2 64 Если требуется найти ортогональный базис без нормирования длин векторов, можно воспользоваться следующими формулами e01 = e1 , e0j (e01 , ej ) 0 (e02 , ej ) 0 (e0m , ej ) 0 = ej − 0 0 e1 − 0 0 e2 − . . . − 0 0 em (j = 2, . . . , m). (e1 , e1 ) (e2 , e2 ) (em , em ) Пример нахождения ортогонального базиса. Пусть V = дартным скалярным произведением, U = he1 , e2 , e3 , e4 i, где        1 −1 −1 2       , e1 =  3  , e1 =  2  , e1 =  e1 =  0  3   8   1 1 −3 R4 со стан −1 6  . 16  7 Будучи подпространством в V , U само является евклидовым пространством. Найдем ортогональный базис U . Для этого заметим, что dim U = 3 и векторы e1 , e2 , e3 образуют базис U (это можно найти, вычислив ранг матрицы, составленной из этих 4 векторов). Применим к линейно независимым векторам e1 , e2 , e3 процедуру ортогонализации Грама—Шмидта.     −2 1  1  2 (e01 , e2 ) 0    e1 = e1 =   , e2 = e2 − 0 0 e1 =   3 , (e1 , e1 ) 1   3  0  (e01 , e3 ) 0 (e02 , e3 ) 0  e3 = e3 − 0 0 e1 − 0 0 e2 =   2 . (e1 , e1 ) (e2 , e2 ) −3 Легко убедиться, что e01 , e02 , e03 —ортогональный базис U . 5.4 Ортогональное дополнение Определение 5.16. Множество всех векторов x ∈ V , ортогональных подпространству U ⊂ V , есть подпространство U ⊥ , которое называется ортогональным дополнением к U . Упражнение. Покажите, что ортогональное дополнение действительно является линейным подпространством. Напомним определение прямой суммы линейных пространств. Сумма U + W линейных подпространств U, W ⊂ V называется прямой (обозначается U ⊕W ), если любой элемент v ∈ V единственным образом представим в виде v = u+w, u ∈ U , w ∈ W . Мы показывали, что сумма U +W прямая тогда и только тогда, когда U ∩ W = {0}. 65 Теорема 5.17. Пусть U — подпространство евклидова векторного пространства V , а U ⊥ — его ортогональное дополнение. Тогда V = U ⊕ U ⊥ и U ⊥⊥ = U . Доказательство. Выберем в U какой-нибудь ортонормированный базис (e1 , e2 , . . . , em ). Пусть w ∈ V . Рассмотрим вектор v = w − (w, e1 )e1 − (w, e2 )e2 − . . . − (w, em )em . Так как ¡ ¢ (v, ej ) = w − (w, e1 )e1 − (w, e2 )e2 − . . . − (w, em )em , ej = = (w, ej ) − (w, e1 )(e1 , ej ) − (w, e2 )(e2 , ej ) − . . . − (w, em )(em , ej ) = = (w, ej ) − (w, ej ) = 0 ∀j = 1, 2, . . . , m, то вектор v ортогонален подпространству U , т.е. v ∈ U ⊥ . Это значит, что w = u + v, где u = (w, e1 )e1 + (w, e2 )e2 + . . . + (w, em )em ∈ U , v ∈ U ⊥ . Итак, V = U + U ⊥. Покажем, что сумма U + U ⊥ — прямая. Пусть x ∈ U ∩ U ⊥ . Так как x ∈ U , то для любого вектора y ∈ U ⊥ по определению ортогональности имеем (x, y) = 0. Но поскольку x ∈ U ⊥ , то можно взять y = x, тогда (x, x) = 0. Из пункта в) определения евклидова пространства получаем x = 0. Значит U ∩ U ⊥ = {0} и V = U ⊕ U ⊥ . Осталось показать U ⊥⊥ = U . Произвольный вектор w ∈ V единственным образом раскладывается в сумму w = u + v, где u ∈ U , v ∈ U ⊥ . Имеем (w, u) = (u + v, u) = (u, u) + (v, u) = ||u||2 , так как u ⊥ v. Аналогично (w, v) = ||v||2 . Если предположить w ∈ U ⊥⊥ , т.е. w ортогонален U ⊥ , то (w, v) = 0, поскольку v ∈ U ⊥ . Тогда (w, v) = ||v||2 = 0. Значит v = 0 и w = u ∈ U . Получили U ⊥⊥ ⊂ U . Для того, чтобы показать обратное вложение, достаточно заметить, что U ⊥⊥ = (U ⊥ )⊥ — подпространство, ортогональное U ⊥ и все вектора из U ортогональны U ⊥ , значит U ⊂ (U ⊥ )⊥ . Из вложений U ⊥⊥ ⊂ U и U ⊂ U ⊥⊥ следует U = U ⊥⊥ . 2 Задача. Представить вектор x = (−7, 2, 1, 6) в виде суммы x = y + z, где y принадлежит подпространству W , натянутому на векторы a1 = (1, 2, −1, 1), a2 = (3, 1, 0, −1), a3 = (1, −3, 2, −3), а вектор z ортогонален W. Решение. Выясним образуют ли векторы a1 , a2 , a3 базис W . Для этого составим из них матрицу и вычислим её ранг: 66    1 2 −1 1 1 2 −1 1  3 1 0 −1  ∼  0 −5 3 −4  . 0 −5 3 −4 1 −3 2 −3  Ранг матрицы равен 2. Первые два вектора образуют базу в системе строк этой матрицы. Система {a1 , a2 } — базис W . Будем искать вектор y в виде y = y1 a1 + y2 a2 . Отсюда z = x − y = x − y1 a1 − y2 a2 . Так как вектор z ортогонален W , то ½ (z, a1 ) = (x − y1 a1 − y2 a2 , a1 ) = (x, a1 ) − y1 (a1 , a1 ) − y2 (a2 , a1 ) = 0 (z, a2 ) = (x − y1 a1 − y2 a2 , a2 ) = (x, a2 ) − y1 (a1 , a2 ) − y2 (a2 , a2 ) = 0 Получаем систему уравнения для нахождения y1 и y2 : ½ 2 − 7y1 − 4y2 = 0 −25 − 4y1 − 11y2 = 0 Эта система уравнений имеет единственное решение y1 = 2, y2 = −3. Получаем y = y1 a1 + y2 a2 = 21 a1 − 3a2 = (−7, 1, −2, 5) и z = x − y = (0, 1, 3, 1). Ответ. y = (−7, 1, −2, 5), z = (0, 1, 3, 1). Контрольные вопросы и задачи 1. Доказать, что формула (X, Y ) = tr X t Y определяет стандартное скалярное произведение на линейном пространство Mat(n, R). 2. Пусть V = Mat(n, R), а W = Sym(n, R) — подпространство симметрических матриц. Доказать, что ортогональное дополнение к W относительно скалярного произведения из пункта 1 совпадает с подпространством кососимметрических матриц Skew(n, R). Отсюда вытекает Mat(n, R) = Sym(n, R) ⊕ Skew(n, R). 3. Пусть V = Mat(n, R) и W = T(n, R) — подпространство верхнетреугольных матриц. Найти W ⊥ . 5.5 Ортогональные матрицы В евклидовом векторном пространстве V ортонормированные базисы играют особую роль, поэтому естественно изучить, как выглядят формулы перехода от одного ортонормированного базиса (e1 , e2 , . . . , en ) к другому (e01 , e02 , . . . , e0n ). 67 Как обычно, выразим вектора второго базиса через первый:  0 e = a11 e1 + a21 e2 + . . . + an1 en ,    10 e2 = a12 e1 + a22 e2 + . . . + an2 en , ...    0 en = a1n e1 + a2n e2 + . . . + ann en . Получим матрицу перехода (29)  a11 · · · a1n A =  ... . . . ...  , an1 · · · ann  где столбец j — координаты e0j , разложенного по базису (e1 , e2 , . . . , en ). Ранее было показано, что det A 6= 0. Воспользуемся ортонормированностью базисов, т.е. тем, что (ei , ej ) = 0 при i 6= j и (ei , ei ) = 1 и аналогичными равенствами для второго базиса: δij = (e0i , e0j ) = (a1i e1 + a2i e2 + . . . + ani en , a1j e1 + a2j e2 + . . . + anj en ) = Ã n ! n X n n n X X X X aki alj (ek , el ) = = aki ek , alj el = aki akj . k=1 k=1 l=1 l=1 k=1 Здесь δij — привычное обозначение символа Кронекера (δij = 0 при i 6= j и δii = 1). Итак, столбцы матрицы A образуют ортонормированный базис, a1i a1j + a2i a2j + . . . + ani anj = 0, если i 6= j; a21i + a22i + . . . + a2ni = 1. (30) Эти соотношения можно записать короче в матричном виде: t A · A = E. (31) Откуда имеем, что обратная к матрице перехода совпадает с транспонированной матрицей: A−1 = t A. Так как A−1 A = E и A · A−1 = E, то A · t A = E, (32) ai1 aj1 + ai2 aj2 + . . . + ain ajn = 0, если i 6= j; a2i1 + a2i2 + . . . + a2in = 1. (33) что приводит к соотношениям Получилось, что строки матрицы A тоже образуют ортонормированный базис. Определение 5.18. Квадратная матрица A = (aij )i,j=1,n , удовлетворяющая одному из эквивалентных условий (30), (31), (32), (33) называется ортогональной. 68 Обозначение множества ортогональных матриц порядка n — O(n). Если A — ортогональная матрица, то система векторов (e01 , e02 , . . . , e0n ), полученная из ортонормированного базиса (e1 , e2 , . . . , en ) по формулам (29), также будет ортонормированным базисом. Таким образом, была доказана Теорема 5.19. Матрица перехода от одного ортонормированного базиса к другому ортонормированному базису ортогональная, и всякая ортогональная матрица может быть получена благодаря такому переходу. Из формул перехода и условия ортонормированности получается геометрическая интерпретация элементов aij ортогональной матрицы перехода. В частности, aij = (ei , e0j ) (ei , e0j ) = = cos ϕij , ||ei || · ||e0j || где ϕij — угол между старым базисным вектором ei и новым базисным вектором e0j . Перейдем к определителям в равенстве (31), получим 1 = det E = det(t A · A) = det t A · det A = (det A)2 , откуда det A = 1 или det A = −1. Следствие 5.20. Определитель ортогональной матрицы равен ±1. Мы ранее говорили, что если разложить вектор x по обоим базисам x = x01 e01 + x02 e02 + . . . + x0n e0n , x = x1 e 1 + x2 e 2 + . . . + xn e n , то формулы преобразования координат векторов будут следующие xi = ai1 x01 + ai2 x02 + . . . + ain x0n , i = 1, 2, . . . , n. Но теперь известно A−1 = t A, поэтому можно легко записать формулы обратной замены координат: xi = a1i x1 + a2i x2 + . . . + ani xn , 5.6 i = 1, 2, . . . , n. Линейные формы в евклидовом пространстве Рассмотрим пространство V ∗ , сопряженное к евклидову векторному пространству V над полем R, см. параграф 4.2. Пространство V ∗ состоит из линейных форм f : V → R. Пусть (∗, ∗) — скалярное произведение на V . Фиксируем вектор v ∈ V и рассмотрим линейную форму fv ∈ V ∗ , ставящую в соответствии произвольному вектору x ∈ V число по правилу fv (x) = (v, x). 69 Если (e1 , e2 , . . . , en ) — произвольный базис евклидова векторного пространства V , то для него существует дуальный базис (e1 , e2 , . . . , en ) пространства V ∗ и ½ 1 при i = j, ei (ej ) = δij = (i, j = 1, 2, . . . , n). 0 при i 6= j Теорема 5.21. Отображение f : V → V ∗ , v 7→ fv , задает биекцию линейных векторных пространств V и V ∗ . При этом ортонормированный базис (e1 , e2 , . . . , en ) евклидова векторного пространства V отождествляется с дуальным к нему базисом (e1 , e2 , . . . , en ) пространства V ∗ . Доказательство. Сначала покажем, что отображение f : V → V ∗ линейно, для этого воспользуемся линейностью скалярного произведения: fu+v (x) = (u + v, x) = (u, x) + (v, x) = fu (x) + fv (x), fλv (x) = (λv, x) = λ(v, x) = λfv (x), т.е. линейная комбинация векторов переходит при отображении f в линейную комбинацию линейных форм, fu+v = fu + fv и fλv = λfv . Для доказательства того, что f — биекция, нужно показать, что f — инъекция и сюръекция. Покажем сначала, что Ker(f ) = {0}. Действительно, если v ∈ Ker(f ), то fv (x) = (v, x) = 0 для любого вектора x ∈ V , в частности, для x = v. Получаем (v, v) = 0, из определения скалярного произведения имеем v = 0. Значит Ker(f ) = {0}, т.е. отображение f — инъективно. Как и любой элемент сопряженного векторного пространства V ∗ , линейная форма fv может быть выражена через базис (e1 , e2 , . . . , en ) пространства V ∗ . Разложим по базису линейные формы, построенные по базисным векторам (e1 , e2 , . . . , en ) пространства V : fei = ai1 e1 + ai2 e2 + . . . + ain en , i = 1, 2, . . . , n. Наша цель — найти коэффициенты aij . Воспользуемся ортонормированностью базиса (e1 , e2 , . . . , en ), для любых i = 1, 2, . . . , n имеем δij = (ei , ej ) = ai1 e1 (ej ) + ai2 e2 (ej ) + . . . + ain en (ej ) = = ai1 δj1 + ai2 δj2 + . . . + ain δjn = aij . Таким образом, aij = 0, если i 6= j и aii = 1. Отсюда получаем fei = ei . Поскольку каждый базисный вектор ei пространства V ∗ имеет прообраз ei при отображении f , то f — сюръекция. Таким образом, f — биекция векторных пространств V и V ∗ , а соотношение fei = ei отождествляет соответствующие базисы V и V ∗ . 2 70 Итак, в евклидовом векторном пространстве V каждый вектор v ∈ V можно рассматривать как линейную форму v : V → R. При таком отождествлении ортонормированный базис в V является своим собственным дуальным базисом. 5.7 Сопряженные операторы Пусть V — евклидово пространство над полем R со скалярным произведением (x, y) а V ∗ — сопряженное к нему пространство, состоящее из линейных форм на V . В предыдущем параграфе мы говорили, что произвольную линейную форму f можно задать так f (x) = (v, x) для некоторого вектора v, другими словами, линейную форму f можно отождествлять с вектором v. Пусть ϕ : V → V — линейный оператор на V . Для линейной формы f : V → R из V ∗ рассмотрим отображение ¢ ¡ ¢ ¡ f, ϕ(x) = f ϕ(x) , ¡ ¢ ставящее в соответствии вектору x ∈ V число f ϕ(x) . Это отображение снова является линейной формой, чтобы показать это, проверим два свойства: ¢ ¡ ¢ ¡ ¢ ¡ f, ϕ(x + y) = f ϕ(x + y) = f ϕ(x) + ϕ(y) = ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ = f ϕ(x) + f ϕ(y) = f, ϕ(x) + f, ϕ(y) , ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ f, ϕ(λx) = f ϕ(λx) = f λϕ(x) = λf ϕ(x) = λ f, ϕ(x) . Раз так, мы можем положить ¡ ∗ ¢ ¡ ¢ ϕ (f ), x := f, ϕ(x) , считая символ ϕ∗ (f ) некоторой линейной функцией на V . Отображение ϕ∗ : V ∗ → V ∗ , ставящее в соответствие линейной форме f линейную форму ϕ∗ (f ), также является линейным. Проверим это, пусть f, g : V → R — линейные формы, а λ — число, тогда ¡ ∗ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ϕ (f + g), x = f + g, ϕ(x) = (f + g) ϕ(x) = f ϕ(x) + g ϕ(x) = ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ = f, ϕ(x) + g, ϕ(x) = ϕ∗ (f ), x + ϕ∗ (g), x = ϕ∗ (f ) + ϕ∗ (g), x , ¡ ∗ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ϕ (λf ), x = λf, ϕ(x) = (λf ) ϕ(x) = λf ϕ(x) = ¡ ¢ ¡ ¢ ¡ ¢ = λ f, ϕ(x) = λ ϕ∗ (f ), x = λϕ∗ (f ), x . Таким образом, ϕ∗ (f +g) = ϕ∗ (f )+ϕ∗ (g) и ϕ∗ (λf ) = λϕ∗ (f ), следовательно, ϕ∗ ∈ L(V ∗ , V ∗ ) — линейный оператор. Определение 5.22. Линейный оператор ϕ∗ на ¡ ¢ сопряженном ¡ ¢ пространст∗ ∗ ве V , определяемый соотношением ϕ (f ), x := f, ϕ(x) , называется сопряженным к оператору ϕ ∈ L(V, V ). 71 Итак, мы построили отображение L(V, V ) → L(V ∗ , V ∗ ), ставящее в соответствие произвольному линейному оператору ϕ сопряженный линейный оператор ϕ∗ . Свойства сопряженного оператора 1. Сопряженный к нулевому оператору o(x) = 0, ∀x ∈ V , — нулевой оператор на V ∗ , т.е. o∗V = oV ∗ . 2. Сопряженный к тождественному оператору ε(x) = x, ∀x ∈ V , — тождественный оператор на V ∗ , т.е. ε∗V = εV ∗ . 3. (λϕ)∗ = λϕ∗ . 4. (ϕ + ψ)∗ = ϕ∗ + ψ ∗ . 5. (ϕψ)∗ = ψ ∗ ϕ∗ . Доказательство. Покажем свойство 1. Возьмем произвольные линейную форму f , получим, что линейная форма o∗ (f ) переводит произвольный вектор x в нулевой: ¡ ∗ ¢ ¡ ¢ o (f ), x = f, o(x) = (f, 0) = 0. Покажем свойство 3. Для любого f ∈ V ∗ имеем ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ (λϕ)∗ (f ), x = f, (λϕ)(x) = λ f, ϕ(x) = λ ϕ∗ (f ), x = λϕ∗ (f ), x . Также докажем 5. ¢ ¡ ¢ ¡ ¢ ¡ (ϕψ)∗ (f ), x = f, (ϕψ)(x) = f, ϕ(ψ(x)) = ¡ ¢ ¡ ¢ ¡ ¢ = ϕ∗ (f ), ψ(x) = ψ ∗ (ϕ∗ (f )), x = ψ ∗ ϕ∗ (f ), x . 2 Упражнение. Докажите свойства 2 и 4. Предположим, что в некотором базисе (e1 , e2 , . . . , en ) векторного пространства V оператор ϕ задается матрицей A = (aij )i,j=1,n , т.е. ϕ(ej ) = a1j e1 + a2j e2 + . . . + anj en , j = 1, 2, . . . , n. Пусть (e1 , e2 , . . . , en ) — базис двойственного пространства V ∗ , дуальный к базису (e1 , e2 , . . . , en ). Тогда ¡ i ¢ e , ϕ(ej ) = (ei , a1j e1 + a2j e2 + . . . + anj en ) = = (a1j (ei , e1 ) + a2j (ei , e2 ) + . . . + anj (ei , en ) = aij (ei , ei ) = aij . Разложим линейные формы ϕ∗ (ei ) по базису с некоторыми коэффициентами a∗ij : ϕ∗ (ei ) = a∗1i e1 + a∗2i e2 + . . . + a∗ni en , 72 i = 1, 2, . . . , n. Найдем коэффициенты a∗ij , для этого вычислим ¡ ∗ i ¢ ¡ ¢ ϕ (e ), ej = a∗1i e1 + a∗2i e2 + . . . + a∗ni en , ej = = a∗1i (e1 , ej ) + a∗2i (e2 , ej ) + . . . + a∗ni (en , ej ) = a∗ji (ej , ej ) = a∗ji . С другой стороны, по определению сопряженного линейного оператора получаем ¡ ∗ i ¢ ¡ ¢ ϕ (e ), ej = ei , ϕ(ej ) = aij , следовательно, a∗ji = aij . Таким образом, была доказана Теорема 5.23. Если в базисе (e1 , e2 , . . . , en ) пространства V линейный оператор ϕ имеет матрицу A = (aij )i,j=1,n , то в дуальном базисе (e1 , e2 , . . . , en ) пространства V ∗ сопряженный к ϕ оператор ϕ∗ имеет транспонированную матрицу t A, т.е. A∗ = (a∗ij )i,j=1,n = (aji )i,j=1,n = t A. Утверждение 5.24. ϕ∗∗ = ϕ. Доказательство. Если линейная форма f определяется вектором v, т.е. f (x) = (v, x) для любого x ∈ V , то ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ∗∗ ϕ (f ), x = ϕ∗∗ (v), x = v, ϕ∗ (x) = ϕ∗ (x), v = ¡ ¢ ¡ ¢ ¡ ¢ = x, ϕ(v) = ϕ(v), x = ϕ(f ), x . Поскольку вектор x может быть выбран произвольно, то линейные формы ϕ∗∗ (f ) и ϕ(f ) совпадают для любого f ∈ V ∗ , последнее означает ϕ∗∗ = ϕ. 2 Задача 1. Пусть линейный оператор ϕ : V → V имеет в базисе (e01 , e02 ) векторного пространства V матрицу µ ¶ 1 0 A = . −1 2 Найдите матрицу сопряженного оператора в базисе (e01 , e02 ), если ½ 0 e1 = 2e1 − 3e2 , e02 = −3e1 + 2e2 , где (e1 , e2 ) — какой-нибудь ортонормированный базис V . Решение. Сначала заметим, что (e01 , e02 ) = (e1 , e2 )T , где µ ¶ 2 −3 T = −3 4 есть матрица перехода. Значит в ортонормированном базисе (e1 , e2 ) оператор ϕ задается матрицей µ ¶ −2 −3 0 −1 A = TA T = , 4 5 73 тогда матрица сопряженного оператора ϕ∗ в ортонормированном базисе будет следующей µ ¶ −2 4 B = tA = . −3 5 Осталось найти матрицу сопряженного оператора ϕ∗ в базисе (e01 , e02 ): µ ¶ 127 −166 B 0 = T −1 BT = . 90 −124 Задача 2. Пусть линейный оператор ϕ : V → V имеет в базисе (e1 , e2 ) векторного пространства V матрицу µ ¶ −1 1 . A= 0 3 Найдите матрицу сопряженного оператора в базисе (e1 , e2 ), если в том же базисе скалярное произведение задано билинейной формой (x, y) = 2x1 y1 − 3x1 y2 − 3x2 y1 + 5x2 y2 . Решение. Запишем матрицу билинейной формы в базисе (e1 , e2 ): µ ¶ 2 −3 S= . −3 5 Очевидно, что t S = S, т.е. перед нами симметрическая билинейная форма. Угловые миноры матрицы S положительны: ¯ ¯ ¯ 2 −3 ¯ ¯ = 1 > 0. D1 = 2 > 0, D2 = ¯¯ −3 5 ¯ Значит по критерию Сильвестра билинейная форма положительно определена. Таким образом, наша билинейная форма ¶µ ¶ µ ¡ ¢ y1 2 −3 t (x, y) = x Sy = x1 x2 −3 5 y2 действительно является скалярным произведением. Пусть B — матрица сопряженного оператора ϕ∗ базисе (e1 , e2 ). Тогда ¡ ¢ ϕ(x), y = (Ax, y) = (Ax)t Sy = xt At Sy, ¢ ¡ x, ϕ∗ (y) = (x, By) = xt S(By). ¡ ¢ ¡ ¢ Поскольку ϕ(x), y = x, ϕ∗ (y) , получаем xt At Sy = xt S(By) для любых векторов x, y, значит At S = SB, откуда следует µ ¶ −52 85 −1 t B=S AS= . −33 54 74 5.8 Самосопряженные операторы Пусть V — евклидово пространство и ϕ — линейный оператор в V . Определение 5.25. Оператор ϕ называется самосопряженным, если ϕ = ϕ∗ . Утверждение 5.26. Линейный оператор самосопряженный, если его матрица в некотором (произвольном) ортонормированном базисе симметрическая. Доказательство. Оператор однозначно определяется своей матрицей, поэтому ϕ = ϕ∗ тогда и только тогда, когда Aϕ = Aϕ∗ . Поскольку базис ортонормированный, то по теореме 5.23 имеем Aϕ∗ = t Aϕ . Следовательно, Aϕ = t Aϕ . Последнее означает, что Aϕ симметрическая матрица. 2 Пример. Матрица   4 2 −1 A =  2 7 −2  −1 −2 4 задает самосопряженный оператор ϕ(x) = AX в евклидовом пространстве Rn со стандартным скалярным произведением. (Напомним, что X — вектор x, записанный в виде столбца.) Утверждение 5.27. Пусть ϕ — самосопряженный оператор, x и y — собственные векторы с собственными значениями λ и µ соответственно. Если λ 6= µ, то x ⊥ y. Доказательство. Пусть x и y собственные векторы с собственными значениями λ и µ соответственно, т.е. ϕ(x) = λx, x 6= 0, ϕ(y) = µy, y 6= 0. Тогда ¡ ¢ ¡ ¢ ¡ ¢ (λx, y) = ϕ(x), y = x, ϕ∗ (y) = x, ϕ(y) = (x, µy), λ(x, y) = µ(x, y), (λ − µ)(x, y) = 0. Так как λ 6= µ, то (x, y) = 0, т.е. вектора x и y перпендикулярны: x ⊥ y. 2 Лемма 5.28. Если A — вещественные симметрическая матрица, то все корни характеристического многочлена det(A − λE) — вещественные числа. 75 Доказательство. Пусть α — комплексный корень характеристического многочлена det(A − λE), значит α — собственное число оператора, определяемого матрицей A. Как и ранее, обозначим через   x1 x   2  X =  ..   .  xn ненулевой комплексный столбец — решение уравнения AX = αX. Пусть   x1 x   2  X =  ..   .  xn есть комплексно сопряженный столбец к X. Возьмем комплексное сопряжение от левой и правой частей уравнения AX = αX. Так как матрица A вещественная и A = A, то AX = αX. Рассмотрим число X t · A · X: X t · A · X = X t · (A · X) = X t · (αX) =   x1 = αX t · X = α(x1 , . . . , xn )  ...  = α(|x1 |2 + . . . + |xn |2 ). xn (Напомним, что |z| = zz — норма комплексного числа z.) С другой стороны, из AX = αX вытекает, что t (AX) = αX t , X t · t A = αX t , X t · A = αX t . Получаем X t · A · X = (X t · A) · X = (αX t ) · X = αX t · X =   x1 = α(x1 , . . . , xn )  ...  = α(|x1 |2 + . . . + |xn |2 ). xn 76 Имеем α(|x1 |2 +. . .+|xn |2 ) = α(|x1 |2 +. . .+|xn |2 ). Так как X — ненулевой столбец, то |x1 |2 + . . . + |xn |2 6= 0, тогда α = α, т.е. α ∈ R. 2 Теорема 5.29. Для любого самосопряженого оператора существует ортонормированный базис из собственных векторов. Доказательство. Пусть ϕ — самосопряженный оператор в евклидовом пространстве V . Пусть A — его матрица в произвольном ортонормированном базисе. Из леммы выше вытекает, что все корни ее характеристического многочлена вещественны. Пусть λ1 — какой-то ее вещественный корень. Пусть f 1 — собственный вектор для ϕ с собственным значением λ1 . Тогда ϕ(f 1 ) = λ1 f 1 , f 1 6= 0. Считаем, что ||f 1 || = 1 (в противном случае проведем нормировку, т.е. заменим f 1 на ||ff 1 || ). 1 Разложим пространство V в прямую сумму одномерного подпространства Rf 1 , натянутого на вектор f 1 , и его ортогонального дополнения V1 : V = Rf 1 ⊕ V1 . Покажем, что подпространство V1 инвариантно относительно оператора ϕ (последнее означает, что ϕ : V1 → V1 ). Пусть x ∈ V1 . Это равносильно (f 1 , x) = 0. Имеем (f 1 , ϕ(x)) = (ϕ(f 1 ), x) = (λ1 f 1 , x) = λ1 (f 1 , x) = 0, поэтому ϕ(x) ∈ V1 . Таким образом, ϕ : V1 → V1 . Для оператора ϕ : V1 → V1 мы можем рассуждать аналогично, как для оператора в V . Существует собственный вектор f 2 ∈ V1 (то есть f 2 ⊥ f 1 ) с собственным значением λ2 . Считаем ||f 2 || = 1. И так далее. В итоге построим ортонормированный базис {f 1 , f 2 , . . . , f n }. Каждый вектор этого базиса — собственный вектор  ϕ(f 1 ) = λ1 f 1 ,    ϕ(f 2 ) = λ2 f 2 , (34) . . .    ϕ(f n ) = λn f n , Доказательство теоремы завершено. 2 Следствие 5.30. Для любого самосопряженного оператора существует ортонормированный базис, в котором его матрица имеет диагональный вид. 77 Доказательство. Используя результаты, полученные в доказательстве теоремы 5.29, получаем, что матрица оператора ϕ в базисе {f 1 , f 2 , . . . , f n } имеет вид   λ1 0 . . . 0  0 λ ... 0  2   (35) B =  .. .. . . . . . . .   . . 0 0 . . . λn Следствие 5.31. Для любой вещественной симметрической матрицы A существует ортогональная матрицы T , такая, что B = T −1 AT — диагональная матрица. Доказательство. Пусть V = Rn — евклидово пространство относительно стандартного скалярного произведения. Для данной вещественной симметрической матрицы A определим линейный оператор ϕ в V следующей формулой ϕ(x) = AX, где X — столбец координат вектора x. Тогда A — матрица оператора ϕ в стандартном ортонормированном базисе {e1 , . . . , en }. Так как A — вещественная симметрическая матрица, то ϕ — самосопряженный оператор. Следовательно, существует ортонормированный базис {f 1 , f 2 , . . . , f n }, в котором ϕ имеет диагональную матрицу B. Тогда B = T −1 AT, где T — матрица перехода. Поскольку оба базиса ортонормированные, то T — тоже ортогональная матрица. 2 Следствие 5.32. Для любой вещественной квадратичной формы g(x) на Rn существует ортонормированный базис, в котором квадратичная форма имеет диагональный вид g = λ1 y12 + . . . + λn yn2 , где y1 , . . . , yn — координаты вектора x в новом базисе. Доказательство. Пусть A — матрица квадратичной формы g(x) в стандартном базисе, то есть g(x) = n X aij xi xj , i,j=1 78 aij = aji . Матрица A — вещественная симметрическая. Из предыдущего следствия имеем, что существует ортогональная матрица T , такая, что   λ1 0 . . . 0  0 λ ... 0  2   B = T −1 AT =  .. .. . . . . . . .   . . 0 0 . . . λn Так как T — ортогональная матрица, то  λ1  0  B = t T · A · T =  ..  . T −1 = t T и λ2 .. .  ... 0 ... 0   . . . ...   . . . λn есть матрица квадратичной формы g(x) в новом ортонормированном базисе. Поэтому в новом базисе g = λ1 y12 + . . . + λn yn2 . 2 Пример. Для следующей симметрической матрицы   4 2 −1 A =  2 7 −2  −1 −2 4 найдем подобную диагональную матрицу B и ортогональную матрицу T , для которой B = T −1 AT . Сначала находим характеристический многочлен det(A − λE) = (λ − 3)2 (λ − 9) и его корни λ1 = λ2 = 3 и λ3 = 9. Далее, найдем собственные векторы. 1. Для собственных значений λ1 = λ2 = 3 система из трех уравнений (A − 3E)X = 0,      1 2 −1 x1  2 4 −2   x2  =  0  −1 −2 1 x3 эквивалентна следующему уравнению x1 + 2x2 − x3 = 0. Найдем его частное решение  −2 f1 =  1  .  79 Теперь найдем второй собственный вектор f 2 с собственным значением 3, ортогональный f 1 : ½ x1 + 2x2 − x3 = 0, −2x1 + x2 = 0. (Второе уравнение системы — условие ортогональности f 1 ⊥ f 2 .) Находим частное решение этой системы   1 f2 =  2  . 5 2. Теперь найдем собственный вектор с собственным значением λ3 = 9: (A − 9E)X = 0,      −5 2 −1 x1  2 −2 −2   x2  =  0  . x3 −1 −2 −5 Система уравнений имеет частное решение   1 f3 =  2  . −1 Нормируем векторы (f 1 , f 2 , f 3 ) и составляем матрицу перехода: √ √ √   −2/√ 5 1/√30 1/√6 T =  1/ 5 2/√30 2/ √6  . 5/ 30 −1/ 6 Здесь столбцы матрицы перехода — нормированные векторы (f 1 , f 2 , f 3 ). Имеем   3 0 0 B = T −1 AT = T t AT =  0 3 0  0 0 9 Контрольные вопросы и задачи 1. Найдите сопряженные операторы для следующих операторов в пространстве геометрических векторов. а) ϕ(x) = (x, a)b (здесь сначала скалярно умножаются векторы x и a, а потом получившееся число умножается на вектор b). 80 б) ϕ(x) = [x, a] — векторное произведение x на фиксированный вектор a. в) ϕ — оператор поворота на угол α против часовой стрелки на плоскости. г) ϕ оператор отражения относительно прямой на плоскости (относительно плоскости в пространстве). 2. Докажите, что произведение двух ортогональных матриц является ортогональной матрицей. 3. Докажите, что обратная матрица к ортогональной матрице также является ортогональной матрицей. 4. Может ли матрица быть симметрической и ортогональной одновременно? 5. Классифицировать матрицы, которые являются симметрическими и ортогональными одновременно. 6. Покажите, что для любой вещественной матрицы A матрица A + t A задает самосопряженный оператор в некотором ортонормированном базисе. 6 Геометрия. Замена декартовых систем координат Определение 6.1. Системой координат в трехмерном пространстве геометрических векторов называется набор (O, e1 , e2 , e3 ), где O — точка в пространстве, {e1 , e2 , e3 } — базис в пространстве. Система координат (O, e1 , e2 , e3 ) декартова, если (e1 , e2 , e3 ) — декартов (ортонормированный) базис. Определение 6.2. Координаты точки A в пространстве — это набор −→ координат вектора OA в базисе (e1 , e2 , e3 ): −→ OA = x1 e1 + x2 e2 + x3 e3 . Обозначение A = (x1 , x2 , x3 ) — координаты точки A. Пусть (O0 , e01 , e02 , e03 ) — другой декартов базис и (x01 , x02 , x03 ) — координаты точки A в этом базисе: −−→ O0 A = x01 e01 + x02 e02 + x03 e03 . (36) Выясним, как связаны старые и новые координаты точки A. −→ −−→0 −−→ OA = OO + O0 A. 81 A r © * © o S S © rX© © XX S XXX S XX Sr z O Пусть O0 −−→0 OO = a1 e1 + a2 e2 + a3 e3 , т.е. O0 = (a1 , a2 , a3 ) — координаты нового центра в старом базисе. −−→ −→ −−→ O0 A = OA − OO0 = (x1 − a1 )e1 + (x2 − a2 )e2 + (x3 − a3 )e3 . −−→ Сравнивая старые и новые координаты вектора O0 A (см.формулу (36)), получаем     0  x1 − a1 t11 t12 t13 x1  x2 − a2  =  t21 t22 t23   x02  . (37) x3 − a3 t31 t32 t33 x3 Здесь  t11 t12 t13 T =  t21 t22 t23  t31 t32 t33  есть матрица перехода от базиса (e1 , e2 , e3 ) к базису (e01 , e02 , e03 ). Матричное уравнение (37) можно переписать следующим образом:   0      x1 a1 t11 t12 t13 x1  x2  =  t21 t22 t23   x02  +  a2  (38) a3 t31 t32 t33 x3 x3 Получили уравнение, связывающее старый и новые координаты точки A. Замечание. Если системы координат (e1 , e2 , e3 ) и (e01 , e02 , e03 ) декартовы, то T — ортогональная матрица. В дальнейшем будем рассматривать только декартовы системы координат. 7 7.1 Кривые второго порядка Классификация кривых второго порядка Пусть (O, e1 , e2 ) — декартова система координат на плоскости. Точка задается набором координат (x, y). Кривой второго порядка называется множество решений уравнения вида F (x, y) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0. 82 (39) Уравнение (60) можно переписать в виде F (x, y) = f (x, y) + `(x, y) + a33 = 0, где а) f (x, y) = a11 x2 + 2a12 xy + a22 y 2 — квадратичная форма, б) `(x, y) = 2a13 x + 2a23 y — линейная форма, в) a33 — константа. Цель настоящего параграфа — описать все виды кривых второго порядка. Для этого выполним замену координат µ ¶ µ ¶µ 0 ¶ µ ¶ x t11 t12 x a1 = + (40) y t21 t22 y0 a2 ¶ µ t11 t12 — ортогональная матрица. где T = t21 t22 Замечание. После подстановки (53) в (60) квадратичная часть преобразуется следующим образом ¶µ 0 ¶ µ ¶ µ x x t11 t12 . (41) = t21 t22 y0 y ¶ µ a11 a12 — матрица квадратичной формы f (x, y) в Матрица A = a12 a22 µ 0 ¶ a a 11 12 начальном базисе. А матрица A0 = матрица квадратичной a012 a022 формы f (x, y) в новом базисе. Как мы показали выше, A0 = t T AT Для любой вещественной симметрической матрицы A существует ортогоµ ¶ λ1 0 — диагональная матрица нальная матрица T , такая, что A0 = 0 λ2 (см. следствие 5.31). После подстановки (41) в (60) уравнение кривой примет вид λ1 (x0 )2 + λ2 (y 0 )2 + ax0 + by 0 + c = 0. Переобозначим (x0 , y 0 ) через (x, y). Получаем уравнение λ1 x2 + λ2 y 2 + ax + by + c = 0. (42) Серия A. Пусть λ1 6= 0, λ2 6= 0. Выделим полные квадраты при переменных x и y: µ ¶ µ ¶ a b λ1 x2 + x + λ2 y 2 + y + c = 0. λ1 λ2 83 ¶2 µ ¶2 µ b a λ1 x + + λ2 y + + δ = 0, 2λ1 2λ2 2 2 a где δ = c − 4λ − b . После параллельного переноса системы координат на 1 ´ 4λ2 ³ вектор 2λa 1 , 2λb 2 получаем уравнение λ1 x2 + λ2 y 2 + δ = 0. (43) Пункт A1. Пусть δ 6= 0. Обозначим µ1 = λ1 , −δ µ2 = λ2 . −δ Уравнение примет вид µ1 x2 + µ2 y 2 = 1. Если µ1 = 1 a2 > 0 и µ2 = 1 b2 > 0, то x2 y 2 + = 1 — эллипс. a2 b2 Если µ1 = 1 a2 > 0 и µ2 = − b12 < 0 (или µ1 = − a12 < 0 и µ2 = (44) 1 b2 x2 y 2 x2 y 2 − = 1 или − 2 + 2 = 1 — гипербола. a 2 b2 a b > 0), то (45) Если µ1 = − a12 < 0 и µ2 = − b12 < 0, то на кривой нет вещественных точек. В таком случае каноническое уравнение имеет вид x2 y 2 + = −1, a2 b2 говорят, что оно определяет мнимый эллипс. Пункт A2. Пусть δ = 0. Тогда уравнение (57) примет вид λ1 x2 + λ2 y 2 = 0. Если λ1 и λ2 одного знака, то на кривой только одна вещественная точка x = y = 0. Если λ1 и λ2 разных знаков, то считаем µ1 = a12 > 0 и µ2 = − b12 < 0. Получаем x2 y 2 − = 0 — пара пересекающихся прямых a2 b2 следующего вида ³x y ´ ³x y ´ + − = 0, a b a b 84 (46) b y = ± x. a Серия B. Пусть λ1 = 6 0 и λ2 = 0. Уравнение (60) принимает вид λ1 x2 + ax + by + c = 0 (47) Пункт B1. Если b 6= 0, то кривая, определяемая уравнением (47), — парабола. Действительно, выделим полный квадрат µ ¶2 a λ1 x + + by + c0 = 0, 2λ1 где c0 = δ − c − a2 4λ1 . µ ¶2 µ ¶ a c0 λ1 x + +b y+ = 0. 2λ1 b После переноса начала системы координат приходим к уравнению λ1 x2 + by = 0, (48) которое, очевидно определяет параболу. Напомним каноническое уравнение параболы: y 2 = 2px. (49) Пункт B2. Рассмотрим случай b = 0. Уравнение (47) не будет зависеть от переменной y и примет вид λ1 x2 + ax + c = 0 — пара параллельных прямых. (50) Выделяя полный квадрат и делая замену, получим канонический вид уравнения (59): x2 − a2 = 0. (51) Вывод. Всякая кривая второго порядка — кривая одного из следующих видов: а) эллипс x2 a2 + б) гипербола y2 b2 x2 a2 2 = 1, − y2 b2 = 1, в) парабола y = 2px, г) пара пересекающихся прямых x2 a2 − y2 b2 = 0, д) пара параллельных прямых x2 − a2 = 0, е) точка x2 a2 + y2 b2 = 0, ж) мнимый эллипс x2 a2 + y2 b2 = −1. 85 7.2 Инварианты кривых второго порядка Кривая второго порядка задается уравнением F (x, y) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0. (52) Замена системы координат осуществляется по формуле µ ¶ µ ¶µ 0 ¶ µ ¶ x t11 t12 x a1 = + (53) y t21 t22 y0 a2 µ ¶ t11 t12 где T = — ортогональная матрица. t21 t22 После подстановки (53) в (60) получаем уравнение той же кривой второго порядка в координатах (x0 , y 0 ): a011 x02 + 2a012 x0 y 02 + a022 y 02 + 2a013 x0 + 2a023 y 0 + a033 = 0. Пусть I = I(a11 , a12 , a22 , a13 , a23 , a33 ) — многочлен от коэффициентов уравнения (60). Определение 7.1. Многочлен I называется инвариантом уравнения кривой, если I не меняется при замене системы координат (53), т.е. I(a11 , a12 , a22 , a13 , a23 , a33 ) = I(a011 , a012 , a022 , a013 , a023 , a033 ). Обозначим µ A= a11 a12 a12 a22 I1 = Tr(A),  a11 a12 a13 A =  a12 a22 a23  , a13 a23 a33  ¶ , I2 = det(A), I3 = det(A). Теорема 7.2. Инварианты I1 , I2 , I3 — инварианты кривой второго порядка. Доказательство. 1. Покажем, что I1 и I2 инварианты. Действительно, после подстановки (53) в (60) матрица A преобразуется A0 = t T AT. Поскольку T – ортогональная матрица, то t T = T −1 и A0 = T −1 AT. То есть матрицы A и A0 подобны. Тогда |A0 − λE| = |A − λE| = λ2 − I1 λ + I2 . Заключаем, что I1 и I2 инварианты. 86 2. Покажем, что I3 — инвариант. Рассмотрим квадратичную форму F (x, y, t) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 xt + 2a23 yt + a33 t2 . Будем делать замену переменных     0  x t11 t12 a1 x  y  =  t21 t22 a2   y 0  t 0 0 1 t0 Обозначим (54) (55)   t11 t12 a1 T =  t21 t22 a2  . 0 0 1 Полагая t = 1 в уравнении (54), получаем уравнение кривой (60). Полагая t = t0 = 1 в формулы замены переменных (55), получаем (53). Матрица A — матрица квадратичной формы F (x, y, t). После подстановки (55) в (54) получаем матрицу A0 = t T AT . Тогда det(A0 ) = det(t T AT ) = det(t T ) det(A) det(T ) = (det(T ))2 det(A), ¯ ¯ ¯ t11 t12 a1 ¯ ¯ ¯ ¯ ¯ ¯ t11 t12 ¯ ¯ = ±1. det(T ) = ¯¯ t21 t22 a2 ¯¯ = ¯¯ ¯ t t 21 22 ¯ 0 0 1 ¯ Таким образом, I3 = det(A0 ) = det(A) — инвариант. 2 7.3 Приложения инвариантов F (x, y) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0. (56) Характеристический многочлен |A−λE| = λ2 −I1 λ+I2 имеет корни λ1 , λ2 . По формулам Виета λ1 λ2 = I2 6= 0. Серия A. Пусть λ1 6= 0, λ2 6= 0. Как мы показывали ранее, уравнение в серии A приводится к виду λ1 x2 + λ2 y 2 + δ = 0. Выпишем значения инвариантов: ¯ ¯ ¯ λ1 0 0 ¯ ¯ ¯ I3 = ¯¯ 0 λ2 0 ¯¯ = λ1 λ2 δ = I2 δ, ¯ 0 0 δ¯ 87 (57) δ= I3 . I2 Видим, что вид уравнения (57) полностью определяется инвариантами: λ1 x2 + λ2 y 2 + I3 = 0. I2 Серия B. Пусть λ1 6= 0, λ2 = 0. Последнее равносильно I2 = 0 и I1 6= 0. Пункт B1. В случае параболы λ1 x2 + by = 0 (58) третий инвариант имеет вид ¯ ¯ ¯ ¯ λ1 0 ¯ ¯ I3 = ¯¯ 0 0 b/2 ¯¯ = −λ1 (b/2)2 6= 0. ¯ 0 b/2 0 ¯ Вид уравнения (73) не определяется по инвариантам. Пункт B2. Для двух параллельных прямых λ1 x2 + ax + c = 0 (59) третий инвариант равен нулю: ¯ ¯ ¯ λ1 0 a/2 ¯ ¯ ¯ I3 = ¯¯ 0 0 0 ¯¯ = 0. ¯ a/2 0 c ¯ Вид уравнения (59) также не определяется по инвариантам. Вывод. Таким образом, значения инвариантов позволяют определить тип кривой второго порядка: а) при I2 6= 0, I3 6= 0 получаем эллипс, гиперболу или мнимый эллипс, б) при I2 6= 0, I3 = 0 — пару пересекающихся прямых или точку, в) при I1 6= 0, I2 = 0, I3 6= 0 — параболу, г) при I1 6= 0, I2 = I3 = 0 — пару параллельных прямых. 7.4 Пересечение кривой второго порядка с прямой Дана кривая второго порядка F (x, y) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0. Рассмотрим прямую `, заданную уравнением ½ x = x0 + kt, y = y0 + mt, 88 (60) (61) где A0 = (x0 , y0 ) — точка на прямой, e = (k, m) 6= 0 — направляющий вектор прямой. Для нахождения координат точек пересечения прямой с кривой второго порядка подставим (89) в (60). Упражнение. Убедитесь, что после подстановки (89) в (60) и приведения подобных слагаемых, уравнение (60) превратиться в квадратный трехчлен At2 + Bt + C = 0, где A = a11 k 2 + 2a12 km + a22 m2 , ∂F ∂F B= (x0 , y0 ) · k + (x0 , y0 ) · m = 0, ∂x ∂y C = F (x0 , y0 ). Уравнение At2 + Bt + C = 0 может иметь не более двух корней, следовательно прямая (89) имеет с кривой второго порядка (60) либо 2 точки пересечения (A 6= 0 и D > 0), либо одну точку пересечения (A 6= 0, D = 0 или A = 0), либо не имеет точек пересечения (A 6= 0, D < 0). Определение 7.3. Направление, определяемое вектором (k, m), называется асимптотическим для кривой (60), если A = 0, т.е. если a11 k 2 + 2a12 km + a22 m2 = 0. Уравнение из определения перепишем так µ ¶2 k k + 2a12 + a22 = 0. a11 m m Находя корни квадратного трехчлена относительно нант D = 4(a212 − a11 a22 ). k m, считаем дискрими- Возможны следующие случаи: а) если a212 −a11 a22 > 0, то существуют два асимптотических направления; б) если a212 −a11 a22 = 0, то существует одно асимптотическое направление; в) если a212 − a11 a22 < 0, то асимптотических направлений нет. 89 № 1 2 3 4 5 6 7 Кривая второго порядка эллипс гипербола мнимый эллипс точка парабола пара пересекающихся прямых пара параллельных прямых Число асимпт. Чем является направлений асимпт. направление нет – 2 направления асимптот нет – нет – 1 ось параболы 2 направления прямых 1 направление прямых Утверждение 7.4. Для любой кривой второго порядка середины хорд, параллельных неасимптотическому направлению, лежат на одной прямой. Эта прямая называется диаметральной прямой, сопряженной заданному неасимптотическому направлению. Доказательство. Пусть (x0 , y0 ) — середина хорды, параллельной неасимптотическому направлению (k, m). Уравнение прямой имеет вид (89). Точки пересечения имеют вид (x0 ± t0 , y0 ± t0 ). Уравнение на точки At2 + Bt + C = 0 имеет два решения ±t0 . Из формул Виета B = 0. То есть ∂F ∂F (x0 , y0 )k + (x0 , y0 )m = 0 ∂x ∂y Поэтому (x0 , y0 ) лежит на прямой ∂F ∂F k+ m = 0. ∂x ∂y Это доказывает теорему и дает уравнение диаметральной прямой, сопряженной неасимптотическому направлению (k, m). 2 7.5 Центр кривой Пусть Γ кривая на плоскости. Определение 7.5. Назовем точку O центром кривой Γ, если для любой точки M на кривой симметричная ей точка M 0 относительно O также принадлежит кривой Γ. То есть центр кривой — это центр симметрии кривой. 90 Замечание. Центр кривой второго порядка лежит на всех диаметральных прямых. То есть O = (x0 , y0 ) — центр кривой кривой (60), если (x0 , y0 ) ∂F удовлетворяют уравнению ∂F ∂x k+ ∂y m = 0 для любого неасимптотического направления (k, m). Вывод. Центр кривой второго порядка определяется из системы уравнений  ∂F  ∂x = 0,  ½ ∂F ∂y = 0, a11 x + a12 y + a13 = 0, a12 x + a22 y + a23 = 0. (62) Упражнение. Покажите 2 2 2 2 1. Эллипс xa2 + yb2 = 1, гипербола xa2 − yb2 = 1, пара прямых пересекающихся y2 y2 x2 x2 − = и точка + 2 2 2 a b a b2 = 0 имеют один центр. 2. Парабола y 2 = 2px центра не имеет. 3. Пара параллельных прямых x2 − a2 = 0 имеет бесконечно много центров — прямую центров x = 0. Замечание. Не путайте центр кривой с центром системы координат. Они не всегда совпадают! 7.6 Задачи Задача 1. Найти канонический вид и каноническую систему координат кривой 5x2 + 4xy + 8y 2 − 32x − 56y + 80 = 0. Решение. Квадратичная часть 5x2 + 4xy + 8y 2 не является полным квадратом. Мы имеем дело с кривой серии A. Выпишем главную матрицу данной кривой и вычислим её характеристический многочлен ¯ ¯ µ ¶ ¯ 5−λ ¯ 5 2 2 ¯ = (λ − 4)(λ − 9). A= , |A − λE| = ¯¯ 2 8 2 8−λ ¯ Собственные значения — λ1 = 4, λ2 = 9, собственные векторы ¶ µ µ ¶ 1 1 2 1 , f2 = √ . f1 = √ 5 −1 5 2 91 Вычислим инварианты: I1 = TrA = 13, I2 = det A = 36, ¯ ¯ ¯ 5 ¯ 2 −16 ¯ ¯ I3 = ¯¯ 2 8 −28 ¯¯ = −362 . ¯ −16 −28 80 ¯ Подставляя в уравнение λ1 x02 + λ2 y 02 + I3 = 0, I2 получаем 4x02 + 9y 02 − 36 = 0. Отсюда находим каноническое уравнение x02 y 02 + =1 9 4 и заключаем, что кривая — эллипс. Нам осталось найти координаты центра новой системы координат. Выпишем систему уравнений (62): ½ 5x + 2y − 16 = 0, 2x + 8y − 28 = 0 и найдём единственное решение (2, 3), которое является центром эллипса, а также центром системы координат, в которой эллипс записывается каноническим уравнением. y 02 x02 + = 1; каноническая система Ответ. Каноническое уравнение: 9 4 координат: µ ¶ µ ¶ 1 1 2 1 O = (2, 3), f 1 = √ , f2 = √ . 5 −1 5 2 Задача 2. Найти канонический вид и каноническую систему координат кривой x2 − 4xy + 4y 2 + 4x − 3y − 7 = 0. Решение. Квадратичная часть является полным квадратом f (x, y) = (x − 2y)2 . Сделаем замену декартовых систем координат ( √ , x0 = x−2y 5 2x+y √ y = 5 . Отсюда получаем формулу замены вида : ( x = √15 x0 + √25 y 0 , y = − √25 x0 + √15 y 0 . 92 Начало этой новой системы координат совпадает со старым началом (0, 0), а векторы нового базиса равны ¶ µ µ ¶ 1 1 1 2 , f2 = √ . f1 = √ 5 −2 5 1 Подставляя формулы (x, y) через (x0 , y 0 ) в уравнение кривой, получаем уравнение кривой в новой системе координат: √ √ 5x02 + 2 5x0 + 5y 0 − 7 = 0. Преобразуем это уравнение к виду ¶2 µ ¶ µ 1 1 8 x +√ = −√ y − √ . 5 5 5 Сделаем параллельный перенос системы координат ( x00 = x0 + √15 , y 00 = y 0 − √85 . Уравнение кривой принимает вид 1 (x00 )2 = − √ y 00 5 и, наконец, после замены x000 = −y 00 , y 000 = x00 , получаем каноническую форму параболы: 1 (y 000 )2 = √ x000 . 5 Осталось найти старые координаты центра новой системы координат. Из x00 = 0, y 00 = 0 получаем x0 = − √15 , y 0 = √85 . Затем окончательно получаем x = 3, y = 2. Ответ. Каноническое уравнение кривой (y 000 )2 = √15 x000 , каноническая система координат ¶ µ µ ¶ 1 1 1 2 , f2 = √ . O = (3, 2), f 1 = √ 5 −2 5 1 8 8.1 Поверхности второго порядка Виды поверхностей второго порядка Раннее в прошлом семестре мы говорили о том, какой вид могут иметь поверхности второго порядка. 93 Определение 8.1. Поверхностью второго порядка называется множество решений уравнения F (x, y, z) = a11 x2 + a22 y 2 + a33 z 2 + 2a12 xy + 2a13 xz + 2a23 yz+ +2a14 x + 2a24 y + 2a34 z + a44 = 0. (63) Виды поверхностей второго порядка 1. Определение 8.2. Поверхность называется цилиндрической (цилиндром), если вместе со всякой своей точкой она содержит прямую, проходящую через эту точку, параллельную некоторому фиксированному вектору a 6= 0. Для построения цилиндрической поверхности нужно выбрать произвольную кривую L, которая называется направляющей, и через каждую точку кривой L провести прямую, параллельную вектору a 6= 0. Такие прямые называются образующими. Рассмотрим три вида поверхностей второго порядка, являющихся цилиндрами. Если в качестве направляющей взять эллипс, что получим эллиптический цилиндр, если параболу — параболический цилиндр, если гиперболу — гиперболический. Цилиндрическая поверхность Каноническое уравнение y2 x2 Эллиптический цилиндр + 2 a b2 = 1 y2 x2 Гиперболический цилиндр a2 − b2 = 1 Параболический цилиндр y 2 = 2px Все цилиндры, определяемые каноническими уравнениями из таблицы выше, вытянуты вдоль оси OZ и имеют образующие, параллельные вектору (0, 0, 1). 2. Определение 8.3. Конической поверхностью (конусом) с вершиной в точке A называют поверхность, которая вместе с любой своей точкой S, S 6= A, содержит всю прямую AS. Для построения конической поверхности нужны взять кривую L и точку A и через каждую точку S ∈ L провести прямую AS. Кривая L называется образующей конуса. Конус второго порядка задается каноническим уравнением x2 y 2 z 2 + − 2 = 0. a2 b2 c Образующей этого конуса является, например, следующий эллипс ½ x2 y2 a2 + b2 = 1, z = c, 94 лежащий в плоскости z = c, а вершиной — начало координат (0, 0, 0). 3. Определение 8.4. Поверхность, которая в некоторой прямоугольной системе координат может быть задана уравнением x2 y 2 z 2 + + = 1, a2 b2 c2 называется эллипсоидом. Эллипсоид имеет центр симметрии в начале координат, несколько осей симметрии, например, оси координат, а также плоскости симметрии. 4. Определение 8.5. Поверхность, которая в некоторой прямоугольной системе координат может быть задана уравнением x2 y 2 z 2 + + = −1, a 2 b2 c 2 называется мнимым эллипсоидом и задает пустое множество точек. 5. Определение 8.6. Поверхность, которая в некоторой прямоугольной системе координат может быть задана уравнением x2 y 2 z 2 + − 2 = 1, a2 b2 c называется однополостным гиперболоидом. Однополостной гиперболоид можно получить путем вращения гиперболы ½ x2 z 2 a2 − c2 = 1, y=0 вокруг оси OZ, в результате этого получится однополостной гиперболоид вращения x2 y 2 z 2 + − = 1. a2 a2 c2 6. Определение 8.7. Поверхность, которая в некоторой прямоугольной системе координат может быть задана уравнением x2 y 2 z 2 − + = 1, a2 b2 c2 называется двуполостным гиперболоидом. − Двуполостной гиперболоид x2 y 2 z 2 − 2 − 2 + 2 = 1, a a c 95 также можно получить, вращая гиперболу ½ x2 z 2 − a2 + c2 = 1, y=0 вокруг оси OZ. Ось OZ является действительной для этой гиперболы. 2 2 В прошлом семестре мы показывали, что гипербола − xa2 + zc2 = 1 имеет асимптоты z = ± ac x. При вращении вокруг оси OZ асимптоты 2 2 2 превращаются в конус − xa2 − ay2 + zc2 = 0, который называется асимптотическим конусом двуполостного гиперболоида. Если точка M при−−→ надлежит гиперболоиду и OM → ∞, то расстояние от точки M до асимптотического конуса стремится к нулю. Упражнение. Запишите уравнение асимптотического конуса для однополостного гиперболоида. 7. Определение 8.8. Поверхность, которая в некоторой прямоугольной системе координат может быть задана уравнением x2 y 2 + = 2z, p > 0, q > 0, p q называется эллиптическим параболоидом. Если точка (x, y, z) принадлежит эллиптичесому параболоиду, то точки (−x, −y, z), (−x, y, z), (x, −y, z) также ему принадлежат. Значит эта поверхность имеет ось симметрии OZ и плоскости симметрии Y OZ и XOZ. Если взять параболу ½ x2 = 2pz, y=0 и вращать ее вокруг оси OZ, то получим поверхность вращения x2 + z 2 = 2pz. 2 При сечении поверхности xp + получается эллипс ( 2 y2 q = 2z плоскостями z = c, c > 0, 2 + yq = 2c, z = c, x p а при сечении плоскостями x = c — парабола ³ ´ ( c2 2 y = q 2z − p , x = c. 96 Заметим, что все такие параболы получаются из параболы y 2 = 2qz, лежащей в плоскости x = 0 параллельным сдвигом. Аналогично для сечения плоскостью y = c. Эллиптический параболоид можно получить следующим образом: берем две параболы, лежащие в перпендикулярных плоскостях с параллельными осями и ветвями, направленными в одну сторону, и двигаем одну из них так, чтобы ее вершина скользила по другой. 8. Определение 8.9. Поверхность, которая в некоторой прямоугольной системе координат может быть задана уравнением x2 y 2 − = 2z, p > 0, q > 0, p q называется гиперболическим параболоидом. Гиперболический параболоид имеет ось симметрии OZ и две плоскости симметрии XOZ и Y OZ. Упражнение. Докажите, что при сечении гиперболического параболоида плоскостями x = c и y = c получаются параболы, а при сечении плоскостями z = c — гиперболы. Гиперболический параболоид можно получить следующим образом: берем две параболы, лежащие в перпендикулярных плоскостях с параллельными осями и ветвями, направленными в разные стороны, и двигаем одну из них так, чтобы ее вершина скользила по другой. 8.2 Классификация поверхностей второго порядка Проведем классификацию поверхностей второго порядка тем же методом, которым описали все кривые второго порядка. Уравнение поверхности второго порядка F (x, y, z) = a11 x2 + a22 y 2 + a33 z 2 + 2a12 xy + 2a13 xz + 2a23 yz+ +2a14 x + 2a24 y + 2a34 z + a44 = 0. (64) можно переписать в виде F (x, y, z) = f (x, y, z) + `(x, y, z) + a44 = 0, где а) f (x, y, z) = a11 x2 +a22 y 2 +a33 z 2 +2a12 xy+2a13 xz+2a23 yz — квадратичная форма, б) `(x, y) = 2(a14 x + a24 y + a34 z) — линейная форма, 97 в) a33 — константа. Выполним замену координат     0    x t11 t12 t13 x a1  y  =  t21 t22 t23   y 0  +  a2  (65) z t31 t32 t23 z a3   t11 t12 t13 где T =  t21 t22 t23  — ортогональная матрица. t31 t32 t23 Если подставить (77) в (88), то квадратичная часть уравнения (88) изменится так:     0  x t11 t12 t13 x  y  =  t21 t22 t23   y 0  . (66) z t31 t32 t23 z   a11 a12 a13 Матрица A =  a12 a22 a23  — матрица квадратичной формы f (x, y, z) a13 a23 a23 в старом базисе, а матрица квадратичной формы f (x, y, z) в новом базисе следующая:  0  a11 a012 a013 A0 = t T AT =  a012 a022 a023  . a013 a023 a023 Для любой вещественной симметрической матрицы A существует ортогональная матрица T , такая, что A0 — диагональная матрица. Пусть в A0 на диагонали стоят числа λ1 , λ2 , λ3 . После подстановки (78) в (88) уравнение поверхности (88) примет вид λ1 (x0 )2 + λ2 (y 0 )2 + λ3 (z 0 )2 + ax0 + by 0 + cz 0 + d = 0. Переобозначим (x0 , y 0 , z 0 ) через (x, y, z). Получаем уравнение λ1 x2 + λ2 y 2 + λ3 z 2 + ax + by + cz + d = 0. (67) Серия A. Пусть λ1 6= 0, λ2 6= 0, λ3 6= 0. Выделим полные квадраты при переменных x, y и z: µ ¶ µ ¶ µ ¶ a b c λ1 x2 + x + λ2 y 2 + y + λ3 z 2 + z + d = 0. λ1 λ2 λ3 ¶2 µ ¶2 µ ¶2 µ b c a + λ2 y + + λ3 z + + δ = 0, λ1 x + 2λ1 2λ2 2λ3 98 2 2 2 a b c где δ = c− 4λ − 4λ − 4λ . После параллельного переноса системы координат 1 2 3 получаем уравнение λ1 x2 + λ2 y 2 + λ3 z 2 + δ = 0. (68) Пункт A1. Пусть δ 6= 0. Обозначим µ1 = λ1 , −δ µ2 = λ2 , −δ µ3 = λ3 . −δ Уравнение примет вид µ1 x2 + µ2 y 2 + µ3 z 2 = 1. Если µ1 > 0, µ2 > 0 и µ3 > 0, то обозначив 1 1 1 , µ = , µ = , 2 3 a2 b2 c2 получим каноническое уравнение эллипсоида µ1 = x2 y 2 z 2 + + = 1. a2 b2 c2 (69) Если µ1 = − a12 < 0, µ2 = − b12 < 0, µ3 = − c12 < 0, то получаем мнимый эллипсоид x2 y 2 z 2 − 2 − 2 − 2 = 1. a b c Если два числа из списка λ1 , λ2 , λ3 положительны, а одно отрицательно, скажем µ1 = a12 > 0, µ2 = b12 > 0 и µ3 = c12 < 0, имеем уравнение однополостного гиперболоида x2 y 2 z 2 + − 2 = 1. (70) a2 b2 c В случае, когда два числа отрицательны, а одно положительно, например, µ1 = a12 < 0, µ2 = b12 < 0 и µ3 = c12 > 0, получается двуполостной гиперболоид x2 y 2 z 2 − 2 − 2 + 2 = 1. (71) a b c Пункт A2. Пусть δ = 0. Тогда уравнение (68) примет вид λ1 x2 + λ2 y 2 + λ3 z 2 = 0. Снова, знаки λi определяют тип поверхности. Если все λ1 , λ2 и λ3 одного знака, то на поверхности только одна вещественная точка x = y = z = 0. 99 x2 a2 + y2 b2 + z2 c2 =0 Если два числа одного знака, а третье — другого, скажем, λ1 = λ2 = b12 > 0 и λ3 = c12 < 0, то получаем конус 1 a2 x2 y 2 z 2 + − 2 =0 a2 b2 c > 0, (72) Серия B. Пусть λ1 6= 0, λ2 6= 0 и λ3 = 0. Уравнение (88) принимает вид λ1 x2 + λ2 y 2 + ax + by + cz + d = 0, µ ¶ µ ¶ a b λ1 x2 + x + λ2 y 2 + y + cz + d = 0. λ1 λ2 Выделяя полные квадраты и переобозначив переменные, получим уравнение λ1 x2 + λ2 y 2 + cz + δ = 0. (73) Пункт B1. Пусть c 6= 0. Сделаем замену z → z + dδ , получим уравнение λ1 x2 + λ2 y 2 + cz = 0. Обозначим p = −c 2λ1 , q= −c 2λ2 , тогда уравнение примет вид x2 y 2 + = 2z. p q Если p и q одного знака, пусть для определенности p > 0 и q > 0, то наша поверхность — эллиптический параболоид x2 y 2 + = 2z. p q (74) Если p > 0 и −q 0 = q < 0 — разных знаков, то имеем гиперболический параболоид x2 y 2 − 0 = 2z, p > 0, q 0 > 0. (75) p q Пункт B2. Рассмотрим случай c = 0, тогда уравнение (73) примет вид λ1 x2 + λ2 y 2 + δ = 0. В этом случае поверхность является цилиндрической, направляющие параллельны оси OZ. 1. При δ 6= 0 обозначим µ1 = Если µ1 = 1 a2 1 a2 > 0 и µ2 = Если µ1 = > 0 и µ2 = y2 x2 a2 − b2 = 1. 1 b2 1 b2 λ1 −δ , µ2 = λ1 −δ . > 0, то эллиптический цилиндр x2 a2 2 + yb2 = 1. < 0, то получаем гиперболический цилиндр 100 2. Пусть δ = 0, тогда уравнение λ1 x2 + λ2 y 2 = 0 определяет прямую x = y = 0, если λ1 , λ2 одного знака, и, если λ1 , λ2 разных знаков, две пересекающиеся плоскости x2 y 2 − = 0, a2 b2 ³x y ´ ³x y ´ − + = 0, a b a b b y = ± x. a Серия C. Пусть λ1 6= 0, λ2 = 0 и λ3 = 0. Уравнение (88) принимает вид λ1 x2 + ax + by + cz + d = 0, ¶ µ a λ1 x2 + x + by + cz + d = 0. λ1 Выделив полный квадрат и переобозначив переменные, получим уравнение λ1 x2 + by + cz + δ = 0. Если b 6= 0 или c 6= 0, то это уравнение задает параболический цилиндр x = 2py. Если b = c = 0, то при δ 6= 0 получаем уравнение x2 = α. Если α > 0, то √ две параллельные плоскости x = ± α. Если α < 0, то пустое множество решений. В случае δ = 0 уравнение x2 = 0 задает точку. 2 Вывод. Всякая поверхность второго порядка — поверхность одного из следующих видов: а) эллипсоид x2 a2 + y2 b2 + z2 c2 = 1, y2 b2 − z2 c2 = 1, в) однополостной гиперболоид x2 a2 + y2 b2 2 б) мнимый эллипсоид − xa2 − − y2 b2 2 г) двуполостной гиперболоид − xa2 + z2 c2 + z2 c2 x2 p + y2 q = 2z, е) гиперболический параболоид x2 p − y2 q д) эллиптический параболоид ж) конус x2 a2 + y2 b2 − z2 c2 = 1, = 1, = 2z, = 0, з) пара пересекающихся плоскостей x2 a2 − y2 b2 и) пара параллельных плоскостей x2 = α, 101 = 0, 2 й) цилиндр одного из следующих видов: эллиптический xa2 + 2 2 гиперболический xa2 − yb2 = 1 или параболический x2 = 2py, y2 b2 = 1, к) прямая x = y = 0, л) точка x = y = z = 0. 8.3 Инварианты уравнения поверхности F (x, y, z) = a11 x2 + a22 y 2 + a33 z 2 + 2a12 xy + 2a13 xz + 2a23 yz+ +2a14 x + 2a24 y + 2a34 z + a44 = 0. Замена системы координат     0    x t11 t12 t13 x a1  y  =  t21 t22 t23   y 0  +  a2  z t31 t32 t23 z0 a3   t11 t12 t13 где T =  t21 t22 t23  есть ортогональная матрица. t31 t32 t33 После подстановки (77) в (76) получаем (76) (77) a011 x2 + 2a012 xy + a022 y 2 + 2a013 xz + 2a023 yz + a033 z 2 + 2a014 x + 2a024 y + 2a034 z + a044 = 0 (78) Пусть I = I(a11 , . . . , a44 ) — многочлен от коэффициентов уравнения (76). Определение 8.10. Многочлен I называется инвариантом уравнения поверхности, если I не меняется при заменах вида (77). Введем обозначения   a11 a12 a13 A =  a12 a22 a23  , a13 a23 a33  a11  a12 A=  a13 a14 ¯ ¯ a11 − λ a12 a13 ¯ det(A − λE) = ¯¯ a21 a22 − λ a23 ¯ a31 a23 a33 − λ где a12 a22 a23 a24 a13 a23 a33 a34 ¯ ¯ ¯ ¯ = −λ3 + I1 λ2 − I2 λ + I3 , ¯ ¯  I1 = a  ¯ 11 + a22 +¯ a33¯ = Tr(A),¯ ¯   ¯a a ¯ ¯a a ¯ ¯a a I2 = ¯¯ 11 12 ¯¯ + ¯¯ 11 13 ¯¯ + ¯¯ 22 23 a21 a22 a31 a33 a32 a33    I3 = det(A) 102  a14 a24  . a34  a44 ¯ ¯ ¯, . ¯ Положим I4 = det(A). Теорема 8.11. I1 , I2 , I3 , I4 — инварианты. Доказательство. Пункт 1. Покажем, что I1 , I2 , I3 — инварианты. Действительно, после подстановки (77) в (76) матрица A преобразуется A0 = T t AT. Поскольку T — ортогональная матрица, то T t = T −1 и A0 = T −1 AT. То есть матрицы A и A0 подобны. Тогда det(A0 − λE) = det(A − λE) = −λ3 + I1 λ2 − I2 λ + I3 . Заключаем, что I1 , I2 , I3 — инварианты. Пункт 2. Покажем, что I4 — инвариант. Рассмотрим квадратичную форму F (x, y, z, t) = a11 x2 + 2a12 xy + a22 y 2 + 2a13 xz + 2a23 yz + a33 z 2 + 2a14 xt + 2a24 yt + 2a34 zt + a44 t2 = 0 Будем делать замену переменных    x t11  y   t21  =  z   t31 t Обозначим t12 t13 t22 t23 t32 t33 0 0  t11 t12 t13  t21 t22 t23 T =  t31 t32 t33 0 0 0  0 a1 x   a2   y 0 a3   z 0 1 t0 (79)   .  (80)  a1 a2  . a3  1 Полагая t = 1 в (79) получаем уравнение кривой (76). Полагая t = t = 1, из формулы замены (80) получаем (77). Матрица A — матрица квадратичной формы F (x, y, z, t). После подстановки (80) в (79) получаем матрицу A0 = T t AT . Тогда det(A0 ) = det(T t AT ) = det(T )t det(A) det(T ) = (det(T ))2 det(A) 103 ¯ ¯ ¯ ¯ det(T ) = ¯¯ ¯ ¯ t11 t12 t13 t21 t22 t23 t31 t32 t33 0 0 0 a1 a2 a3 1 ¯ ¯ ¯ ¯ ¯ t11 t12 t13 ¯ ¯ ¯ = ¯ t21 t22 t23 ¯ ¯ ¯ ¯ t31 t32 t33 ¯ ¯ ¯ ¯ ¯ = ±1. ¯ ¯ I3 = det(A0 ) = det(A) – инвариант. 2 8.4 Приложения инвариантов F (x, y, z) = a11 x2 + a22 y 2 + a33 z 2 + 2a12 xy + 2a13 xz + 2a23 yz+ +2a14 x + 2a24 y + 2a34 z + a44 = 0. (81) Характеристический многочлен det(A − λE) = −λ3 + I1 λ2 − I2 λ + I3 имеет корни λ1 , λ2 , λ3 . Серия A. Пусть λ1 6= 0, λ2 6= 0, λ3 6= 0. По формулам Виета λ1 λ2 λ3 = I3 6= 0. Уравнение в серии A приводится к виду λ1 x2 + λ2 y 2 + λ3 z 2 + δ = 0. ¯ ¯ ¯ λ1 0 0 0 ¯ ¯ ¯ ¯ 0 λ2 0 0 ¯ ¯ = λ1 λ2 λ3 δ = I3 δ. I4 = ¯¯ ¯ λ 3 ¯ ¯ ¯ 0 0 0 δ¯ δ= (82) I4 . I3 I4 = 0. I3 Вид уравнения (82) полностью определяется по инвариантам. λ1 x2 + λ2 y 2 + λ3 z 2 + Серия B. Пусть λ1 6= 0, λ2 6= 0, λ3 = 0, это условие равносильно I3 = 0 и I2 6= 0. Пункт B1. λ1 x2 + λ2 y 2 + cz = 0. ¯ ¯ ¯ λ1 0 0 ¯ ¯ ¯ ¯ 0 λ2 0 ¯ ¯ = −λ1 λ2 (c/2)2 = I4 = ¯¯ 6 0. ¯ ¯ 0 0 0 c/2 ¯ ¯ 0 0 c/2 0 ¯ I4 = I2 (c/2)2 Вид уравнения (83) определяется по инвариантам. 104 (83) Пункт B2. λ1 x2 + λ2 y 2 + ax + by + d = 0 ¯ ¯ ¯ λ1 0 0 a/2 ¯ ¯ ¯ ¯ 0 λ2 0 b/2 ¯ ¯=0 I4 = ¯¯ ¯ ¯ ¯ ¯ a/2 b/2 0 d ¯ (84) Вид уравнения (84) не определяется по инвариантам. Серия C. λ1 6= 0, λ2 = λ3 = 0. В этом случае I2 = I3 = 0. λ1 x2 + ax + by + cz + d = 0 ¯ ¯ ¯ λ1 0 0 a/2 ¯ ¯ ¯ ¯ 0 ¯ b/2 ¯=0 I4 = ¯¯ ¯ ¯ ¯ ¯ a/2 b/2 0 d ¯ 2 λ1 x + p b2 + c2 y = 0 — параболический цилиндр λ1 x2 + d0 = 0 — пара параллельных плоскостей (85) (86) (87) Вид уравнений (86) и (87) не определяется по инвариантам. Вывод. 1. I3 6= 0, I4 6= 0 — эллипсоид, гиперболоид (однополостной или двуполостной), 2. I3 6= 0, I4 = 0 — конус, 3. I3 = 0, I2 6= 0, I4 6= 0 — параболоид (эллиптический или гиперболический), 4. I3 = 0, I2 6= 0, I4 = 0 — цилиндр над кривой второго порядка серии A (эллиптический цилиндр, гиперболический цилиндр, пара пересекающихся плоскостей), 5. I2 = I3 = I4 = 0 — цилиндр над кривой второго порядка серии B (параболический цилиндр, пара параллельных плоскостей). 8.5 Пересечение поверхности второго порядка с прямой Дана поверхность второго порядка F (x, y, z) = a11 x2 + a22 y 2 + a33 z 2 + 2a12 xy + 2a13 xz + 2a23 yz+ +2a14 x + 2a24 y + 2a34 z + a44 = 0. 105 (88) Уравнение (88) записывается в виде F (x, y, z) = f (x, y, z) + `(x, y, z) + a44 = 0, где а) f (x, y, z) = a11 x2 +2a12 xy+a22 y 2 +2a13 xz+2a23 yz+a33 z 2 — квадратичная форма, б) `(x, y, z) = 2a14 x + 2a24 y + 2a34 z — линейная форма, в) a44 – константа. Рассмотрим прямую `, заданную уравнением   x = x0 + kt, y = y0 + mt,  z = z0 + nt, (89) где A0 = (x0 , y0 , z0 ) — точка на прямой, e = (k, m, n) 6= 0 — направляющий вектор прямой. Для нахождения координат точек пересечения прямой с поверхностью второго порядка подставим (89) в (88). Получаем At2 + Bt + C = 0, где A = f (k, m, n), ∂F ∂F ∂F B= (x0 , y0 , z0 )k + (x0 , y0 , z0 )m + (x0 , y0 , z0 )n, ∂x ∂y ∂z C = F (x0 , y0 , z0 ). Прямая имеет с поверхностью второго порядка либо 2 точки пересечения, либо одну точку пересечения (одинарную или двойную), либо не имеет точек пересечения. Определение 8.12. Направление (k, m, n) асимптотическое, если A = f (k, m, n) = 0. Утверждение 8.13. Для любой поверхности второго порядка середины хорд, параллельных неасимптотическому направлению, лежат в одной плоскости. Эта плоскость называется диаметральной плоскостью, сопряженной заданному неасимптотическому направлению. Доказательство. Пусть (x0 , y0 , z0 ) – середина хорды, параллельной неасимптотическому направлению (k, m, n). Уравнение прямой имеет вид (89). Точки пересечения имеют вид (x0 ± kt0 , y0 ± mt0 , z0 ± nt0 ). Уравнение 106 на точки At2 +Bt+C = 0 имеет два решения ±t0 . Из формул Виета B = 0. То есть ∂F ∂F ∂F (x0 , y0 , z0 )k + (x0 , y0 , z0 )m + (x0 , y0 , z0 )n = 0. ∂x ∂y ∂z Поэтому (x0 , y0 , z0 ) лежит в плоскости ∂F ∂F ∂F k+ m+ n = 0. ∂x ∂y ∂z Это доказывает утверждение и дает уравнение диаметральной плоскости, сопряженной неасимптотическому направлению (k, m, n). 2 8.6 Центр поверхности второго порядка Пусть S — поверхность в пространстве. Определение 8.14. Назовем точку O центром поверхности S, если для любой точки M на поверхности симметричная ей точка M 0 относительно O также принадлежит поверхности S. То есть центр поверхности — это центр симметрии поверхности. Заметим, что центр поверхности второго порядка лежит во всех диаметральных поверхностях. То есть O = (x0 , y0 , z0 ) — центр поверхности второго порядка (88), если (x0 , y0 , z0 ) удовлетворяют уравнению ∂F ∂F ∂F k+ m+ n=0 ∂x ∂y ∂z для любого неасимптотического направления (k, m, n). Вывод. Центр кривой второго порядка определяется из системы уравнений  ∂F   ∂x = 0,     ∂F ∂y = 0,       ∂F = 0 ∂z или   a11 x + a12 y + a13 z + a14 = 0, a12 x + a22 y + a23 z + a24 = 0, (90)  a13 x + a23 y + a33 z + a34 = 0. Замечание. Не путать центр кривой с центром системы координат. Они не всегда совпадают! 107 Все поверхности второго порядка серии A имеют единственный центр Эллиптический и гиперболический параболоиды не имеют центра. Эллиптический цилиндр, гиперболический цилиндр, пара пересекающихся плоскостей имеют прямую центров. Параболический цилиндр не имеет центров. Пара параллельных плоскостей имеют плоскость центров. 8.7 Задачи Задача 1. Определить тип поверхности второго порядка, написать ее каноническое уравнение и найти каноническую систему координат 5x2 + 6y 2 + 7z 2 − 4xy − 4yz + 18x − 24y − 6z + 30 = 0. Решение. Выпишем матрицу A уравнения поверхности второго порядка и найдём её характеристический многочлен   5 −2 0 A = −2 6 −2 , 0 −2 7 det(A − λE) = −λ3 + I1 λ2 − I2 λ + I3 = −λ3 + 18λ2 − 99λ + 162 = −(λ − 3)(λ − 6)(λ − 9). Собственные значения: λ1 = 3, λ2 = 6, λ3 = 9. Наша поверхность принадлежит серии A. Собственные векторы равны соответственно       2 −2 1 1  1  1  2 , f2 = 1 , f3 = −2 . f1 = 3 3 3 1 2 2 Для нахождения канонической формы вычислим инварианты I3 , I4 и подставим в уравнение λ1 x02 + λ2 y 02 + λ3 z 02 + I4 = 0. I3 Получаем I3 = λ1 λ2 λ3 = 162, ¯ ¯ ¯ ¯ I4 = ¯¯ ¯ ¯ ¯ 5 −2 0 9 ¯¯ −2 6 −2 −12 ¯¯ = −972, 0 −2 7 −3 ¯¯ 9 −12 −3 30 ¯ λ1 (x0 )2 + λ2 (y 0 )2 + λ3 (z 0 )2 − 6 = 0 108 Каноническая форма поверхности: (x0 )2 (y 0 )2 (z 0 )2 + + =1 2 1 2/3 Наша поверхность — эллипсоид. Осталось найти центр поверхности. Система уравнений (90) имеет вид  10x − 4y + 18 = 0,  −4x + 12y − 4z − 24 = 0,  −4y + 14z − 6 = 0 и имеет единственное решение O0 = (−1, 2, 1). 0 2 0 2 0 2 Ответ. Эллипсоид (x2) + (y1) + (z2/3) = 1, каноническая система координат:       2 −2 1 1  1  1  O = (−1, 2, 1), f 1 = 2 , f2 = 1 , f3 = −2 . 3 3 3 1 2 2 Задача 2. Определить тип поверхности второго порядка, написать ее каноническое уравнение и найти каноническую систему координат 2x2 − 7y 2 − 4z 2 + 4xy + 20yz − 16zx + 60x − 12y + 12z − 90 = 0. Решение. Выпишем матрицу A уравнения поверхности второго порядка и найдём её характеристический многочлен   2 2 −8 A =  2 −7 10  , −8 10 −4 det(A−λE) = −λ3 +I1 λ2 −I2 λ+I3 = −λ3 −9λ2 +162λ = −(λ−9)(λ+18)λ. Собственные значения: λ1 = 9, λ2 = −18, λ3 = 0. Наша поверхность принадлежит серии B. Находим ортонормированный базис из собственных векторов с собственными значениями λ1 , λ2 , λ3 соответственно       −2 1 −2 1  1  1  f1 = 1 , f2 = −2 , f 3 = −2 3 3 3 2 2 −1 Перейдём в систему координат со старым центром 0 = (0, 0, 0) и новым базисом f 1 , f 2 , f 3 . Формула преобразования координат вектора принимает вид:      0 x −2 1 −2 x 1 y  =  1 −2 −2 y 0  . 3 z 2 2 −1 z0 109 Выполним эту подстановку — наше уравнение примет вид: F (x0 , y 0 , z 0 ) = 9x02 − 18y 02 + 2a014 x0 + 2a024 y 0 + 2a024 z 0 − 90 = 0. Теперь найдем новую линейную часть: 60x − 12y + 12z = 20(−2x0 + y 0 − 2z 0 ) − 4(x0 − 2y 0 − 2z 0 )+ +4(2x0 + 2y 0 − z 0 ) = −36x0 + 36y 0 − 16z 0 . Получаем уравнение поверхности после преобразования: F (x0 , y 0 , z 0 ) = 9x02 − 18y 02 − 36x0 + 36y 0 − 16z 0 − 90 = 0. (20 ) Выделив полный квадрат, получим 9(x0 − 2)2 − 18(y 0 − 1)2 − 36(z 0 + 3) = 0. после параллельного переноса системы координат  00  x = x0 − 2, y 00 = y 0 − 1,  00 z = z0 + 3 поверхность будет задана уравнением 9(x00 )2 − 18(y 00 )2 − 36z 00 = 0 или в канонической форме (x00 )2 (y 00 )2 − = z 00 . 4 2 Наша поверхность — гиперболический параболоид. Полагая x00 = 0, y 00 = 0, z 00 = 0, получаем x0 = 2, y 0 = 1, z 0 = −3, тогда O0 = (1, 2, 3). 00 2 00 2 Ответ. Гиперболический параболоид (x4 ) − (y2 ) = z 00 , каноническая система координат       −2 1 −2 1  1  1  O = (1, 2, 3), f 1 = 1 , f2 = −2 , f 3 = −2 . 3 3 3 2 2 −1 Задача 3. Определить тип поверхности второго порядка, написать ее каноническое уравнение и найти каноническую систему координат 4x2 + y 2 + 4z 2 − 4xy + 4yz − 8zx − 28x + 2y + 16z + 45 = 0. Решение. 110 (91) Выпишем матрицу A уравнения поверхности второго порядка и найдём её характеристический многочлен   4 −2 −4 A = −2 1 2  , −4 2 4 det(A − λE) = −λ3 + I1 λ2 − I2 λ + I3 = −λ3 + 9λ2 = −(λ − 9)λ2 . Собственные значения: λ1 = 9, λ2 = λ3 = 0. Наша поверхность принадлежит серии С. То есть либо параболический цилиндр, либо пара параллельных плоскостей. Находим ортонормированный базис из собственных векторов с собственными значениями λ1 , λ2 , λ3 соответственно       2 2 1 1  1  1  f1 = −1 , f 2 = 2 , f3 = −2 . 3 3 3 −2 1 2 Перейдём в систему координат со старым центром 0 = (0, 0, 0) и новым базисом f 1 , f 2 , f 3 . Формула преобразования координат вектора принимает вид:    0   2 2 1 x x y  = 1 −1 2 −2 y 0  . (92) 3 −2 1 2 z z Подставим (92) в (91). После подстановки наше уравнение примет вид: F (x0 , y 0 , z 0 ) = 9x02 + 2a014 x0 + 2a024 y 0 + 2a024 z 0 + 45 = 0. Для нахождения новой линейной части подставим (92) в линейную часть уравнения (91): 2 −28x + 2y + 16z = − 28 3 (2x + 2y + z ) + 3 (−x + 2y − 2z )+ + 16 3 (−2x + y + 2z ) = −30x − 12y . Получаем уравнение поверхности после преобразования (92): 9(x0 )2 − 30x0 − 12y 0 + 45 = 0. Выделив полный квадрат, получим µ ¶2 µ ¶ 5 5 9 x − − 12 y − = 0. 3 3 После параллельного переноса  00  x = x0 − 53 , y 00 = y 0 − 35 ,  z 00 = z 0 111 получаем каноническое уравнение поверхности 4 (x00 )2 = y 00 . 3 Наша поверхность — параболический цилиндр. Осталось найти старые координаты центра новой системы координат. Полагая x00 = 0, y 00 = 0, z 00 = 0, получаем x0 = 35 , y 0 = 35 , z 0 = 0. Подставляя 5 5 в (92), получаем O0 = ( 20 9 , 9 , − 9 ). Ответ. Параболический цилиндр (x00 )2 = 43 y 00 , каноническая система координат       2 2 1 1  1  1  20 5 5 O = ( , , − ), f 1 = −1 , f 2 = 2 , f3 = −2 . 9 9 9 3 3 3 −2 1 2 8.8 Контрольные вопросы и задачи Определить тип и схематически изобразить поверхность, заданную уравнением. 1. x2 − y 2 + z 2 = 1. 2. −x2 + y 2 − z 2 = 1. 3. z = xy. 4. z 2 = xy. 5. y 2 + x + z + 1 = 0. 6. yz = 0. 7. x2 − y + 1 = 0. 8. z 2 − 1 = 0. 112

Авторы лекции