Функции нескольких переменных. Геометрическое изображение функции двух переменных. Линии и поверхности уровня. Предел и непрерывность функции нескольких переменных, их свойства
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Министерство образования Российской Федерации
“МАТИ”- РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ
ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ им. К. Э. ЦИОЛКОВСКОГО
Кафедра “Высшая математика”
Н. Д. ВЫСК
КОНСПЕКТ ЛЕКЦИЙ ПО ВЫСШЕЙ МАТЕМАТИКЕ
Часть 2
Москва 2001 г.
Лекция 1.
Функции нескольких переменных. Геометрическое изображение функции двух переменных. Линии и поверхности уровня. Предел и непрерывность функции нескольких переменных, их свойства. Частные производные, их свойства и геометрический смысл.
Определение 1.1. Переменная z (с областью изменения Z) называется функцией двух независимых переменных х,у в множестве М, если каждой паре (х,у) из множества М по некоторому правилу или закону ставится в соответствие одно определенное значение z из Z.
Определение 1.2. Множество М, в котором заданы переменные х,у, называется областью определения функции, а сами х,у – ее аргументами.
Обозначения: z = f(x,y), z = z(x,y).
Примеры.
1. z = xy, z = x² + y² - функции, определенные для любых действительных значений х,у.
2. - функция, областью определения которой являются решения неравенства .
Замечание. Так как пару чисел (х,у) можно считать координатами некоторой точки на плоскости, будем впоследствии использовать термин «точка» для пары аргументов функции двух переменных, а также для упорядоченного набора чисел , являющихся аргументами функции нескольких переменных.
Определение 1.3. . Переменная z (с областью изменения Z) называется функцией нескольких независимых переменных в множестве М, если каждому набору чисел из множества М по некоторому правилу или закону ставится в соответствие одно определенное значение z из Z. Понятия аргументов и области определения вводятся так же, как для функции двух переменных.
Обозначения: z = f, z = z.
Геометрическое изображение функции двух переменных.
Рассмотрим функцию z = f(x,y), (1.1)
определенную в некоторой области М на плоскости Оху. Тогда множество точек трехмерного пространства с координатами (x,y,z), где , является графиком функции двух переменных. Поскольку уравнение (1.1) определяет некоторую поверхность в трехмерном пространстве, она и будет геометрическим изображением рассматриваемой функции.
z
z = f(x,y)
M y
Примерами могут служить изучаемые в предыдущем семестре уравнения плоскости
z = ax + by + c
и поверхностей второго порядка:
z = x² + y² (параболоид вращения),
(конус) и т.д.
Замечание. Для функции трех и более переменных будем пользоваться термином «поверхность в n-мерном пространстве», хотя изобразить подобную поверхность невозможно.
Линии и поверхности уровня.
Для функции двух переменных, заданной уравнением (1.1), можно рассмотреть множество точек (х,у) плоскости Оху, для которых z принимает одно и то же постоянное значение, то есть z = const. Эти точки образуют на плоскости линию, называемую линией уровня.
Пример.
Найдем линии уровня для поверхности z = 4 – x² - y². Их уравнения имеют вид x² + y² = 4 – c (c=const) – уравнения концентрических окружностей с центром в начале координат и с радиусами . Например, при с=0 получаем окружность x² + y² = 4 .
Для функции трех переменных u = u (x, y, z) уравнение u (x, y, z) = c определяет поверхность в трехмерном пространстве, которую называют поверхностью уровня.
Пример.
Для функции u = 3x + 5y – 7z –12 поверхностями уровня будет семейство параллельных плоскостей, задаваемых уравнениями 3x + 5y – 7z –12 + с = 0.
Предел и непрерывность функции нескольких переменных.
Введем понятие δ-окрестности точки М0 (х0 , у0) на плоскости Оху как круга радиуса δ с центром в данной точке. Аналогично можно определить δ-окрестность в трехмерном пространстве как шар радиуса δ с центром в точке М0 (х0 , у0 , z0). Для n-мерного пространства будем называть δ-окрестностью точки М0 множество точек М с координатами , удовлетворяющими условию
где - координаты точки М0. Иногда это множество называют «шаром» в n-мерном пространстве.
Определение 1.4. Число А называется пределом функции нескольких переменных fв точке М0, если такое, что | f(M) – A| < ε для любой точки М из δ-окрестности М0.
Обозначения: .
Необходимо учитывать, что при этом точка М может приближаться к М0, условно говоря, по любой траектории внутри δ-окрестности точки М0. Поэтому следует отличать предел функции нескольких переменных в общем смысле от так называемых повторных пределов, получаемых последовательными предельными переходами по каждому аргументу в отдельности.
Примеры.
1. Покажем, что функция не имеет предела при М→О(0,0). Действительно, если в качестве линии, по которой точка М приближается к началу координат, выбрать прямую у = х, то на этой прямой . Если же траекторией движения считать прямую у = 2х, то . Следовательно, предел в точке (0,0) не существует.
2. Найдем повторные пределы функции при х→0, у→0. , . Если же произвести предельные переходы в обратном порядке, получим: Таким образом, повторные пределы оказались различными (откуда следует, конечно, что функция не имеет в точке (0,0) предела в обычном смысле).
Замечание. Можно доказать, что из существования предела в данной точке в обычном смысле и существования в этой точке пределов по отдельным аргументам следует существование и равенство повторных пределов. Обратное утверждение неверно.
Определение 1.5. Функция f называется непрерывной в точке М0, если (1.2)
Если ввести обозначения , то условие (1.2) можно переписать в форме (1.3)
Определение 1.6. Внутренняя точка М0 области определения функции z = f (M) называется точкой разрыва функции, если в этой точке не выполняются условия (1.2), (1.3).
Замечание. Множество точек разрыва может образовывать на плоскости или в пространстве линии или поверхности разрыва.
Примеры.
1. Функция z = x² + y² непрерывна в любой точке плоскости Оху. Действительно, , поэтому .
2. Единственной точкой разрыва функции является точка (0,0).
3. Для функции линией разрыва является прямая х + у = 0.
Свойства пределов и непрерывных функций.
Так как определения предела и непрерывности для функции нескольких переменных практически совпадает с соответствующими определениями для функции одной переменной, то для функций нескольких переменных сохраняются все свойства пределов и непрерывных функций, доказанные в первой части курса, а именно:
1) Если существуют то существуют и (если ).
2) Если а и для любого i существуют пределы и существует , где М0 , то существует и предел сложной функции при , где - координаты точки Р0.
3) Если функции f(M) и g(M) непрерывны в точке М0, то в этой точке непрерывны и функции f(M) + g(M), kf(M), f(M)•g(M), f(M)/g(M) (если g(M0) ≠ 0).
4) Если функции непрерывны в точке Р0 , а функция непрерывна в точке М0, где , то сложная функция непрерывна в точке Р0.
5) Функция непрерывная в замкнутой ограниченной области D, принимает в этой области свое наибольшее и наименьшее значения.
6) Если функция непрерывная в замкнутой ограниченной области D, принимает в этой области значения А и В, то она принимает в области D и любое промежуточное значение, лежащее между А и В.
7) Если функция непрерывная в замкнутой ограниченной области D, принимает в этой области значения разных знаков, то найдется по крайней мере одна точка из области D, в которой f = 0.
Частные производные.
Рассмотрим изменение функции при задании приращения только одному из ее аргументов – хi , и назовем его .
Определение 1.7. Частной производной функции по аргументу хi называется .
Обозначения: .
Таким образом, частная производная функции нескольких переменных определяется фактически как производная функции одной переменной – хi. Поэтому для нее справедливы все свойства производных, доказанные для функции одной переменной.
Замечание. При практическом вычислении частных производных пользуемся обычными правилами дифференцирования функции одной переменной, полагая аргумент, по которому ведется дифференцирование, переменным, а остальные аргументы – постоянными.
Примеры.
1. z = 2x² + 3xy –12y² + 5x – 4y +2,
2. z = xy,
3.
Геометрическая интерпретация частных производных функции двух переменных.
Рассмотрим уравнение поверхности z = f (x,y) и проведем плоскость х = const. Выберем на линии пересечения плоскости с поверхностью точку М (х,у). Если задать аргументу у приращение Δу и рассмотреть точку Т на кривой с координатами (х, у+Δу, z+Δyz), то тангенс угла, образованного секущей МТ с положительным направлением оси Оу, будет равен . Переходя к пределу при , получим, что частная производная равна тангенсу угла, образованного касательной к полученной кривой в точке М с положительным направлением оси Оу. Соответственно частная производная равна тангенсу угла с осью Ох касательной к кривой, полученной в результате сечения поверхности z = f (x,y) плоскостью y = const.
Лекция 2.
Дифференцируемость функции нескольких переменных. Дифференциал, его свойства. Применение дифференциала к приближенным вычислениям. Дифференцирование сложных функций. Инвариантность формы дифференциала.
При исследовании вопросов, связанных с дифференцируемостью, ограничимся случаем функции трех переменных, поскольку все доказательства для большего количества переменных проводятся так же.
Определение 2.1. Полным приращением функции u = f(x, y, z) называется
(2.1)
Теорема 2.1. Если частные производные существуют в точке (х0 , у0 , z0) и в некоторой ее окрестности и непрерывны в точке (x0 , y0 , z0) , то
, (2.2)
где α, β, γ – бесконечно малые, зависящие от Δх, Δу, Δz.
Доказательство.
Представим полное приращение Δu в виде:
,
где каждая разность представляет собой частное приращение функции только по одной из переменных. Из условия теоремы следует, что к этим разностям можно применить теорему Лагранжа. При этом получим:
.
Так как по условию теоремы частные производные непрерывны в точке (х0 , у0 , z0), можно представить их в виде:
где . Теорема доказана.
Можно показать, что где . Действительно, α, β и γ – бесконечно малые при ρ→0, а - ограниченные (т.к. их модули не превышают 1).
Тогда приращение функции, удовлетворяющей условиям теоремы 2.1, можно представить в виде: , (2.3)
где (2.4)
Определение 2.2. Если приращение функции u = f (x, y, z) в точке (x0 , y0 , z0) можно представить в виде (2.3), (2.4), то функция называется дифференцируемой в этой точке, а выражение - главной линейной частью приращения или полным дифференциалом рассматриваемой функции.
Обозначения: du, df (x0 , y0 , z0).
Так же, как в случае функции одной переменной, дифференциалами независимых переменных считаются их произвольные приращения, поэтому
(2.5)
Замечание 1. Итак, утверждение «функция дифференцируема» не равнозначно утверждению «функция имеет частные производные» - для дифференцируемости требуется еще и непрерывность этих производных в рассматриваемой точке.
Замечание 2. Если в формуле (2.5) считать , и частными дифференциалами данной функции (как функции одного из аргументов), то можно сказать, что полный дифференциал равен сумме частных дифференциалов.
Применение дифференциала к приближенным вычислениям.
По аналогии с линеаризацией функции одной переменной можно при приближенном вычислении значений функции нескольких переменных, дифференцируемой в некоторой точке, заменять ее приращение дифференциалом. Таким образом, можно находить приближенное значение функции нескольких (например, двух) переменных по формуле:
, (2.6)
где
Пример.
Вычислить приближенное значение .
Рассмотрим функцию и выберем х0 =1, у0 = 2. Тогда Δх = 1,02 – 1 = 0,02; Δу = 1,97 – 2 = -0,03. Найдем ,
Следовательно, учитывая, что f (1, 2) = 3, получим:
Дифференцирование сложных функций.
Пусть аргументы функции z = f (x, y) являются, в свою очередь, функциями переменных u и v: x = x (u, v), y = y (u, v). Тогда функция f тоже есть функция от u и v. Выясним, как найти ее частные производные по аргументам u и v, не делая непосредственной подстановки
z = f ( x(u, v), y(u, v)). При этом будем предполагать, что все рассматриваемые функции имеют частные производные по всем своим аргументам.
Зададим аргументу u приращение Δ u, не изменяя аргумент v. Тогда
. (2.7)
Если же задать приращение только аргументу v, получим: . (2.8)
Разделим обе части равенства (2.7) на Δu, а равенства (2.8) – на Δv и перейдем к пределу соответственно при Δu→0 и Δv→0. Учтем при этом, что в силу непрерывности функций х и у . Следовательно,
(2.9)
Рассмотрим некоторые частные случаи.
Пусть x = x(t), y = y(t). Тогда функция f (x,y) является фактически функцией одной переменной t , и можно, используя формулы (2.9) и заменяя в них частные производные х и у по u и v на обычные производные по t (разумеется, при условии дифференцируемости функций x(t) и y(t) ) , получить выражение для :
(2.10)
Предположим теперь, что в качестве t выступает переменная х, то есть х и у связаны соотношением у = у (х). При этом, как и в предыдущем случае, функция f является функцией одной переменной х. Используя формулу (2.10) при t = x и учитывая, что , получим, что . (2.11)
Обратим внимание на то, что в этой формуле присутствуют две производные функции f по аргументу х: слева стоит так называемая полная производная, в отличие от частной, стоящей справа.
Примеры.
1. Пусть z = xy, где x = u² + v, y = uv². Найдем и . Для этого предварительно вычислим частные производные трех заданных функций по каждому из своих аргументов:
Тогда из формулы (2.9) получим:
(В окончательный результат подставляем выражения для х и у как функций u и v).
2. Найдем полную производную функции z = sin (x + y²), где y = cos x.
Инвариантность формы дифференциала.
Воспользовавшись формулами (2.5) и (2.9), выразим полный дифференциал функции z = f (x, y) , где x = x(u,v), y = y(u,v), через дифференциалы переменных u и v:
(2.12)
Следовательно, форма записи дифференциала сохраняется для аргументов u и v такой же, как и для функций этих аргументов х и у, то есть является инвариантной (неизменной).
Лекция 3.
Неявные функции, условия их существования. Дифференцирование неявных функций. Частные производные и дифференциалы высших порядков, их свойства.
Определение 3.1. Функция у от х, определяемая уравнением
F (x, y) = 0 , (3.1)
называется неявной функцией.
Конечно, далеко не каждое уравнение вида (3.1) определяет у как однозначную (и, тем более, непрерывную) функцию от х. Например, уравнение эллипса
задает у как двузначную функцию от х: для
Условия существования однозначной и непрерывной неявной функции определяются следующей теоремой:
Теорема 3.1 (без доказательства). Пусть:
1) функция F (x,y) определена и непрерывна в некотором прямоугольнике с центром в точке (х0 , у0 );
2) F (x0 , y0 ) = 0 ;
3) при постоянном х F (x,y) монотонно возрастает (или убывает) с возрастанием у.
Тогда
а) в некоторой окрестности точки (х0 , у0 ) уравнение (3.1) определяет у как однозначную функцию от х: y = f(x);
б) при х = х0 эта функция принимает значение у0 : f (x0) = y0 ;
в) функция f (x) непрерывна.
Найдем при выполнении указанных условий производную функции y = f (x) по х.
Теорема 3.2. Пусть функция у от х задается неявно уравнением (3.1), где функция F (x,y) удовлетворяет условиям теоремы 3.1. Пусть, кроме того, - непрерывные функции в некоторой области D, содержащей точку (х,у), координаты которой удовлетворяют уравнению (3.1), причем в этой точке . Тогда функция у от х имеет производную
(3.2)
Доказательство.
Выберем некоторое значение х и соответствующее ему значение у. Зададим х приращение Δх, тогда функция y = f (x) получит приращение Δу . При этом F (x,y) = 0, F (x+ Δx, y+Δy) = 0, поэтому F (x+ Δx, y+Δy) – F (x,y) = 0. Слева в этом равенстве стоит полное приращение функции F (x,y), которое можно представить в виде (2.2):
.
Разделив обе части полученного равенства на Δх, выразим из него : .
В пределе при , учитывая, что и , получим: . Теорема доказана.
Пример. Найдем , если . Найдем , .
Тогда из формулы (3.2) получаем: .
Производные и дифференциалы высших порядков.
Частные производные функции z = f (x,y) являются, в свою очередь, функциями переменных х и у. Следовательно, можно найти их частные производные по этим переменным. Обозначим их так:
Таким образом, получены четыре частные производные 2-го порядка. Каждую из них можно вновь продифференцировать по х и по у и получить восемь частных производных 3-го порядка и т.д. Определим производные высших порядков так:
Определение 3.2. Частной производной n-го порядка функции нескольких переменных называется первая производная от производной (n – 1)-го порядка.
Частные производные обладают важным свойством: результат дифференцирования не зависит от порядка дифференцирования (например, ). Докажем это утверждение.
Теорема 3.3. Если функция z = f (x,y) и ее частные производные определены и непрерывны в точке М (х, у) и в некоторой ее окрестности, то в этой точке
(3.3)
Доказательство.
Рассмотрим выражение и введем вспомогательную функцию . Тогда
. Из условия теоремы следует, что дифференцируема на отрезке [x, x+Δx], поэтому к ней можно применить теорему Лагранжа: где
[x, x+Δx]. Но Так как в окрестности точки М определена , дифференцируема на отрезке [y, y + Δy], поэтому к полученной разности вновь можно применить теорему Лагранжа: , где Тогда
Изменим порядок слагаемых в выражении для А:
и введем другую вспомогательную функцию , тогда Проведя те же преобразования, что и для , получим, что где . Следовательно,
. В силу непрерывности и . Поэтому, переходя к пределу при получаем, что , что и требовалось доказать.
Следствие. Указанное свойство справедливо для производных любого порядка и для функций от любого числа переменных.
Дифференциалы высших порядков.
Определение 3.2. Дифференциалом второго порядка функции u = f (x, y, z) называется
Аналогично можно определить дифференциалы 3-го и более высоких порядков:
Определение 3.3. Дифференциалом порядка k называется полный дифференциал от дифференциала порядка (k – 1): d k u = d (d k-1 u).
Свойства дифференциалов высших порядков.
1. k-й дифференциал является однородным целым многочленом степени k относительно дифференциалов независимых переменных, коэффициентами при которых служат частные производные k-го порядка, умноженные на целочисленные постоянные (такие же, как при обычном возведении в степень):
.
2. Дифференциалы порядка выше первого не инвариантны относительно выбора переменных.
Лекция 4.
Касательная плоскость и нормаль к поверхности. Геометрический смысл дифференциала. Формула Тейлора для функции нескольких переменных. Производная функции по направлению. Градиент и его свойства.
Пусть функция z = f (x, y) является дифференцируемой в окрестности точки М (х0 , у0). Тогда ее частные производные и являются угловыми коэффициентами касательных к линиям пересечения поверхности z = f (x, y) с плоскостями у = у0 и х = х0, которые будут касательными и к самой поверхности z = f (x, y). Составим уравнение плоскости, проходящей через эти прямые. Направляющие векторы касательных имеют вид {1; 0; } и {0; 1; }, поэтому нормаль к плоскости можно представить в виде их векторного произведения: n = {-,-, 1}. Следовательно, уравнение плоскости можно записать так:
, (4.1)
где z0 = .
Определение 4.1. Плоскость, определяемая уравнением (4.1), называется касательной плоскостью к графику функции z = f (x, y) в точке с координатами ( х0 , у0 , z0 ).
Из формулы (2.3) для случая двух переменных следует, что приращение функции f в окрестности точки М можно представить в виде:
или
(4.2)
Следовательно, разность между аппликатами графика функции и касательной плоскости является бесконечно малой более высокого порядка, чем ρ, при ρ→0.
При этом дифференциал функции f имеет вид:
,
что соответствует приращению аппликаты касательной плоскости к графику функции. В этом состоит геометрический смысл дифференциала.
Определение 4.2. Ненулевой вектор, перпендикулярный касательной плоскости в точке М (х0 , у0) поверхности z = f (x, y), называется нормалью к поверхности в этой точке.
В качестве нормали к рассматриваемой поверхности удобно принять вектор --n = {,,-1}.
z
z = f (x,y)
M0 (x0 , y0 , z0)
n
y
M (x0 , y0)
x
Пример.
Составим уравнение касательной плоскости к поверхности z = xy в точке М (1; 1). При х0 = у0 = 1 z0 =1; . Следовательно, касательная плоскость задается уравнением: z = 1 + (x – 1) + (y – 1), или x + y – z – 1 = 0. При этом вектор нормали в данной точке поверхности имеет вид: n = {1; 1; -1}.
Найдем приращение аппликат графика функции и касательной плоскости при переходе от точки М к точке N(1,01; 1,01).
Δz = 1,01² - 1 = 0,0201; Δzкас = (1,01 + 1,01 – 1) – (1 + 1 – 1) = 0,02. Следовательно,
dz = Δzкас = 0,02. При этом Δz – dz = 0,0001.
Формула Тейлора для функции нескольких переменных.
Как известно, функцию F(t) при условии существования ее производных по порядок n+1 можно разложить по формуле Тейлора с остаточным членом в форме Лагранжа (см. формулы (21.7), (21.11) первой части курса). Запишем эту формулу в дифференциальной форме:
(4.3)
где
В этой форме формулу Тейлора можно распространить на случай функции нескольких переменных.
Рассмотрим функцию двух переменных f(x, y), имеющую в окрестности точки (х0 , у0) непрерывные производные по (n + 1)-й порядок включительно. Зададим аргументам х и у некоторые приращения Δх и Δу и рассмотрим новую независимую переменную t:
(0 ≤ t ≤1). Эти формулы задают прямолинейный отрезок, соединяющий точки (х0 , у0) и (х0 + Δх, у0 + Δу). Тогда вместо приращения Δf (x0 ,y0) можно рассматривать приращение вспомогательной функции
F(t) = f (x0 + t Δx, y0 + tΔy) , (4.4)
равное ΔF (0) = F (1) – F (0). Но F (t) является функцией одной переменной t, следовательно, к ней применима формула (4.3). Получаем:
.
Отметим, что при линейной замене переменных дифференциалы высших порядков обладают свойством инвариантности, то есть
Подставив эти выражения в (4.3), получим формулу Тейлора для функции двух переменных:
, (4.5)
где 0<θ<1.
Замечание. В дифференциальной форме формула Тейлора для случая нескольких переменных выглядит достаточно просто, однако в развернутом виде она весьма громоздка. Например, даже для функции двух переменных первые ее члена выглядят так:
Производная по направлению. Градиент.
Пусть функция u = f (x, y, z) непрерывна в некоторой области D и имеет в этой области непрерывные частные производные. Выберем в рассматриваемой области точку M(x,y,z) и проведем из нее вектор S, направляющие косинусы которого cosα, cosβ, cosγ. На векторе S на расстоянии Δs от его начала найдем точку М1(х+Δх, у+Δу, z+Δz), где
Представим полное приращение функции f в виде:
где
После деления на Δs получаем:
.
Поскольку предыдущее равенство можно переписать в виде:
(4.6)
Определение 4.3. Предел отношения при называется производной от функции u = f (x, y, z) по направлению вектора S и обозначается .
При этом из (4.6) получаем:
(4.7)
Замечание 1. Частные производные являются частным случаем производной по направлению. Например, при получаем:
.
Замечание 2. Выше определялся геометрический смысл частных производных функции двух переменных как угловых коэффициентов касательных к линиям пересечения поверхности, являющейся графиком функции, с плоскостями х = х0 и у = у0. Аналогичным образом можно рассматривать производную этой функции по направлению l в точке М(х0 , у0) как угловой коэффициент линии пересечения данной поверхности и плоскости, проходящей через точку М параллельно оси Oz и прямой l.
Определение 4.4. Вектор, координатами которого в каждой точке некоторой области являются частные производные функции u = f (x, y, z) в этой точке, называется градиентом функции u = f (x, y, z).
Обозначение: grad u = .
Свойства градиента.
1. Производная по направлению некоторого вектора S равняется проекции вектора grad u на вектор S. Доказательство. Единичный вектор направления S имеет вид eS ={cosα, cosβ, cosγ}, поэтому правая часть формулы (4.7) представляет собой скалярное произведение векторов grad u и es, то есть указанную проекцию.
2. Производная в данной точке по направлению вектора S имеет наибольшее значение, равное |grad u |, если это направление совпадает с направлением градиента. Доказательство. Обозначим угол между векторами S и grad u через φ. Тогда из свойства 1 следует, что |grad u |∙cosφ, (4.8) следовательно, ее наибольшее значение достигается при φ=0 и равно |grad u |.
3. Производная по направлению вектора, перпендикулярного к вектору grad u , равна нулю.
Доказательство. В этом случае в формуле (4.8)
4. Если z = f (x,y) – функция двух переменных, то grad f = направлен перпендикулярно к линии уровня f (x,y) = c, проходящей через данную точку.
Лекция 5.
Экстремумы функций нескольких переменных. Необходимое условие экстремума. Достаточное условие экстремума. Условный экстремум. Метод множителей Лагранжа. Нахождение наибольших и наименьших значений.
Определение 5.1. Точка М0 (х0 , у0 ) называется точкой максимума функции z = f (x, y), если f (xo , yo) > f (x, y) для всех точек (х, у) из некоторой окрестности точки М0.
Определение 5.2. Точка М0 (х0 , у0 ) называется точкой минимума функции z = f (x, y), если f (xo , yo) < f (x, y) для всех точек (х, у) из некоторой окрестности точки М0.
Замечание 1. Точки максимума и минимума называются точками экстремума функции нескольких переменных.
Замечание 2. Аналогичным образом определяется точка экстремума для функции от любого количества переменных.
Теорема 5.1 (необходимые условия экстремума). Если М0 (х0 , у0 ) – точка экстремума функции z = f (x, y), то в этой точке частные производные первого порядка данной функции равны нулю или не существуют.
Доказательство.
Зафиксируем значение переменной у, считая у = у0. Тогда функция f (x, y0) будет функцией одной переменной х, для которой х = х0 является точкой экстремума. Следовательно, по теореме Ферма или не существует. Аналогично доказывается такое же утверждение для .
Определение 5.3. Точки, принадлежащие области определения функции нескольких переменных, в которых частные производные функции равны нулю или не существуют, называются стационарными точками этой функции.
Замечание. Таким образом, экстремум может достигаться только в стационарных точках, но не обязательно он наблюдается в каждой из них.
Примеры.
1. Найдем стационарную точку функции z = x² + y². Для этого решим систему уравнений откуда х0 = у0 = 0. Очевидно, что в этой точке функция имеет минимум, так как при х = у = 0 z = 0, а при остальных значениях аргументов z > 0.
2. Для функции z = xy стационарной точкой тоже является (0, 0), но экстремум в этой точке не достигается ( z (0, 0) = 0, а в окрестности стационарной точки функция принимает как положительные, так и отрицательные значения).
Теорема 5.2 (достаточные условия экстремума). Пусть в некоторой окрестности точки М0 (х0 , у0 ) , являющейся стационарной точкой функции z = f (x, y), эта функция имеет непрерывные частные производные до 3-го порядка включительно. Обозначим Тогда:
1) f (x, y) имеет в точке М0 максимум, если AC – B² > 0, A < 0;
2) f (x, y) имеет в точке М0 минимум, если AC – B² > 0, A > 0;
3) экстремум в критической точке отсутствует, если AC – B² < 0;
4) если AC – B² = 0, необходимо дополнительное исследование.
Доказательство.
Напишем формулу Тейлора второго порядка для функции f (x, y), помня о том, что в стационарной точке частные производные первого порядка равны нулю:
где Если угол между отрезком М0М , где М (х0+Δх, у0+Δу), и осью Ох обозначить φ, то Δх = Δρ cosφ, Δy = Δρsinφ. При этом формула Тейлора примет вид: . Пусть Тогда можно разделить и умножить выражение в скобках на А. Получим:
. (5.1)
Рассмотрим теперь четыре возможных случая:
1) AC-B² > 0, A < 0. Тогда , и при достаточно малых Δρ. Следовательно, в некоторой окрестности М0 f (x0 + Δx, y0 + Δy) < f (x0 , y0), то есть М0 – точка максимума.
2) Пусть AC – B² > 0, A > 0. Тогда , и М0 – точка минимума.
3) Пусть AC-B² < 0, A > 0. Рассмотрим приращение аргументов вдоль луча φ = 0. Тогда из (5.1) следует, что , то есть при движении вдоль этого луча функция возрастает. Если же перемещаться вдоль луча такого, что tg φ0 = -A/B, то , следовательно, при движении вдоль этого луча функция убывает. Значит, точка М0 не является точкой экстремума.
3`) При AC – B² < 0, A < 0 доказательство отсутствия экстремума проводится
аналогично предыдущему.
3``) Если AC – B² < 0, A = 0, то . При этом . Тогда при достаточно малых φ выражение 2B cosφ + C sinφ близко к 2В, то есть сохраняет постоянный знак, а sinφ меняет знак в окрестности точки М0 . Значит, приращение функции меняет знак в окрестности стационарной точки, которая поэтому не является точкой экстремума.
4) Если AC – B² = 0, а , , то есть знак приращения определяется знаком 2α0. При этом для выяснения вопроса о существовании экстремума необходимо дальнейшее исследование.
Пример. Найдем точки экстремума функции z = x² - 2xy + 2y² + 2x. Для поиска стационарных точек решим систему . Итак, стационарная точка (-2,-1). При этом А = 2, В = -2, С = 4. Тогда AC – B² = 4 > 0, следовательно, в стационарной точке достигается экстремум, а именно минимум (так как A > 0).
Условный экстремум.
Определение 5.4. Если аргументы функции f (x1 , x2 ,…, xn) связаны дополнительными условиями в виде m уравнений (m < n):
φ1 (х1, х2 ,…, хn) = 0, φ2 (х1, х2 ,…, хn) = 0, …, φm (х1, х2 ,…, хn) = 0, (5.2)
где функции φi имеют непрерывные частные производные, то уравнения (5.2) называются уравнениями связи.
Определение 5.5. Экстремум функции f (x1 , x2 ,…, xn) при выполнении условий (5.2) называется условным экстремумом.
Замечание. Можно предложить следующее геометрическое истолкование условного экстремума функции двух переменных: пусть аргументы функции f(x,y) связаны уравнением φ(х,у) = 0, задающим некоторую кривую в плоскости Оху. Восставив из каждой точки этой кривой перпендикуляры к плоскости Оху до пересечения с поверхностью z = f (x,y), получим пространственную кривую, лежащую на поверхности над кривой φ(х,у) = 0. Задача состоит в поиске точек экстремума полученной кривой, которые, разумеется, в общем случае не совпадают с точками безусловного экстремума функции f(x,y).
Определим необходимые условия условного экстремума для функции двух переменных, введя предварительно следующее определение:
Определение 5.6. Функция L (x1 , x2 ,…, xn) = f (x1 , x2 ,…, xn) + λ1φ1 (x1 , x2 ,…, xn) +
+ λ2φ2 (x1 , x2 ,…, xn) +…+λmφm (x1 , x2 ,…, xn), (5.3)
где λi – некоторые постоянные, называется функцией Лагранжа, а числа λi – неопределенными множителями Лагранжа.
Теорема 5.3 (необходимые условия условного экстремума). Условный экстремум функции z = f (x, y) при наличии уравнения связи φ (х, у) = 0 может достигаться только в стационарных точках функции Лагранжа L (x, y) = f (x, y) + λφ (x, y).
Доказательство. Уравнение связи задает неявную зависимость у от х, поэтому будем считать, что у есть функция от х: у = у(х). Тогда z есть сложная функция от х, и ее критические точки определяются условием: . (5.4) Из уравнения связи следует, что . (5.5)
Умножим равенство (5.5) на некоторое число λ и сложим с (5.4). Получим:
, или .
Последнее равенство должно выполняться в стационарных точках, откуда следует:
(5.6)
Получена система трех уравнений относительно трех неизвестных: х, у и λ, причем первые два уравнения являются условиями стационарной точки функции Лагранжа. Исключая из системы (5.6) вспомогательное неизвестное λ, находим координаты точек, в которых исходная функция может иметь условный экстремум.
Замечание 1. Проверку наличия условного экстремума в найденной точке можно провести с помощью исследования частных производных второго порядка функции Лагранжа по аналогии с теоремой 5.2.
Замечание 2. Точки, в которых может достигаться условный экстремум функции f (x1 , x2 ,…, xn) при выполнении условий (5.2), можно определить как решения системы (5.7)
Пример. Найдем условный экстремум функции z = xy при условии х + у = 1. Составим функцию Лагранжа L(x, y) = xy + λ (x + y – 1). Система (5.6) при этом выглядит так:
, откуда -2λ=1, λ=-0,5, х = у = -λ = 0,5. При этом L (x, y) можно представить в виде L (x, y) = -0,5 (x – y)² + 0,5 ≤ 0,5, поэтому в найденной стационарной точке L (x, y)имеет максимум, а z = xy – условный максимум.
Нахождение наибольших и наименьших значений.
Пусть функция u = f (x1 , x2 ,…, xn) определена и непрерывна в некотором ограниченном и замкнутом множестве D и имеет на этом множестве конечные частные производные (за исключением, быть может, отдельных точек). Тогда эта функция достигает на D своего наибольшего и наименьшего значения (см. свойства непрерывных функций). Если это значение достигается во внутренней точке множества, то, очевидно, эта точка должна быть стационарной; кроме того, наибольшее и наименьшее значение может достигаться на границе множества D. Поэтому для определения наибольшего и наименьшего значений функции на множестве D требуется:
1) найти стационарные точки функции, принадлежащие D, и вычислить значения функции в этих точках;
2) найти наибольшее и наименьшее значение, принимаемое функцией на границе множества D;
3) выбрать наименьшее и наибольшее из полученных чисел, которые и будут являться наименьшим и наибольшим значениями функции на всем множестве D.
Примеры.
1. Найдем наибольшее значение функции z = sin x + sin y – sin (x + y) в треугольнике со сторонами х = 0, у = 0, х + у = 2π. Стационарные точки определяются из решения системы, откуда . Единственной внутренней точкой данного треугольника, являющейся решением полученной системы, будет , в которой . Это значение оказывается наибольшим и на всем рассматриваемом множестве, так как на его границе z = 0.
2. Найдем наибольшее и наименьшее значения функции z = x² + y² - 12x + 16y в области x² + y² ≤ 25. , откуда х =6, у = -8 – точка, не лежащая в заданном круге. Следовательно, наибольшее и наименьшее значения данная функция принимает на границе области, то есть на окружности x² + y² = 25. Составим функцию Лагранжа L (x, y ) = x² + y² - 12x + 16y + λ (x² + y² - 25). Ее стационарные точки найдем из системы. Получим , откуда λ1 =1, λ2 = -3. Следовательно, стационарными точками являются (3, -4) и (-3, 4). В первой из них z = -75, во второй z = 125. Эти числа являются наименьшим и наибольшим значениями z в заданной области.
Лекция 6.
Первообразная. Неопределенный интеграл и его свойства. Табличные интегралы. Замена переменной и интегрирование по частям в неопределенном интеграле.
Определение 6.1. Функция F(x) называется первообразной (для) функции f(x) на некотором множестве значений х, если F΄(x) = f(x) на этом множестве.
Теорема 6.1. Если функции F(x) и G(x) являются первообразными одной и той же функции f(x) на некотором множестве, то необходимым и достаточным условием этого является то, что G(x) = F(x) + C, где С – любая постоянная.
Доказательство.
1. Пусть F(x) - первообразная f(x), то есть F΄(x) = f(x). Тогда для любого числа C (F(x) + C)΄= F΄(x) + C΄= F΄(x) + 0 = f(x), то есть F(x) + C - первообразная f(x).
2. Пусть F(x) и G(x) – две различные первообразные одной и той же функции f(x). Тогда (F(x) – G(x))΄= F΄(x) - G΄(x) = f(x) – f(x) = 0, следовательно, F(x) – G(x) = C (по следствию из теоремы Лагранжа). Теорема доказана.
Таким образом, если функция на данном множестве имеет одну первообразную, то она имеет их бесконечно много, причем все они отличаются друг от друга постоянными слагаемыми.
Определение 5.2. Совокупность всех первообразных функции f(x) на некотором множестве называется ее неопределенным интегралом.
Обозначение: .
f(x) при этом называется подынтегральной функцией, а f(x)dx – подынтегральным выражением.
Свойства неопределенного интеграла.
1.
2.
3. Действительно, а . Но, поскольку С1+С2 – произвольная постоянная, выражения в левой и правой частях равны.
4.
Замечание. Все перечисленные свойства формулировались и доказывались в предположении, что на некотором множестве существуют первообразные функций f(x) и g(x), равные соответственно F(x) и G(x).
Табличные интегралы.
Из определения первообразной и неопределенного интеграла следует, что таблицу основных интегралов можно получить из таблицы основных производных (см. лекцию 18 первой части курса), считая производные табличных функций подынтегральными функциями, а сами функции – их первообразными.
1. 2.
3. 3΄)
4. 5.
6. 7.
8. 9.
10. 11.
12.
13.
Можно добавить к этой таблице еще несколько формул, не следующих непосредственно из таблицы производных, но удобных для вычисления многих интегралов, а именно:
14. 15.
Доказательство справедливости этих формул предлагается провести самостоятельно.
Примеры.
1.
2.
Замена переменной в неопределенном интеграле.
Теорема 6.2. Пусть функция f(x) определена на множестве Х, а функция φ(t) – на множестве Φ, причем . Тогда, если функция f(x) имеет первообразную F(x) на Х, а φ(t) дифференцируема на Φ, то
(6.1)
Доказательство.
, поэтому функция F(φ(t)) является первообразной функции f(φ(t)) φ΄(t). Следовательно, . С другой стороны, при x = φ(t) . В полученных формулах равны правые части, следовательно, равны и левые, что доказывает справедливость формулы (6.1).
Замечание 1. Формулу (6.1) называют формулой интегрирования подстановкой.
Замечание 2. Часто удобно бывает использовать формулу (6.1) «в обратную сторону»:
, (6.2)
то есть заменять переменную х функцией новой переменной t. Формула (6.2) носит название формулы интегрирования заменой переменной.
Замечание. Формулы (6.1) и (6.2) показывают, что вид первообразной не изменяется при замене независимой переменной х на функцию φ(t), поэтому их называют формулами инвариантности интегрирования.
Примеры.
1. При этом была сделана подстановка x = sin t.
2.
Интеграл был вычислен с помощью замены переменной: x = t².
Формула интегрирования по частям.
Теорема 6.3. Если функции u(x) и v(x) дифференцируемы на некотором промежутке, и на нем существует интеграл , то на нем существует и интеграл причем
(6.3)
Доказательство.
d(uv) = vdu + udv, поэтому udv = d(uv) – vdu. Проинтегрируем обе части полученного равенства, учитывая, что Тогда что и требовалось доказать. Существование интеграла в левой части равенства следует из существования обоих интегралов в правой части.
Пример.