Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 4. Аппроксимация функций.
4.1. Постановка задачи.
Пусть функция y = f (x) задана таблицей
x x1 x2 . . . xm
y y1 y2 . . . ym
Требуется найти формулу y = F (x), выражающую эту зависимость аналитически. Существует два способа решения этой задачи.
1) Метод интерполяции. Аппроксимирующая кривая y = F (x) проходит
через все узловые точки таблицы. Однако требование точного совпадения
значений приближающей F и приближаемой f функций в узлах является
неоправданным, т.к. 1) значения yi функции f получаются в результате измерений и уже сами являются приближенными; 2) величина y зависит не
только от x, но и от других случайных факторов, которые от опыта к опыту
колеблются по своим собственным случайным законам.
2) Сглаживание опытных данных. Табличные данные аппроксимируют
кривой y = F (x), которая не обязательно должна пройти через все узловые
точки, а должна "сгладить" все случайные помехи табличной функции.
Задача. Найти функцию y = F (x) заданного вида, которая в точках
x1 , x2 , . . . , xm принимает значения, как можно более близкие к табличным
y1 , y2 , . . . , ym .
На практике вид приближающей функции F (x) определяют путем сравнения вида приближенно построенного графика функции y = f (x) с графиками элементарных функций. По таблице строится точечный график функции y = f (x), затем проводится плавная кривая, по возможности наилучшим
образом отражающая характер расположения точек. По полученной таким
образом кривой устанавливается вид приближающей функции F (x).
На рисунке 1 изображены три ситуации:
а) взаимосвязь x и y близка к линейной; прямая линия близка к точкам
наблюдений, последние отклоняются от нее несущественно.
1
y 6
y 6
@
@r
r r
@
@r r
@
а)
O
r r
@
@r
@
y 6
r
-
x
б)
r
rr r r
rr
r
r
r
r
@
@
r
r
r @ r
r
@
r
r r@
r
@
r
r
r
r
@
@
-
O
x
в)
r
-
O
x
Рис. 1:
б ) взаимосвязь x и y описывается нелинейной функцией, и какую бы мы
ни провели прямую линию, отклонение точек наблюдения от нее будет
существенным. В то же время, проведенная ветка параболы достаточно
хорошо отражает характер зависимости между величинами.
с) взаимосвязь x и y отсутствует; какую бы мы ни выбрали формулу связи,
результаты будут неудачными. В частности, обе выбранные прямые одинаково плохи для того, чтобы делать выводы об ожидаемых значениях
переменной y по значениям переменной x.
4.2. Метод наименьших квадратов.
Метод наименьших квадратов – метод определения параметров приближающей функции y = F (x) (заданного вида), минимизирующий величину
Φ=
m
P
2
yi − F (xi )
i=1
– сумму квадратов отклонений наблюдений yi зависимой переменной от значений F (xi ) искомой приближающей функции.
Будем искать приближающую функцию в виде многочлена степени n:
Fn (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 или Fn (x) =
n
P
as x s .
s=0
Тогда Φ является функцией n+1 переменных a0 , a1 , . . . , an , и задача сводится
к нахождению ее минимума. Необходимые условия экстремума функции Φ:
∂Φ
= 0,
∂aj
j = 0, 1, . . . , n.
2
(1)
Находим частные производные функции Φ:
m
m
n
∂Fn (xi )
P
P
P
∂Φ
s
= − 2 yi − Fn (xi )
= −2
yi −
as xi xji .
∂aj
∂aj
s=0
i=1
i=1
Тогда система уравнений (1) для определения неизвестных параметров
a0 , a1 , . . . , an примет вид:
n
m
m
P
P
P
s+j
as x i =
xji yi ,
s=0
i=1
j = 0, 1, . . . , n,
i=1
или
a0
m
P
i=1
xji
m
P
+ a1
i=1
x1+j
i
+ a2
m
P
i=1
x2+j
+ ...+
i
+ an
m
P
i=1
xn+j
=
i
m
P
i=1
xji yi ,
j = 0, 1, . . . , n.
Запишем эту систему в развернутом виде:
m
m
m
m
P
P
P
P
n
2
yi ,
=
x
+
.
.
.
+
a
a
m
+
a
x
+
a
x
n
1
i
2
i
i
i=1
i=1
i=1
i=1
m
m
m
m
m
a0 P xi + a1 P x2 + a2 P x3 + . . . + an P xn+1 = P xi yi ,
i
i
i
i=1
i=1
i=1
i=1
i=1
...
m
m
m
m
m
P
P n+1
P
P
P n
n+2
2n
xni yi .
=
x
x
x
+
a
+
a
+
.
.
.
+
a
a
x
0
1
2
n
i
i
i
i
i=1
i=1
i=1
(2)
i=1
i=1
Алгоритм метода наименьших квадратов. 1) По исходным данным xi ,
yi , i = 1, 2, . . . , m, вычисляем
m
m
m
P
P
P
xi ,
x2i , . . . ,
x2n
i ,
i=1
i=1
m
P
i=1
i=1
yi ,
m
P
xi yi
... ,
i=1
m
P
xni yi .
i=1
2) Составляем и решаем систему уравнений (2) для определения неизвестных коэффициентов a0 , a1 , . . . , an .
3) Записываем приближающую функцию в виде
Fn (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 .
Замечания. 1) Для оценки качества аппроксимации по методу наименьших квадратов вычисляют среднеквадратичную погрешность
v
u
m
u1 X
2
t
yi − Fn (xi ) ,
δn =
m i=1
3
где n – степень многочлена Fn (x).
2) Пусть известна погрешность ε, с которой заданы значения исходной
функции y(x). Тогда:
а) если δn ε, то аппроксимация слишком груба, степень n мала и
необходимо ее увеличить;
б) если δn ε, то приближающая функция слишком усложнена и степень n надо уменьшить;
в) если δn ≈ ε, то степень n "оптимальна".
Пример. Экспериментальные данные о значениях переменных x и y
приведены в таблице:
xi
1
2
3
4
5
yi 5,3 6,3 4,8 3,8 3,3
Методом наименьших квадратов аппроксимировать эти данные линейной функцией F1 (x) = a1 x + a0 .
Система уравнений (2) в случае линейной аппроксимации примет вид
(n = 1):
m
m
P
P
yi ,
a0 m + a1 x i =
a0
m
P
i=1
x i + a1
i=1
m
P
i=1
x2i
=
m
P
(3)
x i yi ,
i=1
i=1
В нашем примере m = 5. Заполняем таблицу для удобства вычисления
сумм, которые входят в систему (3):
i
1
2
3
4
5
5
P
i=1
xi
1
2
3
4
5
15
yi
5,3
6,3
4,8
3,8
3,3
23,5
x2i
1
4
9
16
25
55
xi yi 5,3 12,6 14,4 15,2 16,5
64
Замечание. Заполнение таблицы удобно провести в Excel.
Таким образом, получаем следующую систему:
5a0 + 15a1 = 23,5,
15a + 55a = 64,
1
4
откуда a0 = 6,65, a1 = −0,65. Следовательно, искомая аппроксимирующая
функция F1 (x) = −0,65x + 6,65. Из всех линейных функций она лучше всего
приближает исходные экспериментальные данные (в смысле метода наименьших квадратов).
y6
r
r
r
r
r
y = −0,65x + 6,65
1
O
-
x
1
Рис. 2:
На рисунке 2 изображена найденная прямая y = −0,65x+6,65 и исходные
данные (точки).
Вычислим сумму квадратов отклонений между эмпирическими и теоретическими значениями. Геометрически – это сумма квадратов длин пунктирных отрезков (два из которых настолько малы, что их даже не видно).
Вычисления сведем в таблицу:
i
1
2
3
4
5
xi
1
2
3
4
5
yi
5,3
6,3
4,8
3,8
3,3
F1 (xi )
6
5,35
4,7
4,05
3,4
5
P
2
yi − F1 (xi )
i=1
2
0,49 0,9025 0,01 0,0625 0,01
yi − F1 (xi )
1,475
Найдем среднеквадратичную погрешность:
v
r
u 5
u1 X
1,475
2
δ1 = t
yi − F1 (xi ) =
≈ 0,5.
5 i=1
5
Так как погрешность исходных данных ε не превышает 0,1 (значения искомой функции заданы с точностью до десятых), т.е. имеет такой же порядок,
что и δ1 , то линейную аппроксимацию в данном примере можно считать оптимальной.
5