
Определение эмпирической функции распределения
Пусть X -- случайная величина. F(x) - функция распределения данной случайной величины. Будем проводить в одних и тех же независимых друг от друга условий n опытов над данной случайной величиной. При этом получим последовательность значений x1, x2 , ... , xn, которая и называется выборкой.
Каждое значение xi (i=1,2 , ... , n) называется вариантой.
Функция распределения F(x) генеральной совокупности называется теоретической функцией распределения.
Одной из оценок теоретической функции распределения является эмпирическая функция распределения.
Эмпирической функцией распределения Fn(x) называется функция, которая определяет для каждого значения x относительную частоту события $X Fn(x)=nxn
где nx - число вариант, меньших x, n -- объем выборки.
Отличие эмпирической функции от теоретической состоит том, что теоретическая функция определяет вероятность события $X
Свойства эмпирической функции распределения
Рассмотрим теперь несколько основных свойств функции распределения.
-
Область значений функции Fn(x) -- отрезок [0,1].
-
Fn(x) неубывающая функция.
-
Fn(x) непрерывная слева функция.
-
Fn(x) кусочно-постоянная функция и возрастает только в точках значений случайной величины X
-
Пусть X1 -- наименьшая, а Xn -- наибольшая варианта. Тогда Fn(x)=0 при x≤X1и Fn(x)=1 при x≥Xn.
Введем теорему, которая связывает между собой теоретическую и эмпирическую функции.
Пусть Fn(x) -- эмпирическая функция распределения, а F(x) -- теоретическая функция распределения генеральной выборки. Тогда выполняется равенство:
limn→∞|Fn(x)−F(x)|=0Примеры задач на нахождение эмпирической функции распределения
Пусть распределение выборки имеет следующие данные, записанные с помощью таблицы:
Рисунок 1.
Найти объем выборки, составить эмпирическую функцию распределения и построить её график.
Решение:
Объем выборки: n=5+10+15+20=50.
По свойству 5, имеем, что при x≤1 Fn(x)=0, а при x>4 Fn(x)=1.
Значение $x
Значение $x
Значение $x
Таким образом, получаем:
Рисунок 2.
Построим график эмпирического распределения:
Рисунок 3.
Из городов центральной части России случайным образом выбрано 20 городов, для которых получены следующие данные по стоимости проезда в общественном транспорте: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14, 15, 13, 13, 12, 12, 15, 14, 14.
Составить эмпирическую функцию распределения данной выборки и построить её график.
Решение:
Запишем значения выборки в порядке возрастания и посчитаем частоту каждого значения. Получаем следующую таблицу:
Рисунок 4.
Объем выборки: n=20.
По свойству 5, имеем, что при x≤12 Fn(x)=0, а при x>15 Fn(x)=1.
Значение $x
Значение $x
Значение $x
Таким образом, получаем:
Рисунок 5.
Построим график эмпирического распределения:
Рисунок 6.
Оригинальность: 92,12%.
