Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Глава 2. Элементы математической статистики
§1. Статистические оценки параметров распределения
1.1. Основные понятия
Задача математической статистики состоит в создании
методов сбора и обработки статистических данных для получения научных и практических выводов.
Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Объемом совокупности называют число объектов этой совокупности.
Повторной называют выборку, при которой отобранный
объект перед отбором следующего возвращается в генеральную совокупность.
Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
Выборка должна быть репрезентативной, то есть представительной.
Простым случайным называют такой отбор, при котором
объекты извлекают по одному из всей генеральной совокупности.
Типичным называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой её ”типической” части.
Механическим называют отбор, при котором генеральную
совокупность ”механически” делят на столько групп, сколько
объектов должно войти в выборку, а из каждой группы отбирают один объект.
Серийным называют отбор, при котором объекты отбирают
из генеральной совокупности не по одному, а ”сериями”, которые подвергаются сплошному обследованию.
Составители: Балашов А.Н., Шестакова М.А.
Пусть из генеральной совокупности извлечена выборка,
причем x1 наблюдалось n1 раз, x2 – n2 раз, xk – nk и ni = n –
i
объем выборки. Наблюдаемые значения xi называют вариантами, а последовательность вариант, записанных в возрастающем порядке, - вариационным рядом.
Число наблюдений называют частотами, а их отношения
n
к объему выборки i = i – относительными частотами.
n
Статистическим распределением выборки называют перечень вариант и соответствующих им частот
или относительных частот.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F(x), определяющую
для каждого значения x относительную частоту события X < x:
n
F ( x ) = x ; где nx – число вариант, меньших х; n – объем выборки.
n
Эмпирическая функция является неубывающей, ее значения принадлежат отрезку [0; 1]. Если x1 – наименьшая вырианта, то F(x) = 0 при x ≤ x1; если xk – наибольшая вырианта, то
F(x) = 1 при x > xk.
Функцию распределения генеральной совокупности называют теоретической функцией распределения.
Пример 2.1. Построить эмпирическую функцию по данным распределения выборки:
Варианты хi 2
Частоты ni 10
Решение. Объем выборки
5 9
20 30
n = 10 + 20 + 30 = 60 .
i
10
1
При х 2 𝐹(𝑥) = 0; при 2 < x 5 𝐹(𝑥) = 60 = 6;
1
при 5 < x 9 𝐹(𝑥) = 2; при х > 9 𝐹(𝑥) = 1.
0,
𝑥≤2
1
, 2<𝑥≤5
6
𝐹(𝑥) =
1
, 5<𝑥≤9
2
𝑥 > 9.
{ 1,
F(x)
1
1/2
1/6
2
5
9
x
Полигоном частот называют ломаную, отрезки которой
соединяют точки (x1; n1), (x2; n2), …, (xк; nк).
Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x1; 1), (x2; 2), …, (xк; к).
В случае непрерывного признака целесообразно строить
гистограмму.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат
частичные интервалы длиною h, а высоты равны отношению
ni
(плотность частот). Площадь i – го частичного прямоугольh
ника равна
h ni
= ni
h
- сумме частот вариант i –го интервала, а
площадь гистограммы частот равна объему выборки.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями
которых служат частичные интервалы длиною h, а высоты
равны отношению i .
h
Пример 2.2. Из генеральной совокупности извлечена выборка объемаn = 60:
xi
1
2
3
5
ni
30
n2
9
3
Найдите n2.
Решение. Объем выборки n равен сумме частот ni, т.е.
60 = 30 + n2 + 9 + 3. Отсюда n2 = 60 – 30 – 9 – 3 = 18.
Ответ: n2 = 18.
Пример 2.3. Статистическое распределение выборки
имеет вид
xi
2
3
4
5
ni
2
6
8
4
Найти относительную частоту варианты x1 = 2.
k
Решение. Найдем объем выборки: n = ni = 2 + 6 + 8 + 4 = 20 .
i =1
Тогда относительная частота варианты x1 равна: 1 =
n1 2
=
= 0,1 .
n 20
Ответ: ω1 = 0,1.
Пример 2.4. Из генеральной совокупности извлечена выборка объема n = 50, полигон частот которой имеет вид:
Найти число вариантов xi = 3 в выборке.
Решение. Объем выборки n равен сумме частот ni, т.е.
50 = 3 + 20 + n3 + 16. Отсюда, n3 = 50 – 3 – 20 – 16 = 11.
Ответ: n3 = 11.
Пример 2.5. По выборке объема n = 102 построена гистограмма частот:
Найти значение а.
Решение. Объем выборки n равен произведению частичного интервала h на сумму плотностей частот
ni
h
, т.е.
k
ni
i =1 h
n = h
.
С учетом имеющихся данных (n = 102, h = 2) имеем: 102 = 2(4
+ 12 + 16 + a). Отсюда, a = 19.
Ответ: a = 19.
Если удалось установить вид распределения, к которому
относится исследуемый признак A, то конечно возникает задача нахождения значений параметров, характеризующих данное распределение.
Параметр генеральной совокупности (параметр) – показатель, вычисленный для всей генеральной совокупности.
Параметр выборки (выборочный параметр, статистика)
– некоторый показатель, вычисленный на основе данных выборки.
Пусть X1 , X 2 , ..., X n – выборка, полученная в результате
наблюдения из некоторой генеральной совокупности X . По
выборкам можно получить только приближенные значения неизвестного параметра , которые служат его оценкой.
Оценкой (статистической оценкой, оценочной функцией) неизвестного параметра называют произвольную
функцию = ( x1 , x2 , ..., xn ) , зависящую от выборки x1 , x2 , ..., xn .
Оценка , как функция от случайной выборки является случайной величиной.
Статистические оценки дают достоверные представления
об оцениваемых параметрах, если они обладают определенными свойствами.
1. Оценка неизвестного параметра называется несмещенной, если при любом объёме выборки n , ее математическое
ожидание равно оцениваемому параметру , т.е. M ( ) = . В
противном случае оценка называется смещенной.
Разность M ( ) − называют смещением (систематической ошибкой оценивания). Для несмещенных оценок
систематическая ошибка равна нулю.
2. Оценка неизвестного параметра называется состоятельной, если с ростом объема выборки она сходится по вероятности к оцениваемому параметру , т.е. для любого положительного выполняется соотношение lim P * − = 0 .
n→
Выполнение условия состоятельности гарантирует при достаточно больших n отсутствие грубых ошибок в оценке . Поэтому только состоятельные оценки имеют практический
смысл.
3. Оценка неизвестного параметра называется эффективной, если ее дисперсия наименьшая среди дисперсий других оценок из этого класса.
Эффективная оценка имеет наименьший разброс по сравнению с другими несмещенными и состоятельными оценками
относительно истинного значения оцениваемого параметра.
Статистические оценки параметров подразделяют по способу их представления на точечные (числом) и интервальные
(интервалом).
1.2. Точечные оценки
Точечной
называют
статистическую
оценку
= ( X 1 , X 2 , ..., X n ) параметра , определяемую одним числом.
Точечные оценки зависят от объёма выборки и обычно используются в выборках большого объёма.
Ошибкой выборки (оценивания) называют абсолютную
разность − .
Выборочная средняя
1 k
x в = xi ni
n i =1
есть несмещенная и со-
стоятельная точечная оценка математического ожидания M(X).
1 k
Выборочная дисперсия Dв = ( xi − x в ) 2 ni это точечная
n i =1
смещенная оценка генеральной дисперсии D(X ) .
Несмещенной оценкой генеральной дисперсии
ется «исправленная» выборочная дисперсия
sв2 =
D(X )
n
Dв .
n −1
явля«Ис-
правленная» выборочная дисперсия является состоятельной
оценкой дисперсии D(X ) . При достаточно больших n выборочная и «исправленная» дисперсии различаются мало.
Если известно математическое ожидание M ( X ) случайной
величины
X
, то выборочная дисперсия
Dв =
1 k
( xi − M ( X )) 2 ni
n i =1
–
несмещенная, состоятельная и эффективная оценка генеральной дисперсии D(X ) .
Относительная частота
оценка вероятности
ni
n
P( X = xi ) .
– несмещенная и состоятельная
Пример 2.7. Дана выборка объема n. Если каждый элемент
выборки увеличить в 2 раз, то выборочное среднее x …
1) уменьшится в 2 раза 2) увеличится в 4 раза
3) не изменится
4) увеличится в 2 раза
5) увеличится на 2 единиц
Решение. Выборочное среднее xВ вычисляется по формуле:
xв =
1 k
xi ni .
n i =1
Если каждый элемент выборки xi увеличить в 2 раз, то выборочное среднее xB увеличится в 2 раза.
Ответ: 4) увеличится в 2 раза.
Пример 2.8. Проведено четыре измерения (без систематических ошибок) некоторой случайной величины (в мм): 5, 8,
10, 14. Найти несмещенную оценку математического ожидания.
Решение. Несмещенная оценка математического ожидания
вычисляется
по
формуле
1 k
xв = xi ni .
n i =1
Следовательно,
1
xв = (5 + 8 + 10 + 14) = 9 .
4
Ответ: xВ = 9 .
Пример 2.10. Для выборки объема n = 8 вычислена выборочная дисперсия Dв = 112. Найти исправленную дисперсию s2
для этой выборки.
Решение. Исправленную дисперсию вычислим по фор8
n
Dв . Следовательно, s 2 = 112 = 8 16 = 128 .
муле: s 2 =
n −1
Ответ: s 2 = 128 .
7
Пример 2.11. Дана выборка объема n. Если каждый элемент выборки увеличить на 5 единиц, то выборочная дисперсия Dв …
1) уменьшится в 5 раз
2) увеличится в 25 раз
3) не изменится
4) увеличится в 5 раз
5) увеличится на 5 единиц
Решение. Выборочная дисперсия Dв вычисляется по форk
муле
Dв =
( xi − xв ) 2 ni
i =1
n
. Если каждый элемент выборки xi увели-
чить на 5 единиц, то выборочное среднее xв тоже увеличится
на 5 единиц. В результате разность xi − xв не изменится. Следовательно, выборочная дисперсия Dв не изменится.
Ответ: 3) не изменится.
Рассмотрим методы нахождения точечных оценок.
1. Метод моментов.
При заданном виде закона распределения случайной величины X неизвестные параметры этого распределения можно оценить, т.е. выразить как функцию
вариант выборки, на основе метода моментов (Карл Пирсон, 1894 г.).
Метод моментов состоит в приравнивании определенного числа выборочных моментов к соответствующим теоретическим моментам. Для оценки k параметров составляем k уравнений. Решая полученные k уравнений, относительно параметров получаем искомые оценки параметров.
M ( X ) = x в ,
D( X ) = Dв .
Пример 2.12. На предприятии изготавливаются электронные лампы. Время
работы лампы является случайной величиной, для характеристики которой принят показательный закон распределения f ( x) = e −x , ( x 0 ). Результаты испытания 100 электронных ламп на длительность работы представлены в следующей
табл. 2.3.
Таблица 2.3
Время работы
лампы
Число ламп
(0; 400)
(400; 800)
(800; 1200)
(1200; 1600)
(1600; 2000)
31
26
19
15
9
Найдите оценку параметра .
Решение. Показательный закон распределения зависит от одного параметра
, поэтому для его оценки записываем одно M ( X ) = x в .
Используя данные интервального ряда, подсчитаем выборочную среднюю
по формуле:
k
1
xв = k
xi ni ,
ni i=1
i =1
где xi – середина соответствующего интервала.
5
ni = 31 + 26 + 19 + 15 + 9 = 100 , поэтому
i =1
xв =
1 5
200 31 + 600 26 + 1000 19 + 1400 15 + 1800 9
xi ni =
= 780.
100 i =1
100
Вычислим математическое ожидание:
+
+
u=x
dv = e− x dx
+
−
x
M ( X ) = x f ( x) dx = xe dx =
= − xe −x 0 +
−
x
du = dx v = −e
+
1
+ e − x dx = − e − x
+
=
1
.
1
= xв .
Последнее равенство является приближенным, так как его правая часть является случайной величиной, и оно задает не точное значение параметра , а его
оценку :
1
= xв .
1
1
= 780 , поэтому =
Следовательно,
.
780
2. Метод наибольшего правдоподобия.
Метод наибольшего правдоподобия (Р. Фишер, 1912 г.), опирается на использование условий экстремума функций одной или нескольких случайных величин. В качестве такой функции рассматривают функцию правдоподобия.
В случае непрерывной случайной величины функция правдоподобия имеет
вид
L = f ( x1 , ) f ( x2 , ) ... f ( xk , ) ,
где f ( xi , ) – функция плотности вероятности в точках выборки xi . В качестве
оценки неизвестного параметра , найденной по методу наибольшего правдоподобия, выбирается такая функция = ( x1 , x2 ,..., xn ) , которая максимизирует
L
функцию правдоподобия. Для этого рассматриваем систему уравнений:
= 0,
i
( i = 1, 2, ..., k ) – по числу оцениваемых параметров. Среди решений выбираем
решение, обращающее функцию правдоподобия в максимум.
Тогда по методу моментов
Распределение
Плотность распределения
Параметры
Показательное или
экспоненциальное
Пуассона
𝑓(𝑥) = 𝜆𝑒 −𝜆𝑥
1
= 𝑥̅в
𝜆
Биноминальное
Геометрическое
(p – вероятность
успеха, n ≥ 1)
хи-квадрат
𝑘
Г ( ) – гамма2
функция
Рэлея
Нормальное или
Гаусса
𝜆𝑘 𝑒 −𝜆
𝑃𝑛 (𝑥 = 𝑘) =
𝑘!
𝑘 𝑘
𝑃𝑛 (𝑥 = 𝑘) = 𝐶𝑛 𝑝 (1 − 𝑝)𝑛−𝑘
𝑓(𝑥 ) = (1 − 𝑝)𝑥−1 𝑝
𝑘
2
1
(2) 𝑘−1 −𝑥
𝑓(𝑥 ) =
𝑥2 𝑒 2
𝑘
Г( )
2
𝑥 − 𝑥 22
𝑓(𝑥 ) = 2 𝑒 2𝜎
𝜎
𝑓(𝑥 ) =
1
𝜎 √2𝜋
𝑒
−
(𝑥−𝑎)2
2𝜎 2
𝜆 = 𝑥̅в
𝑝𝑚 = 𝑥̅в
1
= 𝑥̅в
𝑝
𝑘 = 𝑥̅в
𝜋
𝜎 √ = 𝑥̅в
2
𝑎 = 𝑥̅в ,
𝜎 = √𝐷в
1.3. Интервальные оценки
Статистическая оценка параметров закона распределения случайной величины X , характеризующаяся двумя числовыми значениями – концами интервала, называется интервальной.
Интервал, в который с заданной вероятностью (надежностью), попадает
оцениваемый параметр, называется доверительным. На практике обычно используют два типа доверительных интервалов: симметричные и односторонние.
Вероятность , с которой выполняется неравенство − называется
доверительной вероятностью (надежностью) оценки для заданного . Доверительная вероятность связана не с величиной параметра , а лишь с границами интервала, которые меняются при изменении выборки. Доверительную вероятность чаще всего задают заранее в зависимости от конкретных условий и
накладывают требование быть близкой к единице. Общепринятые значения –
0,95; 0,99; 0,999.
Вероятность =1 − называется уровнем значимости (вероятностью
ошибок).
Доверительными границами (критическими значениями) называют границы
доверительного интервала. Доверительные границы зависят от закона распределения параметра . Доверительный интервал, определяемый выборкой – случайной величиной, носит случайный характер и относительно длины и по расположению относительно . Доверительные границы тоже случайная величина,
поэтому принято говорить, что доверительный интервал покрывает параметр
с доверительной вероятностью .
Методы построения доверительных интервалов различны и впервые были
разработаны американским статистиком Ю. Нейманом, использовавшим идеи
английского статистика Р. Фишера.
Точностью оценки называют число, равное половине длины доверительного интервала.
Точность оценки , доверительная вероятность и объем выборки n связаны между собой.
Алгоритм построения доверительного интервала:
1) Производим выборку объема n случайной величины X из генеральной
совокупности с известным распределением f ( x; ) .
2) Находим точечную оценку неизвестного параметра по данным выборки.
3) Задаем доверительную вероятность .
4) Определяем границы доверительного интервала ( − ; + ) . Для
этого возьмем произвольное значение и, используя плотность вероятности,
найдем функцию распределения из условия P − =
+
f ( x, )dx = .
−
Границы интервала определим из решения уравнений P( X ( ) − ) =
1−
,
2
1−
.
2
Полученный интервал с доверительной вероятностью покрывает неизвестный параметр и является его интервальной оценкой.
Замечание. При малом объеме выборки построение доверительных интервалов трудоемко, так как оно сводится к перебору значений неизвестного параметра. Существуют специальные таблицы ([6], табл.5.2), позволяющие по числу
успехов и числу неудач определить границы доверительного интервала доверительной вероятности .
Наиболее часто на практике встречается нормальное распределение. В этом
случае нужно оценить параметры, полностью определяющие нормальное распределение – математическое ожидание и дисперсию. Укажем интервальные
оценки для параметров нормального распределения.
Произведем выборку случайной величины X из генеральной совокупности,
~
подчиненной закону нормального распределения N (a, ) . Пусть оценка являP( X ( ) + ) =
ется несмещенной оценкой параметра , тогда M ( ) = = a .
1. Оценка математического ожидания при известном .
Доверительный интервал для оценки математического ожидания случайной
величины X с заданной доверительной вероятностью в случае нормального
закона распределения имеет вид:
(1)
; xв + z
xв − z
,
n
n
где z = −1 , −1 – функция, обратная функции Лапласа ( x ) , ее значения
2
можно находить, пользуясь таблицей значений функции ( x ) , (приложение 1);
– известное среднее квадратичное отклонение или его оценка;
xв – выборочное среднее;
n – объём выборки.
Здесь z
– точность оценки (предельная погрешность).
n
Этот интервал накрывает математическое ожидание с заданной доверительной вероятностью .
Минимальный объём выборки, который обеспечит заданную точность,
z 2 2
при заданной доверительной вероятности находим из неравенства n
.
2
2. Оценка математического ожидания при неизвестном .
Доверительный интервал для оценки математического ожидания случайной
величины X , распределенной по нормальному закону, с заданной доверительной вероятностью имеет вид:
S
S
(2)
x в − t в ; xв + t в ,
n
n
где Sв – исправленное выборочное среднее квадратичное отклонение;
xв – выборочное среднее;
n – объём выборки;
t находим по таблице значений t распределения Стьюдента в зависимости
от числа степеней свободы k = n − 1 и надежности (приложение 2).
Этот интервал накрывает математическое ожидание с заданной доверительной вероятностью .
Замечание 1. Распределение Стьюдента, связанное с нормальным распределением часто используется в математической статистике. Оно широко применяется при обработке статистических данных, так как зависит только от одного параметра – степени свободы k .
Замечание 2. При возрастании объёма выборки n (практически при n 30)
, распределение Стьюдента стремится к нормальному распределению, поэтому в
этом случае можно использовать нормальное распределение. При малом объёме
выборки n (n 30) замена распределения Стьюдента нормальным распределением приводит к грубым ошибкам – неоправданному сужению доверительного
интервала.
Замечание 3. Если измерения физической величины производят в равных
условиях и на одном приборе, то результаты измерений – независимые случайные величины, имеющие одно и тоже математическое ожидание, дисперсию и
нормальное распределение. Поэтому при нахождении доверительных интервалов можно использовать записанные выше интервалы.
3. Оценка среднего квадратичного отклонения.
Доверительный интервал для оценки среднего квадратичного отклонения
случайной величины X с заданной доверительной вероятностью в случае
нормального закона распределения случайной величины имеет вид:
(3)
(Sв (1 − q) ; Sв (1 + q)) , q 1
где Sв – исправленное выборочное среднее квадратичное отклонение;
q – параметр, который находится по таблице (приложение 3) на основе известного значения объёма выборки n и заданной доверительной вероятностью
.
Если q 1 , то интервал имеет вид
(4)
(0; Sв (1 + q)) .
Доверительные интервалы (3) – (4) используют для оценки точности измерений, которая характеризуется средним квадратическим отклонением случайных ошибок измерений.
4. Оценка вероятности.
Пусть проведено n испытаний, в каждом из которых событие A может произойти с вероятностью p . Если при этом в m случаях событие A произошло,
тогда доверительный интервал для неизвестной вероятности p имеет вид:
~
~
~
p (1 − ~
p) ~
p (1 − ~
p)
p−z
,
(5)
;
p
+
z
n
n
m
p=
где ~
– относительная частота (состоятельная и несмещенная оценка вероn
ятности p );
z = −1 ( / 2) , −1 – функция, обратная функции Лапласа ( x ) , ее значения
можно находить, пользуясь таблицей значений функции ( x ) , (приложения 1).
Замечание. Число испытаний должно удовлетворять неравенству n 36 .
Пример 2.14. Было проверено качество 16 болтов. Их средняя длина оказалась равной 120 мм. Ошибка при их изготовлении подчинена нормальному закону распределения со средним квадратическим отклонением = 4 (мм). Определите доверительный интервал с надежностью 0,95 для оценки математического ожидания.
Решение. Используя соотношение ( z ) =
2
и надежность = 0,95, нахо-
0,95
= 0,475. По таблице значений функ2
ции ( x ) (приложение 1), определяем аргумент функции Лапласа z = 1,96. Со4
4
ставляем доверительный интервал (1): 120 − 1,96
;120 + 1,96
или
16
16
(118,04 ;121,96) .
Пример 2.15. Глубина озера измеряется прибором, систематическая ошибка
которого равна 0 , а случайные ошибки распределены подчинены нормальному
закону распределения со средним квадратическим отклонением = 30 см.
Сколько надо провести независимых измерений, чтобы определить глубину
озера с ошибками не более 10 см при доверительной вероятности 0,99.
Решение. По условию задачи случайная величина, распределена по нормальному закону с = 30 , = 10 , = 0,99. По таблице значений функции ( x )
(приложение 1), определяем аргумент функции Лапласа z = 2,58. Находим знаz 2 2
n
n , удовлетворяющее неравенству
чение
. Следовательно,
2
2,582 30 2
n
, n (2,58 3) 2 или n 60 . Поэтому для выполнения условий за2
10
дачи нужно провести не менее 60 независимых измерений.
Пример 2.16. Случайная величина X распределена нормально. По выборке
объёма n = 50 найдено несмещенное значение выборочного среднего квадратичного отклонения sв = 4 . Определите доверительный интервал для оценки
дим значение функции Лапласа: ( z ) =
среднего квадратичного отклонения случайной величины с заданной доверительной вероятностью 0,999.
Решение. По заданным значениям доверительной вероятности = 0,999 и
объёма выборки n = 50 из таблицы приложения 3 определяем значение 𝑞 = 0,43.
Используя (3) составляем доверительный интервал: (4 (1 − 0,43) ; 4 (1 + 0,43))
или (2,28 ; 5,72) .
Пример 2.17. С целью проверки усвоения темы был проведен тест из 15 вопросов. Для испытаний отобрано 50 человек. Результаты проверки представлены
в табл. 2.5.
Таблица 2.5
Число правильных
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
ответов
Число студентов – 2 – 1 – 3 6 8 7 7 5 3 2 4 2
Тест считается пройденным, если число правильных ответов более 8. Оцените с доверительной вероятностью 0,9 вероятность прохождения студентом теста.
30 3
p=
= = 0,6 ,
Решение. По условию задачи n = 50 , m = 30 . Тогда ~
50 5
1− ~
p = 1 − 0,6 = 0,4 . Используя соотношение ( z ) = и доверительную вероят2
0,9
= 0,45. По таблице
ность = 0,9, находим значение функции Лапласа: ( z ) =
2
значений функции ( x ) (приложение 1), определяем аргумент функции Лапласа
z = 1,65. Составляем доверительный интервал (5):
0,6 0,4
0,6 0,4
0,6 − 1,65
или (0,49; 0,71).
;
,
6
+
1
,
65
50
50
Пример 2.18. Найти доверительный интервал для оценки математического
ожидания а нормального распределения с надежностью = 0,95, зная выборочную среднюю x = 10,43 (статистическую среднюю mx), объем выборки (число
наблюдений) n = 100 и среднее квадратическое отклонение = 5.
Решение. Воспользуемся формулой
t
t
P x −
ax+
= 2Φ(t ) = .
n
n
Найдем t. Из соотношения 2Ф(t) = 0,95 получим Ф(t) = 0,475. По таблице
приложения 1 находим t = 1,96. Подставляя данные в доверительный интервал
t
t
, получаем 10,43 – 1,96(5/10) < a < 10,43 + 1,96(5/10), или
x−
ax+
n
n
окончательно 9,45 < a < 11,41.
Пример 2.19. Точечная оценка математического ожидания нормального
распределения равна 10. Тогда его интервальная оценка может иметь вид...
1) (-0,4; 0,4) 2) (0,2;1,2)
3) (9,4; 10,6)
4) (10,0; 12,0)
Решение. Интервальная оценка математического ожидания нормально распределенного количественного признака симметрична относительно его точечной оценки, т.е. (a – δ; a + δ). Таким свойством обладает интервал (9,4; 10,6), т.е.
(10 - 0,6; 10 + 0,6).
Ответ: (9,4; 10,6).
Пример 2.20. Дана интервальная оценка (7,4; 8,5) математического ожидания нормально распределенного количественного признака. Найти точечную
оценку математического ожидания.
Решение. Для интервальной оценки (α; β) математического ожидания точечную оценку a найдем по формуле a = (α + β)/2 = (7,4 + 8,5)/2 = 7,95.
Ответ: a = 7,95.
Пример 2.21. Дана интервальная оценка (7,5; 8,5) математического ожидания нормально распределенного количественного признака. Найти точность
этой оценки.
Решение. Точность интервальной оценки (α; β) найдем по формуле
δ = (β – α)/2, т.е. δ = (8,5 – 7,5)/2 = 0,5.
Ответ: δ = 0,5.
1.4. Характеристики вариационного ряда
Основными характеристиками вариационного ряда являются выборочная
средняя и выборочная дисперсия. Кроме того, дополнительными характеристиками вариационного ряда являются мода, медиана, размах варьирования, среднее
абсолютное отклонение, коэффициент вариации и др.
Модой называют варианту, которая имеет наибольшую частоту. Возможно
несколько мод, в частности, бимодальный вариационный ряд.
Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант.
Размахом варьирования называют разность между наибольшей и наименьшей вариантами.
Средним абсолютным отклонением называют среднее арифметическое абсолютных отклонений.
Коэффициентом вариации называют выраженное в процентах отношение
выборочного среднего квадратического отклонения к выборочной средней.
Если коэффициент вариации меньше 10%, то разнообразие ряда считается
слабым, если коэффициент вариации принимает значение от 10 до 20% — средним, если более 20% — сильным. Сильное разнообразие ряда свидетельствует о
малой представительности соответствующей средней величины и, следовательно, о нецелесообразности ее использования в практических целях.
Пример 2.22. Найдите выборочную среднюю, выборочную дисперсию,
моду, размах, медиану, среднее абсолютное отклонение, коэффициент вариации
вариационного ряда 1, 3, 3, 5, 6, 7, 8.
1 n
Решение. Выборочная средняя вычисляется по формуле xв = xi . Следоn i =1
1
33
5
=4 .
вательно, xв = (1 + 3 + 3 + 5 + 6 + 7 + 8) =
7
7
7
Для вычисления выборочной дисперсии воспользуемся формулой
Dв = x 2 − (xв )2 ,
где x 2 – выборочная средняя квадратов вариант выборки.
1 7 2 1
193
4
2
Найдем x = xi = (1 + 9 + 9 + 25 + 36 + 49 + 64) =
= 27 . Выбороч7 i =1
7
7
7
193 1089 262
17
−
=
=5 .
ная дисперсия Dв =
7
49
49
49
Модой mo вариационного ряда называется варианта, имеющая наибольшую
частоту. Такой вариантой является варианта 3, частота которой равна трем.
Размах R варьирования вариационного ряда определяется по формуле:
R = xmax – xmin. Следовательно, R = 8 – 1 = 7.
Медианой me вариационного ряда с нечетным числом вариантов называется
варианта, расположенная в середине вариационного ряда. Так как в середине
ряда расположена варианта 5, то медиана me = 5.
Среднее абсолютное отклонение вычисляется по формуле:
1 n
mad = xi − xв .
n i =1
Найдем среднее абсолютное отклонение:
1 5 5
5 2
2
2
2 1
2
2
mad = 3 + 1 + 1 + + 1 + 2 + 3 = 14 = 2 .
7 7 7 7 7 7
7
7 7
7
49
Коэффициент вариации вычисляется по формуле:
Dв
V = 100% =
100% .
xв
xв
Коэффициент вариации V =
262
100% 49,05% .
33
2
5
17
Ответ: xв = 4 , Dв = 5 , mo = 3, R = 7, me = 5, mad = 2 , V 49,05% .
49
7
49
Пример 2.23. Найдите медиану, среднее абсолютное отклонение, коэффициент вариации вариационного ряда 1, 2, 4, 5, 7, 10.
Решение. Медианой вариационного ряда с четным числом вариантов называется варианта, равная среднему арифметическому вариант, расположенных в
середине ряда. Так как в середине ряда расположены варианты 4 и 5, то медиана
me = (4 + 5)/2 = 4,5.
Ответ: 4,5.
Приложения
Приложение 1
z2
1 x −2
Таблица значений функции Лапласа Φ( x) =
e dz
2 0
x
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
0,12
0,13
0,14
0,15
0,16
0,17
0,18
0,19
0,20
0,21
0,22
0,23
0,24
0,25
0,26
0,27
0,28
0,29
0,30
0,31
0,32
0,33
0,34
0,35
0,36
0,37
0,38
0,39
Ф(x)
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
x
0,40
0,41
0,42
0,43
0,44
0,45
0,46
0,47
0,48
0,49
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,61
0,62
0,63
0,64
0,65
0,66
0,67
0,68
0,69
0,70
0,71
0,72
0,73
0,74
0,75
0,76
0,77
0,78
0,79
Ф(x)
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,2580
0,2611
0,2642
0,2673
0,2703
0,2734
0,2764
0,2794
0,2823
0,2852
x
0,80
0,81
0,82
0,83
0,84
0,85
0,86
0,87
0,88
0,89
0,90
0,91
0,92
0,93
0,94
0,95
0,96
0,97
0,98
0,99
1,00
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
Ф(x)
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
x
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
Ф(x)
0,3849
0,3869
0,3883
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
x
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
1,80
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
1,96
1,97
1,98
1,99
Ф(x)
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
Библиографический список
x
2,00
2,02
2,04
2,06
2,08
2,10
2,12
2,14
2,16
2,18
2,20
2,22
2,24
2,26
2,28
2,30
2,32
2,34
2,36
2,38
2,40
2,42
2,44
2,46
2,48
2,50
2,52
2,54
2,56
2,58
2,60
2,62
2,64
2,66
2,68
2,70
2,72
2,74
2,76
2,78
Ф(x)
0,4772
0,4783
0,4793
0,4803
0,4812
0,4821
0,4830
0,4838
0,4846
0,4854
0,4861
0,4868
0,4875
0,4881
0,4887
0,4893
0,4898
0,4904
0,4909
0,4913
0,4918
0,4922
0,4927
0,4931
0,4934
0,4938
0,4941
0,4945
0,4948
0,4951
0,4953
0,4956
0,4959
0,4961
0,4963
0,4965
0,4967
0,4969
0,4971
0,4973
x
Ф(x)
2,80 0,4974
2,82 0,4976
2,84 0,4977
2,86 0,4979
2,88 0,4980
2,90 0,4981
2,92 0,4982
2,94 0,4984
2,96 0,4985
2,98 0,4986
3,00 0,49865
3,20 0,49931
3,40 0,49966
3,60 0,49984
3,80 0,49993
4,00 0,49997
4,50 0,49999
5,00 0,49999
если x > 0,5,
то Ф(x) 0,5
4. Макарова, Н.В. Статистика в Excel.: Учеб. Пособие / Н.В. Макарова, В.Я.
Трофимец. М.: Финансы и статистика, 2002. 368 с.
5. Гмурман, В.Е. Теория вероятностей и математическая статистика. Учеб.
Пособие для вузов / В.Е. Гмурман.11-е изд. М.: Издательство Юрайт, 2010. 479
с.
6. Большев, Л.Н. Таблицы математической статистики / Л Н. Большев, Н.В.
Смирнов. М.: Наука, 1983.