Статистические оценки параметров распределения
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 9-10
Тема: «Статистические оценки параметров распределения».
При рассмотрении предмета и задач математической статистики было отмечено, что в большинстве случаев изучения некоторого количественного признака у исследователя имеется ограниченный объем данных и это связано с тем, что невозможно обследовать каждый объект совокупности. Например, партия зерна на элеваторе, партия электролампочек на количество часов горения и т.д. Поэтому сплошная проверка не всегда применима, в таких случаях ограниченным обследованием некоторой части совокупности – выборкой. По результатам выборочного обследования делается вывод о всей генеральной совокупности.
Совокупность методов позволяющих сделать научно обоснованные выводы о числовых характеристиках распределения генеральной совокупности по случайной выборке, составляет содержание раздела математической статистики - статистической оценки параметров распределения.
Определение 1. Точечной статистической оценкой параметра а распределения случайной величины называется приближенное значение а* этого параметра, вычисленного по статистическим данным.
Замечание 1. Любая точечная статистическая оценка а* некоторого параметра а , вычисляемая на основе статистического ряда, должна удовлетворять трём требованиям:
• математическое ожидание статистической оценки (а* ) (как случайной величины при изменении числа испытаний) равно оцениваемому параметру (свойство несмещенности);
• при заданном объёме выборки статистическая оценка (а* ) имеет наименьшую дисперсию (свойство эффективности;
· при увеличении числа испытаний она (а* ) должна сходиться по вероятности к оцениваемому параметру (свойство состоятельности).
Проведем оценки двух основных числовых характеристик количественного признака:
1) средней генеральной совокупности по выборочной средней
2) генеральную дисперсию по выборочной дисперсии.
Пусть Х – некоторый количественный (дискретный или непрерывный) признак, параметры которого надо найти. Признак Х подчиняется некоторому закону распределения F(X, θ), вид которого можно допустить известным.
Например, пусть Х –( удой (ц) за год от одной коровы, глубина вспашки почвы, высотра всходов на определенную дату, количество загрязняющих частиц в атмосфере и т.д..), подчиняется нормальному закону распределения с дискретной функцией распределения:
где и σ- параметры распределения.
Тогда возникает задача определения параметров распределения генеральной совокупности, имея выборку объема n, где a - генеральная средняя (математическое ожидание), σ – генеральное среднее квадратическое (стандартное) отклонение.
В общем виде оцениваемый параметр обозначим θ (θ может быть и a и σ ).
Оценкой параметра θ некоторого дискретного или непрерывного количественного признака Х называют функцию θ*=f(xi) однозначно определенную по результатам выборки, где xi – случайные величины, каждая из которых распределена по закону F(X, θ).
Поскольку xi – случайные величины, то и θ* - также является случайной величиной. Выбор θ*, которая является хорошим приближением оцениваемого параметра θ, является содержанием теории оценивания.
Чтобы θ* была хорошей оценкой для θ она должна быть несмещенной, эффективной и состоятельной:
• Оценка θ* является несмещенной для параметра θ, если ее математическое ожидание равно оцениваемому параметру θ, т.е. М(θ*)=θ.
• Если несмещенная оценка θ* имеет наименьшую дисперсию среди всех возможных несмещенных оценок для θ, вычисленных по выборкам одного и того же объема, то она называется эффективной.
• Оценка θ* является состоятельной оценкой для параметра θ, если
P(|θ - θ*|<ε)=1
На практике подобрать оценку параметра θ, удовлетворяющую всем трем основным условиям бывает затруднительно, поэтому ограничимся проверкой несмещенности оценки генеральной средней и генеральной дисперсии.
Средняя арифметическая (простая или взвешенная) в , найденная по выборке объема n, является несмещенной оценкой генеральной средней г (математического ожидания)
М (в) = г
Поэтому на практике:
• за неизвестную среднюю количественного признака х принимают среднюю выборочную. Она в выступает как несмещенная, эффективная и состоятельная оценка генеральной средней.
• Выборочная дисперсия σ2 является смещенной оценкой генеральной дисперсии, т.е.
М(σ2) М(σг 2)
Для получения несмещенной оценки генеральной дисперсии σг2 выборочную дисперсию σ2 умножают на коэффициент Бесселя , т.е.
σг2 = σ2
При малом объеме выборки коэффициент Бесселя заметно отличается от единицы, а при больших значениях n отношение 1:
Например, n =3 , тогда = = 1,5
n =15 , тогда = 15/14= 1,07
n =29 , тогда = 29/28= 1,04
n =35 , тогда = 35/34 = 1,03
n =65 , тогда = 65/64 = 1,02
n =200 , тогда =200/199= 1,005
Поэтому, при n больших практически нет разницы между σг2 и σ2 по выборке. Если объем выборки не превышает n=30 единиц, то выборка считается малой и для вычисления σг2 используется формула Бесселя.
σ2 = ,
где σ2 – будет несмещенной оценкой для σг2.
(Действительно, т.к. , то
= = = /n/ = )
Для больших выборок (n30) несмещенную оценку дисперсии определяют по формуле
σ2 = .
Рассмотренные оценки и σ2 по выборке объема n являются точечными оценками неизвестной генеральной средней и неизвестной генеральной дисперсии, когда неизвестные параметры оценены одним числом.
Понятие интервальной оценки
Наряду с точечными оценками в практике оценок параметра используют интервальные оценки, особенно при малых выборках, когда точечные оценки являются случайными.
При выборке малого объема n точечная оценка может значительно отличаться от оцениваемого параметра. Поэтому при небольшом объеме n выборки следует пользоваться интервальными оценками.
Статистическая оценка называется интервальной, если она выражается двумя числами – концами интервала , покрывающего оцениваемый параметр Ө .
Интервальное оценивание заключается в определении интервала, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала “находится” оцениваемый параметр (т.к. оцениваемый параметр величина неслучайная, а концы интервала случайны и их значения зависят от объема выборки n и от надежности наших суждений, то следует говорить о том, что интервал накрывает неизвестный параметр).
Уточнение понятия интервальной оценки требует введения ряда важных сопровождающих понятий: точность оценки; надежность оценки; доверительный интервал.
Точность оценки Ө*
Пусть
Ө – неизвестный оцениваемый параметр теоретического распределения признака генеральной совокупности (Ө есть постоянное число),
Ө* – его точечная статистическая оценка, найденная по данным выборки (Ө* – случайная величина, меняющаяся от выборки к выборке).
Ясно, что оценка Ө* тем точнее определяет параметр Ө , чем меньше модуль разности .
Если рассмотреть неравенство , то число будет характеризовать точность оценки (чем меньше , тем оценка точнее).
Итак, точностью оценки называется такое положительное число , которое удовлетворяет неравенству .
Надежность (или доверительная вероятность) оценки Ө*
Поскольку точечная оценка Ө* является случайной величиной, мы не можем абсолютно доверительно утверждать, что оценка Ө* будет (при заданной точности ) удовлетворять неравенству .
Это неравенство является случайным событием и, следовательно, оно может осуществляться лишь с некоторой вероятностью.
Надежностью (или доверительной вероятностью) оценки Ө* называется вероятность γ , с которой выполняется неравенство , т.е.
(1)
На практике надежность γ назначается (задается наперед): это достаточно большая вероятность (0,95; 0,99; 0,999) – такая, чтобы событие с вероятностью γ можно было считать практически достоверным. Выбор величины γ диктуется особенностями каждой конкретно рассматриваемой задачи.
Замечание: Вероятность γ называется надежностью (доверительной вероятностью), число α –уровнем значимости, ( γ=1-α)
Выбор доверительной вероятности зависит от содержания задачи. Например: вероятность того, что удой от одной коровы составит 35ц. равна 0,90 (это приемлемо), вероятность раскрытия парашюта равна 0,90 (совершенно невозможна)
Доверительный интервал для оцениваемого параметра Ө
Так как неравенство равносильно неравенству , то формулу (1) можно истолковать следующим образом: с заданной надежностью γ интервал накрывает неизвестный оцениваемый параметр Ө .
Таким образом, мы приходим к следующему основному определению:
Доверительным интервалом для оцениваемого параметра Ө называется интервал вида , накрывающий неизвестный параметр Ө с заданной надежностью
Границы и этого интервала называют доверительными границами.
Найти доверительный интервал при заданной надежности γ– значит найти такое значение точности , для которого
.
Доверительный интервал для математического ожидания
нормального распределения случайной величины
Пусть в генеральной совокупности нас интересует некоторый признак C, имеющий нормальный закон распределения. Нормальный закон распределения, как мы знаем, содержит 2 параметра: и .
Нам требуется найти интервальную оценку для параметра a этого распределения. (В данном случае неизвестный оцениваемый параметр Ө = a.) Для этого необходимо располагать выборочными данными. Пусть по данным некоторой выборки объема n вычислена выборочная средняя – точечная статистическая оценка для математического ожидания (здесь ).
Назначим надежность .
Задача состоит в нахождении доверительного интервала , накрывающего математическое ожидание a с заданной надежностью .
Фактически нужно найти соответствующую точность .
Следует различить 2 случая.
1) В случае "больших" выборок ( ) стандартными в теории вероятностей методами доказывается, что искомая точность вычисляется по формуле
(2),
где величина определяется по специальной таблице значений функции Лапласа, исходя из равенства .
Сам же искомый доверительный интервал имеет вид .
2) В случае "малых" выборок ( ) доказывается, что точность оценивания находится по формуле:
где величина определяется по специальной таблице Стьюдента значений функции
2. Доверительный интервал для среднего квадратического отклонения нормально распределенной случайной величины
В отличие от предыдущей задачи, , здесь роль неизвестного оцениваемого параметра выполняет , а роль его точечной статистической оценки – "исправленное" среднее квадратическое отклонение S , вычисленное по данной выборке объема n .
Требуется же найти доверительный интервал при заданной наперед надежности . Фактически нужно найти соответствующую точность .
Стандартными методами в теории вероятностей устанавливается, что искомая точность оценивания вычисляется по формуле , где величина определяется по специальной таблице значений функции .
Определение необходимого объема выборки
Назначив (задав наперед) желаемые надежность и точность , из полученной выше формулы (2) можно рассчитать соответствующий (минимально необходимый) объем выборки:
,
при этом величина может быть найдена по результатам пилотажного обследования.
Отметим теперь, что выборка может считаться репрезентативной, если она обеспечивает достижение желаемой точности и надежности получаемых на ее основе статистических оценок.
Выбор доверительной вероятности зависит от содержания задачи. Например: вероятность того, что удой от одной коровы составит 35ц. равна 0,90 (это приемлемо), вероятность раскрытия парашюта равна 0,90 (совершенно невозможна).
Пример №1. Найти точечные оценки генеральной средней и генеральной дисперсии, ограничившись первыми 20 единицами исходной совокупности 50 единиц (из задачи 1)
5,1,4,5,4,3,55,2,5,5,6,4,3,1,5,8,7,5,5
Найдем выборочную среднюю для выборки объема n=20
Следовательно, в качестве оценки генеральной средней используется выборочная средняя, т.е. г=4,4 (т.к. выб является несмещенной, эффективной и состоятельной оценкой генеральной совокупности).
За оценку неизвестной генеральной дисперсии примем σв2 , т.к. объем выборки n<30. Вычислим
σв2 = =
= - 2 + =2 – 2 +()2=
=2 – 2 ()2+()2=2 –()2
Этой формулой удобно пользоваться в практических расчетах. Составим таблицу:
хi
1
2
3
4
5
6
7
8
хi2
1
4
9
16
25
36
49
64
mi
2
1
2
3
9
1
1
1
=
2=
σв2 =2 –()2= 22.3-(4.4)2=22.3-19.36=2.94
σв = 1,746
Умножим выборочную дисперсию на коэффициент Бесселя и найдем точечную оценку генеральной дисперсии
σг 2 = σв2 =2,94 =3,095
σг = 1,76
Пример №2. Найдем интервальную оценку генеральной средней г при доверительной вероятности γ=0,95 (в предположении нормального распределения количественного признака х) и известной средней квадратичной отклонения σв .
Наилучшей оценкой генеральной средней является выборочная средняя , которая распределена нормально с параметрами М() = г, D()=
Заданная оцениваемая величина распределена нормально с математическим ожиданием =0 и σ2 =1. поэтому вероятность любого отклонения |-г|
Р= {||
Тебе могут подойти лекции
А давай сэкономим
твое время?
твое время?
Дарим 500 рублей на первый заказ,
а ты выбери эксперта и расслабься
Включи камеру на своем телефоне и наведи на Qr-код.
Кампус Хаб бот откроется на устройстве
Не ищи – спроси
у ChatGPT!
у ChatGPT!
Боты в Telegram ответят на учебные вопросы, решат задачу или найдут литературу
Попробовать в Telegram
Оставляя свои контактные данные и нажимая «Попробовать в Telegram», я соглашаюсь пройти процедуру
регистрации на Платформе, принимаю условия
Пользовательского соглашения
и
Политики конфиденциальности
в целях заключения соглашения.
Пишешь реферат?
Попробуй нейросеть, напиши уникальный реферат
с реальными источниками за 5 минут
с реальными источниками за 5 минут
Статистические оценки параметров распределения
Хочу потратить еще 2 дня на работу и мне нужен только скопированный текст,
пришлите в ТГ