Дисперсионный анализ — комплекс статистических процедур. Виды дисперсионного анализа
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Дисперсионный анализ (введение)
Англоязычный синоним – ANOVA (that means Analysis Of VAriance).
Дисперсионный анализ – это комплекс статистических процедур,
направленный на выявление различий в средних арифметических величинах
не между двумя (как мы раньше рассматривали), а между тремя и еще
бόльшим количеством выборочных совокупностей.
Перед
проведением
статистической
проверки
исследуемые
совокупности должны пройти проверку на нормальность распределения.
Вообще говоря, t-test for two independent samples является частным и
самым простым случаем дисперсионного анализа.
Таким образом, дисперсионный анализ относится к семейству
параметрических методов статистики.
Существует несколько видов дисперсионного анализа. Рассмотрим
Однофакторный дисперсионный анализ.
Этот инструмент служит для
анализа дисперсии по данным двух или нескольких выборок. При анализе
нулевая гипотеза о том, что каждая исследуемая выборка принадлежит к
одной и той же генеральной совокупности, сравнивается с альтернативной
гипотезой, предполагающей, что исследуемые выборки принадлежат к
разным генеральным совокупностям.
Применительно к статистическому
анализу в MS Excel, в начальном случае, – для двух выборок, можно
применить функцию ТТЕСТ. Для трех и более выборок не существует более
общего варианта функции ТТЕСТ, но вместо этого можно воспользоваться
моделью
однофакторного
дисперсионного
анализа.
Для
этого
предварительно необходимо подключить надстройку «Пакет анализа».
Далее в появившейся вкладке меню «Анализ данных» выбрать раздел
«Однофакторный дисперсионный анализ».
Далее необходимо разобраться в последовательности операций по
вводу данных и работе с интерфейсом модуля. Это достаточно несложно,
учитывая хорошо отлаженную справочную (offline and online) систему MS
Excel.
Regression Analysis (introduction)
Regression analysis is a statistical methodology that utilizes the relation
between two or more quantitative variables so that one variable can be predicted
from the other, or others. This methodology is widely used in business, the social
and behavioral sciences, the biological sciences including agriculture and fishery
research. For example, fish weight at harvest can be predicted by utilizing the
relationship between fish weights and other growth affecting factors like water
temperature, dissolved oxygen, free carbon dioxide etc. There are other situations
in fishery where relationship among variables can be exploited through regression
analysis.
Regression analysis serves three major purposes: (1) description (2) control
and (3) prediction. We frequent use equations to summarize or describe a set of
data. Regression analysis is helpful in developing such equations. For example we
may collect a considerable amount of fish growth data and data on a number of
biotic and abiotic factors, and a regression model would probably be a much more
convenient and useful summary of those data than a table or even a graph. Besides
prediction, regression models may be used for control purposes. A cause and effect
relationship may not be necessary if the equation is to be used only for prediction.
In this case it is only necessary that the relationships that existed in the original
data used to build the regression equation are still valid.
A functional relation between two variables is expressed by a mathematical
formula. If X denotes the independent variable and Y the dependent variable, a
functional relation is of the form
Y= F(X)
Given a particular value of X, the function f indicates the corresponding
value of Y. A statistical relation, unlike a function is not a perfect one. In general,
the observations for a statistical relation do not fall directly on the curve of
relationship. Depending on the nature of the relationships between X and Y,
regression approach may be classified into two broad categories: linear regression
models and nonlinear regression models.
Корреляционный анализ (введение; по: Лакин Г.Ф., 1990)
Функциональная зависимость и корреляция. Еще Гиппократ в VI в. до
н. э. обратил внимание на наличие связи между телосложением и
темпераментом людей, между строением тела и предрасположенностью к тем
или иным заболеваниям. Определенные виды подобной связи выявлены
также в животном и растительном мире. Так, существует зависимость между
телосложением и продуктивностью у сельскохозяйственных животных;
известна связь между качеством семян и урожайностью культурных растений
и т. д. Наличие связей между варьирующими признаками обнаруживается на
всех уровнях организации живого. Поэтому естественно стремление
использовать эту закономерность в интересах человека, придать ей более или
менее точное количественное выражение.
Для описания связей между переменными величинами применяют
математическое понятие функции f, которая ставит в соответствие каждому
определенному
значению
независимой
переменной
X,
называемой
аргументом, определенное значение зависимой переменной У: y=f(x). Здесь х
– аргумент, а у – соответствующее ему значение функции f(x). Такого рода
однозначные зависимости между переменными величинами У и X называют
функциональными.
Примеров
функциональной
зависимости
между
переменными величинами много. Известно, что повышение температуры на
10°С ускоряет химическую реакцию в два раза, объем куба однозначно
определяется по длине одного из его ребер и т. д.
Однако такого рода однозначные, или функциональные, связи между
переменными
величинами встречаются
далеко не
всегда.
Известно,
например, что между ростом и массой тела у человека существует
положительная связь: более высокие индивиды имеют обычно и большую
массу тела, чем индивиды низкого роста. Однако из этого правила
существуют исключения, когда сравнительно низкорослые индивиды
оказываются тяжелее высокорослых.
Причиной таких «исключений»
является тот факт, что каждый биологический признак представляет собой
функцию многих переменных: на него влияют и генетические, и средовые
факторы,
что
и
обусловливает
варьирование
признаков.
Поэтому
зависимость между биологическими признаками имеет не функциональный,
а
статистический
характер,
когда
в
массе
однородных
индивидов
определенному значению одного признака, рассматриваемого в качестве
аргумента, соответствует не одно и то же числовое значение, а целая гамма
распределяющихся в вариационный ряд числовых значений другого
признака, рассматриваемого в качестве зависимой переменной, или функции.
Такого рода зависимость между переменными величинами называется
корреляционной или корреляцией.
На представленном ниже рисунке показаны примеры функциональной
и корреляционной зависимостей.
Рисунок – Примеры функциональной (А) и корреляционной (Б)
зависимости между числовыми величинами (признаками)
Заключение
Таким образом, по представленному вводному материалу необходимо
составить первичное представление о сути и предназначении описанных
статистических методов (дисперсионный анализ, регрессионный анализ,
корреляционный анализ).