Основные статистические параметры большой и малой выборочной совокупности и их характеристика. Смотреть страницы где упоминается термин малая выборка Понятие о малых выборках
При изучении изменчивости выделяют признаки количественные и качественные, изучением которых занимается вариационная статистика в основе которой лежит теория вероятности. Вероятность указывает возможную частоту встречи особи с тем или иным признаком. P=m/n, где m-число особей с данной величиной признака; n-число всех особей в группе. Вероятность колеблется от 0 до 1 (например вероятность равна 0,02- появление двойни в стаде, т.е. значит на 100 отёлов появится две двойни). Таким образом объектом изучения биометрии является варьирующий признак, изучение которого осуществляется на определённой группе объектов т.е. совокупности. Различают генеральную и выборочную совокупность. Генеральная совокупность это многочисленная группа особей, которая нас интересует по изучаемому признаку. В генеральную совокупность может входить вид животных, породы одного и того же вида. В генеральную совокупность (породу) входит несколько миллионов животных. В тоже время порода расходится на много совокупностей т.е. стада отдельных хозяйств. Так как генеральная совокупность состоит из большого числа особей, то изучить её технически сложно. Поэтому изучают не всю генеральную совокупность, а только её часть, которая называется выборной или выборочной совокупностью .
По выборочной совокупности делают суждение о всей генеральной совокупности в целом. Выборка должна осуществляться по всем правилам, куда должны входить особи со всеми значениями варьирующего признака. Отбор особей из генеральной совокупности осуществляется по принципу случайности или методом жеребьёвки. В биометрии выделяют два типа случайной выборки: большая и малая. Большой выборкой называют такую, куда входит больше 30 особей или наблюдений, а малой выборкой меньше 30 особей. Для большой и малой выборочной совокупности существуют различные методы обработки данных. Источником статистической информации могут служить данные зоотехнического и ветеринарного учёта, где даётся информация о каждом животном от рождения до его выбытия. Другим источником информации могут служить данные научно-производственных опытов, проводимые на ограниченном числе животных. После того как получена выборочная совокупность приступают к её обработке. Это позволяет получить в виде математических величин ряд статистических величин или коэффициентов, которые характеризуют признаки интересующих групп животных.
Биометрическим методом получают следующие статистические параметры или показатели:
1. Средние величины варьирующего признака (средняя арифметическая величина, мода, медиана, средняя геометрическая величина).
2. Коэффициенты, измеряющие величину варьирования т.е. (изменчивости) изучаемого признака (среднее квадратическое отклонение, коэффициент вариации).
3. Коэффициенты, измеряющие величину связи между признаками (коэффициент корреляции, регрессии и корреляционное отношение).
4. Статистические ошибки и достоверность получаемых статистических данных.
5. Долю варьирования возникающая под действием различных факторов и другие показатели, которые связаны с изучением генетических и селекционных проблем.
При статистической обработке выборки члены совокупности организуются в виде вариационного ряда. Вариационным рядом называется группировка особей на классы в зависимости от величины изучаемого признака. Вариационный ряд состоит из двух элементов: из классов и ряда частот. Вариационный ряд может быть прерывистым и непрерывным. Признаки, которые могут принимать только целое число называют прерывистым числом голов, число яиц, число поросят и другие. Признаки, которые могут выражаться дробными числами называются непрерывистыми (рост см, удой кг, % жира, живая масса и другие).
При построении вариационного ряда придерживаются следующих принципов или правил:
1. Определяют или подсчитывают количество особей для которых будет построен вариационный ряд (n).
2. Находят мах и min величину изучаемого признака.
3. Определяют классный промежуток К=мах - min/ к-во классов, количество классов берётся произвольно.
4. Строят классы и определяют границу каждого класса, min+К.
5. Делают разноску членов совокупности по классам.
После построения классов и распределения особей по классам вычисляют основные показатели вариационного ряда (Х, σ, Cv, Mх, Мσ, Мcv). Наибольшее значение при характеристике совокупности получила средняя величина признака. При решении всех зоотехнических, ветеринарных, медицинских, экономических и других задач всегда определяют среднюю величину признака (средний удой по стаду, % жира, плодовитость в свиноводстве, яйценоскость у кур и другие признаки). В число параметров, характеризующих среднее значение признака входят следующие:
1. Средняя арифметическая величина.
2. Средне взвешенная арифметическая.
3. Средняя геометрическая.
4. Мода (Мо).
5. Медиана (Ме) и другие параметры.
Средняя арифметическая величина показывает нам какую величину признаков имели особи данной группы, если он был одинаков для всех, и определяется по формуле Х=А+в× К
Основным свойством средней арифметической величины является то, что она как бы устраняет варьирование признака и делает его общим для всей совокупности. В тоже время необходимо отметить, что средняя арифметическая величина принимает абстрактное значение, т.е. при её вычислении получают дробные показатели, в действительности которых может и не быть. Например: выход телят на 100 коров-85,3 телёнка, плодовитость свиноматок 11,8 поросят, яйценоскость кур 252,4 яйца и другие показатели.
Значение средней арифметической величины очень велико в практике животноводства и характеристики популяции. В практике животноводства в частности скотоводства используют средне взвешенную арифметическую величину при определении среднего содержания жира в молоке за лактацию.
Средняя геометрическая величина вычисляется в том случае, если необходимо характеризовать темп роста, темп увеличения популяции, когда средняя арифметическая величина искажает данные.
Модой называют чаще всего встречающуюся величину варьирующего признака, как количественного, так и качественного. Модальным числом у коровы является число сосков-4. Хотя встречаются коровы с пятью, шестью сосками. В вариационном ряду модальным классом будет тот класс, где имеется наибольшее количество частот и мы его определяем как нулевой класс.
Медианой называется варианта, которая делит всех членов совокупности на две равные части. Половина членов совокупности будет иметь величину варьирующего признака меньше медианы, а другая больше медианы (например: стандарт породы). Медиана чаще всего используется для характеристики качественных признаков. Например: форма вымени чашеобразная, округлая, козье. При правильной выборке вариант все три показателя должны быть одинаковы (т.е. Х, Мо, Ме). Таким образом первой характеристикой совокупности служат средние величины, однако для суждения о совокупности их недостаточно.
Вторым важным показателем любой совокупности является изменчивость или вариабильность признака. Изменчивость признака обуславливается многими факторами внешней среды и внутренними факторами т.е. наследственными факторами.
Определение изменчивости признака имеет большое значение, как в биологии, так и в практике животноводства. Так с помощью статистических параметров измеряющих степень изменчивости признака можно установить породные различия в степени изменчивости различных хозяйственно-полезных признаков, прогнозировать уровень отбора в различных группах животных, а также его эффективность.
Современное состояние статистического анализа позволяет не только устанавливать степень проявления фенотипической изменчивости, но и разделить фенотипическую изменчивость на составляющие её типы, а именно на генотипическую и паратипическую изменчивость. Это разложение изменчивости делается с помощью дисперсионного анализа.
Основными показателями изменчивости служат следующие статистические величины:
1. Лимиты;
2. Среднее квадратическое отклонение (σ);
3. Коэффициент изменчивости или вариации (Сv).
Наиболее простой способ представить величину изменчивости признака помогают нам лимиты. Лимиты определяются следующим образом: разница между мах и min значением признака. Чем больше эта разница, тем больше изменчивость этого признака. Основным параметром измерения изменчивости признака служит среднее квадратическое отклонение или (σ) и определяется по формуле:
σ = ±К ∙ √∑Pa 2 - b 2
Основными свойствами среднего квадратического отклонения т.е. (σ) являются следующие:
1. Сигма всегда величина именованная и выражается (в кг, г, метрах, см, шт.).
2. Сигма всегда величина положительная.
3. Чем больше величина σ, тем больше изменчивость признака.
4. В вариационном ряду все частоты вкладываются в ±3σ.
С помощью среднего квадратического отклонения можно определить к какому вариационному ряду относится данная особь. Методы определения изменчивости признака с помощью лимитов и среднего квадратического отклонения имеют свои недостатки, так как сопоставить разноимённые признаки по величине изменчивости невозможно. Необходимо знать изменчивость разных признаков у одного и того же животного или одной и той же группы животных, например: изменчивость удоя, содержания жира в молоке, живой массы, количества молочного жира. Поэтому сопоставляя изменчивость разноимённых признаков и выявляя степень их изменчивости рассчитывают коэффициент изменчивости по следующей формуле:
Таким образом, основными методами оценки изменчивости признаков у членов совокупности являются: лимиты; среднее квадратическое отклонение (σ) и коэффициент вариации или изменчивости.
В практике животноводства и экспериментальных исследованиях очень часто приходится иметь дело с малыми выборками. Малой выборкой называют число особей или животных не превышающее 30 или меньше 30. Установленные закономерности с помощью малой выборки переносятся на всю генеральную совокупность. У малой выборки определяют те же самые статистические параметры, что и у большой выборочной совокупности (Х, σ, Cv, Mx). Однако формулы и расчёты их отличаются от большой выборки (т.е. от формул и расчётов вариационного ряда).
1. Средняя арифметическая величина Х = ∑V
V- абсолютное значение варианты или признака;
n- число вариант или число особей.
2. Среднее квадратическое отклонение σ = ± √∑α 2
α = х-¯х, это разность между значением варианты и средней арифметической величиной. Эту разность α возводят в квадрат и получают α 2 n-1 число степеней свободы, т.е. количество всех вариант или особей уменьшенное на единицу (1).
Контрольные вопросы :
1.Что такое биометрия?
2.Какие статистические параметры характеризуют совокупность?
3.Какие показатели характеризуют изменчивость?
4.Что такое малая выборка
5. Что такое мода и медиана?
Лекция № 12
Биотехнология и трансплантация эмбрионов
1. Понятие о биотехнологии.
2. Отбор коров- доноров и реципиентов, трансплантация эмбрионов.
3. Значение трансплантации в животноводстве.
18. Теория малых выборок.
При большом числе единиц выборочной совокупности (n >100) распределение случайных ошибок выборочной средней в соответствии с теоремой А.М.Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.
Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с малыми выборками.
Малой выборкой называется такое выборочное наблюдение, численность единиц которого не превышает 30.
При оценке результатов малой выборки величина генеральной совокупности не используется. Для определения возможных пределов ошибки пользуются критерием Стьюдента.
Величина σ вычисляется на основе данных выборочного наблюдения.
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки σ в генеральной совокупности.
Вероятностная оценка результатов малой выборки отличается от оценки в большой выборке тем, что при малом числе наблюдений распределение вероятностей для средней зависит от числа отобранных единиц.
Однако для малой выборки величина коэффициента доверия t по другому связана с вероятностной оценкой, чем при большой выборке (так как, закон распределения отличается от нормального).
Согласно установленному Стьюдентом закону распределения, вероятная ошибка распределения зависит как от величины коэффициента доверия t , так и от объема выборки В.
Средняя ошибка малой выборки вычисляется по формуле:
где - дисперсия малой выборки.
В МВ коэффициент n/(n-1) нужно брать во внимание и обязательно корректировать. При определении дисперсии S2 число степеней свободы равно:
.
Предельная ошибка малой выборки определяется по формуле
При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента, в которых даны распределения стандартизированных отклонений:
Вероятностная оценка результатов МВ отличается от оценки в БВ тем что при малом числе наблюдений распределение вероятностей для средней зависит от числа отобранных единиц
19. Способы отбора единиц в выборочную совокупность.
1. Выборочная совокупность должна быть достаточно большой по численности.
2. Структура выборочной совокупности должна наилучшим образом отражать структуру гнеральной совокупности
3. Способ отбора должен быть случайным
В зависимости от того участвуют ли отобранные единицы в выборке различают метод - бесповторный и повторный.
Бесповторным называется такой отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор.
Расчет средней ошибки бесповторной случайной выборки:
Расчет предельной ошибки бесповторной случайной выборки:
При повторном отборе попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную (генеральную) совокупность для участия в дальнейшей процедуре отбора.
Расчет средней ошибки повторной простой случайной выборки производится следующим образом:
Расчет предельной ошибки повторной случайной выборки:
Вид формирования выборочной совокупности подразделяется на - индивидуальный, групповой и комбинированный.
Способ отбора – определяет конкретный механизм выборки единиц из генеральной совокупности и подразделяется на: собственно – случайный; механический; типический; серийный; комбинированный.
Собственно – случайный наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером. Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку.
Механическая выборка . Применяется в тех случаях, когда генеральная совокупность каким – либо образом упорядочена т. е. имеется определенная последовательность в расположении единиц.
Для определения средней ошибки механической выборки используется формула средней ошибки при собственно – случайном бесповторном отборе.
Типический отбор . Используется когда все единицы генеральной совокупности можно разбить на несколько типических групп. Типический отбор предполагает выборку единиц из каждой группы собственно – случайным или механическим способом.
Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.
Серийный отбор . Применяется в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. Сущность серийной выборки заключается в собственно случайном либо механическом отборе серий, внутри которых производится сплошное обследование единиц.
При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:
Комбинированный отбор может проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.
Выборка называется многоступенчатой , если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.
" |
Метод малых выборок имеет ряд преимуществ перед методом больших выборок. Основными преимуществами его являются, во-первых, уменьшение объема вычислительных работ, во-вторых, возможность следить за динамикой изменения точности процесса во времени, чего нельзя сделать с помощью метода больших выборок. Метод больших выборок может дать представление лишь о точности и устойчивости процесса в период взятия выборки, которые могут сохраниться и в дальнейшем, если после взятия выборки условия протекания процесса не изменяются. В действительности такой неизменности производственных условий заранее предвидеть нельзя. Например, при работе на прутковом автомате в течение смены производится несколько раз замена материала (смена прутка), смена инструмента в связи с износом, поднастройка станка и т.д., которые могут вносить значительные коррективы в полученные ранее параметры распределения. Метод малых выборок, если последние берут в течение всей смены регулярно через определенные промежутки времени, позволяет получить полную картину состояния процесса в течение исследуемого периода, выяснить степень его устойчивости, а также выявить причины недостаточной устойчивости процесса во времени, если она есть.
Статистический анализ малыми выборками производится следующим образом. Выборки объемом n = 5-10 шт. берутся через определенные фиксированные промежутки времени (например, через 15-30 мин). Период времени для отбора проб устанавливается опытным путем и зависит от производительности станка, объема выборки и степени устойчивости технологического процесса. Для каждой выборки нужно вычислить и S . Далее необходимо для каждых двух смежных выборок проверить гипотезу однородности дисперсий выборок при помощи F - критерия Фишера.
Если гипотеза подтверждается, то это свидетельствует о стабильности рассеивания или о том, что сравниваемые выборки взяты из одной и той же генеральной совокупности. При подтверждении гипотезы однородности дисперсий двух выборок следует проверить гипотезу однородности двух выборочных средних по t -критерию Стьюдента.
Подтверждение гипотезы равенства двух смежных выборочных средних означает, что центр настройки оборудования не изменится в момент взятия данной выборки и остался таким, каким был при взятии предыдущей выборки, т.е. процесс находится в стабильном состоянии. Когда гипотеза равенства двух средних выборок не подтверждается, это свидетельствует о смещении центра настройки станка во время взятия данной выборки. Так как выборки берутся через определенные промежутки времени, то при обнаружении смещения центра настройки или изменения зоны рассеивания можно определить период времени, через который наступило нарушение стабильности процесса.
Обнаружив факт нарушения стабильности процесса, можно установить и область, в которой следует искать причину этого явления. Неоднородность выборочных дисперсий, свидетельствующая о нестабильности рассеивания, указывает на то, что причину этого следует искать в станке или в механических свойствах обрабатываемого материала. Неоднородность выборочных средних говорит о смещении центра настройки (причину искать в инструменте).
Таким образом, беря в течение смены через определенные интервалы времени малые выборки из текущей продукции станка, вычислены средние и дисперсии выборок путем сравнения и оценки их расхождения при помощи F и t- критериев, можно установить моменты разладок процесса и даже источники этих разладок.
На практике довольно часто приходится иметь дело с выборками весьма малого объема, численности которых значительно меньше двадцати - тридцати. Такие выборки в статистике получили название малых выборок. Необходимость специального рассмотрения малых выборок вызвана тем, что разобранные выше методы точечной и интервальной оценки выборочных характеристик предполагают достаточно большую численность выборок.
Понятие о малых выборках. Распределение Стьюдента
Выборочная средняя и, соответственно, ее ошибка распределены нормально, а поправка на величину смещения выборочной дисперсии очень близка к единице и не имеет практического значения. Ошибка выборки в этих условиях очень редко превышает величину. Иное дело при небольшом объеме выборки. При малых выборках выборочная дисперсия оказывается значительно смещенной. Поэтому применять функцию нормального распределения для вероятностных выводов о возможной величине ошибки было бы неправомерно. При малом объеме выборки всегда нужно пользоваться несмещенной оценкой дисперсии:
Следовательно, для получения несмещенной оценки дисперсии по данным малой выборки сумму квадратов отклонений нужно делить на величину. Эта величина называется числом степеней свободы вариации. В дальнейшем для краткости число степеней свободы вариации будет обозначаться греческой буквой (ню).
Проблема оценки выборочных характеристик на основе малых выборок впервые была исследована английским математиком статистиком В. Госсетом, публиковавшим свои работы под псевдонимов Стьюдент (1908 г.).
Исходя из предложения о нормальности распределения признака в генеральной совокупности и рассматривая вместо абсолютных отклонений их отношения к независимому стандарту, Стьюдент нашел распределение, которое зависит только от численности выборки. Позже (1925 г.) Р. Фишер дал более строгое доказательство этого распределения, которое получило название распределение Стьюдента.
Величина Стьюдента выражается как следующее отношение:
В числителе выражения фигурирует переменная величина, которая отражает возможные значения отклонений выборочных средних от генеральной средней. Величина распределена нормально с центром, равным нулю, и дисперсией, равной.
Следует особо подчеркнуть, что знаменатель выражения нельзя рассматривать как среднюю ошибку переменной. Величина рассматривается здесь как независимо распределенная от числителя переменная. означает среднее квадратическое (стандартное) отклонение данной выборки и не является оценкой генеральной совокупности, так как распределение Стьюдента не зависит ни от одного параметра генеральной совокупности. определяется по данным выборки как
Распределения независимы друг от друга. Только при этом условии и для выборок из нормальных совокупностей имеет место распределение Стьюдента.
Основное преимущество распределения Стьюдента состоит в том, что оно не зависит от параметров генеральной совокупности и имеет дело только с величинами, полученными непосредственно из выборки.
Дифференциальный закон распределение Стьюдента (плотность вероятности) имеет вид:
где объем выборки;
величина соответствующая максимальной ординате кривой распределения при t = 0.
Соответственно функция распределения Стьюдента выражается:
Иначе говоря,
где t ф стандартизированная (нормированная) разность, вычисляемая по результатам малой выборки.
Величины Г() и Г() являются гамма- функциями. Для некоторого числа гамма - функция выражается несобственным интегралом:
В малых выборках всегда целое положительное число (объем выборки).
В этом случае гамма - функция всегда имеет конечную величину и выражается через факториалы:
следовательно:
При вычислении гамма - функции полезно знать следующие свойства:
1) При есть;
- 3) Например,
Используя это свойство, легко можно вычислить значения Г() и Г() в выражении плотности распределения;
4) Функция достигает минимума при дробном значении
Рис 3.1
Общий вид гамма - функции показан на рис. 3.1.
Из свойств распределения Стьюдента, рассматриваемых обычно в курсе теории вероятностей, обращается внимание на следующее:
1) Распределение Стьюдента замечательно тем, что зависит только от одного параметра - объема выборки и не зависит от средней и дисперсии генеральной совокупности (в отличие от нормального распределения, зависящего о этих двух параметров).
- 2) Распределение Стьюдента точно для любого объема выборки следовательно, и для малых выборок, что позволяет делать вероятностные выводы по малому числу наблюдений.
- 3) При увеличении объема выборки величина приближается к значению, а распределение Стьюдента приближается к нормальному. При распределение Стьюдента становится нормальным. Практически для нормального приближения считается достаточным.
Рис 3.2
На рис. 3.2 показаны соотношения между распределением Стьюдента и нормальным распределением.
Как видно из рис. 3.2, под концами кривой распределения Стьюдента, например или, расположена значительно большая часть площади, чем под кривой нормального распределения при тех же значениях. Это значит, что при малом объеме выборок вероятность допущения больших ошибок заметно увеличивается. Из рисунка видно, что при значениях нормированного отклонения, превышающих по абсолютному значению, площадь под кривой распределения Стьюдента гораздо больше, чем под кривой нормального распределения.
О величине расхождений между значениями функции распределения Стьюдента в зависимости от объема выборки и значениями нормальной функции распределения можно судить по данным табл. 3.2, где приведены значения площадей под кривой распределения от при разной численности выборки при.
Таблица 3.1
Значение нормальной функции распределения
Таблица 3.2
Значения вероятностей при разном объеме выборки
Нормированное отклонение |
Значение при малых выборках с численностями |
Значение при больших выборках |
|||
Из таблицы 3.2. видно, что с увеличением объема выборки малая выборка быстро приближается к нормальной. В то же время при очень маленькой численности выборки расхождения между значениями при данном значении весьма значительны.
Исследованиями было установлено, что распределение Стьюдента практически применимо не только в случае нормального распределения признака в генеральной совокупности. Оказалось, что оно происходит к практически приемлемым выводам и тогда, когда распределения признака в генеральной совокупности не является нормальным, а лишь симметрично и даже несколько асимметрично, но объем выборки не слишком мал.
Значения функции распределения Стьюдента затабулированы при различных значениях Поэтому при оценке выборочных характеристик пользуются готовыми таблицами:
Таблица 3.3
Таблица значений функции
Значения функции распределения Стьюдента могут быть использованы различными способами в зависимости от характера решаемых задач при определении вероятности отклонения выборочной от генеральной. Наиболее часто используются:
1) Определение вероятности того, что разность между выборочной средней и генеральной средней окажется меньше на некоторую заданную величину. В нормированных отклонениях задача сводится к определению вероятности того, что окажется меньше значения, задаваемого условиями задачи, т.е. к нахождению значения
Рис 3.3
Это есть вероятность больших отрицательных отклонений, которая на рис. 3.3 соответствует заштрихованной площади.
2) Определение вероятности того, что разность между выборочной средней и средней генеральной окажется не менее некоторой заданной величины, иначе говоря, следует найти
Рис 3.4
Это есть вероятность больших положительных отклонений, которая показана в виде заштрихованной площади на рис. 3.4. эту вероятность легко найти, используя таблицы.
3) Определение вероятности того, что нормированное отклонение по абсолютной величине окажется менее, выражается
Это есть вероятность меньших по абсолютной величине отклонений. Эта вероятность может быть определена с использованием таблиц. Поскольку на практике чаще всего приходится определять эту вероятность, составленной специальной таблицы значения (табл. 3.3).
Графическая иллюстрация вероятности меньших по абсолютной величине отклонений дана на рис. 3.5
Рис 3.5
4) Определение вероятности того, что ошибка выборки по абсолютной величине окажется не менее некоторой заданной величины. В нормированных единицах вероятность того, что по абсолютной величине окажется не менее, выразится
Это есть вероятность больших по абсолютной величине отклонений. Графически она иллюстрируется на рис. 3.6.
Рис 3.6
Для нахождения вероятности больших по абсолютной величине отклонений имеются специальные таблицы (приложение 3). Эту вероятность легко можно вычислить, также используя таблицы.
А.М. Носовский1*, А.Э. Пихлак2, В.А. Логачев2, И.И. Чурсинова3, Н.А. Мутьева2 СТАТИСТИКА МАЛЫХ ВЫБОРОК В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ
"Государственный научный центр Российской Федерации - Институт медико-биологических проблем Российской академии наук, 123007, Москва, Россия; 2ГБОУ ВПО «Московский государственный медико-стоматологический университет имени А.И.Евдокимова» Минздрава России, 127473, Москва, Россия; 3АНО «Артрологическая больница НПО СКАЛ», 109044, Москва, Россия
*Носовский Андрей Максимович, E-mail: [email protected]
♦ Экспериментально найдены характеристики статистических критериев. В результате вычисляли значение статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz). Для каждой исходной статистики вычисляется нормальная аппроксимация (Z-статистика) и уровень значимости p нулевой гипотезы об отсутствии различий в разбросе значений двух выборок. Если p>
Предлагаемые методы математической статистики позволяют подтверждать достоверность различий полученных результатов даже в небольших группах наблюдений, если различия достаточно значимы. Иллюстрацией служили клинические примеры пациентов с костно-суставной патологией. Ключевые слова: малая выборка, мощность критерия, коксартроз, подагрический полиартрит
A.M. Nosovskiy1, A.E.Pikhlak2, V.A. Logachev2, I.I. Chursinova3, N.AMuteva2 SMALL-DATA STATISTICS ANALYSIS IN MEDICAL STUDIES
1The state research center-institute of medical biological problems of the Russia academy of medical sciences, 123007 Moscow, Russia; 2Moscow State University of Medicine and Dentistry named after A.I. Evdokimov, 127473 Moscow, Russia; 3Arthrology hospital of scientific and practical association SKAL, 109044 Moscow, Russia
♦ The experimentally was found characteristics of statistical criteria. As a result, calculated the value of the statistics by W. An-sari-Bradly and K. Klotz. For each source of statistics calculated normal approximation (Z-statistics) and the significance level of p of the null hypothesis of no difference in the spread of the values of the two samples. Atp>0.05 the null hypothesis can be accepted. Suggested methods of mathematical statistics can be confirming the accuracy of the differences of the results, even in small groups of observations, if the differences are significant enough.
We used medical cases of patients with joint and bone pathology.
Key words: small data analysis, power of criteria, coxarthrosis, gouty arthritis
Принципы доказательной медицины предъявляют высокие требования к достоверности сравнительной оценки полученных результатов исследований. Это становится тем более важным, что большинство врачей имеет весьма поверхностное представление о методиках статистической обработки, ограничиваясь в своих публикациях помимо вычисления процентов, в лучшем случае /-критерием Стьюдента.
Однако для проведения полноценного анализа результатов исследования в ряде случаев этого бывает недостаточно. Не вызывает обычно сомнений достоверность выявленных закономерностей, когда число наблюдений составляет несколько тысяч или даже сотен. А если это - несколько десятков? А если мы имеем лишь несколько случаев? Ведь в медицине встречаются достаточно редкие заболевания, хирурги порой выполняют уникальные операции, когда количество наблюдений совсем невелико. Где та грань, тот необходимый и достаточный объем исследований, позволяющий утверждать о несомненном наличии той или иной закономерности?
Этот вопрос имеет важнейшее значение не только при оценке уже проведенных исследований, но и при планировании научной работы. Достаточно ли провести наблюдение за 20 пациентами или необходимо минимум 40? А может быть, хватит и 10 случаев? От своевременного и правильного ответа на этот вопрос зависит не только достоверность сделанных выводов, но и сроки проведения исследований, их стоимость, потребность в кадрах, оснащении и т.д.
Современная статистика знает довольно много приемов, с помощью которых можно определять достоверность результатов даже при небольшом числе наблюдений. Это - методы «малой выборки». Принято считать, что начало статистике малых выборок было положено в первом десятилетии XX века публикацией работы У Гос -
сета, где он под псевдонимом «Стьюдент» (студент) постулировал так называемое /-распределение. В отличие от теории нормального распределения, теория ^распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности, а также не требует допущений относительно параметров. В /-распределении одно из отклонений от выборочного среднего всегда фиксировано, так как сумма всех таких отклонений должна равняться нулю. Это сказывается на сумме квадратов при вычислении выборочной дисперсии как несмещённой оценки дисперсии генеральной совокупности и ведёт к тому, что число степеней свободы df получается равным числу измерений минус единица для каждой выборки. Отсюда, в формулах и процедурах вычисления /-статистики для проверки нулевой гипотезы df=w-1. Известны также классические работы крупнейшего английского статистика Р.А. Фишера (в честь которого получило свое название ^-распределение) по дисперсионному анализу - статистическому методу, явно ориентированному на анализ малых выборок. Из многочисленных статистик, которые можно обоснованно применять к малым выборкам, можно упомянуть: критерий точной вероятности Фишера; двухфак-торный непараметрический (ранговый) дисперсионный анализ Фридмана; коэффициент ранговой корреляции / Кендалла; коэффициент конкордации Кендалла; Я-критерий Краскела-Уоллеса для непараметрического (рангового) однофакторного дисперсионного анализа; ^/-критерий Манна-Уитни; медианный критерий; критерий знаков; коэффициент ранговой корреляции г Спирме-на; /-критерий Уилкоксона.
Определённого ответа на вопрос, какой объем должна иметь выборка, чтобы её можно было считать малой, не существует. Однако условной границей между малой и большой выборкой принято считать df=30. Основанием
для этого в какой-то мере произвольного решения служит результат сравнения /-распределения (для малых выборок) с нормальным распределением (г). Расхождение значений / и г имеет тенденцию возрастать с уменьшением и снижаться с увеличением Фактически, 1 начинает тесно приближаться к ъ задолго до предельного случая, когда /=г. Простое визуальное изучение табличных значений / позволяет увидеть, что это приближение становиться довольно быстрым, начиная с ^=30 и выше. Сравнительные величины / (при ^=30) и г равны соответственно: 2,04 и 1,96 для р=0,05; 2,75 и 2,58 для р=0,01; 3,65 и 3,29 для р=0,001.
В математической статистике употребляют коэффициент доверия /, значения функции табулированы при разных его значениях, при этом получают соответствующие уровни доверительной вероятности (табл. 1) .
Коэффициент доверия позволяет вычислить предельную ошибку выборки АХ, вычисляемую по формуле АХср=1цср, т.е. предельная ошибка выборки равна /-кратному числу средних ошибок выборки .
Таким образом, величина предельной ошибки выборки может быть установлена с определённой вероятностью. Как видно из последней графы таблицы 1, вероятность появления ошибки равной или большей утроенной средней ошибки выборки, т. е. АХс =3цс крайне мала и равна 0,003 (1-0,997). Такие маловероятные события считаются практически невозможными, а потому величину АХ =3цс можно принять за предел возможной ошибки выбо рки р3].
Интервал, в который с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительным, а вероятность Р - доверительной вероятностью . Чаще всего доверительную вероятность принимают равной 0,95 или 0,99, тогда коэффициент доверия 1 равен соответственно 1,96 и 2,58.
Это означает, что доверительный интервал с заданной вероятностью заключает в себе генеральную среднюю.
Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки .
Применение данного подхода может быть проиллюстрировано наблюдением за 20 пациентами с коксартрозом, находившихся на лечении в Артрологической больнице НПО «СКАЛ» (Научно-производственное объединение «Специализированное курсовое амбулаторное лечение») г. Москвы.
При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.
Вероятность ошибки первого рода называется уровнем значимости и обозначается а. Таким образом, а=Р{Ш¥ | Н0}, т.е. уровень значимости а - это вероятность события {Це¥}, вычисленная в предположении, что верна нулевая гипотеза Н0.
Уровень значимости и мощности критерия объединяются в понятии функции мощности критерия - функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области ¥ и действительного распределения результатов наблюдений. В параметрической
Таблица 1
Коэффициент доверия t и соответствующие уровни доверительной вероятности
t 1,00 1,96 2,00 2,58 3,00
F(0 0,683 0,950 0,954 0,990 0,997
задаче проверки гипотез распределение результатов наблюдений задается параметром 0. В этом случае функция мощности обозначается М(¥,0) и зависит от критической области ¥ и действительного значения исследуемого параметра 0. Если Н0: 0=00, Н1: 0=01, то М(¥,00) = а, М(¥,01)=1-в, где а - вероятность ошибки первого рода, в - вероятность ошибки второго рода. Тогда, мощность критерия - это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.
Функция мощности М(¥,0) в случае одномерного параметра 0 обычно достигает минимума, равного а, при 0=00, монотонно возрастает при удалении от 00 и приближается к 1 при | 0 - 00 | ^ да.
Оценим необходимую мощность статистических критериев (рис. 1), которые могли бы быть применены для анализа лечения 20 пациентов с коксартрозом.
Как видим, при среднеквадратическом отклонении равном 3,0, что бывает крайне редко, будут получены результаты с высокой степенью надёжности /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.
Для определения уровня значимости р обычно используется приближенная нормальная 2-аппроксимация соответствующей статистики. Такая аппроксимация дает хорошее приближение при достаточно больших размерах выборок. При малом объеме выборки и значениях р, близких к 0,05, мы проверяли вывод о нулевой гипотезе срав-
Power Curve alpha=0,05, sigma=
Power Curve alpha=0,05, sigma=1,
True Difference Between Means
True Difference Between Means
Рис. 1. Экспериментально найденные характеристики статистических
критериев.
Таблица 2 .
Группы наблюдения
Группа 1 Группа 2 Группа 3 Всего наблюдений
Нимесулид, витамины, хондропротекторы, лечебная физкультура + + + 20
Физиотерапия --- + + 15
Массаж... --- + 8
Боль при движении
Боль в покое 43±13 27±17
нением вычисленного значения статистики с критическим значением в таблице соответствующего распределения из статистического справочника.
Критерии различия сдвига (положения). Мы использовали эти критерии для проверки следующих гипотез:
♦ отсутствие различий во взаимном положении (медианах) двух исследованных выборках;
♦ сдвиг выборок друг относительно друга равен некоторому значению d;
♦ медиана одной анализируемой выборки равна значению d.
В случае б) необходимо было предварительно все значения второй выборки уменьшить на величину d: yi=yi-d.
В случае в) необходимо подготовить вспомогательную парную выборку, все элементы которой равны d.
В результате вычисляли:
♦ значение статистики W. Вилкоксона (Wilco-xon) - сумма рангов Rxi элементов одной из выборок в объединенной ранжированной выборке;
♦ значение статистики V Ван дер Вардена (van der Varden), основанную на использовании метода «произвольных меток».
Для каждой статистики вычислялась нормальная аппроксимация (Z-статистика) и уровень значимости P нулевой гипотезы об отсутствии различий в сдвиге по отношению друг к другу. Если p>0,05 нулевая гипотеза может быть принята.
Некоторые пакеты и авторы предлагают использовать ^/-критерий Манна-Уитни (Mann-Whitney) и критерий Вальда-Вольфовица (Vald-Wolfowitz). Однако давно уже доказано , что критерий Манна-Уитни эквивалентен, т.е. обладает теми же возможностями, что и крите-
Таблица 3 .
Средние показатели интенсивности боли (в баллах по ВАШ)
Группа 1 (n= 5) Группа 2 (n=7) Группа 3 (n= =8)
Показатель Начало наблюдения Конец наблюдения Снижение боли Начало наблюдения Конец наблюдения Снижение боли Начало наблюдения Конец наблюдения Снижение боли
Таблица 4.
Данные лабораторного обследования больного Б.
№ Показатель Норма Результат предпослед- Результат последнего
него посещения посещения
Гематокрит, % 40-48 38,7
Лимфоциты, % 19-37 42
СОЭ, мм/час 2-10 39
Мочевая кислота, мкмоль/л 200-416 504
Креатинин, мкмоль/л 44-106 238
Паратиреоидный гормон, пг/мл 7-53 76,8
Фибриноген, г/л 1,69-3,92 5,7
Белок в моче, г/л 0-0,1 1
43,5 39 10 489 202 101 3
Предпоследнее
Последнее
Рис. 2. р-значения клинических показателей больного Б. при предпоследнем и последнем обследовании.
рий Вилкоксона, а критерий Вальда-Вольфовица страдает сравнительно малой чувствительностью.
Критерии различия масштаба (рассеяния). Мы использовали эти критерии для проверки следующих гипотез:
♦ гипотеза об отсутствии различий в масштабах (в разбросе или рассеянии значений) исследуемых выборок;
♦ гипотеза о том, что отношение масштабов выборок равна заданной величине g.
В последнем случае необходимо предварительно изменить значения второй выборки у1=(у1-т0)^ , где т0 -общая медиана двух исследуемых спектров.
Если медианы генеральных совокупностей, из которых извлечены выборки, не равны по величине, но их
применить, предварительно модифицировав одну из выборок, например, в выборку yi=yi-m2+mr
Если же медианы не равны и не известны, то следует подтвердить гипотезу об отсутствии различий сдвига или же использовать метод для обнаружения произвольных альтернатив.
В результате вычисляли значение статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz), которые являются концептуальными аналогами статистик Вилкоксона и Ван дер Вардена.
Для каждой исходной статистики вычисляется нормальная аппроксимация (Z-статистика) и уровень значимости P нулевой гипотезы об отсутствии различий в разбросе значений двух выборок. Если />>0.05, нулевая гипотеза может быть принята.
Таким образом, предлагаемые выше методы математической статистики позволяют подтверждать достоверность различий
полученных результатов даже в небольших группах наблюдений, если различия достаточно значимы.
Иллюстрацией могут служить два клинических примера пациентов с костно-суставной патологией.
Клинический пример № 1. У 20 пациентов с кок-сартрозом применяли базовый лечебный комплекс, включающий пероральный прием нимесулида, хондропротекторов, внутримышечные инъекции витаминов и лечебную физкультуру. Кроме этого у 15 из них применяли физиотерапевтическое лечение, а у 6 пациентов - массаж. Таким образом, образовалось 3 группы пациентов с небольшим (от 5 до 8) числом наблюдений (табл. 2).
Среди прочих параметров перед началом лечения и после завершения курса (21±2 дня) оценивали интенсивность боли при движении и в покое по 100-бальной визуальной аналоговой шкале (ВАШ).
Использовались следующие методы статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz) (табл. 3).
Согласно полученным данным (табл. 3) было отмечено, что снижение боли в покое в группе 1 в конце наблюдения не являлось достоверным. Однако по всем другим изучаемым параметрам выявлены достоверные значения. Рассматриваемый клинический пример свидетельствует о возможности получения достоверных результатов на малом количестве выборки.
В клиническом примере № 2 рассматриваются в динамике лабораторные данные больного Б., страдающего хроническим подагрическим полиартритом, подагрической не-фропатией с явлениями ХПН, которые находились за пределами референсных значений (табл. 4).
Рассчитаем вероятность того, что результаты анализа статистически достоверно выходят за границы клинической нормы. Для этого используем вероятностный калькулятор статистического пакета «STATISTICA 6.0». В данном случае p-значение характеризует ошибку первого рода: вероятность отклонить правильную гипотезу, когда на самом деле она верна. В большинстве случаев результаты предпоследнего посещения статистически достоверно отличаются от нормы (рис. 2). Поскольку пороговый уровень значимости в данном случае мы принимаем равным 0,05, то результаты гематокрита, лимфоцитов, СОЭ, фибриногена статистически значимо улучшились при последнем посещении. Соответственно, клинические показатели мочевой кислоты, креатинина, паратиреоидного гормона и белка в моче, с точки зрения математической статистики, не улучшились.
Таким образом, при планировании исследования важно учитывать мощность применяемых статистических критериев, которые определяются вариабельностью выборки и заданным уровнем значимости.
Предлагаемый подход может быть интересен специалистам в области персонифицированной медицины для
анализа в динамике применяемых методов лечения и лекарственных средств, при контроле за проводимыми лечебными и диагностическими мероприятиями.
ЛИТЕРАТУРА
1. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука; 1995.
2. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука; 2003.
3. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ; 2006.
4. Правецкий Н.В., Носовский А.М., Матросова М.А., Холин С.Ф., Шакин В.В. Математическое обоснование достаточного количества измерений для достоверной оценки регистрируемых параметров в космической биологии и медицине. Космическая биология и авиакосмическая медицина. М.: Медицина; 1990; 5: 53-6.
5. ХоллендерМ., Вульф Д.А. Непараметрические методы статистики. М.: Финансы и статистика; 1983.
6. Носовский А.М. Применение вероятностных моделей на окружности в медико-биологических исследованиях. Космическая биология и авиакосмическая медицина. Тезисы докладов IX Всесоюзная конференция. Калуга, 19-21 июня 1990.
7. Носовский А.М., Правецкий Н.В., Холин С.Ф. Математический подход к оценке точности измерений физиологического параметра различными методами. Космическая биология и авиакосмическая медицина. М.: Медицина; 1991; 6: 53-5.
1. Bol"shev L.N., Smirnov N.V. Tables of Mathematical Statistics. Moscow: Nauka; 1995 (in Russian).
2. Korn G., Korn T. Mathematical Handbook for Scientists and Engineers. Moscow: Nauka; 2003 (in Russian).
3. Kobzar" A.I. Applied Mathematical Statistics. For engineers and scientists. Moscow: FIZMATLIT; 2006 (in Russian).
4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Mathematical justification of a sufficient number of measurements for reliable evaluation of recorded parameters in space biology and medicine. Space Biology and Aerospace Medicine. Moscow: Meditsina; 1990; 5: 53-6 (in Russian).
5. Khollender M., Vul"f D.A. Non-parametric statistical methods. Moscow: Finansy i statistika; 1983 (in Russian).
6. Nosovskiy A.M. The use of probabilistic models on the circle in biomedical research. Space Biology and Aerospace Medicine. Abstracts of the IX All-Union Conference. Kaluga, June 19-21, 1990 (in Russian).
7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Mathematical approach to estimation accuracy of the physiological parameter by different methods. Space Biology and Aerospace Medicine. Moscow: Me-ditsina; 1991; 6: 53-5 (in Russian).