ВЫБОРОЧНЫЙ МЕТОД
Описание
ВЫБОРОЧНЫЙ МЕТОД (син.: выборочное наблюдение, выборка) — статистический метод, позволяющий получить характеристику всей изучаемой совокупности в целом (генеральной совокупности) на основе специального отбора и изучения части составляющих ее единиц (выборочной совокупности).
В. м., основанный на законе больших чисел и теории вероятностей (см. Вероятностей теория), теоретически был разработан русскими математиками П. Л. Чебышевым, А. М. Ляпуновым, А. А. Марковым и др. В. м. широко применялся в статистических исследованиях отечественными врачами в 90-е годы 19 в. Теория и практика В. м. получила дальнейшее развитие в советской статистике, в т. ч. санитарной.
В советском здравоохранении В. м. применяется наряду со сплошным исследованием при изучении различных вопросов состояния здоровья населения и деятельности мед. учреждений. Сплошное наблюдение производят при необходимости иметь краткую информацию обо всех без исключения единицах наблюдения исследуемой совокупности (напр., при переписях населения, изучении заболеваемости, смертности и др.). В. м. используют для получения углубленных сведений или для проверки данных, полученных сплошным методом, путем более детального и строгого изучения части объектов, а также для проведения пробных, поисковых работ. В. м. обеспечивает экономию сил, средств, сокращение сроков работы при расширении и углублении программы исследования.
Для обеспечения статистически достоверных результатов предъявляют особые требования к выборочной совокупности. Она должна быть репрезентативной (представительной) по отношению к генеральной совокупности. Это означает, что выборочная совокупность должна быть достаточно представительной по численности отобранных единиц, а также должна соответствовать качественному составу генеральной совокупности.
Применение В.м. включает следующие этапы: 1) определение объема выборочной совокупности; 2) специальный отбор необходимой численности единиц из генеральной совокупности; 3) расчет выборочных статистических величин и оценка их репрезентативности; 4) распространение результатов исследования с выборочной совокупности на всю генеральную совокупность.
Основным условием применения В. м. является определение достаточного объема выборочной совокупности, обеспечивающей получение статистически достоверных результатов, и репрезентативность ее. По мере увеличения объема выборки уменьшается ошибка выборки, т. е. возрастает ее точность. Для определения объема выборочной совокупности используют специальные формулы. С целью обеспечения качественного соответствия состава выборочной совокупности составу генеральной совокупности применяют следующие способы отбора необходимой численности единиц из генеральной совокупности (или способы выборочного наблюдения): случайный, механический, типологический, серийный.
Случайный способ — выборку производят с помощью жеребьевки (рендомизации) или с помощью специальных таблиц случайных чисел; каждая единица генеральной совокупности имеет равную возможность стать единицей выборочной совокупности. Механический способ — единицы генеральной совокупности располагают в определенном порядке (по номерам, алфавиту и т. д.), а затем механически производят отбор единиц через какой-либо интервал (напр., 5, 10, 15 и т. д.). Типологический способ — генеральную совокупность предварительно расчленяют на отдельные качественно однородные группы (типы) по какому-либо изучаемому признаку, напр, население по возрасту, проживанию в различных географических районах (горных, приморских, степных и др.)» по профессии (занимающиеся полеводством, животноводством, рыболовством и т. д.). После предварительного расчленения генеральной совокупности на группы производят отбор части единиц внутри каждой типологической группы. Отбор осуществляют механическим путем. При этом необходимо, чтобы объем выборки из каждой типологической группы был пропорционален удельному весу данной группы в составе изучаемой генеральной совокупности. Серийный (гнездовой) способ — выборочную совокупность образуют путем отбора не отдельных единиц, а сразу целых серий (гнезд) из генеральной совокупности. Для этой цели всю генеральную совокупность предварительно разбивают на относительно однородные серии (гнезда). Отбор серий осуществляют методом случайной или механической выборки. Отбор должен производиться так, чтобы каждой серии генеральной совокупности была обеспечена одинаковая возможность быть отобранной в выборочную совокупность. Такой принцип выборочного наблюдения обеспечивает репрезентативность выборочной совокупности по отношению к генеральной. В каждой отобранной серии изучаются все составляющие ее единицы.
После отбора всех единиц выборочной совокупности приступают к расчету различных (в зависимости от необходимости) статистических величин: средних арифметических, относительных величин, коэффициентов корреляции и др.
Важным этапом В. м. является оценка репрезентативности выборочных статистических величин: средних арифметических, относительных величин, коэффициентов корреляции и т. д.
Для оценки репрезентативности этих величин используется ошибка репрезентативности (m). Она показывает, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, к-рые были бы получены при сплошном изучении всей генеральной совокупности.
Ошибка репрезентативности (m) средней арифметической рассчитывается по формуле: m =σ/√n , где σ — среднее квадратическое отклонение, n — число наблюдений. Ошибка репрезентативности для показателя рассчитывается по формуле:
m =√(p×q/n) , где р — величина показателя в процентах, а q=100—р (если p выражено в промилле, то q=1000—p).
В. м. предусматривает определение меры различия (ошибку) статистических величин выборочной совокупности от статистических величин генеральной совокупности и тем самым обеспечивает возможность перенесения выводов с выборочной совокупности на всю генеральную совокупность.
Заключительным этапом при применении В. м. является распространение результатов выборочного исследования на всю генеральную совокупность.
Статистические величины выборочной совокупности несколько отличаются от величин генеральной совокупности. Статистика позволяет определить эти пределы колебаний выборочных величин, к-рые не должны выходить за пределы доверительных границ статистических величин генеральной совокупности. Используя ошибку репрезентативности m с заданной мерой вероятности безошибочного прогноза р, можно установить доверительные границы, в пределах к-рых будет находиться средняя арифметическая величина (или показатель) того или иного признака в генеральной совокупности.
Для этого используют формулу: M=m±tm, где М — доверительные границы средней арифметической генеральной совокупности; m — средняя арифметическая, полученная в выборочной совокупности; t — критерий точности, к-рый зависит от заранее заданной вероятности безошибочного прогноза p.
Математически доказано, что при р = = 95% t=2, при р = 99,7% t=3. Такое соотношение закономерно при числе наблюдений n>30. При меньшем числе наблюдений соотношение величин p и t находят по специальной статистической таблице «критерия t» (критерий Стьюдента). Напр., для определения среднего роста мужчин в возрасте 25 лет в генеральной совокупности можно измерить рост мужчин 25 лет в выборочной совокупности. Так, если средний рост мужчин 25 лет в выборочной совокупности составил 173 см, а ошибка репрезентативности средней величины роста m=±0,3 см, то при вероятности безошибочного прогноза р=95,0% критерий t=2, М=173±(2х0,3 мм) или 172,4-173,6. Это означает, что при любом увеличении числа обследованных лиц аналогичного пола и возраста их средний рост не окажется (с вероятностью в 95%) ниже 172,4 см и выше 173,6 см. Если, по мнению исследователя, доверительные границы слишком велики и тем самым полученная средняя величина (показатель) является ненадежной, следует принять меры к увеличению числа наблюдений.
При сравнении двух выборочных средних величин В. м. предусматривает определение существенности различия между ними по формуле
где М1 и М2 — сравниваемые средние арифметические, а m1 и m2 — соответствующие ошибки репрезентативности. Если t= 2, то можно будет утверждать (с вероятностью безошибочного прогноза р = 95%), что сравниваемые величины действительно существенно различны между собой. Если же t = 3, то р=99,7%, т. е. различие еще более существенно.
Такое статистическое доказательство достоверности различия результатов исследования широко применяется при выводах об эффективности тех или иных оздоровительных мероприятий, сравнении методов лечения, при доказательстве различия сравниваемых групп по каким-либо иным признакам и т. д. При этом необходимо иметь в виду, что количественный результат оценок существенности различия должен сопровождаться глубоким качественным анализом, напр, изучением в сравнительном плане особенностей распространения того или иного заболевания в зависимости от пола, возраста, профессии, социальных условий и т. д.
«Малыми выборками» называются группы, состоящие из 30 и менее единиц наблюдения, по результатам к-рых оценивается вся генеральная совокупность. В этих случаях предъявляются повышенные требования к обработке и оценке выборочных статистических величин. Видоизменяются расчеты среднего квадратического отклонения (а) и критерия точности t. Оценка существенности различий двух выборочных статистических величин осуществляется также путем расчета критерия t, но полученного двумя разными путями, в зависимости от того, связаны или не связаны между собой сравниваемые совокупности (пример связанных между собой совокупностей: уровень кровяного давления до лечения и после лечения одних и тех же лиц; пример не связанных между собой совокупностей: уровень кровяного давления у мужчин и женщин).
См. также Санитарная статистика.
Библиогр.: Йейтс Ф. Выборочный метод в переписях и обследованиях, пер. с англ., М., 1965, библиогр.; Крылов В. Н. Выборочный метод в статистике, М., 1957; Мерков А. М. и Поляков Л. М. Санитарная статистика, Л., 1974, библиогр.; Сeпeтлиeв Д. Статистические методы в научных медицинских исследованиях, пер. с болг., М., 1968; Статистические методы исследования в медицине и здравоохранении, под ред. Л. Е. Полякова, Л., 19 71, библиогр.
И. Г. Лаврова.