Национальный стандарт РФ ГОСТ Р ИСО 3534-4-2021
"Статистические методы. Словарь и условные обозначения. Часть 4. Выборочный контроль на основе данных опроса и анкетирования"
(утв. и введен в действие приказом Федерального агентства по техническому регулированию и метрологии от 28 сентября 2021 г. N 1017-ст)
Statistical methods. Vocabulary and symbols. Part 4. Survey sampling
УДК 658.562.012.7:65.012.122:006.354
ОКС 03.120.30;
01.040.03
Дата введения - 1 января 2022 г.
Введен впервые
Предисловие
1 Подготовлен Закрытым акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем" (ЗАО "НИЦ КД") на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4
2 Внесен Техническим комитетом по стандартизации ТК 125 "Применение статистических методов"
3 Утвержден и введен в действие Приказом Федерального агентства по техническому регулированию и метрологии от 28 сентября 2021 г. N 1017-ст
4 Настоящий стандарт идентичен международному стандарту ИСО 3534-4:2014 "Статистика. Словарь и условные обозначения. Часть 4. Выборочные опрос и анкетирование" (ISO 3534-4:2014 "Statistics - Vocabulary and symbols - Part 4: Survey sampling", IDT).
Международный стандарт разработан Техническим комитетом ISO/ТС 69.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5).
Алфавитный указатель эквивалентов терминов на английском языке приведен в дополнительном приложении ДА.
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДБ
5 Введен впервые
Введение
Выборочный контроль на основе данных опроса и анкетирования - это, по сути, стратегия планирования сбора информации об исследуемой совокупности. В тех случаях, когда можно перечислить все единицы совокупности, ключевую роль играют статистические методологии отбора выборки без замещения. Планирование опроса и его проведение зависят от типа вопросов, которые должны быть рассмотрены, степени обобщенности выводов и, в конечном счете, доступных ресурсов для проведения исследования и анализа результатов.
Политические опросы, опросы об удовлетворенности потребителей и личные интервью широко распространены в современном обществе как способы представления лицам, принимающим решения, информации, необходимой для формирования или корректировки стратегий. Средства массовой информации часто сообщают о результатах опроса о настроении в обществе в отношении политического руководства. Это не новое явление, поскольку выборочные опросы (особенно перепись населения) существуют на протяжении тысячелетий. Опрос, как общая методология, и отбор выборки из конечной совокупности, как его строгая теоретическая основа, являются предметом настоящего стандарта.
Методология выборочного опроса состоит из процесса отбора в выборку единиц совокупности, измерения характеристик этих единиц и последующей оценки характеристик совокупности на основе полученных результатов. В [4] определено понятие опроса со следующим описанием:
1) опрос касается набора элементов, входящих в совокупность;
2) опрос применим к совокупности, элементы которой имеют одно или более измеримых свойств;
3) опрос имеет целью описание совокупности (структуры совокупности) в соответствии с одним или несколькими параметрами, характеризующими эти свойства;
4) опрос требует оперативного представления совокупности (структуры), такого как перечень всех элементов, для упрощения исследования отдельных элементов;
5) опрос применим к подмножеству элементов структуры, которые отобраны в соответствии со схемой отбора выборки, состоящей из объема выборки и способа ее случайного отбора;
6) опрос выполняют путем определения характеристик элементов выборки;
7) для определения оценок параметров совокупности необходим соответствующий процесс обработки результатов опроса.
Это краткое введение ни в коем случае не отражает всех тонкостей и преимуществ в области выборочного опроса, достигнутых на протяжении веков и особенно в последние несколько десятилетий с повышением вычислительных возможностей. Достижения получены на основе фактического применения метода.
Некоторые определения в настоящем стандарте приведены по ИСО 3534-1:2006 и ИСО 3534-2:2006. Если принятое определение идентично исходному, к определению добавлена ссылка в квадратных скобках, при наличии различий они указаны.
1 Область применения
В настоящем стандарте установлены термины, используемые в области выборочных опроса и анкетирования (далее - опроса). Настоящий стандарт может быть использован при разработке других стандартов.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты [для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных - последнее издание (включая все поправки)]:
ISO 3534-1:2006, Statistics - Vocabulary and symbols - Part 1: General statistical terms and terms used in probability (Статистика. Словарь и условные обозначения. Часть.1. Общие статистические термины и термины, используемые в теории вероятностей)
ISO 3534-2:2006, Statistics - Vocabulary and symbols - Part 2: Applied statistics (Статистика. Словарь и условные обозначения. Часть 2. Прикладная статистика)
3 Термины и определения
В настоящем стандарте применены термины по ИСО 3534-1:2006, ИСО 3534-2:2006, а также следующие термины с соответствующими определениями.
3.1 Общие термины |
|
|
3.1.1 (генеральная) совокупность: Множество всех рассматриваемых единиц. [ИСО 3534-1:2006, 1.1]
Примечание - Совокупность может состоять из реальных объектов и быть конечной, может состоять из реальных объектов и быть бесконечной или может быть полностью гипотетической. В настоящем стандарте основное внимание уделено конечной совокупности (3.1.2). Большая часть области выборочного опроса (3.1.20) касается конечных совокупностей. Вместо термина "генеральная совокупность" может быть использован термин "совокупность". Поскольку совокупность может изменяться во времени, ее следует рассматривать в фиксированный момент времени. |
en |
population |
3.1.2 конечная совокупность: Совокупность (3.1.1), состоящая из конечного количества элементов.
Примечание - Отбор выборки для опроса (3.1.21) применяют исключительно к конечному количеству элементов совокупности. Количество элементов может быть очень большим (например, количество гибридных автомобилей в Европе, артефактов в музее, овец в Новой Зеландии), но конечным. Количество элементов в совокупности, как правило, обозначают N. Конкретное значение N до проведения исследования может быть точно известно или нет.
Пример 1 - Количество зарегистрированных граждан страны является примером конечной совокупности известного объема. Пример 2 - Несмотря на то, что, как правило, объем совокупности N известен заранее, такая ситуация не обязательно имеет место. Например, при исследовании доли гибридных автомобилей наблюдения могут быть сделаны в контрольной точке (например, в пункте оплаты). Количество автомобилей, проходящих через этот пункт в определенный день, заранее неизвестно, хотя исследователи, вероятно, имеют приблизительное представление об этом количестве из предыдущих данных. Возможно, будет сделана цифровая фотография выбранного количества транспортных средств, чтобы определить, являются ли они гибридными автомобилями. |
en |
finite population |
3.1.3 подсовокупность: Точно определенная часть совокупности (3.1.1).
Примечание 1 - Выборочный опрос (3.1.20) часто имеет несколько целей. Несмотря на то, что основная цель может касаться совокупности в целом, возможно, что отдельные подмножества также представляют интерес. В примере, приведенном в 3.1.2, гибридные транспортные средства или, в качестве альтернативы, субкомпактные автомобили включают подсовокупности, которые могут представлять особый интерес. В некоторых ситуациях фактический объем подсовокупности неизвестен (например, количество детей подросткового возраста среди туристов, посещающих Евродисней), и опрос может быть сосредоточен на оценке этого значения. Примечание 2 - В соответствии с ИСО 3534-2:2006 1.2.3, подсовокупность - это "часть генеральной совокупности". При отборе выборки для опроса (3.1.21) основной интерес представляют подсовокупности, которые точно определены (четко идентифицированы), а не рассмотрение произвольных "частей" совокупности.
Пример - Дети школьного возраста в области составляют подсовокупность жителей области. Работающее население области - другая подсовокупность жителей области. Могут представлять интерес, но их труднее идентифицировать, люди без определенного места жительства. Объем такой подсовокупности, как правило, неизвестен. |
en |
subpopulation |
3.1.4 сверхсовокупность: Расширенная совокупность (3.1.1), включающая исследуемую совокупность.
Примечание - Для вывода или оценки целей может быть полезно предположить, что исследуемая совокупность является частным случаем более крупной совокупности. Такая теоретическая схема облегчает разработку оптимального плана отбора выборки (3.1.28) и позволяет определить параметры плана отбора выборки. Совокупность значений можно рассматривать как случайную выборку (3.1.10) из гипотетической сверхсовокупности, в отличие от множества фиксированных значений, из которых формируют выборку (3.1.8). В соответствии с [2] понятию сверхсовокупности может быть дано несколько интерпретаций. Одна из интерпретаций состоит в том, что конечная совокупность (3.1.2) на самом деле отобрана из более крупной совокупности. Это понятие сверхсовокупности в чистом виде. Подход, использующий рассмотрение сверхсовокупности, может быть полезен для включения ошибок, не связанных с выборкой (3.2.10), в отбор выборки для опроса (3.1.21).
Пример - Для стабильной страны (согласованные политические границы без иммиграции или эмиграции) сверхсовокупностью может быть население страны за период в несколько веков. Таким образом, десятилетняя перепись (3.1.19) в такой стране может отразить отдельное наблюдение о численности населения в определенное время. |
en |
superpopulation |
3.1.5 выборочная единица: Одна из конкретных единиц, из которых состоит генеральная совокупность (3.1.1). [ИСО 3534-2:2006, 1.2.14]
Примечание 1 - Генеральная совокупность состоит из выборочных единиц. Генеральная совокупность может быть разделена на группы единиц, которые отличаются друг от друга, не пересекаются, идентифицируются, наблюдаются и удобны для отбора выборки. В зависимости от обстоятельств наименьшей рассматриваемой единицей может быть физическое лицо, ваучер, домашнее хозяйство, избирательный округ или административная единица. Это определение допускает возможность в сложных условиях иметь различные выборочные единицы, состоящие из различного количества единиц. На высшем уровне выборочной единицей может быть избирательный округ. В избирательном округе выборочными единицами могут быть отдельные домохозяйства. В домохозяйстве выборочными единицами могут быть дети школьного возраста. Примечание 2 - Каждый элемент совокупности должен принадлежать только одной выборочной единице. В некоторых случаях совокупность состоит из отдельных элементов, субъединиц или объектов, но для целей выборочного анализа может быть полезно сгруппировать отдельные элементы в объекты более высокого уровня, которые затем рассматривают как исследуемые выборочные единицы. Например, группировки могут представлять собой кластеры (3.1.6), каждый из которых состоит из совокупности элементов.
Пример - При многоступенчатом отборе выборки (3.1.40) на первом этапе в качестве первоначальных выборочных единиц могут быть использованы области. На втором этапе выборочными единицами могут быть районы. На третьем этапе - города. |
en |
sampling unit, unit |
3.1.6 кластер: Часть генеральной совокупности (3.1.1), разделенной на взаимно не пересекающиеся группы, связанные между собой определенным образом.
Примечание 1 - Для экономии на отборе выборки (3.1.16) может быть гораздо более эффективным отбор выборки из выборочных единиц (3.1.5), составляющих кластеры. Кластерный отбор выборки (3.1.38) полезен, когда схема выборочных единиц недоступна. Кластерный отбор выборки также может быть неотъемлемой частью многоступенчатого отбора выборки (3.1.40), в котором, например, на этапе первого уровня рассматривают города, на следующем этапе многоквартирные здания (в качестве кластера следующего уровня), а затем этажи или квартиры здания. На самом низком уровне исследуют все выборочные единицы. Примечание 2 - Приведенное в настоящем стандарте определение отличается от определения, приведенного в ИСО 3534-2:2006, 1.2.28, в котором установлено: "часть генеральной совокупности, разделенной на взаимно не пересекающиеся группы выборочных единиц, связанные между собой определенным образом". Фраза "выборочных единиц" опущена в настоящем стандарте для отражения практического отбора выборки, такого как многоступенчатый отбор выборки.
Пример - В исследовании мошенничества с медицинской страховкой (переплата поставщику медицинских услуг) легче получить выборку (3.1.8) из пациентов и затем исследовать все представленные ими требования, чем рассматривать совокупность (3.1.1) претензий большого количества пациентов. Общие примеры кластеров включают домашние хозяйства или жителей данного здания, сельскохозяйственные области сельских поселений, пациентов, врачей, учащихся школы. |
en |
cluster |
3.1.7 слой (страта): Одна из взаимно не пересекающихся и совместно охватывающих всю генеральную совокупность подсовокупностей (3.1.3), элементы которой имеют более однородные характеристики, чем элементы генеральной совокупности (3.1.1) в целом.
Примечание 1 - Множественное число от stratum - это strata. Примечание 2 - Стратификация - это разделение генеральной совокупности на взаимоисключающие и исчерпывающие слои. Примечание 3 - Фундаментальный аспект стратификации состоит в том, что слои должны быть однородными по отношению к рассматриваемой характеристике совокупности. С другой стороны, если стратификация не связана с характеристикой совокупности (но была проведена для удобства), то может быть мало или вообще не быть выигрыша в точности оценки характеристики совокупности. Удобно, если переменная или переменные, на которых основана стратификация, сильно коррелируют с исследуемой характеристикой совокупности. Примечание 4 - Стратификация может осуществляться по географическому признаку с презумпцией того, что смежные районы могут обеспечить более однородные группы выборочных единиц (3.1.5). Такая стратификация может также иметь экономические и административные преимущества при проведении исследования. Примечание 5 - Основное различие между кластером (3.1.6) и слоем (стратой) состоит в том, что слой должен включать в себя достаточно однородные элементы, тогда как кластер может состоять из разнородных элементов. Примером является семья в качестве кластера, которая, как правило, неоднородна по возрасту членов семьи. Примечание 6 - Аналогичное определение приведено в ИСО 3534-2:2006, 1.2.29. В настоящем стандарте приведено более точное определение.
Пример - Два примера - разделение популяции кошек или собак по породам и разделение людей по гендерным и социальным признакам. |
en |
stratum |
3.1.8 выборка: Подмножество генеральной совокупности (3.1.1), состоящее из одной или более выборочных единиц (3.1.5). [ИСО 3534-2:2006, 1.2.17]
Примечание 1 - Для получения информации о генеральной совокупности отбор выборки следует выполнять в соответствии с установленной процедурой. В зависимости от рассматриваемой генеральной совокупности, выборочными единицами могут быть предметы, числовые значения или даже абстрактные объекты. Примечание 2 - Несмотря на то, что в соответствии с определением любое подмножество генеральной совокупности может быть выборкой, на практике существует основополагающая цель формирования выборки. Другими словами, выборку отбирают в соответствии с целью исследования. Даже перепись (3.1.19), которая предназначена для изучения каждого элемента генеральной совокупности, может в конечном итоге привести к изучению ее подмножества из-за трудностей общения с каждым индивидом генеральной совокупности. |
en |
sample |
3.1.9 объем выборки n: Число выборочных единиц (3.1.5) в выборке (3.1.8). [ИСО 3534-2:2006, 1.2.26]
Примечание 1 - Определение объема выборки возникает практически при каждом применении выборочного опроса (3.1.20). Типичный подход к определению объема выборки заключается в определении предела истинной, но неизвестной исследуемой характеристики совокупности, и приравнивании функции отклонения оценки к этому пределу. Другими словами, объем выборки вычисляют так, чтобы оценка характеристики совокупности находилась в пределах заранее установленного отклонения от истинной исследуемой характеристики совокупности. Примечание 2 - В сложных исследованиях объемом выборки является общее количество отобранных выборочных единиц на момент завершения последней стадии отбора выборки. Еще одна сложность в исследованиях заключается в том, что планируемый объем выборки может быть лишь возможным объемом выборки из-за отсутствия ответов (3.2.11), фактический объем выборки может быть меньше, чем объем, определенный путем фиксирования границ погрешности и уровня значимости. Могут существовать различия между запланированным и фактическим объемом выборки из-за многих возможных непредвиденных обстоятельств. |
en |
sample size n |
3.1.10 случайная выборка: Выборка (3.1.8), отобранная методом случайного отбора. [ИСО 3534-1:2006, 1.6]
Примечание 1 - Метод случайного отбора может быть таким, что фактическая вероятность отбора выборочных единиц (3.1.5) в выборку не может быть определена ни заранее, ни в конце исследования. Если можно определить вероятность отбора каждой выборочной единицы, то такая случайная выборка называется вероятностной выборкой (3.1.13). Примечание 2 - Когда выборка из n выборочных единиц отобрана из конечной совокупности (3.1.2), каждая из возможных комбинаций n выборочных единиц имеет конкретную вероятность быть отобранной. Для выборочных планов (3.1.24) опроса конкретная вероятность каждой возможной комбинации может быть вычислена заранее. В соответствии с планированием отбора выборки (3.1.28), вероятность отбора не обязательно должна быть одинаковой для каждой выборочной единицы. Примечание 3 - В отборе выборки для опроса (3.1.21) из конечной совокупности случайная выборка может быть отобрана с помощью различных планов отбора выборки, таких как планы отбора стратифицированной выборки (3.1.32), систематической выборки (3.1.29), кластерной выборки (3.1.38), выборки с отбором пропорционального объема (3.1.44), соответствующего вспомогательной переменной (3.2.15), а также с помощью различных других планов. Примечание 4 - Особый интерес представляют фактические наблюдаемые значения, связанные с элементами случайной выборки. Значения могут быть количественными или отражать наличие определенного признака. Результаты, полученные в случайной выборке, дают основу для понимания генеральной совокупности (3.1.1) в целом. В частности, случайная выборка необходима для использования статистических выводов при проведении выборочного опроса. Примечание 5 - Данное определение, как уже отмечалось, совпадает с определением, приведенным в стандарте ИСО 3534-1:2006, 1.6. Это определение предполагает, что понятие случайного отбора применено в соответствии с принципами теории вероятностей. То есть случайность в выборочном опросе включает случайный способ отбора выборочных единиц в выборку, в отличие от систематического или детерминированного способа. |
en |
random sample |
3.1.11 случайный отбор выборки: Формирование случайной выборки (3.1.10).
Примечание - Отбор выборки (3.1.16), включающий n выборочных единиц (3.1.5) из генеральной совокупности (3.1.1) таким образом, что каждая из возможных комбинаций n выборочных единиц имеет конкретную вероятность быть отобранной, которую может быть трудно или невозможно определить. Данное определение отличается от определения, приведенного в ИСО 3534-2:2006, 1.3.5.
Пример - Для получения случайной выборки из реестра физических лиц в стране или области может быть применена компьютерная программа, использующая генератор случайных чисел. |
en |
random sampling |
3.1.12 простая случайная выборка: Вероятностная выборка (3.1.13) из конечной генеральной совокупности, такая, что всем подмножествам заданного объема соответствует одна и та же вероятность быть отобранными.
Примечание - Данное определение гармонизировано с определением, приведенным в ИСО 3534-2:2006, 1.2.24, хотя и имеет немного отличную словесную формулировку. |
en |
simple random sample |
3.1.13 вероятностная выборка: Случайная выборка (3.1.10), для которой может быть определена вероятность отбора каждой возможной выборки (3.1.8).
Примечание - Может быть определена вероятность отбора (3.1.15) каждой выборочной единицы (3.1.5).
Пример - В выборке пропорционального объема (3.1.44) вероятность отбора связана с установленной вспомогательной переменной (3.2.15). |
en |
probability sample |
3.1.14 репрезентативная выборка: Выборка (3.1.8), отобранная таким образом, что наблюдаемые значения в выборке имеют такое же распределение, что и в генеральной совокупности (3.1.1).
Примечание 1 - Понятие "репрезентативная выборка" достаточно противоречивое, и некоторые специалисты по проведению опросов полностью отвергают этот термин. В [6] приведено шесть категорий понимания репрезентативной выборки в нестатистической литературе, описание которых приведено в [7], [8], [9] и [10] по серии статей в Международном статистическом обзоре: 1) общее необоснованное одобрение данных; 2) отсутствие селективных факторов; 3) миниатюрное отражение генеральной совокупности. Выборка подчиняется тому же распределению, что и генеральная совокупность; 4) типичный или идеальный случай; 5) охват генеральной совокупности. Структура выборки отражает изменчивость данных, особенно между слоями; 6) вероятностный отбор. Формальная схема отбора выборки устанавливает для каждого элемента генеральной совокупности заданную вероятность быть отобранным. Примечание 2 - Данное определение расширяет определение, приведенное в ISO 3534-2:200, 1.2.35, на более широкий класс выборок, чем случайная выборка, включая, например, выборку, отобранную на основе решения (3.1.31). Отправной точкой в определении репрезентативной выборки, приведенном в ISO 3534-2:2006, является случайная выборка (3.1.10), тогда как в данном определении отправной точкой является выборка. |
en |
representative sample |
3.1.15 вероятность отбора: Число, выражающее вероятность того, что будет отобрана конкретная выборочная единица (3.1.5). |
en |
selection probability |
3.1.16 отбор выборки: Действия по формированию выборки (3.1.8).
Примечание 1 - Использование термина "формирование" обусловлено тем, что выборки могут возникать в результате генерации случайного процесса, физического процесса или схемы, которая мало имеет или вообще не имеет стохастической основы. Последующий статистический вывод требует применения метода генерации случайной выборки, но сама выборка исторически включает в себя некоторые методы, которые имеют практические недостатки. Примечание 2 - Термин "метод отбора выборки" иногда используют как синоним термина "отбор выборки", однако эта практика не является универсальной. Метод отбора выборки также связан с планом отбора выборки (3.1.24). Примечание 3 - В данном определении не использовано понятие "извлечение" (в отличие от ISO 3534-2:2006, 1.3.1), так как это предполагает наличие физического процесса формирования выборки, что не является необходимым требованием. |
en |
sampling |
3.1.17 отбор с замещением: Отбор выборки (3.1.16), при котором каждую отобранную выборочную единицу (3.1.5) исследуют и возвращают в генеральную совокупность (3.1.1) до отбора следующей выборочной единицы. [ИСО 3534-2:2006, 1.3.15]
Примечание 1 - В данном случае одна и та же выборочная единица может быть отобрана в выборку (3.1.8) более одного раза. Возможна ситуация, когда группы единиц отбирают и затем возвращают в генеральную совокупность до того, как произойдет дополнительный отбор. Конечно, используемая процедура формируется на основе соответствующих вероятностей отбора. Примечание 2 - При отборе с замещением вероятности отбора (3.1.15) выборочных единиц остаются неизменными при каждом отборе, и все отборы являются независимыми. |
en |
sampling with replacement |
3.1.18 отбор без замещения: Отбор выборки (3.1.16), при котором каждая выборочная единица (3.1.5) может быть отобрана из генеральной совокупности (3.1.1) только один раз и не возвращается в исходную совокупность.
Примечание 1 - При отборе из конечной совокупности (3.1.2) (особенно при небольшом объеме совокупности) отбор без замещения является предпочтительной процедурой, так как при этом можно получить более точные оценки. Однако эти результаты достигаются за счет более сложных формул для оценки дисперсий. Примечание 2 - При отборе без замещения вероятности отбора (3.1.15) выборочных единиц изменяются при каждом отборе (в зависимости от результатов), и, следовательно, отборы не являются независимыми. Примечание 3 - Данное определение аналогично определению, приведенному в ISO 3534-2:2006, 1.3.16. |
en |
sampling without replacement |
3.1.19 перепись: Исследование каждой выборочной единицы (3.1.5) в заданной конечной совокупности (3.1.2).
Примечание 1 - Большое количество стран проводит полную перепись населения на регулярной основе (например, каждые 10 лет). Эти действия являются сложными, так как, например, некоторые части совокупности могут быть обманчивыми (например, незаконные иммигранты), их трудно включать в перепись. Может быть проведена исчерпывающая перепись конечной совокупности для устранения ошибок отбора выборки (3.2.9) за счет дополнительных усилий по сравнению с обычным отбором выборки (3.1.16). Перепись может быть нецелесообразной для стран, которые ведут полный реестр своего населения (например, Дания). Примечание 2 - Как правило, перепись проводят по отношению к фиксированному моменту времени и в отношении определенных характеристик. Например, десятилетнюю перепись населения в Соединенных Штатах проводят по состоянию на 1 апреля года переписи. Примечание 3 - Цель переписи состоит в исследовании каждой выборочной единицы конечной совокупности, но известно, что в исследовании каждой выборочной единицы и получении полной информации о ней могут возникнуть практические трудности. |
en |
census |
3.1.20 выборочный опрос: Проверка или аналитическое исследование конечной совокупности (3.1.2) с применением отбора выборки для опроса (3.1.21).
Примечание 1 - Выборочный опрос включает огромное количество методов исследования свойств и особенностей совокупности (3.1.1). Анкеты, интервью, почтовые опросы и так далее являются методами сбора информации о совокупности. Методология выборочного опроса включает тщательный отбор выборок с целью максимизации объема собранной информации о совокупности, по отношению к затраченным усилиям. Примечание 2 - Цель выборочного опроса состоит в получении подробной информации и знаний о совокупности. Результаты выборочного опроса могут быть гораздо более качественными, чем результаты переписи (3.1.19) совокупности, фокусирующейся на подмножестве совокупности. В случае переписи, возможно, что характер исчерпывающего детального исследования каждой единицы совокупности может привести к многочисленным ошибкам, не связанным с отбором выборки (3.2.10), которые сводят на нет все усилия. |
en |
sample survey |
3.1.21 отбор выборки для опроса: Процесс отбора в выборку (3.1.8) выборочных единиц (3.1.5) из генеральной совокупности (3.1.1) для получения информации о характеристиках элементов совокупности.
Примечание 1 - Отбор выборки для опроса в повседневном использовании часто неявно предполагает определенную методологию и может относиться к общей области знаний, связанной с исследованием конечных совокупностей (3.1.2) с помощью анкет, опросов общественного мнения (3.1.23), политических опросов и опросов удовлетворенности потребителей. Примечание 2 - Это определение отличается от определения, приведенного в ИСО 3534-2:2006, 1.2.18 (отбор выборки, используемый в качественных или аналитических исследованиях для определения оценок одной или нескольких характеристик совокупности или анализа распределения этих характеристик в совокупности), в котором подчеркнута цель, а не процесс отбора выборки, как это указано в приведенном определении. |
en |
survey sampling |
3.1.22 пробный опрос: Предварительный небольшой выборочный опрос (3.1.20).
Примечание - Перед проведением полного выборочного опроса рекомендуется проведение небольшого опроса для определения наличия трудностей в способах проведения опроса, составлении опросника и планировании отбора выборки (3.1.28). Например, в результате пробного опроса можно определить, что приведенный вопрос неоднозначен, а поэтому полученные результаты могут оказаться бесполезными. Кроме того, могут быть выявлены ключевые упущения или может быть установлено, что способ проведения опроса может быть улучшен. |
en |
pilot survey |
3.1.23 социологический опрос: Выборочный опрос (3.1.20), выполняемый с целью изучения общественного мнения.
Примечание - Как правило, социологическое исследование проводят с помощью письменного опросника, личных интервью, телефонных интервью или электронных средств массовой информации. Следовательно, результаты таких исследований могут отражать субъективные мнения или точки зрения. Два распространенных типа социологических исследований - это политические исследования (или голосование) и маркетинговые исследования. |
en |
opinion survey |
3.1.24 план отбора выборки: Планирование отбора выборки (3.1.28), включая детали его выполнения.
Примечание - План и планирование отбора выборки различаются в настоящем стандарте так же, как в ИСО 3534-3:2013 различаются план и планирование эксперимента. Планирование отбора выборки ограничивается отбором выборочных единиц (3.1.5) в соответствии с возможно сложной вероятностной схемой, которая подразумевает выполнение необходимой оценки (3.2.4). План отбора выборки включает планирование отбора выборки и подробную информацию о выполнении процесса отбора выборки в целом, включая рабочие задания персонала, подготовку опросников и условия окружающей среды при опросе. |
en |
sampling plan |
3.1.25 структура отбора выборки: Полный перечень всех выборочных единиц (3.1.5) с их описанием.
Примечание 1 - Структура отбора выборки обеспечивает точное представление исследуемой генеральной совокупности (3.1.1), как правило, в виде перечня. Возможно, что перечень может быть неполным или содержать некоторые ошибки. Например, список избирателей может содержать сведения о лицах, которые переехали из избирательного округа или въехали в него, лицах, умерших после создания структуры отбора выборки, перечень может содержать дубликаты записей и даже включать осужденных преступников, которые по закону не имеют права голосовать и не могут быть включены в список. Примечание 2 - Данное определение отличается от определения, приведенного в ИСО 3534-2:2006, 1.2.27, чтобы подчеркнуть практические ограничения в разработке структуры отбора выборки, которая может не полно представлять целевую совокупность.
Пример - В зависимости от исходной информации о генеральной совокупности структура отбора выборки может быть простой, но точной или, в крайнем случае, очень сложной. В одном известном опросе [11], проведенном в Восточной Индии, структура отбора выборки состояла из перечисления полей, списка деревень и набора карт в различных областях страны. На основе неоднородного материала была разработана структура отбора выборки, и затем выполнено исследование. |
en |
sampling frame |
3.1.26 двойная структура: Структура отбора выборки (3.1.25) из двух источников.
Пример - Структура отбора выборки может включать телефонные номера как стационарных, так и сотовых телефонов. Заранее точно неизвестно, какому сотовому телефону принадлежит данный стационарный номер, но эта информация может оказаться важной на этапе анализа. Существует потенциальная проблема в выборе одного и того же человека дважды (по одному разу из каждого источника). |
en |
dual frame |
3.1.27 региональная структура: Структура отбора выборки (3.1.25), состоящая из неперекрывающихся географических регионов.
Примечание - С увеличением доступности географических информационных систем и портативных систем глобального позиционирования была улучшена возможность проведения проектов по отбору выборки (3.1.16) с использованием региональной структуры. Практическая мотивация, лежащая в основе отбора выборки по регионам, состоит в том, что для многих проблем может отсутствовать текущий и точный перечень элементов генеральной совокупности (3.1.1).
Пример - Для оценки объема продаж конфет в розничных магазинах можно отобрать выборку (3.1.8) из городских кварталов, а затем провести аудит продаж всех торговых точек в этих выбранных кварталах. |
en |
area frame |
3.1.28 планирование отбора выборки: Полное описание структуры отбора выборки (3.1.16) и последующего анализа.
Примечание - Описание соответствует виду отбора выборки, который должен быть проведен [простой случайный отбор выборки (3.1.12), стратифицированный отбор выборки (3.1.32), кластерный отбор выборки (3.1.38) и т.д.], а также объему или объемам выборки (3.1.9), если рассматриваются различные группировки выборочных единиц (3.1.5). Описание также может включать вероятности отбора (3.1.15) для каждой выборочной единицы и, возможно, вероятность отбора каждой потенциальной выборки (3.1.8). |
en |
sampling design |
3.1.29 систематический отбор выборки: Отбор выборки (3.1.16) в соответствии с частично определенным структурным планом.
Примечание 1 - При систематическом отборе рандомизация отбора выборки ограничена. Начальная точка в структуре отбора выборки (3.1.25) может быть выбрана случайным образом, а затем каждый k-й элемент отбирают в выборку (3.1.8). При систематическом отборе выборки, как правило, существует фиксированный интервал во времени или пространстве между отбираемыми единицами. Если структура отбора выборки является периодической и длина цикла сопоставима с периодом отбора выборки, то могут быть введены непреднамеренные смещения или завышенные оценки дисперсии на этапе анализа. Примечание 2 - Данное определение несколько отличается от определения, приведенного в ISO 3534-2:2006, 1.3.12, подчеркивая, что систематический отбор выборки не является полностью случайным. |
en |
systematic sampling |
3.1.30 квазислучайный отбор выборки: Систематический отбор выборки (3.1.29) для каждой n-й записи структуры отбора выборки (3.1.25).
Примечание - В некоторых условиях, в значительной степени определяемых методом составления структуры отбора выборки или перечня, систематическая выборка для каждой n-й записи перечня эквивалентна для большинства практических целей случайной выборки (3.1.10). Данный метод отбора выборки (3.1.16) иногда называют квазислучайным отбором выборки. Он должен быть одним из видов систематического отбора выборки и расположен ниже определения "систематический отбор выборки" в диаграмме взаимосвязи основных понятий.
Пример - Предположим, руководство супермаркета хочет изучить покупательские привычки своих клиентов. Применяя квазислучайный отбор выборки, менеджер супермаркета может выбрать каждого 15-го покупателя, входящего в супермаркет, и провести исследование, используя полученную выборку (3.1.8). |
en |
quasi-random sampling |
3.1.31 отбор выборки на основе решения, целевой отбор выборки: Отбор выборки (3.1.16), выполняемый по усмотрению исследователя.
Примечание 1 - Отбор выборки на основе решения не является случайным отбором выборки (3.1.11), так как некоторые выборочные единицы (3.1.5) имеют нулевую вероятность отбора, в то время как другие выбирают непредсказуемо. Даже эксперты в данной области сталкиваются с проблемой получения полезной выборки при отборе на основе решения, по сравнению с выборкой, отобранной надежными статистическими методами отбора выборки. Примечание 2 - Квотированный отбор выборки (3.1.45) является примером отбора выборки на основе решения, в котором, например, интервьюеры выбирают своих респондентов таким образом, чтобы получить ответы определенного количества мужчин и женщин в приблизительно равных возрастных группах, в результате чего обеспечивается получение демографических данных, за счет распространения результатов опроса на произвольную большую группу. Примечание 3 - В исключительных случаях отбор выборки на основе решения может быть эффективно использован в сочетании с другими методами отбора выборки, если, например, существует определенное подмножество генеральной совокупности (3.1.1) (например, высшее руководство), для которого ошибки отбора выборки (3.2.9) не допустимы с учетом связей с общественностью. Таким образом, все высшее руководство должно быть включено в отбор выборки на основе решения, в то время как остальную часть совокупности оценивают с помощью более подходящих методов отбора выборки. Примечание 4 - При отборе выборки на основе решения выборочные единицы отбирают путем рассмотрения имеющейся вспомогательной информации (часто субъективной) для формирования выборки (3.1.8), которая является адекватным отражением генеральной совокупности. Примечание 5 - Каждое из понятий "систематический отбор выборки" (3.1.29), "квазислучайный отбор выборки" (3.1.30) и "отбор выборки на основе решения" можно рассматривать как форму контролируемого отбора выборки, как описано в [5] и [3] (раздел 5А.6). Примечание 6 - В отличие от вероятностной выборки (3.1.13) при отборе выборки на основе решения связанные с отбором неопределенности не могут быть оценены. |
en |
judgment sampling, purposive sampling |
3.1.32 стратифицированный отбор выборки: Отбор выборки (3.1.16) такой, что доли выборки (3.1.8) отобраны из разных слоев (3.1.7), и из каждого слоя отобрана, по крайней мере, одна выборочная единица (3.1.5).
Примечание 1 - В некоторых случаях доли выборки устанавливают в виде заранее определенных пропорций для повышения точности оценки характеристик генеральной совокупности (3.1.1). В других случаях слои не могут быть установлены до тех пор, пока не будет произведен отбор выборки из-за отсутствия информации о пропорциях. Это происходит, когда структура не содержит информации, относящейся к основам стратификации. Примечание 2 - Единицы каждого слоя часто отбирают методом случайного отбора (3.1.11). Примечание 3 - Если применяют стратифицированный отбор выборки, то соответствующие оценки (3.2.3) параметров генеральной совокупности (3.2.1) должны это учитывать. Примечание 4 - Данное определение несколько отличается от определения, приведенного в ISO 3534-2:2006, 1.3.6. |
en |
stratified sampling |
3.1.33 стратифицированный простой случайный отбор выборки: Простой случайный отбор выборки (3.1.12) из каждого слоя (3.1.7). [ИСО 3534-2:2006, 1.3.7]
Примечание - Если пропорции единиц, отобранных из различных слоев, равны пропорциям соответствующих единиц в слоях генеральной совокупности, такой отбор называется пропорциональным стратифицированным простым отбором выборки. |
en |
stratified simple random sampling |
3.1.34 пропорциональное распределение: Процедура стратифицированного отбора выборки (3.1.32) с распределением количества выборочных единиц (3.1.5) по разным слоям (3.1.7) пропорционально количеству выборочных единиц в слоях.
Примечание - Преимущество использования пропорционального распределения состоит в том, что оценка (3.2.3) общего совокупности (3.1.1) не требует использования весовых коэффициентов, соответствующих объему слоев. Другими словами, оценку общего генеральной совокупности, например, получают путем суммирования наблюдаемых значений по всем слоям и последующего расчета объема выборки и объема совокупности. Это пример автовзвешенной оценки. |
en |
proportional allocation |
3.1.35 оптимальное распределение: Процедура стратифицированного отбора выборки (3.1.32) с распределением количества выборочных единиц (3.1.5) по слоям (3.1.7) для оптимизации целевой функции.
Примечание 1 - Можно рассматривать различные целевые функции, включая функции, связанные с затратами, и функции, связанные с точностью оценки. Оптимизация может означать минимизацию или максимизацию в зависимости от ситуации (например, минимизацию затрат, максимизацию точности, максимизацию количества выборок с фиксированной общей стоимостью или минимизацию дисперсии оценки). Примечание 2 - В частности, в случаях повторного отбора выборки (например, на ежегодной основе) было бы разумно сравнить выборочные стандартные отклонения слоев с предполагаемыми стандартными отклонениями, используемыми для оптимального распределения.
Пример - Предположим, что стоимость проведения опроса С равна
,
где с 0 - накладные расходы; c h - стоимость, соответствующая слою h; n h - объем выборки слоя h (подлежит определению). В соответствии с заданной общей стоимостью С оптимальный общий объем выборки n (сумма объема выборок по слоям) равен
.
Объем выборки слоя h равен
.
Данные, приведенные в [3], позволяют определить оптимальный объем выборки, если целью является соответствие заданной дисперсии оценки среднего генеральной совокупности. |
en |
optimum allocation |
3.1.36 распределение Неймана: Оптимальное распределение (3.1.35) с целевой функцией, равной дисперсии оценки (3.2.3) среднего генеральной совокупности.
Примечание - Целью метода является максимизация точности результатов опроса при фиксированном объеме выборки (3.1.9). Распределение Неймана, как следует из определения, на самом деле является частным случаем оптимального распределения (то есть минимизирующего дисперсию оценки среднего генеральной совокупности).
Пример - При распределении Неймана оптимальный объем выборки слоя (3.1.7) h равен:
,
где k - количество слоев; n h - объем выборки слоя h; n - общий объем выборки; N h - объем слоя h в генеральной совокупности (3.1.1); - стандартное отклонение слоя h. Большее количество выборочных единиц (3.1.5) следует отбирать из слоев, характеризующихся большей изменчивостью или большего объема. |
en |
Neyman allocation |
3.1.37 постстратификация: Процедура распределения выборочных единиц (3.1.5) по слоям после отбора случайной выборки (3.1.10) при стратифицированном отборе выборки (3.1.32).
Примечание - Возможное применение постстратификации происходит в сочетании с простым случайным отбором выборки (3.1.12), при котором слой (3.1.7) для каждой единицы в выборке (3.1.8) идентифицируют после отбора. Если объем слоев известен, то соответствующие весовые коэффициенты могут быть применены к средним слоям. Если объем слоев заранее не известен, то весовые коэффициенты могут быть оценены в соответствии с пропорциями, наблюдаемыми в простой случайной выборке. Данную процедуру можно рассматривать как аналог пропорционального распределения (3.1.34) с использованием наблюдаемых пропорций. Для больших выборок и случаев, когда ошибки в оценках весовых коэффициентов незначительны, постстратификация может быть почти такой же точной, как и результаты, полученные при пропорциональном распределении. |
en |
poststratification |
3.1.38 кластерный отбор выборки: Отбор выборки (3.1.16), при котором случайную выборку (3.1.10) отбирают из кластеров (3.1.6), при этом все выборочные единицы (3.1.5), на которых основаны кластеры, содержатся в выборке (3.1.8). [ИСО 3534-2:2006, 1.3.9]
Примечание - Кластеры рассматривают в качестве основных выборочных единиц, как это ранее рассматривалось в 3.1.5. |
en |
cluster sampling |
3.1.39 посткластерный отбор выборки: Отбор выборки (3.1.16), выполняемый по кластерам (3.1.6), из исходной случайной выборки (3.1.10).
Примечание 1 - Основная трудность, с которой сталкиваются при кластерном отборе выборки (3.1.38), заключается в отсутствии информации о составе кластеров. В таких ситуациях кластеры формируют на основе исходной случайной выборки, затем выполняют окончательный отбор выборки с этими кластерами в качестве выборочных единиц (3.1.5). Примечание 2 - Таким образом, термин "посткластерный", который, по существу, означает, что кластеры формируют впоследствии и они неизвестны заранее. Термин был введен Т. Далениусом [4]. |
en |
post cluster sampling |
3.1.40 многоступенчатый отбор выборки: Отбор выборки (3.1.16), при котором выборку (3.1.8) отбирают поэтапно и выборочные единицы (3.1.5) каждого этапа отбирают из большего количества единиц, отобранных на предыдущем этапе. [ИСО 3534-2:2006, 1.3.10, модифицировано]
Примечание 1 - Многоступенчатый отбор отличается от сложного отбора. Сложный отбор - это отбор выборки одновременно по нескольким критериям. Примечание 2 - Методы отбора выборки на каждом этапе могут быть разными, так, первоначальная выборка может быть отобрана, например, методом простого случайного отбора выборки (3.1.12), а последняя выборка отобрана методом систематического отбора выборки (3.1.29).
Пример - При многоступенчатом отборе единицами первого этапа могут быть области внутри страны, второго этапа - города внутри областей, а третьего этапа - районы внутри городов. |
en |
multi-stage sampling |
3.1.41 двухступенчатый отбор выборки: Многоступенчатый отбор выборки (3.1.40), выполняемый в два этапа.
Примечание - После первоначального отбора выборки из n выборочных единиц (3.1.5) проводят еще один отбор выборки из группы выборочных единиц, отобранных на первом этапе процесса отбора выборки.
Пример - Можно сначала сгенерировать выборку (3.1.8) стран, а затем отобрать выборку областей (альтернативно, районов или округов). |
en |
two-stage sampling |
3.1.42 многоступенчатый кластерный отбор выборки: Кластерный отбор выборки (3.1.38), выполняемый в два или более этапа, когда каждая выборка (3.1.8) поделена на кластеры (3.1.6), уже отобранные в предыдущей выборке. [ИСО 3534-2:2006, 1.3.11] |
en |
multistage cluster sampling |
3.1.43 обратный отбор выборки: Отбор выборки (3.1.16), который продолжается до тех пор, пока не будут выполнены заранее установленные условия на основе полученных ранее результатов.
Примечание - Обратный отбор выборки часто используют в исследованиях редких единиц, например редких заболеваний, чтобы получить достаточное количество единиц в выборке (3.1.8), причем общее количество единиц, подлежащих отбору, является случайной величиной.
Пример - Случайный отбор выборки (3.1.11) продолжается в больнице до тех пор, пока не произойдет 10 случаев рождения новорожденных с редким врожденным заболеванием. После выявления десятого такого новорожденного можно оценить уровень заболеваемости этой патологией. |
en |
inverse sampling |
3.1.44 отбор выборки пропорционального объема: Отбор выборки (3.1.16), при котором вероятность отбора выборочных единиц (3.1.5) пропорциональна значению вспомогательной переменной.
Примечание 1 - Отбор выборки, пропорциональный объему, наиболее полезен, когда выборочные единицы значительно различаются по объему в совокупности, так как при таком отборе более многочисленные выборочные единицы имеют большую вероятность попадания в выборку (3.1.8). Данный метод также облегчает планирование работ, поскольку в каждом выбранном подразделении опрашивают заранее определенное количество респондентов, и персонал может быть распределен соответствующим образом. Примечание 2 - Если применяют отбор выборки пропорционального объема, то соответствующие оценки (3.2.3) параметров генеральной совокупности (3.2.1) должны это учитывать. Также целесообразно проверить на основе данных, что вспомогательная переменная, которая является основой для определения вероятностей отбора, действительно коррелирует с исследуемой характеристикой генеральной совокупности. Примечание 3 - Отбор выборки пропорционального объема иногда обозначают как "отбор выборки PPS" (т.е. вероятность, пропорциональная объему). Отбор выборки PPS особенно полезен, если вспомогательная переменная сильно коррелирует с рассматриваемой характеристикой генеральной совокупности. |
en |
sampling proportional to size |
3.1.45 квотированный отбор выборки: Стратифицированный отбор выборки (3.1.32), при котором выборку (3.1.8) отбирают не случайным образом, соответствующим предопределенным структурам.
Примечание 1 - Квотированный отбор выборки является проблематичным, так как отбор выборочных единиц (3.1.5) является не случайным и исключает использование стандартных процедур вывода. Особую озабоченность при применении квотированного отбора выборки вызывает очевидная предвзятость (3.2.7) в тех случаях, когда, например, интервьюер отбирает выборочные единицы с учетом конкретного заключения. В результате не случайного отбора выборки обычные методы оценки неопределенности неприменимы. Примечание 2 - Данное определение приведено в соответствии с ISO 3534-2:2006, 1.3.8 с добавлением фразы "соответствующим предопределенным структурам", для отражения использования квотированного отбора выборки при выборочном контроле на основе данных опроса и анкетирования (3.1.21). |
en |
quota sampling |
3.2 Термины, относящиеся к оценке | ||
3.2.1 параметр генеральной совокупности: Неизвестная величина, соответствующая некоторой характеристике генеральной совокупности (3.1.1).
Примечание 1 - Целью выборочного опроса (3.1.20) обычно является определение значения оценки (3.2.2) параметров генеральной совокупности. Параметры генеральной совокупности обычно обозначают малыми греческими буквами и курсивом. Примечание 2 - Данное определение отличается от определения, приведенного в ISO 3534-2:2006, 1.2.2. Значение параметра генеральной совокупности может быть известно, если была проведена перепись (3.1.19) и каждая характеристика каждой единицы генеральной совокупности была определена без ошибок. До проведения переписи параметр генеральной совокупности не известен.
Пример - Примерами параметров генеральной совокупности и типичными применяемыми символами являются общее (итоговое) количество , математическое ожидание и стандартное отклонение . |
en |
population parameter |
3.2.2 значение оценки: Наблюдаемое значение оценки (3.2.3). [ИСО 3534-1:2006, 1.31]
Примечание - Значение оценки представляет собой численное значение, полученное на основе наблюдаемых значений. По отношению к определению оценки параметра генеральной совокупности (3.2.1) оценка связана со статистикой, предназначенной для определения оценки параметра, при этом значение оценки получают на основании наблюдаемых значений. Иногда после слова "значение" употребляют термин "точечной оценки", чтобы подчеркнуть, что получено только одно значение (значение точечной оценки), а не интервал значений. Подобным образом прилагательное "интервальной" употребляют перед словом "оценки" в том случае, когда определяют интервал значений (3.2.4). |
en |
estimate |
3.2.3 оценка: Статистика, используемая для определения значения оценки параметра генеральной совокупности (3.2.1) на основе выборки (3.1.8).
Примечание 1 - Оценка учитывает метод отбора выборки (3.1.16) и вспомогательную информацию, если она доступна и уместна. Оценкой может быть выборочное среднее, используемое в качестве оценки (3.2.2) среднего генеральной совокупности (3.1.1), которое подходит для простого случайного отбора выборки (3.1.12). В случае вероятностной выборки (3.1.13) для оценки среднего генеральной совокупности также может быть определена другая оценка, несмотря на то что формула этой оценки включает вероятности отбора в выборку каждой единицы. Примечание 2 - Данное определение несколько отличается от определения, приведенного в ISO 3534-1:2006, 1.12.
Пример - Обычно рассматривают общее количество по генеральной совокупности. Оценкой общего количества по генеральной совокупности может быть выборочное среднее, умноженное на общее количество единиц в генеральной совокупности, что было бы целесообразно для простой случайной выборки. |
en |
estimator |
3.2.4 определение оценки: Процедура определения значения оценки (3.2.2) на основе выражения для оценки (3.2.3).
Примечание - Термин "определение оценки", приведенный в ISO 3534-1:2006, 1.36, применяют в довольно широком смысле, который включает определение точечной оценки, интервальной оценки или оценки свойств генеральной совокупности (3.1.1). В данном определении рассмотрено определение точечной оценки. |
en |
estimation |
3.2.5 стандартная ошибка: Стандартное отклонение оценки (3.2.3). [ИСО 3534-1:2006, 1.24]
Примечание - Не существует (целесообразного) дополнительного понятия "нестандартная ошибка". Термин "стандартная ошибка" можно рассматривать как сокращение выражения "стандартное отклонение оценки". |
en |
standard error |
3.2.6 ошибка оценки: Разность оценки (3.2.2) и истинного значения оцениваемого параметра генеральной совокупности (3.2.1) или характеристики генеральной совокупности (3.1.1). [ИСО 3534-1:2006, 1.32 - модифицировано, см. примечание 3]
Примечание 1 - Характеристикой генеральной совокупности может быть ее объем, среднее или доля единиц, обладающих определенным свойством. Примечание 2 - Ошибка оценки может включать составляющие, связанные с отбором выборки (3.1.16), неопределенностью результатов измерений, округлением результатов вычислений и др. По сути, ошибка оценки характеризует достоверность результатов. Определение основных составляющих ошибки оценки является важным элементом оценки качества действий по отбору выборки. Примечание 3 - Данное определение несколько отличается от определения, приведенного в ISO 3534-1:2006, 1.32, тем, что в нем использован термин "значение параметра генеральной совокупности", а не просто "параметр", что обусловлено спецификой отбора выборки для опроса (3.1.21). |
en |
error of estimation |
3.2.7 смещение: Математическое ожидание ошибки оценки (3.2.6) [ИСО 3534-1:2006, 1.33].
Примечание 1 - На практике наличие смещения может привести к нежелательным последствиям. Например, смещение может привести к неправильным решениям в ходе политического голосования. С другой стороны, в выборочном опросе (3.1.21) существуют некоторые оценки (3.2.3) (например, оценки отношения параметров регрессии и произведения), которые имеют наибольшее смещение, но могут иметь низкую вариабельность по сравнению с лучшей несмещенной оценкой. Примечание 2 - Оценка параметра генеральной совокупности (3.2.1) имеет нулевое смещение, если ее среднее (математическое ожидание) при всех возможных выборках равно этому параметру. В некоторых учебниках по отбору выборки это свойство называют несмещенным планом, хотя такое использование не является универсальным. Примечание 3 - Термин "математическое ожидание" приведен в ISO 3534-1:2006, 2.12. |
en |
bias |
3.2.8 несмещенная оценка: Оценка (3.2.3), смещение (3.2.7) которой равно нулю. [ИСО 3534-1:2006, 1.34]
Примечание - Несмещенные оценки предпочтительны, т.к. в среднем их значения корректны. Такие оценки являются начальной точкой поиска "оптимальных" оценок характеристик генеральной совокупности (3.1.1). Приведенное определение имеет статистический характер. В повседневной практике исследователи стараются избегать внесения смещения в исследование, например путем обеспечения репрезентативности случайной выборки (3.1.10) по отношению к рассматриваемой генеральной совокупности. Однако во многих случаях применения выборочного опроса (3.1.21) несмещенные оценки могут быть недоступны, на практике некоторые оценки, хотя и имеют некоторое смещение, могут давать высокоточные значения оценок (3.2.2) параметров генеральной совокупности (3.2.1). |
en |
unbiased estimator |
3.2.9 ошибка отбора выборки: Ошибка оценки (3.2.6), связанная с процессом отбора выборки (3.1.16).
Примечание - Поскольку рассматривают не все единицы генеральной совокупности (3.1.1), итоговое значение, полученное по выборке (3.1.8), скорее всего, будет изменяться от выборки к выборке и может отличаться от значения, полученного по всей генеральной совокупности [если оно было получено в результате переписи (3.1.19)]. Ошибка отбора выборки относится к той части разности параметра генеральной совокупности (3.2.1) и значения его оценки (3.2.2), которая обусловлена только рассмотрением выборки. Общепризнано, что большая часть значений характеристики в выборке несколько отличается от параметра генеральной совокупности, который можно определить только путем исчерпывающего рассмотрения всех единиц генеральной совокупности. |
en |
sampling error |
3.2.10 ошибка, не связанная с отбором выборки: Ошибка оценки (3.2.6), вызванная другими факторами, не связанными с процессом отбора выборки (3.1.16).
Примечание 1 - При проведении выборочного опроса (3.1.20) могут возникать трудности. Основные ошибки могут быть сделаны из-за неточной записи ответов субъектами, вызванной неправильным пониманием вопроса, а также отсутствием ответа. Для преодоления ошибок, не связанных с отбором выборки, разработаны различные методы. Источники ошибок, не связанных с отбором выборки, включают в себя недостатки структуры выборки (3.1.25), ошибки респондентов, небрежность интервьюеров или участников опроса. Кроме того, дополнительные трудности создают культурные предубеждения, предвзятость интервью и двусмысленные вопросы. Примечание 2 - Ошибки, не связанные с отбором выборки, могут быть ошибками человека, возможно, возникающими в ходе статистического анализа. Эти ошибки могут включать (но не ограничиваются ими) ошибки ввода данных, предвзятые вопросы в анкете, предвзятую обработку/принятие решений, неправильный анализ, неправильные выводы и ложную информацию, представленную респондентами. Наличие этих ошибок делает оценку менее точной. Примечание 3 - Ошибки, не связанные с отбором выборки, являются частью общей ошибки, которая может возникнуть при проведении статистического анализа. Остальная часть общей ошибки возникает из-за ошибки отбора выборки (3.2.9). В отличие от ошибки отбора выборки, увеличение объема выборки (3.1.9) не оказывает влияния на уменьшение ошибки, не связанной с отбором выборки. На самом деле ошибки, не связанные с отбором выборки, могут стать более очевидными с увеличением объема выборки (в то время как ошибка отбора выборки уменьшается с увеличением объема выборки). К сожалению, полностью устранить ошибки, не связанные с выборкой, практически невозможно. Примечание 4 - Ошибки, не связанные с отбором выборки, возникают из-за отсутствия ответа, ошибок кодирования, ошибок компьютерной обработки, ошибок структуры отбора выборки, ошибок отчетности и других ошибок. Ошибки, не связанные с выборкой, могут быть уменьшены путем редактирования данных, статистических корректировок при отсутствии ответа и пристального внимания к деталям. Ошибки, не связанные с отбором выборки, возникают в ходе проведения почти всех опросов [даже при полной переписи (3.1.19)], это различная интерпретация респондентами вопросов, ошибки в обработке результатов или ошибки в структуре отбора выборки. Отсутствие ответа может привести к смещенным оценкам (3.2.2). Примечание 5 - Многие методы выборочного опроса (3.1.21) (этап проектирования или анализа) разработаны для исправления или уменьшения отмеченных ошибок, не связанных с отбором выборки. |
en |
non-sampling error |
3.2.11 отсутствие ответа: Отсутствие наблюдаемого значения для выборочной единицы (3.1.5), включенной в выборку (3.1.8).
Примечание 1 - Отсутствие ответа представляет собой пропущенные значения, которые могут нарушить планирование отбора выборки (3.1.28). Некоторые недостающие значения могут быть в конечном итоге заменены наблюдениями благодаря настойчивости исследователей. Несмотря на все усилия исследователей, отсутствие ответа представляет собой потенциальный источник смещения (3.2.7) или ошибки, не связанной с отбором выборки (3.2.10). Наблюдения могут отсутствовать из-за трудностей в реализации плана отбора выборки (3.1.24) или из-за отказа некоторых респондентов (выборочных единиц) дать ответ (наблюдаемую величину), возможно, потому, что их не было дома во время опроса. Примечание 2 - Обработка отсутствия ответа важна, чтобы избежать сильно смещенных результатов. В выборочном опросе (3.1.21) разработана методология обработки случаев отсутствия ответов. С точки зрения логистики используется обратная связь или повторные попытки контактов. Например, отказ вернуть анкету может привести к личному собеседованию. В конечном счете, исчерпав такие методы при сборе данных, можно рассмотреть методы подстановок (нулевые подстановки, подстановки среднего значения и регрессионные подстановки). Метод регулировки с помощью весовых коэффициентов также может быть использован для решения проблемы отсутствия ответа. Примечание 3 - Отсутствие ответа может быть особенно проблематичным в обстоятельствах, когда конкретные группы выборочных единиц [возможно, учитываемые через слои (3.1.7)] дают очень разный процент ответов. Например, в телефонных опросах обычно наблюдают различные показатели ответов в зависимости от ситуации с занятостью.
Пример - Ситуации, которые вызывают отсутствие ответа, включают (но не ограничиваются) отсутствие охвата, нахождение вне дома и неспособность ответить. Отсутствие охвата происходит, например, в сельскохозяйственных условиях, когда не учитывают продукцию садов домовладений или поставщиков фермерского рынка. |
en |
non-response |
3.2.12 смещение вопроса: Смещение (3.2.7), обусловленное особенностями вопроса в способе опроса.
Примечание - Способом опроса может быть анкета или сценарий, используемый интервьюером.
Пример - Смещение вопроса возникает, если использована несоответствующая формулировка вопроса и вопрос неправильно понят респондентами или подмножествами респондентов. Смещение вопроса также возникает, если формулировка вопроса подталкивает к ответу, который спрашивающий хочет получить. Смещение вопроса имеет место в ситуациях, когда респондент не склонен или не желает давать правдивый ответ (например, в отношении религиозной принадлежности, сексуальной ориентации, незаконного употребления наркотиков и т.д.). В таких случаях можно использовать рандомизированные процедуры ответа [16]. |
en |
question bias |
3.2.13 ошибка наблюдения: Разность между измеренным значением величины и ее истинным значением.
Примечание - В статистике ошибка не является "погрешностью". Изменчивость - неотъемлемая часть измеряемых объектов и процесса измерения. |
en |
observational error |
3.2.14 регрессионная оценка: Оценка (3.2.3), скорректированная линейной функцией одной или нескольких вспомогательных переменных.
Примечание - Регрессионные оценки предназначены для использования вспомогательной информации, имеющейся в выборочных единицах (3.1.5), и сильно коррелируют с исследуемой характеристикой генеральной совокупности. Поскольку вспомогательные данные (3.2.15), как правило, доступны для всей генеральной совокупности (3.1.1), оценки (3.2.3) могут быть улучшены с помощью этой информации. |
en |
regression estimator |
3.2.15 вспомогательные данные: Дополнительная информация о выборочных единицах (3.1.5) помимо основной переменной отклика.
Примечание 1 - Вспомогательные данные обеспечивают наблюдаемые значения одной или нескольких вспомогательных переменных, которые могут оказаться полезны на этапе анализа оцениваемых характеристик совокупности. В частности, регрессионные оценки (3.2.14) и оценки отношения (3.2.16) опираются на вспомогательные данные о генеральной совокупности (3.1.1) в целом в сочетании с результатами выборки (3.1.8). Примечание 2 - Вспомогательные данные могут быть использованы при отборе выборки, пропорциональной объему (3.1.44), когда объем является вспомогательной переменной. Примечание 3 - Еще одно использование вспомогательных данных заключается в оценке объема различных слоев (3.1.7) до проведения стратифицированного отбора выборки (3.1.32).
Пример - В настоящем стандарте приведены и другие примеры, использующие вспомогательные переменные [см. (3.1.35), (3.1.36), (3.1.44), (3.2.14) и (3.2.16)]. |
en |
auxiliary data |
3.2.16 оценка отношения: Оценка (3.2.3), представляющая собой одну оценку, деленную на вторую оценку, где числитель получен по выборке (3.1.8) наблюдаемых значений, а значение в знаменателе соответствует всей генеральной совокупности (3.1.1).
Примечание - Оценки отношения обычно встречаются при отборе выборки (3.1.16) из конечной совокупности (3.1.2). Оценки отношения также возникают в случае двухэтапной выборки (3.1.41).
Пример 1 - Если исследуемой переменной является количество бычков на ферме, а вспомогательной переменной - площадь фермы, то для оценки среднего количества бычков на ферме можно использовать оценку отношения. Пример 2 - Исследуемой переменной является оценка общего количества тракторов в районе (чистая посевная площадь является вспомогательной переменной). Пусть в округе есть N деревень, из которых случайным образом выбрано n деревень: y i - общее количество тракторов в i-й случайно выбранной деревне; x i - чистая посевная площадь в i-й случайно выбранной деревне; R i = y i/x i - общее количество тракторов на единицу чистой посевной площади в i-й случайно выбранной деревне. |
en |
ratio estimator |
3.2.17 оценка Хорвица-Томпсона: Оценка (3.2.3), в которой наблюдаемые значения использованы с весовыми коэффициентами, представляющими собой величины, обратные вероятностям.
Примечание - Оценка Хорвица-Томпсона - универсальная оценка, которая может быть использована для любого вероятностного плана отбора выборки (3.1.24). Вероятность того, что выборочная единица (3.1.5) будет включена в выборку (3.1.8), обозначают . Оценка Хорвица-Томпсона для общего количества по совокупности имеет вид
,
где s - набор индексов выборки; y i - наблюдаемое значение; - величина, обратная вероятности, соответствующей i-й выборочной единице. Эта оценка является несмещенной. Примечание 2 - В некоторых случаях оценка дисперсии оценки Хорвица-Томпсона может быть отрицательной [13]. Примечание 3 - Оценка дисперсии Ятеса-Гранди оценки Хорвица-Томпсона в условиях схемы отбора выборки Мицуно [12] всегда неотрицательна. |
en |
Horvitz-Thompson estimator |
3.2.18 доля отбора выборки: Доля выборочных единиц, отобранных из совокупности (3.1.1), подсовокупности (3.1.3), кластера (3.1.6) или слоя (3.1.7) по отношению к общему количеству выборочных единиц в совокупности, подсовокупности, кластере или слое, соответственно.
Примечание - Доля отбора выборки в большинстве ситуаций различна для различных подсовокупностей, кластеров или слоев. |
en |
sampling fraction |
3.2.19 корректирующий коэффициент для конечной совокупности fpc: Поправочный коэффициент при отборе без замещения (3.1.18) из конечной совокупности (3.1.2).
Пример - В случае простого случайного отбора выборки без замещения дисперсия выборочного среднего равна (/n(1 - n/N). Второй член - это корректирующий коэффициент для конечной совокупности. Если доля отбора выборки (3.2.18) стремится к 1, корректирующий коэффициент для конечной совокупности стремится к нулю. Наоборот, корректировка не оправдана при отборе выборки с замещением (3.1.17). |
en |
finite population correction fpc |
Библиография
Ключевые слова: статистика, генеральная совокупность, конечная совокупность, параметр совокупности, выборка, отбор выборки, выборочный опрос, смещение, оценка, ошибка оценки.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Национальный стандарт РФ ГОСТ Р ИСО 3534-4-2021 "Статистические методы. Словарь и условные обозначения. Часть 4. Выборочный контроль на основе данных опроса и анкетирования" (утв. и введен в действие приказом Федерального агентства по техническому регулированию и метрологии от 28 сентября 2021 г. N 1017-ст)
Текст ГОСТа приводится по официальному изданию Российского института стандартизации, Москва, 2021 г.
Дата введения - 1 января 2022 г.