Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение N 1
УТВЕРЖДЕНЫ
приказом Росстата
от 29.12.2023 N 708
Методологические положения
по формированию выборочной совокупности домашних хозяйств по субъектам Российской Федерации для проведения ежемесячного выборочного обследования рабочей силы
I. Общие положения
1. Выборочное обследование рабочей силы проводится ежемесячно во всех субъектах Российской Федерации в отобранных в соответствии с разработанным порядком домашних хозяйствах.
2. При построении выборочного массива обеспечивается полное соответствие реализованных моделей стандартным и международным требованиям в части применения вероятностных схем отбора при проектировании крупномасштабных выборочных обследований населения.
3. В качестве основы выборки при создании выборочной сети домашних хозяйств для проведения обследования рабочей силы используется Базовый подмассив (далее - БПМ) информационного массива Всероссийской переписи населения 2020 года (далее - ВПН-2020).
БПМ - это реестр объектов наблюдения, сформированный на принципах их вероятностного отбора в каждом из субъектов Российской Федерации, его муниципальном образовании, отдельно по городскому и сельскому населению. Данный реестр включает в себя случайно отобранные территориальные и переписные единицы, помещения, домашние хозяйства (домохозяйства).
В основе БПМ лежит базовый массив первичных данных ВПН-2020 (далее - БМ), включающий совокупность всех счетных участков ВПН-2020 с населением, постоянно проживающим на территории соответствующего муниципального образования субъекта Российской Федерации.
БП имеет следующие особенности:
в состав БП включено постоянное население частных домохозяйств;
при построении БМ и создании на его основе БПМ используется база неперсонифицированных данных ВПН-2020 отдельно по городскому и сельскому населению, содержащих коды ответов на вопросы переписных листов и расчетные показатели по помещениям, домохозяйствам и семейным ячейкам;
из БМ не исключаются труднодоступные и закрытые административно-территориальные образования (ЗАТО), а также счетные участки, в которых помимо постоянного населения переписаны лица, временно проживающие на территории России;
в состав БМ не включаются счетные участки, состоящие полностью из населения коллективных домохозяйств или из лиц, временно проживающих на территории России;
в структурном составе БМ представляются переписные единицы трех уровней (обрабатываемой территории, переписного и счетного участков) с описанием их качественной характеристики и количественного состава по основным признакам программы ВПН-2020, а также по общему числу образованных переписных единиц в каждом муниципальном образовании каждого субъекта Российской Федерации отдельно по городскому и сельскому населению.
II. Формирование выборочной совокупности для проведения выборочного обследования рабочей силы
4. Построение выборочных массивов объектов и единиц наблюдения выборочного обследования рабочей силы (далее - ОРС) осуществляется на 2 года, при этом используется ротационная схема с полным замещением первичных выборочных единиц (счетных участков). Повторное использование счетных участков осуществляется с периодичностью 1 раз в 2 года. В соответствии с принятой ротационной схемой ежегодно обновляется от 15 до 30% счетных участков. Актуализация счетных участков проводится постоянно с учетом административных, структурных и временных изменений, происходящих в исходных совокупностях с течением времени.
Выборочная совокупность для проведения ОРС формируется с использованием подсистемы "Демография" на основе БПМ с использованием следующих исходных данных:
периодичность обследования;
дата начала и дата окончания обследования;
процент достижимости единиц наблюдения (значение, характеризующее ожидаемый % недостижимых в ходе обследования домохозяйств, включая отказ от участия в опросе);
количество счетных участков, подлежащих отбору в рамках субъекта Российской Федерации по городскому и сельскому населению (для каждого субъекта Российской Федерации);
количество домохозяйств, подлежащих отбору в рамках счетного участка в городском и сельском населении (для каждого субъекта Российской Федерации);
параметры основы выборки для проведения обследования, включая характеристики ПВЕ, составляющих основу выборки.
Построение выборочной сети домашних хозяйств для проведения ОРС осуществляется в соответствии с принятой моделью многофазной выборки, в рамках которой на последней фазе реализуется модуль двухступенчатою отбора.
Нумерация пунктов приводится в соответствии с источником
6. В состав модульной структуры многофазной выборки ОРС включено восемь модулей:
6.1. Модуль 1. В рамках данного модуля реализуется три основных функции:
а) первая функция направлена на определение возможности полноценного использования базового массива ВПН-2020, для создания базового подмассива ВПН-2020 и его использования в дальнейшем для формирования выборки и проведения ОРС;
б) вторая функция, предназначена для построения по субъектам Российской Федерации, отдельно по городскому и сельскому населению, на основе базы данных БПМ ВПН-2020 (в т.ч. отдельных ее подмассивов) и крупных выборочных подмножеств (КВПМ), специальных выборочных подмассивов для формирования на их основе выборочного массива ПВЕ (счетных участков) на четвертой фазе;
в) третья функция направлена на обеспечение в составе каждого из специальных выборочных подмассивов (далее - CBПM ПBE), построенном в рамках субъектов Российской Федерации, непересекающихся элементов.
Для реализации указанных функций используются следующие данные:
о количестве ПВЕ, входящих в состав муниципально-территориальной единицы (МТЕ) подмножества БПМ, для создания СВПМ ПВЕ;
о количестве доступных ПВЕ в МТЕ для формирования выборочной совокупности ПВЕ для проведения ОРС.
В целом, пошаговая схема создания базового подмассива ВПН-2020 сводится к следующему:
1) На первом шаге осуществляется построение на основе информационного массива (ИМ) ВПН-2020 базового массива, в состав которого включается только население частных домашних хозяйств, постоянно проживающих на территории Российской Федерации;
2) На втором шаге осуществляется создание БПМ ВПН-2020. Для ее построения характерно:
применение в качестве основы выборки базового массива ВПН-2020, созданного на основе ИМ ВПН-2020;
использование в качестве ПВЕ переписной единицы третьего уровня, то есть счетного участка;
реализация при создании БПМ ВПН-2020 одноступенчатого гнездового отбора, при котором единицей отбора является составной элемент БМ ВПН-2020 - счетный участок. Это означает, что в составе БПМ также присутствует только постоянно проживающее население частных домохозяйств, относящееся к счетному участку (ПВЕ);
применение при создании БПМ ВПН-2020 модели отбора с вероятностью пропорциональной размеру. В качестве размера использовался признак "Количество домашних хозяйств в счетном участке";
отражение в составе БПМ ВПН-2020 практически всего муниципально-территориального деления Российской Федерации (то есть в рамках каждого субъекта Российской Федерации в выборочном массиве БПМ представлены все муниципально-территориальные единицы (МТЕ), входящие в его состав);
применение при построении БПМ ВПН-2020 методов систематизации МТЕ (муниципальный район, муниципальное образование, городской округ, городской округ муниципального образования) по географическому признаку с целью реализации процедур по территориальному сегментированию территории субъекта Российской Федерации и обеспечения при построении подвыборок его территориального представительства;
3) На третьем шаге проводится первая актуализация БПМ ВПН-2020 в рамках каждого субъекта Российской Федерации отдельно по городскому и сельскому населению;
4) На четвертом шаге осуществляется построение с использованием схем случайного отбора на базе данных БПМ ВПН-2020 четырех крупных выборочных подмножеств (КВПМ) ПВЕ с непересекающимся элементами (счетными участками) с целью обеспечения:
а) единства методологических и технологических подходов при эксплуатации БПМ в межпереписной период;
б) непересекаемости и представительности выборочных совокупностей, формируемых на базе БПМ;
в) оптимизации нагрузки на респондентов при проведении в межпереписной период социально-демографических и социально-экономических обследований населения и домохозяйств. Характерным для построенных в рамках базового подмассива ВПН-2020 крупного выборочного подмножества (КВПМ ПВЕ) является:
применение вероятностных схем отбора ПВЕ (счетных участков);
реализация при построении КВПМ ПВЕ двухфазной выборки:
первая фаза - случайный отбор ПВЕ (счётного участка) в состав БПМ ВПН-2020;
вторая фаза - случайный отбор ПВЕ в состав крупного выборочного подмножества;
применение при построении КВПМ ПВЕ ряда модулей, включенных в состав программных средств ПС "Демография";
отражение в составе КВПМ ПВЕ адекватного территориального представительства всех субъектов Российской федерации;
наличие в составе построенных КВПМ ПВЕ полностью непересекающихся элементов;
планирование проведения ежегодной актуализации состава сформированных КВПМ на основании информации территориальных органов Росстата о различного рода изменениях в выборочных массивах, выявленных при проверке их состава перед эксплуатацией;
6.2. Модуль 2 предназначен:
а) для определения как по субъектам Российской Федерации, так и муниципальным районам отдельно по городскому и сельскому населению, общего объема выборки ПВЕ для проведения ОРС;
б) для проведения по субъектам Российской Федерации, отдельно по городскому и сельскому населению, расчетов объема выборочного массива ПВЕ, подлежащего отбору в рамках территориального сегмента (ТС) и МТЕ, входящих в их состав;
в) для определения по выделенным аналитическим областям (элементам муниципально-территориального деления субъектов Российской Федерации): достаточного количества ПВЕ в массиве данных БПМ ВПН-2020 для построения как соответствующего КВПМ, так и соответствующей подвыборки.
Информация, получаемая в результате реализации трех функций, является основой для определения достаточности числа ПВЕ в БД БПМ BПH-2020, КВПМ, специальных выборочных подмассивов (СВПМ) для формирования выборки и проведения ОРС;
6.3. В рамках Модуля 3 выполняются функции:
составление основы выборки в целом для построения специального выборочного подмассива;
проведение комплекса работ, связанных с построением выборочных совокупностей для организации ОРС;
реализация процедуры по определению минимального числа элементов (ПВЕ), подлежащих включению в состав основы выборки и построения СВПМ;
6.4. Модуль 4 необходим для выполнения функций по:
а) определению состояния элементов основы специального выборочного подмассива на предмет их соответствия периоду проведения ОРС и установления необходимости его актуализации;
б) реализации процедур, где применяется систематизация элементов базового массива (подмассива) с учетом: как географического признака, так и применение процедур по упорядочиванию номеров элементов массива с разной направленностью и последовательностью расположения В соответствующих аналитических областях субъектов Российской Федерации;
6.5. В рамках Модуля 5 выполняются функции ряда подмодулей, входящих в состав разработанной модели многофазной выборки и являющихся ключевыми компонентами ПС "Демография" ВПН-2020. Реализация данного Модуля осуществляется на полной основе специального выборочного подмассива ПВЕ. Для реализации функций ряда подмодулей в рамках Модуля 5 используются три стандартных способа случайного включения единиц в выборочные подмассивы: случайный бесповторный отбор, случайный систематический отбор (начало отбора определяется случайно), отбор с вероятностью пропорциональной размеру (ВПР). В качестве размера используется показатель "количество домохозяйств" в рамках ПВЕ.
Для реализации стандартной процедуры отбора с вероятностью пропорциональной размеру используется:
информация информационного массива БПМ ВПН-2020 о количестве счетных участков (ПВЕ), включенных в его состав, о численности постоянного населения и количестве домашних хозяйств. Данная информация выгружается из созданного в рамках субъектов Российской Федерации массива БПМ (в т.ч. и БМ) по городскому и сельскому населению, по каждой муниципально-территориальной единице, входящей в состав образованных территориальных сегментов;
информация о реквизитах ПВЕ (для указания кода населенного пункта используется восьмизначный код ТЕРСОНА-МО);
информация на уровне счетного участка по показателю: "количество домохозяйств";
информация о количестве ПВЕ (счетных участков), подлежащих отбору в выборочные подмассивы и совокупности на последующих фазах (то есть после первой фазы, предназначенной для создания БПМ ВПН-2020) построения выборки по каждому территориальному сегменту, равно как и по муниципально-территориальной единице в рамках субъекта РФ, отдельно по городскому и сельскому населению.
Структура модели отбора ПВЕ с вероятностью пропорциональной размеру включает:
1) подготовку основы выборки для реализации модели отбора с ВПР;
2) определение интервала отбора и случайного начала отбора;
3) реализацию процедуры отбора с ВПР;
4) определение совокупности ПВЕ, подлежащей включению в выборочный подмассив ПВЕ и расчет вероятности включения ПВЕ в выборку;
5) представление результатов формирования выборочного подмассива ПВЕ в соответствии с определенной в ПС "Демография" АС ВПН-2020 структурой электронной таблицы.
Для реализации указанных пяти составляющих применяется стандартная последовательность (то есть алгоритм) отбора счетных участков с вероятностью пропорциональной размеру (ВПР):
1) Осуществляется построение специальной электронной таблицы в рамках базового массива ВПН-2020 по каждой аналитической области (то есть образованному ТС (в том числе и МТЕ) в субъекте РФ, отдельно по городскому и сельскому населению.
По каждой ПВЕ в электронной таблице указывается ее принадлежность к соответствующему муниципальному образованию и номеру территориального сегмента. По каждой ПВЕ базового массива представляются также все переписные реквизиты (номер обрабатываемой территории, номер переписного участка, номер счетного участка), включая информацию о количестве домашних хозяйств в каждом счетном участке. В соответствующей графе электронной таблицы указывается информация о накопленном количестве домашних хозяйств (данная информация является основой для включения единицы отбора (счетного участка) в выборочный массив ПВЕ). В рамках данной графы по последней ПВЕ базового массива накопленная сумма будет соответствовать общему количеству домашних хозяйств, включенных в соответствующую АО базового массива;
2) Определяется интервал отбора (ИО) и случайное число. ИО вычисляется путем деления суммарного значения количества домохозяйств, то есть накопленной суммы, на общее количество ПВЕ, подлежащих отбору в рамках аналитической области.
Дробное значение интервала отбора округляется до ближайшего целого числа и указывается в соответствующей графе электронной таблицы.
Случайное число (СЧ) определяется в интервале от 01 до ИО с помощью генератора случайных чисел. Следует отметить, что, если установленная в компьютере стандартная программа получения случайных чисел выдает их в пределах от 0 до 1, то для определения случайного начала отбора следует умножить величину интервала отбора на полученное случайное число. Найденное случайное число характеризует случайное начало отбора и также заносится в одну из граф электронной таблицы;
3) Находится последовательность чисел (их количество равно числу отбираемых ПВЕ), в которой первое число соответствует случайному числу (СЧ), а все последующие числа равны: СЧ + ИО, СЧ + 2ИО, СЧ + ЗИО, СЧ + 4ИО и т.д. Полученный набор чисел вводится в соответствующую графу электронной таблицы. Количество чисел, подлежащих включению в данный набор, должно соответствовать количеству ПВЕ, подлежащих отбору;
4) Определяются ПВЕ, подлежащие отбору, на основании полученной совокупности набора последовательных чисел. Основой для их определения является графа электронной таблицы, где представляется информация о накопленном количестве домашних хозяйств. Отбору подлежит i-я ПВЕ, находящаяся в интервале между двумя ближайшими значениями с накопленным количеством домохозяйств. Данный интервал должен удовлетворять следующему неравенству: любое число из определенного набора последовательных чисел должно быть больше или равно значения(ю) верхней границы данного интервала и меньше значения нижней границы данного интервала. Отобранная ПВЕ должна находиться или между значением нижней и верхней границы или соответствовать верхней границе данного интервала.
На основании результатов отбора ПВЕ составляется совокупность ПВЕ, подлежащая включению в выборочный подмассив соответствующей аналитической области (или территориального сегмента или муниципально-территориальной единицы, входящей в состав ТС), а в целом - в соответствующий выборочный подмассив ПBE;
6.6. Модуль 6 функционально нацелен на построение выборочного массива ПВЕ на первой ступени последней фазы формирования выборки ПВЕ для проведения ОРС. При реализации данного модуля (этот модуль также является компонентой ПС "Демография" AC BПH-2020) могут быть реализованы три стандартных способа случайного включения ПВЕ (стандартный систематический отбор 1, случайный бесповторный отбор) в выборочный массив.
------------------------------
1 Для реализации стандартной процедуры систематического отбора ПВЕ входными данными являются: 1) информация о количестве ПВЕ в базовом подмассиве (БПМ ВПН-2020); 2) информация о территориальных и переписных реквизитах ПВЕ; 3) информация о количестве ПВЕ, подлежащих включению в выборочный массив; 4) информация о количественном составе специального выборочного подмассива.
------------------------------
На первом шаге проводится процедура присвоения каждой из единиц выборочного подмассива соответствующего порядкового номера.
На втором шаге реализуется начальная стадия систематического отбора: определяется интервал отбора; определяется случайное начало отбора.
На третьем шаге определяются номера счетных участков, подлежащих включению в выборочный массив путем получения последовательности чисел, начиная со случайного начала отбора и периодическому прибавлению к нему и всем последующим числам значения, равного интервалу отбора.
На четвертом шаге устанавливается совокупность ПВЕ (счетных участков), подлежащих включению в выборочный массив ПВЕ для проведения ОРС;
6.7. Модуль 7 функционально направлен на реализацию процедуры построения выборочных совокупностей домашних хозяйств в рамках ПВЕ, включенных в выборочные массивы с использованием модуля 5 или модуля 6. Для формирования выборки домашних хозяйств используется стандартная модель систематического отбора, где начало отбора определяется случайно.
Характерным для реализации алгоритма отбора домохозяйств из основы выборки, составленной в рамках ПВЕ является:
применение одного из модулей общей модели выборки по упорядочиванию элементов основы выборки. Его основное назначение - это построение в рамках ПВЕ систематизированной основы выборки по показателю "размер домохозяйства", присвоение домохозяйствам единой порядковой нумерации с учетом количества домохозяйств, проживающих в жилом помещении, и использование разного направления упорядочивания номеров элементов в рамках исходного массива (базового массива ВПН-2020);
формирование в рамках ПВЕ резервного массива домохозяйства, предназначенного для использования при недостижимости домохозяйства из основного списка. Таким образом, в рамках ПВЕ случайно формируется общий массив, состоящий из основного и резервного массива.
По субъектам Российской Федерации применяется разная доля отбора с учетом вариации изучаемых признаков.
Размер выборки обследований рабочей силы определяется отдельно по каждому региону Российской Федерации с учетом относительной вариации по показателю "уровень безработицы" и заданной степени относительной точности по этому показателю (не более 1,5%, 5%, 8% соответственно в целом по России, ряду крупных и средних регионов, небольших по численности населения регионов). В рамках ПВЕ в разных субъектах Российской Федерации случайно отбирается разное количество домохозяйств из которых "m i" домохозяйств включаются в основной массив для проведения ОРС и "m i" (то есть одинаковое количество) домохозяйств отбираются в резервный массив. Формирование основного и резервного массива проводится случайно, а затем также случайно общий массив разделяется на основной и резервный массивы (в рамках общего списка резервное домохозяйство затемнено). На первом и втором циклах построения указанных массивов применяется систематический отбор, при котором начало отбора определяется случайно (стандартная процедура систематического отбора изложена в пункте 6.6.);
6.8. Модуль 8 предназначен для разделения годового выборочного массива ПВЕ ОРС на 12 месячных подвыборок. Для реализации этого модуля применяется систематическая выборка (начало отбора случайное).
В целом же по большинству субъектов Российской Федерации реализован ротационный модуль, обеспечивающий использование в первые два года полностью непересекающихся выборочных массивов счетных участков при проведении в субъектах Российской Федерации ОРС, и применение повторной эксплуатации действующих выборочных массивов через каждые 2 года, включая их постоянную актуализацию.
Месячный объем выборочной совокупности ОРС составляет в целом по стране около 41 тыс. домашних хозяйств или 77 тысяч человек в возрасте от 15 лет и старше, что соответствует 0,06% численности населения обследуемого возраста. Годовой объем выборки при проведении месячных обследований составляет около 924 тыс. человек (около 495 тыс. домашних хозяйств), что соответствует 0,76% численности населения этого возраста.
7. Домашние хозяйства, отобранные на второй ступени, подлежат опросу и включаются в список, выдаваемый интервьюеру. Список содержит основные и резервные адреса домашних хозяйств. В целях сохранения представительности выборки эти домашние хозяйства не могут быть произвольно заменены другими.
8. Дополнительный массив единиц, включенных в выборку, составляют домашние хозяйства, вселившиеся в течение года в новые жилые помещения. Формирование его осуществляется на основе ежегодной актуализации основы выборки.
9. Эксплуатация сформированной и постоянно актуализируемой выборочной совокупности счетных участков и домашних хозяйств осуществляется до построения нового информационного массива на базе данных очередной Всероссийской переписи населения.
10. Реализованные случайные модели построения выборочных массивов ПВЕ и домашних хозяйств и последующая их актуализация на основе информации территориальных органов Росстата о различного рода административных, структурных, временных изменениях, а также недостижимости объектов наблюдения, являются основой для формирования в целом обновленного выборочного массива для проведения ежемесячных обследований рабочей силы в очередном году.
Сформированный годовой выборочный массив обследования рабочий силы обеспечивает территориальное представительство субъектов Российской Федерации. Это позволяет в сочетании с достаточным объемом выборки получать представительную информацию о современном состоянии рынка труда как на уровне годового периода по всем субъектам Российской Федерации, так и квартального периода по крупным и средним субъектам Российской Федерации.
План размещения выборочного массива первичных выборочных единиц (счетных участков) в разрезе административно-территориальных единиц, входящих в состав субъектов Российской Федерации, для проведения выборочного обследования рабочей силы в 2024 году приводится в приложении N 2.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.