Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение 1
УТВЕРЖДЕНЫ
приказом Росстата
от 30.06.2017 N 446
Методологические положения по формированию выборочной
совокупности домашних хозяйств по субъектам Российской Федерации для проведения ежемесячного выборочного обследования рабочей силы
1. Выборочное обследование рабочей силы проводится ежемесячно во всех субъектах Российской Федерации в отобранных в соответствии с разработанным порядком домашних хозяйствах.
При построении выборочного массива обеспечивается полное соответствие реализованных моделей стандартным и международным требованиям в части применения вероятностных схем отбора при проектировании крупномасштабных выборочных обследований населения.
В качестве основы выборки при создании выборочной сети домашних хозяйств для проведения обследования рабочей силы используется базовый массив территориальной выборки многоцелевого назначения (ТВМН), построенный на базе данных первичного информационного фонда, сформированного на основе базы данных Всероссийской переписи населения 2010 г. (БД ВПН-2010).
В состав первичного информационного фонда включается постоянное население (т.е. население частных домашних хозяйств, постоянно проживающее на территории соответствующего района, города, населенного пункта и т.п.).
Первичный информационный фонд по каждому субъекту Российской Федерации содержит всю необходимую информацию о структурном составе населения и о реквизитах переписных единиц (переписных участков, инструкторских участков, счетных участков), на которые разбиты административно-территориальные единицы субъекта Российской Федерации.
Построение выборочных массивов объектов и единиц наблюдения осуществляется на 2 года, при этом используется ротационная схема с полным замещением первичных выборочных единиц (счетных участков). Повторное использование счетных участков осуществляется с периодичностью 1 раз в 2 года. В соответствии с принятой ротационной схемой ежегодно обновляется от 15 до 30% счетных участков.
Актуализация счетных участков проводится постоянно с учетом административных, структурных и временных изменений, происходящих в исходных совокупностях с течением времени.
2. Построение выборочной сети домашних хозяйств для проведения обследования рабочей силы осуществляется в соответствии с принятой моделью многофазной выборки*, в рамках которой на последней фазе реализуется модуль двухступенчатого отбора.
На первой ступени формируется выборочный массив первичных выборочных единиц. В качестве первичной выборочной единицы (далее - ПВЕ) принят счетный участок.
Основой выборки для построения выборочного массива на первой ступени является совокупность счетных участков, входящих в состав ТВМН, созданной на основе БД ВПН-2010.
При формировании выборочного массива первичных выборочных единиц реализована процедура стратификации совокупности административно-территориальных единиц с учетом их географического расположения. Для установления географической близости административно-территориальных единиц в рамках субъектов Российской Федерации применялся принцип серпантинного расположения территориальных единиц с севера на юг в направлении запад-восток.
Основное назначение данной процедуры - образование территориальных сегментов, объединяющих ряд смежных административных районов с целью получения в выборке адекватного территориального представительства субъекта Российской Федерации и обеспечения сопоставимости результатов обследования в разные периоды обследования.
Отбор счетных участков ВПН-2010 для обследования осуществляется в рамках образованных на территории субъектов Российской Федерации территориальных сегментов, отдельно по городскому и сельскому населению.
На второй ступени в отобранных на первой ступени счетных участках отбираются домашние хозяйства, где сбор информации проводится по лицам в обследуемом возрасте (с 2017 г. - 15 лет и старше).
3. Для отбора домохозяйств применяется модель систематического случайного отбора. Систематический отбор домохозяйств проводится из упорядоченного списка домохозяйств по признаку - размер домохозяйства.
3.1. На первом шаге осуществляется процедура присвоения каждой из единиц упорядоченной основы выборки соответствующего порядкового номера от 1 до , где - количество домохозяйств в i-ПВЕ (счетном участке), отобранной на первой ступени. Таким образом, количество присвоенных порядковых номеров должно полностью соответствовать количеству отобранных домохозяйств в i-ПВЕ.
3.2. На втором шаге реализуется начальная стадия стандартной модели систематического отбора, на которой:
- определяется интервал отбора (ИО) по формуле:
,
где - плановое число домохозяйств, подлежащее отбору в i-ПВЕ с учетом резерва (резерв принимается равным плановому числу домохозяйств, т.е. отбирается в два раза больше домохозяйств).
- определяется случайное начало отбора. В соответствии со стандартной процедурой случайное начало отбора определяется в рамках полученного интервала отбора.
Для определения случайного числа используется генератор случайных чисел**. Если интервал отбора целое число, то случайное начало отбора выбирается из совокупности целых чисел в интервале от 01 до "ИО" (например, если шаг отбора равен 33, то случайное число выбирается в интервале от 01 до 33).
Если интервал отбора является дробным числом, то для определения диапазона, в котором будет отбираться случайное начало отбора, может быть использована следующая процедура:
- сначала в дробном интервале отбора оставляется его целая часть и первый десятичный шаг. Например, если интервал отбора равен 21,44, то диапазон для выбора случайного числа равнозначен интервалу от 0,1 до 21,4;
- затем в указанном выше диапазоне снимается десятичный знак и осуществляется выбор случайного числа в интервале от 001 до 214.
Случайное начало отбора (СЧ) определяется по формуле путем помещения десятичного знака перед последней цифрой выбранного случайного числа, т.е. умножением его на 0,1:
,
где - случайное число.
Например, если случайное число оказалось равным 12, то случайное начало отбора будет равно 1,2.
3.3. На третьем шаге определяются номера домохозяйств, которые должны быть включены в выборку на второй ступени. Для этого требуется:
- сначала получить последовательность чисел, начиная со случайного начала отбора путем периодического прибавления к нему и всем последующим числам значения, равного интервалу отбора, т.е.:
СЧ - номер первого отобранного домохозяйства;
СЧ + ИО - номер второго отобранного домохозяйства;
(СЧ + ИО) + ИО - номер третьего отобранного домохозяйства (т.е. СЧ + 2ИО);
(СЧ + 2ИО) + ИО - номер четвертого отобранного домохозяйства (т.е. СЧ + 3ИО);
...
- номер последнего отобранного домохозяйства.
- затем прекратить процедуру получения последовательности чисел, когда целая часть очередного полученного десятичного числа (при дробной величине интервала отбора) превысит значение . Это последнее число отбрасывается.
- определить совокупность номеров домохозяйств, которые подлежат включению в выборку на второй ступени из i-ПВЕ, отобранной на первой ступени.
Данная совокупность номеров устанавливается на основе полученной на этом шаге последовательности ряда десятичных чисел, в которых берется только их целая часть (т.е. десятичная часть отбрасывается).
3.4. На четвертом шаге устанавливается адресная часть домашнего хозяйства, включенного в дополнительный выборочный массив, а также номера тех домохозяйств, которые подлежат включению в резервный массив (для этих целей применяется специальная штриховка).
Данная составляющая схемы отбора домохозяйств реализуется на региональном уровне. Для этих целей применяется одна из подсистем автоматизированной системы ВПН-2010, а именно, Подсистема переписного районирования. Данная подсистема позволяет установить адресную часть на основании реквизитов (переписных и территориальных) отобранного счетного участка, наименования населенного пункта, а также информации о номере жилого помещения и порядковом номере домохозяйства в пределах жилого помещения.
3.5. Домашние хозяйства, отобранные на второй ступени процедуры выборки, подлежат опросу и включаются в список, выдаваемый интервьюеру. Список содержит основные и резервные адреса домашних хозяйств. В целях сохранения представительности выборки эти домашние хозяйства не могут быть произвольно заменены другими.
3.6. Дополнительный массив единиц, включенных в выборку, составляют лица, вселившиеся в течение года в новые жилые помещения. Формирование его осуществляется на основе ежегодной актуализации основы выборки.
4. Эксплуатация сформированной и постоянно актуализируемой выборочной совокупности счетных участков и домашних хозяйств осуществляется до построения нового информационного массива на базе данных очередной Всероссийской переписи населения.
На этапе эксплуатации сформированных выборочных массивов ПВЕ и домохозяйств реализована следующая ротационная схема:
- в 2013 и 2014 гг. эксплуатировались выборочные массивы с полностью непересекающимися элементами;
- в 2015 и в 2016 гг. эти же массивы эксплуатировались повторно, при этом в 2015 г. для проведения обследования использовался актуализированный выборочный массив счетных участков 2013 г., в 2016 г. - актуализированный выборочный массив счетных участков 2014 г.
- в 2017 г. повторно эксплуатируется актуализированный выборочный массив 2015 г., обновление которого составило в среднем по субъектам Российской Федерации 20%.
При этом было обеспечено территориальное представительство субъектов Российской Федерации на основе максимального учета предложений территориальных органов Росстата о различного рода административных, структурных и временных изменениях, происходящих в исходных совокупностях (в том числе выборочных) с течением времени.
5. При актуализации выборочных массивов ПВЕ используется стандартная процедура отбора с вероятностью пропорциональной размеру (ВПР). Для ее реализации применяется следующая информация:
во-первых, информация специального базового подмассива, созданного на уровне каждого субъекта Российской Федерации, о количестве счетных участков, включенных в его состав, о численности постоянного населения и количестве домашних хозяйств. Информация выгружается из созданного специального базового подмассива по городскому и сельскому населению, по каждой административно-территориальной единице, входящей в состав образованных территориальных сегментов;
во-вторых, информация о реквизитах ПВЕ (для указания кода населенного пункта используется девятизначный код ТЕРСОНА***);
в-третьих, информация на уровне счетного участка по показателю: "количество домохозяйств";
в-четвертых, информация о количестве ПВЕ (счетных участков), подлежащих отбору по каждому территориальному сегменту, равно как и административно-территориальным единицам, входящих в его состав.
В структуру модели отбора ПВЕ с вероятностью пропорциональной размеру включено пять составляющих, направленных на:
- подготовку специального базового подмассива для реализации модели отбора с вероятностью, пропорциональной размеру, и модели систематического случайного отбора;
- определение интервала отбора и случайного начала отбора;
- реализацию процедуры отбора с вероятностью, пропорциональной размеру;
- определение совокупности ПВЕ, подлежащей включению в выборочный подмассив ПВЕ;
- представление результатов формирования выборочного массива ПВЕ.
6. Стандартная процедура отбора счетных участков с вероятностью, пропорциональной размеру, сводится к следующему:
6.1 В рамках подготовки специального базового подмассива для реализации обозначенной модели осуществляется построение специальной электронной таблицы по каждому образованному территориальному сегменту (в том числе по каждой административно-территориальной единице) в субъекте Российской Федерации, отдельно по городскому и сельскому населению.
По каждому счетному участку (ПВЕ) в электронной таблице указывается его принадлежность к соответствующему административному району и номеру территориального сегмента. По каждой ПВЕ специального базового подмассива представляются также все переписные реквизиты, включая информацию о количестве домашних хозяйств в каждом счетном участке. В соответствующей графе электронной таблицы указывается информация о накопленном количестве домашних хозяйств (данная информация является основой для включения единицы отбора (счетного участка) в выборочный массив ПВЕ).
6.2 Определяется интервал отбора (ИО) путем деления суммарного значения количества домохозяйств, т.е. накопленной суммы, на общее количество ПВЕ, подлежащих отбору в рамках территориального сегмента.
Дробное значение интервала отбора округляется до ближайшего целого числа и указывается в соответствующей графе электронной таблицы.
Случайное число (СЧ) определяется в интервале от 01 до ИО с помощью генератора случайных чисел. Следует отметить, что, если установленная в компьютере стандартная программа получения случайных чисел выдает их в пределах от 0 до 1, то для определения случайного начала отбора следует умножить величину интервала отбора на полученное случайное число. Найденное случайное число характеризует случайное начало отбора и также заносится в одну из граф электронной таблицы.
Находится последовательность чисел (их количество равно числу отбираемых ПВЕ), в которой первое число соответствует случайному числу (СЧ), а все последующие числа равны: СЧ + ИО, СЧ + 2ИО, СЧ + 3ИО, СЧ + 4ИО и т.д.
Полученный набор чисел вводится в соответствующую графу электронной таблицы. Количество чисел, подлежащих включению в данный набор, должно соответствовать количеству ПВЕ, подлежащих отбору.
Определяются ПВЕ, подлежащие отбору, на основании набора последовательных чисел. Основой для их определения является графа электронной таблицы, где представляется информация о накопленном количестве домашних хозяйств. Отбору подлежит i-ПВЕ, находящаяся в интервале между двумя ближайшими значениями с накопленным количеством домохозяйств. Данный интервал должен удовлетворять следующему неравенству: любое число из определенного набора последовательных чисел должно быть меньше или равно значению верхней границы данного интервала и больше значения нижней границы данного интервала. Отобранная ПВЕ должна находиться или между значением нижней и верхней границы или соответствовать верхней границе данного интервала.
Составляется совокупность ПВЕ, подлежащих включению в выборочный массив соответствующего территориального сегмента или административно-территориальной единицы, входящей в состав территориального сегмента, где требовалась актуализация.
Нумерация подпунктов приводится в соответствии с источником
6.1 Реализованные случайные модели построения выборочных массивов ПВЕ и домашних хозяйств и последующая их актуализация на основе информации территориальных органов Росстата о различного рода административных, структурных, временных изменениях, а также недостижимости объектов наблюдения, являются основой для формирования в целом обновленного выборочного массива для проведения ежемесячных обследований рабочей силы в очередном году.
Сформированный годовой выборочный массив обследования рабочий силы обеспечивает территориальное представительство субъектов Российской Федерации. Это позволяет в сочетании с достаточным объемом выборки получать представительную информацию о современном состоянии рынка труда как на уровне годового периода по всем субъектам Российской Федерации, так и квартального периода по крупным и средним субъектам Российской Федерации.
План размещения выборочного массива первичных выборочных единиц (счетных участков) в разрезе административно-территориальных единиц, входящих в состав субъектов Российской Федерации, для проведения выборочного обследования рабочей силы в 2017 году приводится в Приложении 2.
______________________________
* Многофазная выборка - вид выборки, при которой конечная выборочная совокупность формируется в несколько фаз, на каждой из которых используется одна и та же единица отбора (например, счетный участок, который при построении ТВМН является первичной выборочной единицей). При построении выборочного массива для проведения обследования рабочей силы в качестве единицы отбора также используется счетный участок. Использование многофазной выборки при эксплуатации ТВМН для проведения системы выборочных наблюдений по социально-демографическим и социально-экономическим проблемам нацелено на построение в рамках базового массива ТВМН множества выборочных подмассивов с непересекающимися элементами.
** Если установленная в компьютере стандартная программа получения случайных чисел выдает их в пределах от 0 до 1, то для определения случайного начала отбора следует умножить величину интервала отбора на полученное случайное число.
*** Территориальная единица разработки статистики о населении. Данное понятие является базовым при проведении Всероссийской переписи населения.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.