Постановление Госкомстата РФ от 19 декабря 2003 г. N 114
"Об утверждении Методологических положений по проведению выборочного наблюдения индивидуальных предпринимателей, осуществляющих деятельность в торговле и общественном питании, алгоритма формирования выборочной совокупности"
Приказом Росстата от 29 августа 2013 г. N 346 настоящее постановление признано утратившим силу
Во исполнение Плана научно-методологической работы Госкомстата России на 2003 год, утвержденного приказом Госкомстата России от 20.12.2003 N 143, Государственный комитет Российской Федерации по статистике постановляет:
Утвердить прилагаемые Методологические положения по проведению выборочного наблюдения индивидуальных предпринимателей, осуществляющих деятельность в торговле и общественном питании, алгоритм формирования выборочной совокупности.
Председатель |
В.Л.Соколин |
Методологические положения по проведению выборочного наблюдения индивидуальных предпринимателей, осуществляющих деятельность в торговле и общественном питании, алгоритм формирования выборочной совокупности
(утв. постановлением Госкомстата РФ от 19 декабря 2003 г. N 114)
См. также Методические указания по расчету индекса-дефлятора оборота организаций розничной торговли, общественного питания и организаций по продаже автотранспортных средств и моторного топлива на федеральном уровне, утвержденные постановлением Федеральной службы государственной статистики от 6 июля 2004 г. N 22
1. Введение
При проведении обследований экономической деятельности индивидуальных предпринимателей, в том числе в сфере торговли, органы статистики сталкиваются с трудностями создания и в особенности поддержания в актуальном состоянии основы выборки - списка единиц наблюдения генеральной совокупности, формируемого на основе ЕГРПО и отраслевых статистических баз данных. Созданные методологические положения решают задачу обеспечения полного охвата исследуемой совокупности и учитывают состав и качество имеющейся в органах статистики пообъектной информации об индивидуальных предпринимателях, осуществляющих деятельность в торговле.
Методологической базой проведения выборочного обследования индивидуальных предпринимателей торговли является двухосновная схема плана отбора и формирования выборки, что позволяет учитывать динамические изменения в исследуемой совокупности индивидуальных предпринимателей.
Данные методологические положения по формированию выборочной совокупности индивидуальных предпринимателей, осуществляющих деятельность в торговле, разработаны с учетом практики проведения обследований индивидуальных предпринимателей органами государственной статистики, а также зарубежного опыта по организации и проведению аналогичных обследований, прежде всего Бюро цензов США, а также статистических служб Италии и Индонезии.
2. Общие положения
Основной целью выборочного обследования индивидуальных предпринимателей торговли является получение показателя оборота в разрезе субъектов Российской Федерации и в целом по стране. При создании основы выборки и определении плана отбора должны учитываться такие факторы, как динамично меняющийся состав исследуемой совокупности и практические сложности осуществления контакта с респондентами для получения первичных сведений по имеющемуся в органах статистики фактическому адресу проживания индивидуального предпринимателя.
Ввиду высокой степени вариации показателя оборота эффективность плана отбора требует использование списковой основы наблюдения. Однако из-за динамичности состава и структуры исследуемой совокупности основа выборки быстро устаревает. Это является причиной неполного охвата.
Один из путей обеспечения полноты охвата заключается в использовании территориальной основы отбора, которая покрывает всю территорию страны (региона) и, следовательно, всю целевую совокупность. Так же, как списочная основа является списком единиц совокупности, территориальная основа - перечень территориальных единиц. Эти единицы удобно отбирать с использованием расслоенной многоступенчатой схемы.
Хотя территориальная основа обеспечивает полный охват целевой совокупности, она обычно не приводит к эффективному плану отбора. Это связано с тем, что размер территориальных единиц (в смысле числа относящихся к ним единиц наблюдения) обычно существенно варьирует. Поэтому необходим большой объем территориальной выборки и непосредственно числа индивидуальных предпринимателей, включенных в выборку, чтобы обеспечить приемлемую точность результатов.
В связи с этим территориальные основы отбора наиболее часто используются в обследованиях, охватывающих широкий спектр показателей, которые достаточно равномерно распределены географически, например, обследование бюджетов домашних хозяйств.
Другой путь заключается в создании многоосновной базы проведения выборочного обследования. В многоосновном выборочном обследовании используется комбинация нескольких основ отбора. Основная причина использования многоосновного отбора - возможность возместить недостатки каждой основы достоинствами другой. Так, территориальная основа отбора обеспечивает полноту охвата совокупности индивидуальных предпринимателей торговли, в то время как списочная, менее полная, но более эффективная в смысле точности результатов.
Таким образом, для организации выборочного обследования деятельности индивидуальных предпринимателей торговли и общественного питания, учитывая состав имеющихся сведений о них в ЕГРПО, целесообразно использовать комбинированное использование списочной и территориальной основ отбора.
2.1. Принципы применения двухосновного отбора
Для проведения выборочного обследования индивидуальных предпринимателей торговли создаются списочная и территориальная основы наблюдения, которые выступают в качестве двух независимых источников отбора единиц наблюдения. Списочную основу составляют индивидуальные предприниматели, зарегистрированные в региональных разделах ЕГРПО, а территориальную - перечни населенных пунктов в субъектах Российской Федерации.
Выборки индивидуальных предпринимателей извлекаются независимо из каждой из основ. Предполагается, что индивидуальный предприниматель торговли принадлежит данной единице территориальной основы, если он может быть приписан к этой единице после одного или более этапов случайного отбора.
Кроме того, предполагается:
- полнота, т.е. каждая единица целевой совокупности принадлежит, по крайней мере, одной основе;
- опознаваемость, т.е. для каждой единицы наблюдения в любой из основ возможна ее идентификация в другой.
Опознаваемость необходима для корректного распространения выборочных данных, т.е. исключения "двойного счета". Выполнение этого требования связано с практическими трудностями. Поэтому следует осуществлять специальные процедуры сопоставления.
Общий объем выборки обследования определяется на федеральном уровне организатором обследования, исходя из выделенного на его проведение ресурсного обеспечения, и распределяется, например, поровну между выборками из списочной и территориальной основ.
2.2. Отбор из списочной основы
Для осуществления эффективного оценивания показателей выборочного обследования индивидуальных предпринимателей торговли, т.е. обеспечения приемлемой точности результатов распространения выборочных данных на генеральную совокупность обследования, списочную основу отбора целесообразно расслоить по регионам России, видам деятельности и доступной характеристике размера единиц, например, обороту.
Исходя из фиксированного общего объема выборки из списочной основы и формулы размещения объема по слоям, определяются доли отбора в слоях, после чего в каждом слое извлекаются случайные выборки соответствующего объема. Далее осуществляется наблюдение единиц выборки по адресу проживания.
Если в списочной основе отбора отсутствуют признаки, характеризующие размер единиц, и расслоение по ним не может быть выполнено, то для повышения точности результатов обследования на этапе распространения выборочных данных будет применена процедура пострасслоения, которая заключается в расслоении единиц выборки по признаку размера, например, обороту, полученному в ходе проведения наблюдения. Примером такого расслоения может служить группировка индивидуальных предпринимателей по размеру среднего за период (месяц, год) оборота в расчете на 1 предпринимателя (в настоящее время разрабатывается по итогам ежегодного выборочного обследования предпринимателей, осуществляющих деятельность в розничной торговле). При распространении данных выборки на генеральную совокупность методом пострасслоения в каждом постслое (группе предпринимателей по размеру оборота) рассчитывается средняя величина конкретного показателя, которая умножается на число в генеральной совокупности индивидуальных предпринимателей, относимых к данной группе. Следует отметить, однако, что необходимым условием применения пострасслоения является наличие данных сплошного обследования индивидуальных предпринимателей.
2.3. Отбор из территориальной основы
Концепция использования территориальной основы для многоэтапного отбора индивидуальных предпринимателей торговли заключается в следующем.
Первоначально создаются слои, представляющие собой перечень субъектов Российской Федерации. Затем в отношении каждого слоя - субъекта Российской Федерации - создается перечень населенных пунктов, находящихся на территории соответствующего субъекта Федерации, с признаком численности проживающего населения (по данным переписи населения). Затем список населенных пунктов расслаивается по численности населения. В каждом слое отбирается не менее двух населенных пунктов, по которым составляется перечень счетных участков.
Счетный участок - территориальный сегмент, в границах которого путем непосредственного обхода регистрируются, а затем наблюдаются индивидуальные предприниматели, осуществляющие деятельность в торговле или общественном питании. В качестве учетной единицы выступает место торговли: магазин (павильон), киоск - в случае торговли через стационарную сеть, и торговое место на рынке - в случае, если предприниматель торгует на вещевом, смешанном или продовольственном рынке; ресторан, кафе, бар - если предприниматель осуществляет деятельность в общественном питании.
Наблюдение осуществляется на сплошной основе, если в результате первичного обхода обнаружено ограниченное число учетных единиц. Иначе - на основе систематической выборки единиц из созданного во время предварительного обхода списка (более подробно приводится в разд. 3.3.).
3. Порядок формирования выборочной совокупности
Проведение обследования деятельности индивидуальных предпринимателей в торговле организуется на региональном уровне территориальными комитетами государственной статистики выборочным методом, базирующимся на комбинированном использовании списочной и территориальной статистических основ наблюдения для формирования выборки. Единицами наблюдения выступают индивидуальные предприниматели:
1) отобранные из списочной основы;
2) осуществляющие деятельность на территории включенных в выборку населенных пунктов (более подробно приводится в разд. 3.2.).
Общий объем выборки обследования индивидуальных предпринимателей торговли определяется на федеральном уровне структурным подразделением Госкомстата России, осуществляющим ведение статистического наблюдения в сфере торговли, исходя из отведенного на проведение обследования ресурсного обеспечения. Фиксированный общий объем выборки распределяется по регионам России согласно данным текущей отчетности о распределении численности единиц наблюдения по регионам и с учетом обеспечения приблизительно одинаковой точности результатов обследования по субъектам Российской Федерации. Соответствующая расчетная формула приведена в приложении 1.
Формирование списка единиц выборки осуществляется на региональном уровне специалистами территориальных комитетов государственной статистики программными средствами.
3.1. Алгоритм формирования выборки из списочной основы
Формирование выборки из списочной основы (выборки (1) осуществляется на базе пакета "Выборка" с помощью процедуры систематического отбора.
Входные данные.
Списочная основа выборки (1) формируется на базе текущего состояния территориального раздела ЕГРПО. Основа выборки (1) состоит из перечня индивидуальных предпринимателей, занимающихся торговлей, учтенных в ЕГРПО, включая признаки идентификации и классификации. В случае наличия пообъектной количественной информации, характеризующей размер единиц (оборот, торговая площадь и т.п.) соответствующие переменные включаются в основу выборки (1).
Структура записи
Таблица 1
Структура записи списочной основы выборки (базовая совокупность)
Переменные | |||||
идентификации | классификации | размера | |||
ОКПО | наименование | ОКАТО | ОКВЭД | ... | х(1), х(2)...... |
План выборки (1).
Для проведения систематического отбора единицы основы выборки (1) следует упорядочить (сортировать) по возрастанию значений классифицирующих признаков:
- вид деятельности (ОКВЭД);
- код территории (ОКАТО).
Из упорядоченной основы выборки (1) с помощью процедуры систематического отбора формируется список выборки (1). Алгоритм систематического отбора приведен в приложении 2. Объем выборки (1) для целей настоящего алгоритма отбора устанавливается равным половине (50%) общего объема выборки (числа обследуемых единиц), установленного на федеральном уровне организатором обследования.
Такая схема формирования выборки (1) приводит к пропорциональному размещению единиц выборки (1) по видам деятельности и по территории субъекта Российской Федерации.
3.2. Алгоритм формирования выборки из территориальной основы
Формирование выборки из территориальной основы (выборки (2) осуществляется методом многоступенчатого расслоенного случайного отбора территориальных единиц с помощью модуля Complex Samples (сложные выборки) пакета SPPS для Windows. Перечень территориальных единиц создается специалистами территориальных органов государственной статистики.
При создании территориальной основы необходимо руководствоваться общим принципом получения на последнем этапе отбора перечня мелких территориальных единиц (счетных участков, аналогичных формируемым при проведении переписи населения), по возможности однородных по численности проживающего на их территории населения.
Входные данные.
Территориальная основа выборки (2) на региональном уровне формируется на основе кодов ОКАТО населенных пунктов и базы данных Всероссийской переписи населения 2002 года. Технологически оптимальной основой выборки (2) служит перечень счетных участков, использованных в переписи населения, относящихся к населенным пунктам данного субъекта Российской Федерации. В случае невозможности (по объективным причинам) использования на региональном уровне полного перечня счетных участков на каждом этапе отбора следует создавать собственный перечень единиц отбора, например, на первом этапе - список населенных пунктов с признаком численности населения.
Созданный перечень счетных участков должен включать следующие перемененные:
- ТИП - тип населенного пункта, к которому относится данный счетный участок. Выделяются следующие типы:
1) областной (республиканский) центр (ТИП = 1);
2) город (ТИП = 2);
3) поселок городского типа (ТИП = 3):
4) сельский населенный пункт (ТИП = 4).
- СЛОЙ - группа по численности населения населенного пункта, к которому относится данный счетный участок.
- ОКАТО - Общероссийский классификатор объектов административно-территориального деления;
- РАЙОН - район населенного пункта, к которому относится данный счетный участок.
- НАСЕЛ - численность населения населенного пункта, к которому относится данный счетный участок.
План выборки (2).
Этап отбора 1.
На первом этапе осуществляется расслоенный случайный отбор населенных пунктов (или кластеров, состоящих из счетных участков, относящихся к населенным пунктам), расположенных на территории данного субъекта Российской Федерации.
Созданный список первичных единиц отбора (населенных пунктов или кластеров счетных участков) расслаивается по различным значениям переменной ТИП. Далее осуществляется группировка первичных единиц в зависимости от численности населения (НАСЕЛ).
Таблица 2
Группировка первичных единиц отбора
Тип населенного пункта |
Критерий группировки по численности населения, число жителей, человек |
Код типа населенного пункта (ТИП) |
Коды групп первичных единиц отбора (СЛОЙ) |
Областной центр | 1 | 1 | |
Город | Менее 3000 | 2 | 21 |
3000-4999 | 2 | 22 | |
5000-9999 | 2 | 23 | |
10000-19999 | 2 | 24 | |
20000-49999 | 2 | 25 | |
50000-99999 | 2 | 21 | |
100000-499999 | 2 | 22 | |
500000-999999 | 2 | 21 | |
1 млн. и более | 2 | 22 | |
Поселок городского типа |
Менее 3000 | 3 | 31 |
3000-4999 | 3 | 32 | |
5000-9999 | 3 | 33 | |
10000-19999 | 3 | 34 | |
20000-49999 | 3 | 35 | |
50000 и более | 3 | 36 | |
Сельский населенный пункт |
До 50 | 4 | 41 |
51-100 | 4 | 42 | |
101-200 | 4 | 43 | |
201-500 | 4 | 44 | |
501-1000 | 4 | 45 | |
1001-2000 | 4 | 46 | |
2001-3000 | 4 | 47 | |
3001-5000 | 4 | 48 | |
5001 и более | 4 | 49 |
В каждом слое осуществляется простой случайный отбор без возвращения не менее двух первичных единиц. Таким образом, на первом этапе объем выборки должен составить не менее удвоенного числа образованных групп (см. табл. 2). Специалистам ТОГР рекомендуется определить объем выборки, при котором коэффициент вариации оценки по переменной численности населения не превышает 5%.
Этап отбора 2.
На втором этапе во всех отобранных городских населенных пунктах, имеющих в своем составе районы (или иные территориально-административные единицы), осуществляется выборка районов. В этих целях создается список районов (РАЙОГ). В случае наличия информации о численности в них населения, районы следует упорядочить по значениям созданной переменной - НАСЕЛР - численности населения, проживающего в районе.
В каждой отобранной первичной единице (населенном пункте) осуществляется систематический отбор не менее двух вторичных единиц (районов) из упорядоченного по переменной НАСЕЛР списка районов.
Отбор второго этапа (районов) рекомендуется производить только в крупных сельских населенных пунктах.
Этап отбора 3.
На третьем этапе отбора в каждой включенной в выборку вторичной единице (районе) создается список счетных участков. В целях образования территориальных единиц третьего этапа с приблизительно одинаковой численностью населения счетные участки могут укрупняться или разукрупняться в пределах данной вторичной единицы. Для идентификации территориальных единиц отбора третьего этапа (счетных участков) создается переменная порядкового номера счетного участка (НОМСЧ).
В каждой включенной в выборку вторичной единице осуществляется равновероятностный случайный отбор без возвращения не менее 2 единиц.
Выходные данные.
Результатом планирования и формирования территориальной выборки (2) является список счетных участков, извлеченных на третьем этапе отбора.
3.3. Формирование списка индивидуальных предпринимателей торговли, отобранных из территориальной основы (выборка (2))
Сотрудниками территориальных органов государственной статистики путем непосредственного обхода и регистрации наличия должны быть составлены списки индивидуальных предпринимателей торговли, осуществляющих деятельность на территории отобранных на третьем этапе счетных участков. В случае наличия необходимого ресурсного обеспечения следует обследовать всех зарегистрированных предпринимателей.
В противном случае следует определить приемлемый объем выборки и провести систематический отбор из списка осуществляющих деятельность на территории счетного участка предпринимателей во время предварительного обхода.
Для этого в территориальных единицах, включенных в выборку, путем предварительного обхода работниками статистики должны быть созданы перечни (номер и адрес) функционирующих мест торговли*(1). Во время предварительного обхода экспортно по пятибалльной шкале*(2) нужно оценить размер каждого места торговли. При этом учитываются:
- число предпринимателей, осуществляющих деятельность в данном месте торговли;
- приблизительный объем деятельности с учетом реализуемых товарных групп;
- размер торговой площади.
Структура записи
Таблица 3
Структура записи перечня мест торговли, относящихся к выборке (2)
Переменная | Описание |
НОМСЧ | Код счетного участка территориальной выборки (2) |
НОМТМ | Условный код (номер) места торговли |
АДРЕС | Адрес места торговли |
РАЗМЕР | Размер места торговли |
Далее список мест торговли внутри счетного участка ранжируется по возрастанию значений переменной размера торгового места (НОМТМ) и с помощью алгоритма систематического отбора (приложение 2) формируется выборка мест торговли.
4. Пример формирования выборки первого этапа индивидуальных предпринимателей
Ниже приведены описание выполненных действий и результаты контрольного примера формирования выборочной совокупности индивидуальных предпринимателей, осуществляющих деятельность в розничной торговле (по данным одного из субъектов Российской Федерации). Формирование выборки на базе списочной основы наблюдения произведено с применением расслоенного случайного отбора программными средствами пакета прикладных программ "УИС-СТАТЭК". Программные средства формирования выборки территорий многоступенчатым случайным отбором разработаны на основе пакета прикладных программ SPSS.
4.1. Формирование выборки на базе списочной основы наблюдения
Цель - на основе данных о предпринимателях сформировать выборочную совокупность.
Входные данные.
Файл данных на базе текущего состояния территориального раздела ЕГРПО в формате *.txt, содержащий перечень индивидуальных предпринимателей торговли, и включает признаки идентификации:
ОКПО - код предпринимателя по ОКПО;
ФИО - фамилия имя отчество предпринимателя;
ОКАТО - код территории по ОКАТО;
ОКВЭД - код вида экономической деятельности (численный);
OKBЭД N - код вида экономической деятельности (строчный).
Пример:
Файл описатель (1001.ttl)
[Title]
Forma=Перечень индивидуальных предпринимателей
Db=vib_torg
Table=data_1001
Filename=1001.txt
Check_ei=NO
User=<имя пользователя>
Date=<дата выгрузки>
;Del - Определяет записи, которые должны быть удалены
Priz_Out=PR# okpo# fio# okato# okved# okvedn
;Priz_Out - Описывает структуру выгруженных данных
Priz=pr # okpo # fio # okato # okved # okvedn
;Priz - Описывает структуру для загрузки
Файл с данными (1001.txt)
65487468#Кудрявцев Андрей Владимирович#46208501000#520000#52
65487656#3убов Геннадий Николаевич#46220501000#520000#52
65487776#Бодрикова Наталия Николаевна#46220501000#520000#52.62
65487788#Крючкова Ирина Михайловна#46220501000#520000#52
65487974#Медведева Валентина Александровна#46253558000#520000#52
65488229#Чулков Игорь Борисович#46259501000#520000#52.62
65488830#Тыщенко Ольга Васильевна#46215553000#520000#52
42790662#Асташов Николай Эдуардович#46233852011#520000#52.62
60061316#Королев Александр Викторович#46470000000#520000#52.62
60240008#Савицкая Ирина Владимировна#46457000000#520000#52.63
Порядок работы.
1) В режиме "Пакетная загрузка" производится загрузка в справочники и фонд данных "Перечень индивидуальных предпринимателей" (см. рис. 1)*(3).
Для того, чтобы начать загрузку необходимо выбрать (нажатием левой клавиши мышки) из высвечиваемого списка файлы - описатели пришедших текстовых файлов, данные которых необходимо загрузить.
Если список пуст или необходимо обновить его содержимое, нажмите кнопку "Обновить список на загрузку", после нажатия которой из пришедших заархивированных файлов, лежащих в почтовом ящике, просматриваются файлы-описатели текстовых файлов и заполняется список для выбора (если загрузка идет из архивных файлов) или опрашивается директория загрузки на наличие файлов-описателей (файлов с расширением *.ttl).
Любой файл-описатель можно просмотреть и внести в него изменения: либо подведя курсор к соответствующей строке списка и дважды нажав левую клавишу мыши, либо отметив нужную строку списка, нажатием на левую клавишу мыши и выбрав кнопку "Просмотреть описатель".
После того как были выбраны все файлы-описатели, выберите тип загружаемого файла, определите как будет идти загрузка (с первой записи или с контрольной точки, по умолчанию принято, что загрузка идет с первой записи), установите режим загрузки - автоматическая или с подтверждением (по умолчанию установлена автоматическая), определите нужно ли удалять после загрузки архивный файл из почтового ящика, если загрузка идет из архивных файлов, или нужно ли удалять неархивный файл из директории загрузки, и нажмите кнопку "Начать загрузку".
Информация о ходе загрузки выдается в левом верхнем углу окна, где указывается общее число строк в текстовом файле (если в файле-описателе есть строка TOTALROW=число записей), число обработанных строк и число строк, которые были загружены во временную таблицу для дальнейшей проверки на корректность кодовых значений.
Сам файл-описатель исключается из списка на загрузку при условии, что загрузка прошла корректно. Чтобы просмотреть информацию о ходе загрузки, нажмите на кнопку "Протокол загрузки".
Для вызова файла-помощи воспользуйтесь кнопкой "Помощь", для выхода из режима "Загрузки данных" нажмите на кнопку "Выход".
2) В режиме "Ведение нормативно-справочной информации" заполните справочник "Число выборки"*(4) (см. рис. 2).
Справочник заполняется вручную в пункте меню ВЕДЕНИЕ БД -> СПРАВОЧНИКИ -> НОРМАТИВНО-СПРАВОЧНАЯ ИНФОРМАЦИЯ. Выберите справочник и нажмите кнопку "Ведение НСИ". Далее добавьте необходимое значение и нажмите кнопку "Сохранить" для внесения изменения. В справочнике "Число выборки" должна быть внесена одна строка. В случае отсутствия строки или при наличии более одной строки, формирование выборки будет выполнено с ошибкой.
3) В режиме "Рубрикатора фондов" из контекстного меню выполняется пункт "Формирование выборки" (см. рис. 3);
Процедура формирования выборки отрабатывает по алгоритму систематического отбора (см. Приложение 2). Результат выполнения заносится в фонд данных "Выгрузка в SPSS", заполняется справочник предпринимателей.
4) Из фонда "Выгрузка в SPSS" производится выгрузка обменного формата данных.
Для выгрузки информации в обменном формате для последующей передачи данных предназначен режим "Выгрузки данных". Выгруженные данные могут быть переданы в виде текстового *.txt, *.dbf - файла или архивного файла *.lsh, который содержит файл-описатель *.ttl на загрузку информации и текстовый файл с данными *.txt. По умолчанию режим создания архивного файла включен (см. рис. 4).
При выгрузке данных в текстовый файл используются следующие настройки:
- данные выгружаются с дополнительным признаком на загрузку;
- разделитель между полями #;
- разделитель между записями \n, который используется для задания спецсимволов "Конец строки" и "Возврат каретки".
Разделитель между полями может быть изменен на любой из предложенного списка, который высвечивается при нажатии левой кнопки мыши. Разделитель между записями изменению не подлежит. Чтобы не выгружать данные с дополнительным признаком на загрузку, снимите галочку у данного режима. Если необходимо выгрузить данные без создания архивного файла, снимите галочку у режима создать архивный файл.
Пример выходного файла:
pr# okpo # okato # okved # ves
0#60259213#46204501000#520000#21.30
0#117902500#46204501000#520000#21.30
0#117856703#46204501000#520000#21.30
0#91464366#46204501000#520000#21.30
0#81300727#46204501000#520000#21.30
0#81300034#46204501000#520000#21.30
0#62418238#46204501000#520000#21.30
0#117995231#46204819001#520000#21.30
0#117883794#46205558000#520000#21.30
0#117855758#46206501000#520000#21.30
0#117907090#46206501000#520000#21.30
0#117876755#46206501000#520000#21.30
0#117874124#46206501000#520000#21.30
0#84523476#46206501000#520000#21.30
0#65523792#46206501000#520000#21.30
0#117884170#46206501000#520000#21.30
0#117890464#46206501000#520000#21.30
0#117875678#46206501000#520000#21.30
0#117940887#46206501000#520000#21.30
0#117905305#46206501000#520000#21.30
0#117919950#46206501000#520000#21.30
0#117892947#46206501000#520000#21.30
0#117874914#46206501000#520000#21.30
0#117871893#46206501000#520000#21.30
0#117933210#46206501000#520000#21.30
0#117863696#46206501000#520000#21.30
0#117855308#46206501000#520000#21.30
Структура выходного файла:
Признак загрузки # Код предпринимателя # Код территории # ОКВЭД # Вес
4.2. Формирование выборки на базе территориальной основы наблюдения
Цель - на основе файла данных SPSS с информацией о численности населения по всем населенным пунктам субъекта Российской Федерации сформировать территориальную выборку.
Входные данные.
Файл данных SPSS, в котором в качестве наблюдений (строки таблицы данных) выступают записи о населенных пунктах субъекта Российской Федерации (см. табл. 2), включая численность населения (НАСЕЛ), тип населенного пункта (ТИП) и коды группировки по численности (СЛОЙ).
Порядок работы (приведен в табл. 4).
Таблица 4
Выполняемая задача |
Выполняемое действие | Результат |
Сформировать выборку населенных пунктов на основе созданного списка населенных пунктов |
1. Выбрать меню "Анализ... Сложные выборки...Задать параметры выборки" |
Открыто окно "Конструктор отбора" |
2. Щелкнуть "Далее" | Открыто окно сохранения создаваемого файла |
|
3. Ввести имя файла "plan" | ||
4. Щелкнуть "Сохранить" | Открыто окно "Переменные плана" |
|
5. Перенести переменные ТИП и СЛОЙ в поле "Расслоить" (см. рисунок 3). |
||
6. Если наблюдениями в файле территориальной основы отбора являются счетные участки, то также перенести в поле "Кластеры" переменную ОКАТО (идентификатор населенного пункта). |
Выполняемая задача |
Выполняемое действие | Результат |
7. Щелкнуть "Далее" | Открыто окно "Метод отбора" | |
8. Убедиться, что в окне "Метод отбора" параметры установлены, как показано на рисунке 4. |
||
9. Щелкнуть "Далее" | Открыто окно "Объем выборки" |
|
10. В поле "Значение" вводится 2 (показано на рисунке 5). |
Выполняемая задача |
Выполняемое действие | Результат |
11. Щелкнуть "Далее" дважды. | Открыто окно "Сводка плана" | |
12. Убедиться, что в окне "Сводка плана" параметры установлены, как показано на рисунке 6. |
Выполняемая задача |
Выполняемое действие | Результат |
13. Щелкнуть "Готово". | В файле вывода SPSS помещены таблицы, характеризующие созданный план и результаты отбора (рисунок 6). Населенные пункты, включенные в выборку на 1-м этапе отбора, отмечены в файле данных. |
Отбор на втором и третьем этапах реализуется в пакете SPSS описанным выше способом.
Ниже (в табл. 5 и 6) представлены результаты планирования отбора и формирования выборки первого этапа обследования индивидуальных предпринимателей торговли.
Таблица 5
Сводка заданных параметров плана отбора
Этап 1 | |
Переменные плана Расслоение 1 2 Информация о Метод отбора выборке Число единиц отбора Созданные или Вероятность модифицированные включения переменные (отбора) по этапам Кумулятивный выборочный вес по этапам Информация об Предположения процедуры оценки анализе Вероятность включения |
тип слой Простой случайный отбор без возвращения 2 Вероятность Включения_1_ Накопленный Выборочный Вес_1_ Отбор с равными вероятностями без возвращения Получено из переменной Вероятность Включения_1_ |
Таблица 6
Сводка результатов отбора для этапа 1
Тип | слой | Число единиц отбора | Доля единиц отбора | ||
Запрошено | Фактически | Запрошено | Фактически | ||
2.00 21.00 22.00 23.00 24.00 25.00 26.00 27.00 29.00 3.00 31.00 32.00 2 33.00 2 34.00 2 35.00 2 36.00 2 37.00 2 400 41.00 42.00 2 43.00 2 44.00 2 45.00 2 46.00 2 47.00 2 |
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 |
2 2 2 2 2 2 2 1 2 20.0% 11.8% 15.4% 40.0% 28.6% 14.3% 2 50.0% 25.0% 20.0% 14.3% 15.4% 16.7% |
15.4% 16.7% 11.1% 9.5% 7.4% 14.3% 5.9% 200.0% 50.0% 20.0% 11.8% 15.4% 40.0% 28.6% 14.3% 22.2% 50.0% 25.0% 20.0% 14.3% 15.4% 16.7% |
15.4% 16.7% 11.1% 9.5% 7.4% 14.3% 5.9% 100.0% 50.0% 22.2% |
------------------------------
*(1) Под местом торговли понимаются как объекты стационарной торговой сети, так и торговые места на вещевых, смешанных и продовольственных рынках.
*(2) Балл 1 присваивается наименьшим относительно остальных местам торговли.
*(3) Для выполнения загрузки обязательно заполнение справочников Территорий (s_okato) и Видов экономической деятельности (s_okved).
*(4) Вносимая переменная показывает, сколько предпринимателей попадает в выборку.
Приложение 1
Расчетная формула для распределения общего объема выборки индивидуальных предпринимателей, занимающихся торговлей, по субъектам Российской Федерации
Общий объем выборки обследования индивидуальных предпринимателей, занимающихся торговлей, размещается по регионам России исходя из распределения численности единиц наблюдения по регионам и с учетом обеспечения приблизительно одинаковой точности результатов обследования на уровне субъектов Российской Федерации.
a
(X ) x CV(y )
h h
n = n x ---------------------
h a
Сумма (X ) x CV(y )
h h h
Сумма ведется по субъектам Российской Федерации;
n - заданный общий объем выборки в целом по Российской Федерации;
n - объем выборки в h-ом субъекте Российской Федерации;
h
X - показатель оборота индивидуальных предпринимателей, занимающихся
h торговлей, в h-ом субъекте Российской Федерации по итогам
предыдущего цикла обследования;
CV(y ) - оценка коэффициента вариации показателя оборота индивидуальных
h предпринимателей, занимающихся торговлей, в h-ом субъекте
Российской Федерации в текущем периоде наблюдения;
а - параметр "силы размещения", который изменяется в промежутке от
нуля до единицы (обычно выбирается а = 1, 1/2, 1/3).
При а = 1 формула дает размещение близкое к оптимальному, т.е. с минимальной дисперсией оценки. При уменьшении а ослабляется требование к обеспечению приблизительно одинаковой точности результатов выборочного обследования по субъектам Российской Федерации.
Приложение 2
Алгоритм систематического отбора
Входные данные:
(а) Файл, содержащий перечень единиц генеральной совокупности (основы выборки);
(б) Заданный объем выборки (n), (n <= N), где (N) - число единиц в генеральной совокупности.
Процедура, реализующая систематический отбор:
Шаг 1. Присвоить порядковые номера от 1 до (N) единицам основы выборки.
Шаг 2. Рассчитать длину интервала отбора (d):
d = N/n
Примечание. Следует сохранять по возможности большее число десятичных знаков - это нужно для обеспечения в точности заданного объема выборки (n).
Шаг 3. Получить с помощью датчика случайных чисел реализацию равномерно распределенной в интервале (0, d) (исключая ноль и включая значение верхнего предела) случайной величины. Это значение (r_1) будет точкой начала отбора.
Начало отбора (r_1) должно иметь столько же цифр в дробной части, сколько и длина интервала отбора (d).
Примечание. Если датчик случайных чисел компьютерной программы дает только случайные числа в промежутке от нуля до единицы, то полученное значение следует умножить на величину (d).
Шаг 4. Построить кумулятивный ряд начиная с точки начала отбора (r_1) и шагом, равным длине интервала отбора (d).
r = r + d(k - 1), k = 1, 2,... .
k 1
Так для определения второго уровня ряда к первому следует прибавить значение d. Затем, для получения третьего - ко второму нужно также прибавить d и т.д. (в процессе сложения округление не производится).
Шаг 5. Прекратить кумулятивный процесс, когда очередное полученное значение превысит (N); это число отбрасывается.
Шаг 6. Округлить до большего целого все уровни построенного кумулятивного ряда (например, значение 6,238 до 7).
Шаг 7. Включить в выборку все единицы основы с номерами, полученными на шаге 6.
Выходные данные:
Список единиц выборки (1), полученный на шаге 7, с выборочными весами каждой единицы. Выборочный вес рассчитывается как величина обратно пропорциональная доле отобранных единиц в каждой группе классификации по видам деятельности (по ОКОНХ или ОКВЭД).
|
Управление статистики |
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Постановление Госкомстата РФ от 19 декабря 2003 г. N 114 "Об утверждении Методологических положений по проведению выборочного наблюдения индивидуальных предпринимателей, осуществляющих деятельность в торговле и общественном питании, алгоритма формирования выборочной совокупности"
Текст постановления официально опубликован не был
Приказом Росстата от 29 августа 2013 г. N 346 настоящее постановление признано утратившим силу