Методические указания МУ 3.1.3.3394-16
"Методические указания по прогнозированию эпизоотической активности природных очагов чумы Российской Федерации"
(утв. Главным государственным санитарным врачом РФ 19 августа 2016 г.)
1. Область применения
1. Настоящие методические указания определяют методологические основы и порядок проведения эпизоотологического мониторинга в природных очагах чумы на территории Российской Федерации для подготовки прогнозов их эпизоотической активности.
2. Методические указания предназначены для специалистов противочумных учреждений Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека, осуществляющих эпидемиологический надзор и прогнозирование эпизоотической активности природных очагов чумы на территории Российской Федерации.
2. Общие положения
Прогноз эпизоотической активности природных очагов чумы является основой планирования профилактических мероприятий. Внедрение в практику эпидемиологического надзора эколого-эпизоотологических и эпидемиологических прогнозов различной длительности позволяет значительно усовершенствовать стратегию и тактику мониторинга энзоотичных по чуме территорий Российской Федерации, минимизировать негативные эпидемиологические последствия роста эпизоотической активности природных очагов, обосновать приоритетность финансирования конкретных противоэпидемических мероприятий. Современная экономическая, социальная и экологическая обстановка диктует необходимость создания нового методического документа, направленного на разработку долгосрочных и краткосрочных эпизоотологических и эпидемиологических прогнозов.
Внедрение в практику эпидемиологического надзора за чумой эпизоотологических прогнозов различной длительности (на сезон, год и более) даст возможность более точно определять время, место и масштабность обострения эпизоотической обстановки, планировать и оперативно проводить упреждающие профилактические мероприятия, направленные на снижение риска заражения.
Настоящий документ основан на многолетнем опыте работы противочумных учреждений в области прогнозирования эпизоотической активности природных очагов чумы различной биоценотической структуры и разработан взамен "Методических рекомендаций по долгосрочному прогнозированию эпизоотической активности природных очагов чумы" (1991). Приведены конкретные примеры применения различных математических методов при составлении прогнозов эпизоотической активности равнинных и высокогорных природных очагов чумы на территории Российской Федерации.
3. Основные принципы прогнозирования эпизоотической активности природных очагов чумы
Основой прогнозов эпизоотологического профиля служат представления о наличии зависимости эпизоотической активности природных очагов чумы от уровня численности носителей и переносчиков этой инфекции и/или факторов внешней среды. Изменения эпизоотической активности природных очагов чумы во многом связаны с ритмикой атмосферных циркуляционных процессов, формирующих тот или иной гидрометеорологический фон. Важную роль в динамике эпизоотологического процесса играют сезонные и многолетние колебания численности фоновых видов носителей и их эктопаразитов, а также трофический фактор. Для построения эпизоотологических прогнозов различной длительности используют результаты многолетнего эпизоотологического обследования очаговых территорий, эколого-эпизоотологические данные, собранные на пунктах долговременных наблюдений. На основании анализа этих материалов определяют сезонные и многолетние особенности динамики паразитарных систем природных очагов различной биоценотической структуры, равно как и их эпизоотическую активность. В связи с тем, что количественные характеристики паразитарных систем природных очагов чумы получают, как правило, на основании ограниченных выборок, необходимо проводить тщательный подбор анализируемых показателей и статистическую оценку достоверности влияния исследуемых факторов.
Результаты анализа данных эпизоотологического обследования служат основанием для определения не только текущего состояние природного очага чумы, но и выявления основных тенденций дальнейшей динамики его эпизоотической активности. В качестве общего показателя интенсивности эпизоотии также используют долю проб полевого материала с положительным на чуму результатом от числа всех исследованных, а также проводят балльную оценку экстенсивных и интенсивных характеристик выявленной эпизоотии (табл. 1).
Оценку параметров эпизоотического состояния природного очага чумы проводят по формуле:
Х = (A + B + С + D + E) / 5, где
Х - показатель эпизоотического состояния природного очага;
А - показатель результатов бактериологических, иммунологических и генодиагностических исследований;
В - численность основных носителей;
С - численность переносчиков;
D - показатель состояния климатических факторов;
Е - численные показатели состояния астрофизических факторов (показатели приливообразующих сил, в отличие от чисел Вольфа, вычисляют заранее, что имеет большое прогностическое значение).
В зависимости от текущей ситуации по каждой из градаций (А-Е) выставляют соответствующие баллы, а затем вычисляют их среднюю арифметическую.
Соответственно, при среднем балле 1 следует ожидать (табл. 1) единичные проявления чумы или их отсутствие; 2 - отдельные проявления на незначительной территории; 3 - локальные эпизоотии и 4 - обширные разлитые эпизоотии чумы.
Таблица 1
Основные предикторы изменения эпизоотической активности природных очагов чумы
Характеристика эпизоотического состояния природных очагов чумы |
Уровень значений основных предикторов изменения эпизоотической активности очагов |
Количественная оценка используемых предикторов, баллы |
||||
положительные результаты бактериологических, иммунологических, геннодиагностических исследований |
численность доминирующих носителей |
общая численность переносчиков |
климатические характеристики (увлажненность, температурный режим и др.) |
астрофизические характеристики (числа Вольфа, приливообразующая сила) |
||
X |
А |
В |
С |
D |
Е |
|
Отсутствие эпизоотий |
Низкий или его резкое падение |
Повышение или понижение* аридности климата |
Ниже нормы |
1 |
||
Единичные находки зараженных животных |
Ниже среднемноголетних показателей |
Соответствуют среднемноголетним показателям |
Норма |
2 |
||
Локальные эпизоотии |
Соответствует среднемноголетним показателям |
Снижение или повышение* аридности климата |
Значительно выше нормы |
3 |
||
Разлитые эпизоотии |
Выше среднемноголетних показателей и (или) его быстрый рост |
Аномальные отклонения от среднемноголетних показателей |
Аномальные отклонения от нормы |
4 |
||
* Для горных очагов Сибири |
4. Методологические основы краткосрочных и долгосрочных прогнозов эпизоотической активности природных очагов чумы
Методические основы построения краткосрочного прогноза разделяют на два типа: экспертная оценка и количественный прогноз с использованием математической модели. При первом подходе оценивают современное состояние популяций основных и второстепенных носителей и переносчиков чумы, устанавливают тенденции динамики их численности, разрабатывают прогноз эпизоотической ситуации на следующий год (сезон). При этом обычно используется словосочетание "ожидаемая активность выше (ниже или равна) среднемноголетней". В заключение оценивают реальную возможность эпидемических осложнений и дают рекомендации по организации и объему профилактических мероприятий.
Экспертный краткосрочный прогноз состояния природных очагов чумы строится на анализе текущей эпизоотической обстановки на территории конкретного очага с учетом тенденций развития ведущих его биоценотических компонентов. Основой эпизоотологического прогноза являются данные, характеризующие сезонную и многолетнюю динамику эпизоотического состояния очага (сведения о находках переболевших и инфицированных животных, площадь и ландшафтная приуроченность эпизоотических участков, зараженность зверьков по видам в процентах к исследованным, зараженность блох, доля положительных посевов от числа сделанных в процентах, показатели численности носителей и переносчиков и т.д.).
Экспертный краткосрочный прогноз проводится в виде качественной оценки эпизоотического состояния очага, выраженной в четырех уровнях (градациях), соответствующих четырем фазам эпизоотического цикла: рост активности, пик, спад и депрессия. Такой прогноз дает важную информацию о тенденции изменения эпизоотической активности конкретного природного очага чумы. При этом прогностическая активность природного очага оценивается по следующим качественным показателям: единичные находки зараженных чумой животных или их отсутствие, локальные эпизоотии на участках их стойкого проявления, обширные эпизоотии. Поскольку каждый эпизоотический цикл конкретного природного очага чумы характеризуется определенными средними значениями основных показателей состояния его паразитарной системы (показатели численности и зараженности носителей и переносчиков), то с помощью качественного и количественного анализа состояния ведущих его биоценотических компонентов определяется текущий прогностический уровень эпизоотической активности рассматриваемой территории. Для фазы депрессивного состояния природного очага характерна низкая, для фаз роста и спада - средняя, для фазы пика - высокая эпизоотическая активность.
В природных очагах чумы с постоянной эпизоотической активностью качественная оценка текущей фазы эпизоотического цикла осуществляется, как правило, на основании проявляющейся связи между уровнями численности, носителей и переносчиков и показателями их эпизоотической активности. При этом рост эпизоотической активности обычно совпадает с периодом роста численности основных носителей и переносчика. Соответственно, пик эпизоотической активности природных очагов наблюдается в годы пика или начала спада численности основных носителей и переносчиков возбудителя чумы. Минимальная эпизоотическая активность природных очагов, вплоть до установления длительных межэпизоотических периодов, отмечается в периоды, характеризующиеся депрессивным состоянием численности фоновых видов грызунов и их эктопаразитов.
В связи с этим основой качественного прогноза изменения эпизоотической активности природных очагов чумы является соответствующий по длительности прогноз сезонной (многолетней) динамики численности основных носителей и переносчиков возбудителя чумы.
Соответственно, прогнозы численности грызунов - основных носителей возбудителя чумы, строятся на основании результатов оценки плотности их населения, распределения и общего состояния их популяций, а также разностороннего анализа ретроспективной и текущей обстановки на рассматриваемой территории (погодные условия, антропогенные воздействия и др.). Особое внимание следует уделять прогнозированию массовых размножений фоновых видов (обычно основных носителей возбудителя), способствующих активизации очагов и осложнению эпидемиологической обстановки.
Для построения краткосрочного прогноза численности фоновых видов грызунов и их эктопаразитов, а также эпизоотической активности природного очага используют также данные, полученные на пунктах долговременного наблюдения, а именно:
- метеоданные за теплый и холодный периоды года, аномальные погодные явления, состояние кормовых условий существования основных и второстепенных носителей чумы;
- характер переживания основными и второстепенными носителями чумной инфекции холодного периода года;
- показатели фоновой численности перезимовавшего поголовья зверьков;
- для популяций малого, длиннохвостого и даурского сусликов - даты пробуждения, расселения, залегания в спячку и т.д.;
- ход размножения основного носителя, а также видов грызунов и зайцеобразных, играющих заметную эпизоотологическую роль (начало, конец размножения, для полиэстральных видов - сроки и интенсивность вступления в размножение молодняка текущего года рождения, наличие повторного размножения перезимовавших самок);
- показатели численности основного носителя, равно как и других видов мелких млекопитающих, в первую очередь домовой мыши, в открытых и закрытых стациях;
- прогностические параметры численности основных и дополнительных переносчиков чумы в открытых стациях;
- данные по видовому составу и численности эктопаразитов в населенных пунктах;
- сведения о ходе размножения переносчиков чумы (особенности размножения в текущем году, сроки и интенсивность откладки яиц и выплода молодых, изменения возрастного состава популяций и т.д.);
- показатели численности и активность основных переносчиков чумы (характер изменения численности, периоды смены генераций, обилие мигрирующих блох, обилие блох на основных и второстепенных носителях чумы и т.д.).
На основании этих данных оценивают возможные причины происшедших изменений и вероятность дальнейших перестроек в биоценотических комплексах и эпизоотическом состоянии природных очагов чумы. В связи с этим только комплексный анализ факторов, оказывающих влияние на паразитарную систему природных очагов чумы, а также выделение среди них ведущих, является непременным условием при прогнозировании ожидаемых изменений их эпизоотической активности. В то же время следует учитывать, что все прогнозы природных явлений, находящихся под влиянием большого числа разнородных факторов, часто недостаточно точны, по своей сути сугубо относительны и характеризуются определенными пространственно-временными параметрами. В практике эпизоотологического мониторинга используют, как правило, краткосрочные прогнозы, составленные для конкретных территорий на ближайшие полгода или год.
При составлении эпизоотологического прогноза для конкретного природного очага чумы также оценивают реальную возможность эпидемических осложнений и дают рекомендации по организации комплекса профилактических мероприятий (содержание, сроки, дислокация и объемы дератизационных и дезинсекционных обработок, необходимость санпросветработы среди местного и приезжего населения, их вакцинации, специальной подготовки организаций общей медицинской сети к возможным обострениям эпидемиологической обстановки. С этой целью составляют прогнозы буферных зон (площади) эпизоотий, на которых необходимо проводить профилактические (противоэпидемические) мероприятия.
Теоретической предпосылкой долгосрочного прогнозирования служат представления о том, что крупные колебания эпизоотической активности очагов представляют собой результат совместного влияния составляющих их периодических флюктуаций меньшей длительности. При наложении пиков нескольких мелких периодов проявляется максимальное значение более крупного цикла. При этом ряд лет, вошедших в краткосрочные прогнозы, может стать основой для долгосрочного прогнозирования, так как он дает возможность выделить значимые факторы и оценить их статистически. При этом выбор критериев (предикторов) прогнозирования эпизоотической активности природных очагов чумы ведется с помощью статистических методов при программном обеспечении ПК пакетом Statistica или его аналогов.
Прогноз эпизоотической активности природных очагов чумы на территории Российской Федерации на первое полугодие представляется к 15 декабря; на второе полугодие - к 15 июля. Долгосрочный прогноз эпизоотической активности природных очагов чумы разрабатывается на 5 лет.
4.1. Методы выявления факторов, связанных с изменением эпизоотической активности природных очагов чумы
В настоящее время в биологических исследованиях широко применяют компьютерные программы Statistica и Excel и другие пакеты для статистической обработки данных.
Анализ данных следует начинать с ввода исходных количественных значений в электронную таблицу этих программ. Обычно по горизонтали (верхняя строка) вводятся наименования анализируемых показателей, по вертикали (столбцы или графы) - их количественные значения. В программе Statistica для этого используют модуль "Описательная статистика". Для сжатого описания временных рядов использованы статистические параметры: средняя арифметическая (характеризует центральную тенденцию) и период (интервал времени между двумя уровнями временного ряда с одинаковой фазой). Амплитуду колебаний значений временного ряда не анализировали, но при необходимости она может быть охарактеризована величиной показателя дисперсии, среднего квадратического отклонения или коэффициентом вариации. В программе Excel для такого анализа данных используют модуль "Анализ данных" => "Описательная статистика".
Существует два основных подхода к экстраполяции (прогнозу) значений временных рядов: путем выявления экологических предикторов (факторное прогнозирование) или моделирование тенденций развития исходной последовательности. Каждая статистическая компьютерная программа содержит определенный набор методов для решения этих задач. Выделить один метод в качестве наиболее "правильного" невозможно. Обусловлено это тем, что каждый из них лучше аппроксимирует временные ряды определенного типа, в разной степени отвечает решаемым на данный момент исследователем задачам, техническим возможностям, уровню подготовки исполнителя и т.д. Для целей выявления факторов, связанных с исходным временным рядом, используют корреляционный, регрессионный и дискриминантный анализы.
Корреляционный анализ
Корреляция - мера связи между переменными. Различают линейную и нелинейную зависимости. Линейная связь описывается коэффициентом корреляции Пирсона (r) и характеризует степень пропорциональности изменения переменных (тесноту связи). Коэффициент корреляции является безразмерной величиной. Значение коэффициента корреляции не зависит от масштаба измерения и изменяется в пределах от -1,0 до +1,0. Значение, равное 1,0, (по абсолютной величине) показывает, что переменные связаны функционально. Если - связь считается слабой; при - умеренной; - указывает на тесную зависимость между исследуемыми переменными.
Если связь между переменными нельзя описать прямой (или близкой к ней) линией, то либо связи нет, либо корреляция между переменными носит нелинейный характер. Для выявления связи нелинейного характера используется непараметрический коэффициент корреляции Спирмена. Его значения также изменяются в пределах от -1,0 до +1,0. Используя модуль "Анализ данных" => "Гистограмма", нужно проверить форму распределения данных. Если распределение значительно отличается от нормального, необходимо использовать непараметрические методы статистики (Спирмена или Кендала).
Главным источником информации о надежности корреляции служит уровень значимости (р), который зависит от объема проведенных наблюдений. Уровень значимости более 0,05 свидетельствует, что связь между значениями переменных не доказана.
Применение корреляционного анализа следует, по возможности, сопровождать биологической интерпретацией полученных результатов, так как само наличие связи не является доказательством причинно-следственной обусловленности явлений.
Перед проведением корреляционного анализа определяют тип связи: линейный или нелинейный.
Например, в программе Statistica для этого применяется вложение "Графики", которое выводит результаты на экран. Если зависимость носит нелинейный характер (точки не укладываются на изображенную линию регрессии), дальнейшую обработку материалов проводят с применением коэффициент корреляции Спирмена, который выводится на экран в виде таблицы (табл. 2).
Таблица 2
Итоговая таблица в программе Statistica
... |
Valid |
Spearman |
t(N - 2) |
p-level |
Признак |
... |
... |
... |
... |
Примечание. Valid - число измерений признаков, Spearman - значение коэффициента корреляции Спирмена, t(N-2) - число степеней свободы, p-level - уровень значимости. Жирным шрифтом в таблице выделяются значения коэффициента корреляции при уровне значимости менее 0,05 (то есть, достоверные) |
При линейной связи в программе Excel для вычисления коэффициента корреляции Пирсона в меню "функция" вызывают команду "КОРРЕЛ", а дальше необходимо следовать инструкциям ее диалогового окна. Коэффициент корреляции Спирмена эта программа не вычисляет. Но его можно рассчитать "вручную", воспользовавшись возможностями Excel по ранжированию значений временных рядов. При этом каждый ряд ранжируется отдельно. Меньшему значению в ряде присваивается ранг 1, наибольшему - ранг, соответствующий числу сравниваемых наблюдений (естественно, их число в рядах должно быть одинаковым). Корреляция Спирмена рассчитывается по формуле:
, где
- сумма квадратов разностей между попарно связанными рангами значений;
n - число пар сравниваемых значений.
Оценка достоверности коэффициента корреляции может быть проведена исходя из числа степеней свободы (n - 2). Достоверны коэффициенты корреляции, которые превышают табличные значения при уровне значимости 0,05 и меньше.
В случае если интересует связь исследуемой переменной с несколькими факторами, возможно проведение одновременного корреляционного анализа всех рядов. Для этого необходимо построить матрицу парных коэффициентов корреляции (табл. 3).
Таблица 3
Общий вид матрицы парных коэффициентов корреляции в программе Excel
Исследуемые ряды |
А |
В |
С |
D |
А |
1 |
|||
В |
1 |
|||
С |
1 |
|||
D |
1 |
Так как коэффициент корреляции - мера связи симметричная (т.е., ; и т.д.), то достаточно анализировать лишь верхнюю (над диагональю) или нижнюю части таблицы. Значения диагонали равны единице в силу полной связи значений каждого ряда, при коррелировании его самим с собой.
Матрицу парных коэффициентов корреляции можно рассчитать в любой из компьютерных статистических программ. Так, в Excel для этого необходимо войти в диалоговое окно "Сервис", затем - "Анализ данных..." и "Корреляция". Если команда "Анализ данных" не высвечена в меню "Сервис", так как ранее никогда не использовалась, то ее можно активировать. Для этого необходимо войти в пункт "Надстройки" диалогового окна "Сервис" и активировать команду "Пакет анализа".
Таким образом, с помощью корреляционного анализа выявляются факторы, достоверно и в наибольшей степени связанные с зависимой переменной, которые могут быть в дальнейшем использованы для построения статистических моделей прогноза. Однако необходимо помнить, что перед выбором метода корреляционного анализа нужно определить характер распределения данных и выбрать соответствующий метод корреляционного анализа.
Регрессионный анализ
Регрессия показывает, насколько изменится (и какие значения примет) исследуемая переменная при изменении независимой переменной на единицу.
При этом можно изучать обилие видов, показатели приспособленности особей, изменение факторов окружающей среды и т.д. Переменная, описывающая обилие или любую другую характеристику вида (например, уровень рождаемости, смертности, активности и т.д.), является зависимой (объясняемой, обозначается Y), а переменные, характеризующие время или действие факторов среды - независимыми (объясняющими) переменными (обозначаются , ).
Зависимость между переменными величинами Y и Х можно выразить математически с помощью формул и уравнений, а также графически в виде геометрического места точек в системе прямоугольных координат (диаграмма рассеяния). В регрессионном анализе программа строит линию регрессии так, чтобы минимизировать квадраты отклонений этой линии от реально наблюдаемого разброса точек. В практических исследованиях с целью прогнозирования возникает необходимость описать диаграмму рассеяния математическим уравнением.
При рассмотрении изменения двух переменных (в двухмерном пространстве) прямая линия на плоскости задается уравнением
Y = a + bX, где
Y - зависимая переменная (обилие, площадь эпизоотий, число культур возбудителя и т.д.);
a - константа (свободный член уравнения регрессии);
b - угловой коэффициент (регрессионный);
Х - независимая переменная (обычно - это год, месяц и т.д.).
В случае рассмотрения влияния на эпизоотический процесс нескольких факторов (многомерный анализ), когда имеется более одной независимой переменной, процедура множественной регрессии будет оценивать параметры линейного уравнения вида:
, где
а - константа;
, , - регрессионные коэффициенты, отражающие вклады каждой независимой переменной (, , ) в предсказание зависимой переменной.
Парная и множественная регрессия применимы к данным, зависимость между которыми носит линейный характер. При этом линия регрессии выражает наилучшее предсказание Y по X. На практике природные явления очень редко бывают полностью предсказуемыми, поэтому на графике наблюдается существенный разброс точек относительно идеально построенной прямой. Отклонение отдельной точки от линии регрессии называется остатком. Чем меньше величина значений остатков по отношению к общему разбросу значений, тем более точным является прогноз. Следует учитывать, что увеличение числа изученных факторов, которые влияют на исследуемую переменную, увеличивает точность прогноза, но требует увеличения длины временного ряда. Для корректного факторного прогноза на каждый предиктор должно приходиться не менее 10-15 исследуемых наблюдений. Из итоговой таблицы регрессионного анализа в уравнение регрессии берутся данные по количественным значениям константы а- и b-коэффициента с учетом их знака. При этом в уравнение включаются только параметры, для которых уровень значимости р < 0,05. Таким образом, уравнение прогноза и выбор количества используемых в нем предикторов опирается на: 1) оценку их значимости; 2) необходимую для корректного прогноза длину временного ряда. То есть в случае 45 наблюдений в уравнение прогноза нельзя включать более 3 предикторов. В случае 100 наблюдений - более 7 и т.д.
Множественный регрессионный анализ может быть выполнен в Excel или Statistica.
Для расчетов множественной регрессии в Excel следует пользоваться пунктом "Регрессия" диалогового окна "Анализ данных", который находится в основном меню "Сервис".
При работе методом регрессионного анализа данные в электронную таблицу Statistica вводятся следующим образом: в первый столбец вводятся количественные значения зависимой переменной (Y), в остальные - значения измеренных параметров (, ), на основе которых предполагается прогнозирование поведения зависимой переменной.
В ходе применения анализа множественной регрессии на экран выводится информационное окно, в котором содержатся количественные значения промежуточных расчетов коэффициентов и полная информация об анализе.
Конечные результаты регрессионного анализа выдают в виде табл. 4, в которой представлены количественные значения всех коэффициентов регрессии.
Таблица 4
Пример итоговой таблицы регрессионного анализа в программе Statistica
|
Beta |
Std. Err. of Beta |
b |
Std. Err. of b |
p-level |
Intercept (а) |
... |
... |
... |
... |
... |
Параметр 1 |
... |
... |
... |
... |
... |
Параметр 2 |
... |
... |
... |
... |
... |
Параметр 3 |
... |
... |
... |
... |
... |
Параметр 4 |
... |
... |
... |
... |
... |
Примечание. Intercept (а) - свободный член уравнения регрессии; Beta - стандартизированный коэффициент регрессионного уравнения (коэффициент при независимой переменной); Std.Err. of Beta - стандартная ошибка Beta; b - угловой коэффициент для каждой переменной; Std.Err. of b - стандартная ошибка углового коэффициента; p-level - уровень значимости; выделены значимые коэффициенты при уровне значимости р < 0,05 |
Из итоговой таблицы в уравнение регрессии берут данные по количественным значениям константы а- и b-коэффициентов с учетом их знака. При этом в уравнение включают только параметры, для которых уровень значимости р < 0,05, причем в количестве, которое позволяет анализировать имеющаяся длина временного ряда.
По итогам применения регрессионного анализа делают вывод, какие из проанализированных независимых переменных вносят наибольший вклад в предсказание поведения зависимой переменной.
В ходе корреляционного анализа нередко выявляется, что факторы, влияющие на независимую переменную, достоверно и в сильной степени (то есть, r > 0,7) коррелируют между собой (видно из матрицы корреляций - табл. 3). В этом случае в уравнении линии регрессии следует использовать лишь один из двух факторов, обычно в наибольшей степени связанный с зависимой переменной.
Для применения регрессионного анализа необходимо наличие тесных корреляционных связей между объектом и признаком (переменной). Кроме того, связь объекта прогнозирования с признаком с течением времени может слабеть и даже меняться на противоположную. Поэтому такие модели требуют ежегодной корректировки. Обычно прогнозирование методами регрессии без корректировки укладывается в пределы доверительного интервала только на 2-3 прогнозных периода.
Дискриминантный анализ
Этот вид анализа используется для принятия решения о том, какие переменные разделяют (дискриминируют) две или более формирующиеся совокупности наблюдений. Для осуществления данного анализа необходимо иметь одну качественную характеристику объекта и несколько количественных (не менее 5). В конечном итоге нужно сделать выводы о строгом соответствии количественных характеристик определенным качественным или, напротив, о невозможности четкого разделения объектов на основе количественных параметров.
Ввод данных в электронную таблицу Statistica осуществляют следующим образом: по горизонтали - признаки объектов, по вертикали - классифицируемые объекты по порядковым номерам групп. На основе анализа выбирают переменные, имеющие наибольшие (по модулю) значения линейных коэффициентов и вносящие наибольший вклад в разделение групп. На основе итоговой таблицы оценивают процент правильных отнесений объектов к каждой группе. Если процент высок, то можно говорить о высокой предсказательной способности дискриминантной функции.
Апробированные методы обработки материалов эколого-эпизоотологического профиля позволяют рекомендовать этот комплекс статистических методов анализа для разработки статистических моделей динамики эпизоотической активности природных очагов чумы.
4.2. Анализ временного ряда на неслучайность и стационарность
Общий алгоритм последовательного анализа временного ряда с целью его экстраполяции (прогноза) отражен на рис. 1. На первом этапе анализа необходимо убедиться, что исследуемый временной ряд не является случайным набором наблюдений, не связанных между собой никакими закономерностями. Для этого можно воспользоваться рассмотрением графиков процесса. Однако визуальный анализ при отсутствии выраженных линейных трендов не всегда позволяет выявить наличие закономерностей, т.е. неслучайность временного ряда. Одним из методов объективного решения этой задачи является нахождение коэффициента автокорреляции , характеризующего связь между последовательными наблюдениями этого же временного ряда.
Очевидно, что в предположении о случайном характере колебаний наблюдений в исследуемом ряду связи между предыдущими и последующими значениями быть не должно. В этом случае прогноз невозможен (рис. 1). Альтернативное предположение допускает зависимость величины последовательных значений друг от друга или, иными словами, неслучайность временного ряда.
Для расчета коэффициента автокорреляции в программе Excel интересующий ряд значений эпизоотической активности природного очага чумы необходимо повторно копировать в электронную таблицу значения исходного ряда таким образом, чтобы первое его значение совпадало со вторым, затем с третьим и так далее. Затем между первым (исходным) рядом и каждой следующей его копией вычисляют обычный коэффициент корреляции Пирсона (разд. 4.1), но так как этот показатель рассчитывается между значениями одного и того же ряда, то он имеет специальное название - коэффициент автокорреляции . Применение коэффициента автокорреляции "на практике" дано на рис. 4 прилож. 2.
Значения изменяются в пределах: . Как и для обычного коэффициента корреляции, чем ближе значения к 1 по абсолютной величине, тем сильнее связь между наблюдениями в ряду.
Если значим, то ряд неслучаен. Следовательно, возможен прогноз его значений после выяснения закономерности, которой он подчиняется. Кроме того, величина коэффициента автокорреляции позволяет делать предварительные выводы о периоде колебаний. Высокие положительные значения достоверного указывают либо на наличие выраженного тренда (что обычно видно визуально на графике), либо на низкочастотные (длиннопериодические) колебания. Значимый отрицательный коэффициент свидетельствует о высокочастотных колебаниях.
Совокупность последовательных значений (, , ... ) называют коррелограммой. Если значим хотя бы один коэффициент из серии , то это является основанием, чтобы отвергнуть предположение о случайности исходного временного ряда. Вместе с тем с увеличением порядка вычисляемого коэффициента автокорреляции надежность оценки резко уменьшается. В настоящее время принято считать, что корректен расчет порядка, не превышающего величины отношения n/4, где n - длина исходного временного ряда.
Программа Statistica после ввода в нее исходного ряда может выдать график или последовательные значения коррелограммы этого ряда с указанием границ. В случае выхода за пределы границ одного из коэффициентов автокорреляции исходный ряд можно отнести к неслучайным. Эта процедура легко выполняется в модуле Time Series/Forecating, переход в который осуществляется в меню "Переключатель модулей" (Module Switch).
4.3. Трансформация временного ряда к стационарному виду
В данном разделе рассмотрим два способа трансформации нестационарного ряда к стационарному в качестве этапа подготовки модели прогноза (рис. 1): метод последовательных разностей и удаление тренда из исходного ряда путем нахождения аппроксимирующего его уравнения. Оба способа легко реализуются в модуле Time Series/Forecating программы Statistica. Кроме того, соответствующие расчеты могут быть проведены в программе Excel.
Для преобразования нестационарного временного ряда (рис. 2, А) к стационарному можно использовать прием взятия разностей между двумя последовательными значениями наблюдений (рис. 2, Б). Такие разности называются первыми. Если в ряду, представляющем, первые разности, вновь найти последовательные разности, то получим ряд вторых разностей и так далее. Считается, что нахождение первой-второй разности - процедура вполне достаточная для удаления трендов и приведения большинства временных рядов к стационарному виду.
Существует также способ приведения исходного ряда (рис. 2, А) к стационарному путем удаления из него тренда (рис. 2, В). При этом на первом этапе определяют тип тренда. Эта процедура называется также заданием аналитического уравнения тренда. Любая компьютерная программа статистических расчетов содержит несколько простых функций для аппроксимации данных, то есть создания аналитических уравнений.
В Excel это можно сделать по следующей схеме.
1. Создать график исходного временного ряда с помощью диалогового окна "Мастер диаграмм" основного меню программы.
2. Установив курсор мышки на исследуемой кривой, путем нажатия правой клавиши вызвать диалоговое окно, содержащее команду "Добавить линию тренда...". Программа позволяет выбрать для аппроксимации имеющихся данных четыре простых (линейный, логарифмический, степенной, экспоненциальный) и полиномиальный тренды.
3. Перейдя в меню "Параметры" этой же панели управления, отметить необходимость вывода на график формулы аналитического уравнения выбранного тренда и величины коэффициента детерминации . Чем больше , тем лучше уравнение тренда описывает исходные данные. Желательно, чтобы в подобранном аналитическом уравнении был не ниже 0,7-0,8.
4. Рассчитать ожидаемые значения временного ряда по полученному аналитическому уравнению тренда. Если в ряду есть выраженный линейный тренд или подобранное аналитическое уравнение его хорошо описывает, то данный этап может стать и последним. То есть, остается по полученному уравнению определить показатель эпизоотической активности природного очага чумы на следующий сезон. Если же исходный временной ряд циклический и нестационарный, то надлежит перейти к следующему этапу его трансформации к стационарному виду.
5. Из каждого исходного наблюдения временного ряда необходимо вычесть значение, полученное по уравнению тренда. В результате временной ряд остатков становится стационарным (рис. 2, В). При этом если получивший после удаления тренда преобразованный ряд описывается как случайный, то прогноз изучаемого процесса нужно проводить по уравнению тренда. Если исследуемый временной ряд (например, эпизоотическая активность природного очага чумы) не представляет набора случайных чисел и является стационарным относительно центральной тенденции (рис. 2, Б и В), можно перейти к аппроксимации его значений в будущее одним из ниже рассмотренных методов (прилож. 2).
Руководитель Федеральной службы |
А.Ю. Попова |
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приведены Методические указания МУ 3.1.3.3394-16 "Методические указания по прогнозированию эпизоотической активности природных очагов чумы Российской Федерации".
Они определяют методологические основы и порядок проведения эпизоотологического мониторинга в природных очагах чумы на территории нашей страны для подготовки прогнозов их эпизоотической активности.
Указания предназначены для специалистов противочумных учреждений Роспотребнадзора, осуществляющих эпидемиологический надзор и прогнозирование эпизоотической активности природных очагов чумы.
Методические указания МУ 3.1.3.3394-16 "Методические указания по прогнозированию эпизоотической активности природных очагов чумы Российской Федерации" (утв. Главным государственным санитарным врачом РФ 19 августа 2016 г.)
Текст методических указаний опубликован в Бюллетене нормативных и методических документов Госсанэпиднадзора, март 2017 г., N 1
Разработаны Федеральной службой по надзору в сфере защиты прав потребителей и благополучия человека (А.Ю. Попова, В.Ю. Смоленский, Ю.В. Демина, Н.Д. Пакскина, Е.С. Зенкевич), ФКУЗ "Противочумный центр" Роспотребнадзора (В.Е. Безсмертный, Ю.М. Федоров, В.П. Попов), ФКУЗ "Российский научно-исследовательский противочумный институт "Микроб" Роспотребнадзора (В.В. Кутырев, Н.В. Попов, Е.В. Куклев, В.П. Топорков, А.А. Кузнецов, О.В. Кедрова, С.А. Яковлев, А.М. Поршаков, А.В. Иванова), ФКУЗ "Иркутский научно-исследовательский противочумный институт" Роспотребнадзора (А.Я. Никитин, В.М. Корзун, Е.В. Чипанин, В.В. Балахонов), ФКУЗ "Ставропольский научно-исследовательский противочумный институт" Роспотребнадзора (В.М. Дубянский, М.П. Григорьев, О.В. Малецкая, Д.С. Агапитов, Ю.М. Евченко, А.Н. Куличенко), ФКУЗ "Астраханская противочумная станция" Роспотребнадзора (А.А. Ковалевская)