Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение А
(справочное)
Использование непараметрического статистического критерия Уилкоксона-Манна-Уитни для установления существенности отличия сравниваемых массивов данных
Изменение концентраций химических веществ в речной воде очень часто существенно зависит от влияния таких природных факторов, как изменение расхода и температуры речной воды, наличия или отсутствия ледяного покрова, или от совокупности влияния этих и других факторов. По этой причине для получения представительных данных о выносе (переносе) веществ с речным стоком очень важно выделение наиболее характерных сроков периодичности (сезонности) изменения содержания этих веществ в годовом цикле. Для данной цели наиболее целесообразно использование непараметрического критерия Уилкоксона-Манна-Уитни (критерий ), преимущество которого в состоит том, что он достаточно эффективен при любом виде статистической закономерности распределения концентраций химических веществ в выделяемых периодах времени согласно [2] и РД 52.24.622.
Процедуру сравнения двух выборок данных с целью оценки существенности их отличия проводят следующим образом.
Расчет средних концентраций конкретного химического вещества в сравниваемых выборках данных выполняют по формуле
, (А.1)
где - средняя концентрация s-го вещества в выборке данных;
- i-я концентрация s-го вещества в выборке данных;
n - общее число данных в выборке;
Значения концентраций обеих выборок располагают в общую возрастающую последовательность, например, в виде
|
, |
|
(А.2) |
где , ..., - концентрации первой выборки;
, ..., - концентрации второй выборки.
Каждому значению концентрации в общей возрастающей последовательности присваивают ранг, например
|
|
(А.3) |
||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10. |
|
|
Если в первой и второй выборках имеются одинаковые по значению концентрации, то каждому из них приписывается среднее значение ранга. Например, если , то для рассмотренной последовательности будем иметь
|
|
(А.4) |
||||||||||
|
1 |
2 |
3,5 |
3,5 |
5 |
6 |
7 |
8 |
9 |
10. |
|
|
При получим
|
|
(А.5) |
||||||||||
|
1 |
2 |
4 |
4 |
4 |
6 |
7 |
8 |
9 |
10. |
|
|
Далее отдельно для каждой выборки подсчитывают сумму рангов. Например, для последовательности (А.4) получим
- для первой выборки
|
|
||||
|
2 |
3,5 |
7 |
10 |
(А.6) |
сумма рангов равна 22,5;
- для второй выборки
|
|
||||||
|
1 |
3,5 |
5 |
6 |
8 |
9 |
(А.7) |
сумма рангов равна 32,5.
Значения критерия определяют по формуле
, (А.8)
где - меньшая сумма рангов в сравниваемых выборках;
- число значений концентраций в выборке с суммой рангов ;
Например, для последовательности (А.3) получим
. (А.9)
Если число данных в большей из сравниваемых выборок m* менее или равно восьми , то рассчитывают теоретическое (критическое) значение критерия по формуле
, (А.10)
где n* - число данных в меньшей из сравниваемых выборок.
Примечание - Результат, полученный по формуле (А.10), округляют до первого знака после запятой.
В том случае, если рассчитанное значение больше , то отличие между сравниваемыми выборками принимают незначимым.
Например, для последовательноcти (А.4) при ; ; ; отличие сравниваемых выборок концентраций принимается незначимым (при ).
Если число данных в большей выборке более восьми (m* > 8), то оценка отличия сравниваемых выборок концентраций проводится по критерию z*, который представляет собой приближенно нормированную величину, распределенную по нормальному закону
.(А.11)
В том случае, если рассчитанное значение z* попадает в интервал (-1,28) < z* < 1,28, то отличие между двумя сравниваемыми выборками концентраций принимают незначимым при Р = 0,90.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.