Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение А
(справочное)
Использование непараметрического статистического критерия Вилькоксона-Манна-Витни (критерия ) для установления существенности отличия сравниваемых массивов данных
Изменение концентраций ЗВ в речной воде очень часто существенно зависит от влияния таких природных факторов, как изменение расхода и температуры речной воды, наличия или отсутствия ледяного покрова или от совокупности влияния этих и других факторов. По этой причине для получения представительных данных о выносе (переносе) ЗВ с речным стоком очень важно выделение наиболее характерных сроков периодичности (сезонности) изменения содержания этих веществ в годовом цикле. Для данной цели наиболее целесообразно использование непараметрического критерия Вилькоксона-Манна-Витни (критерий ), преимущество которого состоит в том, что он достаточно эффективен при любом виде статистической закономерности распределения концентраций ЗВ в выделяемых периодах времени согласно [5] и РД 52.24.622.
Неравномерность содержания того или иного ЗВ в сечении реки (особенно для рек с широким руслом) может быть связана прежде всего с относительно медленным смешением загрязненных масс воды, поступающих в реки со сточными, коллекторными и дренажными вещами#, а также водами загрязненных притоков. Выделение и последующий учет при расчете выноса существенной струйности в реке позволяет существенно повысить точность таких расчетов. Для решения указанной задачи также целесообразно использовать непараметрический критерий Вилькоксона-Манна-Витни (критерий ).
Процедура сравнения двух выборок данных с целью оценки существенности их отличия проводят следующим образом:
а) выполняют расчет средних концентраций конкретного ЗВ в сравниваемых выборках данных по формуле:
, (А.1)
где:
- средняя концентрация k-го ЗВ в j-й выборке данных;
- 1-я концентрация k-го ЗВ в j-й выборке данных;
n - общее число данных в j-й выборке;
б) значения концентраций обеих сравниваемых выборок располагают в общую возрастающую последовательность, например, в виде:
, (А.2)
где:
- концентрации ЗВ, принадлежащие первой выборке;
- концентрации ЗВ второй выборки.
Каждому значению концентрации в общей возрастающей последовательности присваивают ранг, например:
Общая последовательность сравниваемых данных... |
(А.3) |
||||||||||
Ранг... |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Если в первой и второй выборках имеются одинаковые по значению концентрации, то при составлении общей последовательности им приписывают одинаковый средний ранг. Например, если , то для рассмотренной последовательности будем иметь:
Общая последовательность сравниваемых данных... |
(А.4) |
||||||||||
Ранг... |
1 |
2 |
3,5 |
3,5 |
5 |
6 |
7 |
8 |
9 |
10 |
при получим:
Общая последовательность сравниваемых данных... |
(А.5) |
||||||||||
Ранг... |
1 |
2 |
3 |
4 |
4 |
4 |
7 |
8 |
9 |
10 |
Отдельно для каждой выборки подсчитывают сумму рангов. Например, для последовательности (А.4) получим:
Концентрация |
Ранг |
2 |
|
3,5 |
|
7 |
|
10 |
|
Сумма рангов |
22,5 |
Концентрация |
Ранг |
1 |
|
3,5 |
|
5 |
|
6 |
|
8 |
|
9 |
|
Сумма рангов |
32,5 |
Численные значения критерия определяют по формулам:
, (А.5)
, (А.6)
где:
- меньшая сумма рангов в сравниваемых выборках;
- число значений концентраций в выборке с суммой рангов ,
- большая сумма рангов в сравниваемых выборках;
- число значений концентраций в выборке с суммой рангов .
Например, для последовательности (А.3) критерий будет равен:
.
Если число данных в большей из сравниваемых выборок m* меньше или равно восьми (m* <= 8), то рассчитывают теоретическое (критическое) значение критерия по формуле:
, (А.7)
где n* - число данных в меньшей из сравниваемых выборок.
Примечание - Результат, полученный по формуле (А.7), округляют до первого знака после запятой.
В том случае, если рассчитанное значение больше, чем , разницу между сравниваемыми выборками считают несущественной. Для последовательности (А.4):
; ;
;
.
Разница концентраций в сравниваемых выборках несущественна (незначима при Р ~ 0,90).
Если число данных в большей выборке более восьми (m* > 8), то оценка различия концентраций ЗВ в сравниваемых выборках проводится по критерию z, который представляет собой (приближенно) нормированную величину, распределенную по нормальному закону:
. (А.8)
В том случае, если рассчитанная величина z попадает в интервал -1,28 < z < 1,28, разницу между концентрациями двух сравниваемых выборок считают несущественной (незначимой при Р = 0,90).
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.