Оценка статистической значимости индексов разнообразия

Вычислить индексы разнообразия легко. Но вот что с ними делать дальше? Допустим, выравненность одного сообщества составила 0,65, другого — 0,70. Можно ли говорить, что второе сообщество более разнообразно?

Практически всегда исследователь сравнивает разнообразие двух или более сообществ по выборкам, отражающим сообщество как генеральную совокупность с той или иной степенью случайности. Это значит, что необходима статистическая оценка различий.

Проще всего, когда имеется ряд измерений разнообразия (взято несколько параллельных проб). В этом случае для каждого ряда можно рассчитать некоторые статистики (среднее и стандартное отклонение, или медиану и сумму рангов) и воспользоваться каким-то статистическим критерием. Такая ситуация наблюдается при исследовании почвенной и водной фауны. Но гораздо чаще никаких повторностей нет, и возникает задача сравнить две единицы. Как сказано выше, индекс Шеннона сам является статистическим показателем и позволяет проводить статистическое оценивание «без повторностей».

В настоящее время для решения таких задач все шире применяется ресамплинг (ресэмплинг — resampling)[1]. В отличие от классической статистики он основан на извлечении псевдоповторностей из самой эмпирической выборки (генерации псевдовыборок, размножении выборок). Это своего рода экспериментирование с исходными данными, моделирование данных. Остальная проце-

дура анализа совпадает с классическим анализом: статистические выводы также базируются на классических доверительных интервалах и p-значениях. Методы ресамплинга выполняют обработку различных фрагментов исходного массива эмпирических данных, как бы поворачивая их разными гранями и сопоставляя полученные таким образом результаты. Эти методы реализованы, в частности, в программах Past и R, описанных ниже.

Ресэмплинг объединяет такие методы, как jackknife, bootstrap, permutation Идея исторически первого метода «складного ножа» (jackknife) заключалась в том, чтобы последовательно исключать из имеющейся выборки по одному наблюдению, обрабатывать всю оставшуюся информацию и предсказывать результат в исключенной точке. Основная идея бутстрепа (bootstrap) s состоит в том, что методом Монте-Карло (статистических испытаний) многократно извлекаются выборки из эмпирического распределения на основе генератора псевдослучайных чисел. Таким образом, становится возможным проводить точечное и интервальное оценивание статистических параметров и индексов разнообразия. Рандомизация (перестановочный тест, permutation) позволяет вычислить уровень значимости различия между группами на основании многократных случайных перестановок значений между выборками при сохранении объема исходных выборок. Доля испытаний, в которых статистика псевдовыборок больше или равна статистике реальных выборок, и представляет собой уровень значимости, вероятность случайного возникновения различий. Например, пусть сообщество А имеет более высокий индекс разнообразия, чем сообщество В. Генерируется 1 000 случайных пар выборок с тем же числом особей, что в исходной паре, вычисляется разность индексов разнообразия для каждой пары псевдовыборок. Число случаев, в которых разность индексов разнообразия для псевдовыборок

58 Согласно распространенной версии название метода можно интерпретировать как вытягивание себя за шнурки от ботинок.

больше или равна разности индексов разнообразия для реальных выборок, и есть уровень значимости.

  • [1] Шитиков В. К., Розенберг Г. С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. Тольятти: Кассандра, 2013. 305 с. URL: http://www.ievbras.ru/ecostat/Kiril/Article/A32/Starb.pdf; Шитиков В. К. Статистические методы ресамплига: рандомизация и бутстреп. URL: http://www.ievbras.ru/ ecostat/Kiril/Article/A32/Stare.htm; Шитиков В. К. Использование рандомизации и бут-стрепа при обработке результатов экологических наблюдений // Принципы экологии. 2012. № 1. С. 4-24. URL: http://ecopri.ru/journal/atricle.php?id=481.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >