Компьютерные книги
Главное меню
Главная Поиск по сайту Добавить материал О нас Карта книг Карта сайта
Реклама
computersbooks.net -> Добавить материал -> Теория программирования -> Боровиков В. -> "STATISTICA. Искусство анализа данных на компьютере" -> 144

STATISTICA. Искусство анализа данных на компьютере - Боровиков В.

Боровиков В. STATISTICA. Искусство анализа данных на компьютере — Спб.: Питер, 2003. — 688 c.
Скачать (прямая ссылка): statistikaiskusstvoanalizadannih2003.djvu
Предыдущая << 1 .. 138 139 140 141 142 143 < 144 > 145 146 147 148 149 150 .. 204 >> Следующая


Использование критериев, основанных на предположении нормальности, ме того, ограничено шкалой измерений (см. главу Элементарные понятия анаш» данных). Такие статистические методы, как t-критернй, регрессия и т. д., предпсДЦр гают, что походные данные непрерывны. Однако имеются ситуации, когда даин«4&~ скорее, просто ранжированы (измерены в порядковой шкале), чем измерены точ»*»>* Типичный пример дают рейтинги сайтов в Интернете: первую позицию занимает сайт с максимальным числом посетителей, вторую поз|Щиюзак1шаетс<штсмаиЙИ мальным числом посетителей средн оставшихся сайтов (среди сайтов, из котнДОЯ удален первый сайт) и т. д. Зная рейтинги, мы можем сказать, что число посеЛП*»-лей пдного сайта больше числа посетителей другого, но насколько больше, СМЯВ уже нельзя. Представьте, вы имеете 5 сайтов: А, В, С, D, Е, которые располагав** на 5 первых местах Пусть в текущем месяце ми имели следующую расста» »»'* А, В, С, D, Е, а в предыдущем месяце: D, Е, А, В, С. Спрашивается, проы-манМЕ существенные изменения в рейтингах сайтов или нет? В данной ситуации, оч(<1в* но. мы не можем использовать t-критерий, чтобы сравнить эти две группы д ХИМИ и переходим в область специфических вероятностных вычислений (а любо И СП1 гнсгический критерий содержит в себе вероятностную калькуляцию!). Мы |Я суждаем примерно следующим образом: насколько велика вероятность того. отличие в дьух расстановках сайтов вызвано чисто случайными причинами JMII это отличие слишком велико н не может быть объяснено за счет чистой пости. В этих рассуждениях мы используем лишь ранги или перестановки и никак не нспользусм конкретный вид распределения числа посетителе!! на»*»» Для анализа малых выборок и для данных, измеренных в бедных шкала*, ЯР*" меняют непараметрические методы

)аткий обзор непараметрических процедур

По существу, для каждого параметрического критерия имеется, по крайней ¦>дна иепараметрическая альтернатива
краткий обзор иепараметрических процедур

505

В общем, эти процедуры попадают в одну из следующих категорий*

О критерии различия для независимых выборок;

3 критерии различия для зависимых выборок,

3 оценка степени зависимости между переменными.

Вообще, подход к статистическим критериям в анализе данных должен быть прагматическим и не отягощен лишними теоретическими рассуждениями. Имея в своем распоряжении компьютер с системой STATISTICA, вы легко примените к своим данным несколько критериев. Зная о некоторых подводных камнях методов, вы путем экспериментирования выберете верное решение. Развитие сюжета довольно естественно: если нужно сравнить значения двух переменных, то вы используете t-критерий. Однако следует помнить, что он основан на предположении нормальности и равенстве дисперсий в каждой группе. Освобождение от этих предположений приводит к непараметрическим тестам, которые особенно полезны для малых выборок.

Далее имеются две ситуации, связанные с исходными данными: зависимые и независимые выборки, в которых применяется t-критерий для зависимых и независимых выборок соответственно.

Развитие t-критерия приводит к дисперсионному анализу, который используется, когда число сравниваемых групп больше двух. Соответствующее развитие нспа-раметрических процедур приводит к непараметрическому дисперсионному анализу, правда, существенно более бедному, чем классический дисперсионный анализ.

Для оценки зависимости, или, выражаясь несколько высокопарно, степени тесноты связи, вычисляют коэффициент корреляции Пирсона. Строго говоря, его применение имеет ограничения, связанные, например, с типом шкалы, в которой измерены данные, и нелинейностью зависимости, поэтому в качестве альтернативы используются также непараметрические, или так называемые ранговые, коэффициенты корреляции, применяемые, например, для ранжированных данных Если данные измерены в номинальной шкале, то их естественно представлять в таблицах сопряженности, в которых используется критерий хи-квадрат Пирсона с различными вариациями и поправками на точность.

Итак, по существу имеется всего несколько типов критериев и процедур, которые нужно знать и уметь использовать в зависимости от специфики данных. Вам нужно определить, какой критерий следует применять в конкретной ситуации.

Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, и >100), часто не имеет смысла использовать непа-рамегрическую статистику.

Если размер выборки очень мал (например, и - 10 или меньше), то уровни значимости для тех непараметрических критериев, которые используют нормальное приближение, можно рассматривать только как грубые оценки

Различия между независимыми группами. Если имеются две выборки (напри-МеР. мужчины и женщины), которые нужно сравнить относительно некоторого среднего значения, например, среднего давления или количества лейкоцитов в кро-8и т° можно использовать С-тест для независимых выборок.

Непараметрическими альтернативами этому тесту являются критерий серий Вальда—Вольфовица, Манна—Уитни U-тест и двухвыборочный критерий Колмогорова—Смирнова.
Предыдущая << 1 .. 138 139 140 141 142 143 < 144 > 145 146 147 148 149 150 .. 204 >> Следующая
Книги
Web-программирован-
ие
Аппаратное обеспечение Графика Руководство по П.О. Самоучитель Теория программирования Фотошоп Языки программирования
Новые книги
Вирт Н. "Систематическое программирование " (Теория программирования)

Эком "Microsoft Excel 2000 шаг за шагом Русская версия самоучитель " (Самоучитель)

Поляков А.Ю. "Методы и алгоритмы компьютерной графики в примерах Vizual C++" (Графика)

Баяковский Ю.М. "Графическая библиотека Open GL " (Графика)

Валиков А. "Технология " (Языки программирования)
Авторские права © 2013 ComputersBooks. Все права защищены.