Компьютерные книги
Главное меню
Главная Поиск по сайту Добавить материал О нас Карта книг Карта сайта
Реклама
computersbooks.net -> Добавить материал -> Теория программирования -> Боровиков В. -> "STATISTICA. Искусство анализа данных на компьютере" -> 153

STATISTICA. Искусство анализа данных на компьютере - Боровиков В.

Боровиков В. STATISTICA. Искусство анализа данных на компьютере — Спб.: Питер, 2003. — 688 c.
Скачать (прямая ссылка): statistikaiskusstvoanalizadannih2003.djvu
Предыдущая << 1 .. 147 148 149 150 151 152 < 153 > 154 155 156 157 158 159 .. 204 >> Следующая


для каждой переменной

¦ I

А

Медиана

Медиана разбивает выборку на две равные части. Пятьдесят процентов набтМИЯ ний лежит ниже медианы, пятьдесят процентов — выше медианы. Если з№*ММН медианы существенно отличается от среднего, то распределение пюшенв (Ив подробно см. главу Элементарные понятия).

Мода

Мода — это максимально часто встречающееся значение в выборке. Частота вгТ(Ж~ чаемости также отображается. Если имеется несколько значений с максима?**”

частотой, то распределение мультимодально. Если каждое значение пстреч5^*1

(jiuiin, одни раз, программа делает запись, моды пет (см. электронную таблицу с. результатами).

Геометрическое среднее

Геометрическое среднее — это произведение всех значении переменной, нолиеден-ное в степень 1/п (единица, деленная на число наблюдений). Геометрическое среднее полезно, например. если шкала измерений нелинейная.

Пусть наблюдается переменная Xпринимающая только положительные значения. То|Да геометрическое срелнее вычисляется как

С(Х) = (ПХ, , ¦

Гармоническое среднее

Пусть наблюдается переменная X, имеющая отличные от 0 значения Тогда гармп-

I иическос среднее вычисляется как

ВД)= l/d/njl/X.fc

Гармоническое среднее меньше геометрического среднего, которое, в свою оче-

I рель, меньше среднего арифметического.

Гармоническое среднее иногда используется для усреднения частот.

Дисперсия и стандартное отклонение

Выборочная дисперсия и стандартное отклонение — наиболее часто используемые меры изменчивости (вариации) данных. Дисперсия вычисляется как сумма квадратов отклонений значений переменной от выборочного среднего, деленная на к-t (но не на и). Стандартное отклонение вычисляется как корень квадратный из оценки дисперсии

Размах

Размах переменной является показателем изменчивости, вычисляется как максимум минус минимум.

Квартальный размах

Квартнльный размах, по определению, равен: верхняя квартиль минус нижняя квар-Ти1ь (75% процентиль минус 25% процентиль). Так как 75% процентиль (верхняя Кй'*ртиль) — это значение, слева от которого находятся 75% наблюдений, а 25/о про-Центиль (нижняя квартиль) — этоаначение, слева от которого находится 25% наблюдений, то квартальный размах представляет собой интервал вокруг медианы. кот°РЫЙ содержит 50% наблюдений (значений переменной).
Глава 13. Непараметрическая ста’

Асимметрия

Асимметрия связана с третьим моментом и определяется формулой (c*J главу 2 )•

Эксцесс

Эксцесс — это характеристика формы распределения, а именно мера остроты ¦ пика (относительно нормального распределения, эксцесс которого равен 0) J правило, распределения с более острым пиком, чем у нормального, имеют »-J._ жительный эксцесс; распределения, пик которых менее острый, чем пик норма**- |

НПГО ПЯГППР.ТР nuuiro ниошт гтппПйТАШ.ч.!» ------

ного распределения, имеют отрицательный эксцесс. Эксцесс моментом и определяется формулой (см. также главу 2):

связан с четверг

где Х = —?х,.

Анализ выживаемости

Введение в анализ выживаемости

Методы анализа выживаемости интенсивно применяются в медицине, биологии, страховании и промышленности

Одной из важных характеристик, описывающих течение болезни, является продолжительность жизни пациентов с момента поступления в клинику или после [ проведения операции.

В принципе, для описания средних времен жизни и сравнения новой методики со старой можно использовать стандартные статистические методы.

Однако рассматриваемые данные имеют специфику, которую след» «*т учитывать. Дело в том, что в медицинской практике мы часто имеем дето с неполюллш j данными.

Это связано с тем, что трудно наблюдать все время жизни пациента после операции. так как пациент мог быть выписан или переведен в другую клинику и связь с ним была утеряна. При этом мы располагаем не полной информацией п времени J жизни пациента, а лишь частичной.

Естественное желание исследователя использовать все данные, то есть анализировать как полные времена жизни, так и неполные. и не терять с трудом собран-Е ную информацию.

Для этого и предназначены методы анализа выживаемости, которые позволяют изучать неполные, или цензурированные, данные

Наблюдения, которые содержат неполную информацию, называются неполными, или цензурированными (например, «пациент А был жив по крайней мере

4 месяца после того, как был переведен в другую клинику и контакт с ним был | потерян»). Это пример цензурированного наблюдения: информация о том, чго

I пациент был жив 4 месяца, важна и может быть использована для построения

I оценок.

Наблюдения от момента операции до летального исхода называются полными.
Предыдущая << 1 .. 147 148 149 150 151 152 < 153 > 154 155 156 157 158 159 .. 204 >> Следующая
Книги
Web-программирован-
ие
Аппаратное обеспечение Графика Руководство по П.О. Самоучитель Теория программирования Фотошоп Языки программирования
Новые книги
Вирт Н. "Систематическое программирование " (Теория программирования)

Эком "Microsoft Excel 2000 шаг за шагом Русская версия самоучитель " (Самоучитель)

Поляков А.Ю. "Методы и алгоритмы компьютерной графики в примерах Vizual C++" (Графика)

Баяковский Ю.М. "Графическая библиотека Open GL " (Графика)

Валиков А. "Технология " (Языки программирования)
Авторские права © 2013 ComputersBooks. Все права защищены.