Компьютерные книги
Главное меню
Главная Поиск по сайту Добавить материал О нас Карта книг Карта сайта
Реклама
computersbooks.net -> Добавить материал -> Теория программирования -> Боровиков В. -> "STATISTICA. Искусство анализа данных на компьютере" -> 155

STATISTICA. Искусство анализа данных на компьютере - Боровиков В.

Боровиков В. STATISTICA. Искусство анализа данных на компьютере — Спб.: Питер, 2003. — 688 c.
Скачать (прямая ссылка): statistikaiskusstvoanalizadannih2003.djvu
Предыдущая << 1 .. 149 150 151 152 153 154 < 155 > 156 157 158 159 160 161 .. 204 >> Следующая


График функции риска достаточно наглядно показывает, что в первые дни риск смерти очень велик, затем он падаети спустя некоторое время вновь начинает возрастать. Заметим, что именно функция риска используется для прогностических целей.

Позвольте сделать отступление. Одним из лейтмотивов нашей книги является непредвзятость и критическое отношение к полученным результатам. Такая критичность особенно важна в медицине. Мы доверяем результатам, полученным с помощью компьютера, однако всесторонне их проверяем.

Итак, нас интересует функция риска, однако реально мы получаем лишь оценку риска Поэтому важна точность полученных оценок. Из простых соображений Целует, что мы не доверяем оценкам с большой погрешностью. Например, мы не ьУДем доверять оценкам, погрешность которых имеет тот же порядок, что и сами °Ценки. Поэтому внимательно просмотрите построенную таблицу и выбросите из Иее плохие оценки (оценки с большой погрешностью). Это чрезвычайно важный п№нцип анализа данных!
Глава 14. Анализ

Известно, что для получения надежных оценок параметров и ошибо» Пах жизни требуется как минимум 30 наблюдении

Взгляните на таблицу. Заметьте, в ней наряду с оценками приведены г цые ошибки полученных оценок.

Медиана ожидаемого времени жизни

По определению, медиана равна моменту времени, в котором функция ния становится равной 'А Например, из первой строчки таблицы вы вида пациент с вероятностью 'А будет жить 809 дней после операции.

Если пациент пережил первый временной интервал (161 с вероятностью 'Л он проживет еще 1036 дней (см. вторую строчку таблицы)

В общем случае таблица времен жизни дает хорошее представление о pal делении отказов или смертен, если наблюдений достаточно много.

Однако для прогноза часто необходимо знать форму функции выживания этой цели используются различные семейства распределений.

Наиболее важны следующие семейства распределений: экспоненциальное Вейбулла и распределение Гомпсрца.

Эти распределения имеют неизвестные параметры, которые программу ниьаст. Процедура оценивания параметров основана на методе найме квадратов. Для проведения оценивания применима модель линейной ре] сии, поскольку все перечисленные семейства распределен ий могут быть к чинейным» (относительно параметров) с помощью подходящих up Такие преобразования приводят иногда к тому, что дисперсия остатки и от интервалов (то есть дисперсия различна на разных интервалах). Чтобы это. в алгоритмах подгонки дополнительно используются оценки вэв<1 наименьших квадратов двух типов.

Оценки Каплана—Мейера

Напомним, что одна из задач анализа выживаемости состоит в том, чтобы функцию выживания S(t), то есть вероятность того, что пациент проживе" t дней после операции. Формально S(t) = Р{х > t}, где х — случайная
и Каплана—Мейера

вписывающая время жизни после операции. Заметьте, что функция выживания )__1ЯСТся убывающей функцией, равной 1 при ?•=(), и обращающейся в 0 при боль-

ших значениях I

Если все наблюдения являются полными. то оценка S(t) строится легко: мы просто подсчитываем количество пациентов, проживших t дней после операции, и делим ,ix на общее число пациентов. Наличие неполных наблюдений усложняет ситуацию.

Окалывается, что для цензурированных наблюдений функцию выживания мож-ио оценить непосредственно, не используя таблицу времен жизни Такой метод впервые предложили Каплан и Мейер в 1958 году-

Представьте, что вы имеете файл, в котором записаны в хронологическом порядке отде чьные события. Тогда имеет место следующая оценка функции выживания:

S(0-ni(«-Mn-j+i)« ]

В этом выражении S(t) — оценка функции выживания, тг — общее чне-ю событий (объем выборки), j — порядковый (хронологически) номер отдельного события, 5(j) равно 1, если j-e событие означает отказ (смерть), и S(j) равно 0, если j-c событие означает потерю наблюдения (индикатор цензурирования). П означает произведение по всем наблюдениям j, завершившимся к моменту ?.

Данная оценка функции выживания состоит из произведения нескольких со-множитетей, поэтому она также называется множительной оценкой.

Рассмотрим тот же файл данных, что и для таблиц времен жизни. Оценка Каплана-Мейера функции выживания, построенная но этим данным, показана в следующей таблице:

АНАЛИЗ Замечание: ценэурироиалмые наблюдения отмечены +
ВЫЖИВ
Номер щтщ КумуЛ Стенд.
Набл Времена
ВйШШШ 0.000 I - -
16* 1.000 -
ее- '*7| 1.000 -
24 3.000 - -
Ю _ ю.ооо ,983607 .016269
«6* 12.000
64- 13.000 -
* 15.000 -
Предыдущая << 1 .. 149 150 151 152 153 154 < 155 > 156 157 158 159 160 161 .. 204 >> Следующая
Книги
Web-программирован-
ие
Аппаратное обеспечение Графика Руководство по П.О. Самоучитель Теория программирования Фотошоп Языки программирования
Новые книги
Вирт Н. "Систематическое программирование " (Теория программирования)

Эком "Microsoft Excel 2000 шаг за шагом Русская версия самоучитель " (Самоучитель)

Поляков А.Ю. "Методы и алгоритмы компьютерной графики в примерах Vizual C++" (Графика)

Баяковский Ю.М. "Графическая библиотека Open GL " (Графика)

Валиков А. "Технология " (Языки программирования)
Авторские права © 2013 ComputersBooks. Все права защищены.