Журнал издаётся при содействии Ассоциации русскоязычных журналистов Израиля ( IARJ )
имени Михаэля Гильбоа (Герцмана)

Наши награды:

Биометрия-наука об измерении жизни?

0

BIOMETRICS — the science of measurement LIFE?

Biometrics = Bio + meters. Bio … — From the Greek bios — life, part of the compound word means: pertaining to life. METRO … — from the Greek metreo — measure, part of compound words, the corresponding value for the word «measure», for example, geometry, photometry. So what, biometrics — the science of measuring life? Well, yes and no. If we turn to encyclopedias and dictionaries, you can find the following interpretation of the term. Biometrics — branch of biology, the content of which is the planning and analysis of the results of quantitative experiments and observations, the methods of mathematical statistics. Biometrics — the science of quantitative measurements of biological variables (metrics). It should be noted that the designation of this research direction, the word biometrics, often use another term – Biometrics.
Article Doctor of Technical Sciences Vasily Leonov devoted to practical application of biometrics in life.

 

Василий Леонов, к.т.н., доцент.  

 

Биометрия = Био + Метрия. Био… – от греческого bios — жизнь, часть сложных слов, означающая: относящийся к жизни. …Метрия – от греческого metreo – измеряю, часть сложных слов, соответствующая по значению слову «измерение», например, геометрия, фотометрия. Так что же, биометрия – наука об измерении жизни? И да, и нет. Если обратиться к энциклопедиям и словарям, то можно обнаружить следующие толкования этого термина. Биометрия – раздел биологии, содержанием которого являются планирование и обработка результатов количественных экспериментов и наблюдений методами математической статистики. Биометрия — наука о количественных измерениях биологических величин (метрик). Следует отметить, что для обозначения этого научного направления вместо слова биометрия, чаще используют другой термин – биометрика. Ниже мы и будем использовать именно этот термин. Не вдаваясь в этимологические детали, отметим, что в последние 20-30 лет термином биометрика стали обозначать и недавно возникшее параллельное направление исследований в области биоидентификации человека. Одщнако исторически возникновение слова биометрика непосредственно связано именно с работами по использованию методов статистики в биологии и медицине. Хотя математическая статистика и является основным инструментом биометрики, но было бы неверно сводить весь инструментарий биометрики только к математической статистике. О популярности методов биометрики можно судить, к примеру, по тому, что в большинстве научных публикаций по биологии и медицине обязательно приводятся результаты применения этих методов. Так что же изучает биометрика?

История этой науки восходит к концу 19 века. При выполнении биологических экспериментов и наблюдений учёный всегда имеет дело с вариациями частоты встречаемости или степени проявления различных признаков. В силу этого без статистического анализа нельзя сделать вывод о том, являются ли наблюдаемые различия между величинами в разных опытах случайными или отражают собой влияние неких факторов. Основоположником биометрики по праву считают англичанина Френсиса Гальтона, внёсшего большой вклад в создание корреляционного и регрессионного анализа, а также Карла Пирсона, предложившего критерий «хи-квадрат». Теоретическая основа современной биометрики разработана английском статистиком Рональдом Фишером. Он разработал основы теории планирования эксперимента, предложил такой известный метод, как дисперсионный анализ, и многие другие методы.

При анализе результатов наблюдений возникают 3 основных статистических задачи: оценка параметров распределения изучаемых признаков, таких как среднее, дисперсия (показатель вариабельности) и т.д. Вторая задача – сравнение между собой параметров нескольких групп. Например, необходимо сравнить между собой группу здоровых и группу больных пациентов, чтобы ответить на вопрос, случайны или неслучайны различия между средними величинами исследуемых показателей в этих группах? Наконец, третья задача сводится к обнаружению статистических взаимосвязей между признаками, таких как корреляция, регрессия и др. Именно эта третья задача и представляет наибольший интерес в реальных исследованиях. Для иллюстрации возможностей этого приведём несколько примеров основанных на результатах реальных исследований.

По результатам многолетнего исследования был собран массив данных из 643 наблюдений и 98 признаков. Пациентами были женщины, страдающие злокачественной опухолью яичников. 98 показателей описывали разнообразные стороны заболевания, начиная от клинического диагноза, наследственности, возраста первой менструации и возраста начала половой жизни, разнообразные сопутствующие патологии, биохимические показатели, и исход лечения – выздоровление, прогрессирование заболевания или летальный исход. Одна из главных задач исследования заключалась в том, чтобы определить набор информативных показателей, которые на основе собранных данных позволяли бы достаточно надёжно прогнозировать для конкретной больной наиболее вероятный исход. И зная такой набор, можно было бы выбирать наиболее оптимальную тактику лечения больной, направленную на достижение благоприятного исхода. Особенностью данной задачи являлся тот факт, что зависимый признак, исход лечения, представлял собой так называемую качественную переменную, имеющую несколько альтернативных вариантов. Тогда как потенциальные признаки-предсказатели, их принято называть предикторами, были как количественными (биохимические показатели, возраст и т.д.), так качественными (вид сопутствующей патологии, вид контрацепции, метод лечения и т.д.). Для решения данной задачи были использованы разнообразные методы биометрики. В частности, с помощью непараметрического дисперсионного анализа решалась задача сравнения средних величин количественных показателей для групп с разными исходами. С помощью анализа таблиц сопряжённости анализировались парные связи между качественным признаком «Исход» и другими качественными признаками. Наконец, с помощью такого мощного метода анализа как логистическая регрессия, удалось найти несколько наиболее удачных решений, которые содержали по 5-6 предикторов, позволяющих с надёжностью 90-95% предсказывать для больных наиболее вероятный на момент поступления исход лечения. В том случае, когда такой наиболее вероятный исход оказывался неблагоприятным, можно было оценить, какие именно признаки вносят наибольший вклад в вычисляемую вероятность неблагоприятного исхода, и соответственно на основе этого выбирать тактику лечения направленную на достижение благоприятного исхода.

Другая задача, которая также представляет не меньший интерес. Представим себе, что в результате крупного теракта имеется много жертв, которые необходимо идентифицировать. Внешний облик жертв не позволяет это сделать визуально. Однако у жертв сохранился кожный узор на ладонях рук. В последние 50 лет дерматоглифика, а именно так называется наука, изучающая отпечатки ладоней, достигла определённых успехов. В частности, с помощью методов биометрики были обнаружены устойчивые зависимости между кожным узором и предрасположенностью человека к ряду наследственных заболеваний. В спортивной медицине были обнаружены зависимости между рисунком кожных узоров и достижениями в некоторых видах спорта, и т.д. Однако описанная выше задача гораздо сложнее. Необходимо по кожному узору реконструировать внешний облик человека, а нередко даже и пол. Такая задача имеет место, к примеру, в оперативно-розыскной деятельности, когда на месте преступления может быть обнаружен отпечаток части ладони преступника. И по этому отпечатку требуется сделать надёжный прогноз таких характеристик человека, как пол, рост и остальные параметры тела человека, цвет кожи, цвет глаз, цвет волос, форма волос, ширина глаз, размер ушей, размеры лица, и т.п. Вы скажете это фантастика? Отнюдь! Оказалось, что эта задача вполне решаемая. Анализ данных нескольких тысяч человек, по каждому из которых были представлены более 100 признаков, включающих количественное описание отпечатков обеих ладоней человека, и все измеряемые размеры его тела, головы, цвет волос, цвет глаз и т.д., позволил найти путь решения этой задачи. Хотя и следует отметить, что решение этой задачи оказалось достаточно сложным и нетривиальным. Однако в результате этого решения на основе отпечатка ладони удавалось осуществлять весьма точный прогноз многих параметров человека. Для повышения точности по другим признакам требуется увеличение исходных данных для анализа примерно до 30-40 тысяч человек.

Биометрика – мощное оружие научных исследований в области медицины и биологии. И как всякое оружие требует осторожного обращения. В частности, при использовании тех или иных методов существуют различные ограничения на их использование. К примеру, 100 лет назад английский химик В. Госсет, работавший на пивоваренных заводах Гиннеса, предложил при сравнении средних в двух группах использовать так называемый t-критерий Стьюдента. Поскольку по правилам компании Гиннеса о не мог публиковать статьи под своим именем, то статья была подписана псевдонимом Student. Отсюда и пошло название критерия. Так вот, при использовании этого критерия существуют два ограничения на анализируемый признак. Во-первых, в обеих группах количественный признак должен подчиняться нормальному закону распределения. Во-вторых, дисперсии этого признака в обеих группах должны быть равны. В том случае, если хотя бы одно из этих ограничений не выполняется, использовать t-критерий Стьюдента нельзя (см. URL: http://www.biometrica.tomsk.ru/student.htm ). К сожалению, подавляющее большинство медиков и биологов, использующих этот критерий, даже не подозревают об их существовании. И как следствие этого получают при использовании данного критерия неверные выводы. А дальше на основе этих неверных выводов строятся ложные модели изучаемых процессов, которые далее используются в реальной практике.
Опасность подобных заблуждений стали исследовать в западных странах ещё в 20-30-е годы 20 века. В СССР первые работы на эту тему появились примерно 50 лет назад. Так в 1955 г. появляется книга А.Я. Боярского «Статистические методы в экспериментальных медицинских исследованиях». Автор детально проанализировал большое количество статей, опубликованных в течение нескольких лет в известных советских медицинских журналах. Вот что он пишет в своей книге. «Уже беглое ознакомление с состоянием дела показывает, что статистическая обработка экспериментальных данных является наиболее слабым местом во многих исследованиях. … Трудно требовать от медика, чтобы он, наряду со знаниями в своей собственной области, был в то же время достаточно вооруженным, скажем, в радиотехнике для конструирования аппаратуры, улавливающей биотоки, или в статистике для нахождения наиболее правильных методов статистической обработки своих экспериментальных данных. И подобно тому, как медику, несомненно, приходится обращаться за содействием к радиотехнику, для правильной статистической обработки экспериментальных данных нередко приходится обращаться к специалисту-статистику». В 1997 г. мы опубликовали в Бюллетене ВАК собственную статью с аналогичным критическим обзором. Многочисленные примеры подобных ошибок и заблуждений, приведены в разделе КУНСТКАМЕРА нашего сайта БИОМЕТРИКА (см. URL: http://www.biometrica.tomsk.ru ). Среди авторов анализируемых статей и диссертаций, немало кандидатов и докторов наук, а также академиков.
Но и в начале 21 века ситуация с использованием статистики в российской медицине и биологии остаётся на прежнем уровне. В своей статье «Ошибки статистического анализа биомедицинских данных» (URL: http://www.biometrica.tomsk.ru/error.htm ) мы подробно рассмотрели причины этого явления. Основных причин несколько. 1. Отсутствие знаний по статистике у авторов публикаций, членов журнальных редколлегий и диссертационных советов, что не позволяет им осознать всю степень ошибочности выводов в таких публикациях. 2. Деформация цели публикации. Нередко истинной целью публикации является не стремление ученого обнародовать, легализовать надежные результаты исследования, а лишь сам факт быстрейшей публикации как непосредственное доказательство «научности» результатов. 3. Отдаленность во времени и пространстве возможных негативных последствий публикации сомнительных результатов от автора, времени и места публикации. 4. Ограниченность доступа широкой читательской аудитории к медицинским публикациям, содержащим ошибочные выводы. Это связано как с ограниченными тиражами медицинской периодики, так и с ограничением доступа к медицинским диссертациям. В ряде медицинских вузов доступ к защищенным диссертациям разрешается ректором вуза. 5. Отсутствие доступа для читателей к исходным данным автора публикации. Автор, зная что любой читатель, сомневающийся в истинности авторских выводов, имеет возможность немедля (или же спустя некоторое время) получить эти данные, и самостоятельно перепроверить авторские выводы, будет совершенно иначе относиться к процедуре статистического анализа этих данных. 5. Незаинтересованность редакций периодических изданий, ректоров медицинских вузов, диссертационных советов, ВАК РФ и дирекций НИИ в повышении качества журнальных публикаций и диссертаций.
Одним из решений данной проблемы и повышения качества использования биометрики в медицине и биологии могла бы стать предварительная публикация полных текстов диссертаций, например, за 3 месяца до их защиты, на сайте ВАК РФ. Кстати сказать, подобная практика существует во многих странах. Полные тексты диссертации до их защиты выкладываются в свободный доступ на сайтах университетов. И хотя подобные предложения высказываются в российской печати уже более 10 лет, ВАК РФ упорно сопротивляется данному предложению. И это несмотря на то, что данное предложение было озвучено в 2007 г. и нынешним президентом России Д. Медведевым на встрече с членами ВАК РФ (см. URL: http://www.biometrica.tomsk.ru/vak_14.htm ). Удастся ли добиться реализации этого предложения, покажет ближайшее время.
Леонов В.П., доцент Томского государственного университета,
канд. техн. наук, Томск, Россия.

Поделиться.

Об авторе

Василий Леонов

Доцент, кандидат технических наук

Прокомментировать

Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.