El blog de Ciril Rozman

Archive for the ‘Estadística’ Category

Interrupción de actividades en mi espacio electrónico personal

Posted by 3321crb en abril 24, 2011

Tal como he tenido la oportunidad de comentar en otra ocasión, los medios informáticos se han impuesto en nuestra sociedad de modo espectacular. Al empleo de los ordenadores personales en todos los ámbitos de la vida, incluidas las aulas de enseñanza primaria,  se ha unido el uso generalizado del Internet que ha convertido el llamado ciberespacio en una aldea global. En este entorno han surgido con fuerza las llamadas redes sociales que están ejerciendo una influencia extraordinaria en numerosos campos de la vida diaria. Recordemos al respecto las recientes movilizaciones políticas en diversos países africanos, convocadas a través del Internet.

No me ha dejado de impresionar la  enorme velocidad con que se desarrollan los acontecimientos en el terreno de las redes sociales. El Facebook fue creado en 2004. Su autor Mark Zuckerberg es un joven estadounidense de apenas 27 años que cuenta con una fortuna estimada en 6900 millones de dolares y apareció como el personaje del año 2010 en la famosa revista Time Magazine.

Por determinadas circunstancias ligadas a lo que ha sido uno de mis más importantes proyectos vitales, la dirección del tratado Farreras-Rozman: Medicina Interna, me he visto involucrado durante los últimos dos años y medio en una red social tipo espacio electrónico personal o blog. Mi experiencia ha sido muy fructífera. Aunque la publicación periódica de sendos artículos constituye una notable esclavitud, ello queda sobradamente compensado por las satisfacciones percibidas. Una de ellas es el número de visitantes. Aunque mi espacio electrónico personal no es de los que tienen un éxito social masivo, sí ha sido frecuentado de modo constante por un promedio de 100 usuarios diarios, lo que supone la nada despreciable suma de un total de 85 000 visitas. Y si bien el tanto por ciento de comentarios es relativamente pequeño, su análisis me permite asegurar que mi público es muy variado y está representado por todos los estamentos del sector sanitario, no tan sólo de España, sino incluyendo diversos países de Latinoamérica

Las mismas circunstancias que me impulsaron a crear mi blog en Noviembre de 2008, me obligan a interrumpir sus actividades. En efecto, la preparación de la décimo-séptima edición del Farreras-Rozman: Medicina Interna que acabo de comenzar requiere mi dedicación exclusiva. Y ello no tan sólo porqué se trata de un libro de medicina en soporte impreso, sino que  en el futuro se va a acompañar de un ambicioso proyecto en forma de la plataforma digital Farreras-Rozman on line, en la cual se ofrecerán variadas ayudas autoformativas al estudiante de Medicina y al médico en ejercicio.

Debo confesar que me siento razonablemente satisfecho de los archivos depositados en el blog: 76 artículos y 217 comentarios que abordan de forma resumidaa la variada problemática con que se enfrenta el ejercicio de las tres funciones universitarias en el ámbito biomédico: asistencia, docencia e investigación. Y todo ello analizado por un autor quien ha tenido el privilegio de vivir estas situaciones en primera persona a lo largo de un nada despreciable período de medio siglo.

Posted in Arena MIR, Asistencia Médica, Educación Médica, Estadística, Investigación, Lenguaje, MIR, Sanidad, Universidad | 22 Comments »

Índice de Hirsch (índice h), un parámetro bibliométrico de moda

Posted by 3321crb en noviembre 9, 2010

En pasados artículos me he ocupado en justificar la necesidad de estudios que permitan evaluar la calidad científica de los investigadores, la llamada cienciometría, y he abogado definitivamente por los métodos bibliométricos, mucho más objetivos que las clásicas revisiones por expertos (peer-review). También he revisado el lugar que ocupan en este terreno los dos índices clásicos y, por ende, más utilizados: el factor de impacto y el índice de citaciones. Aunque de forma no exhaustiva, he señalado la forma correcta de su empleo.

No me ha parecido oportuno cerrar este ciclo de artículos bibliométricos sin citar el índice de Hirsch o índice h, el cual a pesar de su introducción relativamente reciente, está siendo utilizado profusamente. Raro es el científico que no incluya este dato  cuando presenta su currículum vítae.

El índice fue introducido el año 2005 por el físico Jorge E. Hirsch, de la Universidad de California San Diego (UCSD) y pretende medir tanto la productividad científica como el aparente impacto de un investigador. Se basa en un conjunto de trabajos más citados de un autor y el número de citaciones que reciben dichas publicaciones por otros autores. Queda definido de la siguiente manera:

Un científico tiene un índice h si el h de sus Np trabajos recibe al menos h citas cada uno, y los restantes (Np-h) tienen como máximo h citas cada uno.

Esta definición es difícil de comprender si no se recurre a un ejemplo:

Nº de orden                 Nº de citas

…                               …

33                               40

34                               38

35                              36

36                               28

37                               27

…                               …

En primer término es preciso ordenar los trabajos atendiendo al número de citaciones recibidas por otros autores desde el mayor al menor generando dos columnas, el nº de orden y el nº de citas. En el ejemplo anterior el índice h es 35, pues el trabajo nº 35 tiene 36 citas y el nº 36 no llega al idéntico número de citas.

Actualmente disponemos de potentes plataformas informáticas que nos permiten objetivar el perfil productivo de cualquier investigador. Así, la ISI Web of Knowledge (Thomson Institute for Scientific Information) nos genera en el caso del ejemplo anterior (un destacado científico que ocupó hace años la presidencia de un Organismo Público de Investigación), la siguiente información (figura)

La gráfica va acompañada del siguiente resumen. A lo largo de los últimos 20 años, este investigador  ha publicado 165 trabajos que han recibido un total de 4001 citas, con una C/D (media de citas por documento) de 24,25 y su índice h es de 35. Con estos instrumentos informáticos, la calidad de los científicos, por lo menos en cuanto a su análisis bibliométrico se refiere, está a la vista de cualquier curioso.

Como todos los parámetros bibliométricos, también el índice h debe ser valorado con cautela. Se llegó a afirmar que después de 20 años, un valor de 20 significa una carrera científica coronada por el éxito, que entre 35 y 45 sólo se da entre los mejores científicos y que más de 60 se da sólo en individuos excepcionales. Sin embargo, estos datos cuantitativos probablemente valgan para el campo de la física. En el terreno de la biomedicina, los valores son bastantes más altos. A partir de su publicación se ha generado una abundante bibliografía acerca de las posibles ventajas y desventajas del índice h, con numerosas propuestas de su modificación. A mi juicio es preciso subrayar como mínimo un principio ineludible en su aplicación: Este parámetro produce resultados relativamente fiables tan sólo cuando se emplea para comparar investigadores que trabajan en el mismo campo científico.

Posted in Asistencia Médica, Educación Médica, Estadística, Investigación, MIR, Sanidad, Universidad | Leave a Comment »

Indice de citaciones, un parámetro bibliométrico importante

Posted by 3321crb en octubre 26, 2010

En la medición de la actividad científica, llamada también cienciometría, actualmente no ocupan una posición preeminente las revisiones por expertos, sino que se tienden a emplear más los métodos bibliométricos que aplican procedimientos matemáticos y estadísticos a toda la bibliografía científica y a los autores que la producen, con el objetivo de proceder a su evaluación.

Uno de los índices bibliométricos más empleados es el llamado factor de impacto (FI) al que he dedicado ya un artículo especial señalando su utilización abusiva y errónea. En concreto, el FI valora la calidad de las revistas y no la de los artículos individuales que estas contienen. La presuposición de que un FI elevado pueda aplicarse automáticamente a todas publicaciones contenidas en una revista no se sostiene. Por tanto, para la medición de la calidad científica de un investigador o un grupo de investigadores se requieren otros instrumentos bibliométricos. Uno de ellos es el llamado índice de citaciones. Se define como el número de citas que recibe un artículo por otros autores. A partir de este dato se pueden generar otros dos parámetros  bibliométricos, a saber, la media de citas por documento (C/D) y el tanto por ciento de no citación. La productividad científica de un investigador se considera de mayor calidad cuanto mayor es su índice de citaciones, cuanto más alta es el C/D y cuanto menor es % de no citación.

En su empleo es preciso tener en cuenta otras dos consideraciones importantes: establecer el período de análisis y proceder a su normalización.

Respecto al primer punto tomemos el ejemplo de la figura adjunta. En ella se representa un conjunto de documentos publicados entre 1981 y 2000 (línea azul oscura), y el número de citas recibidas a lo largo de todos el período (línea roja), a los 3 años (línea amarilla) y a los 5 años (línea azul clara). Como cabe observar, el período de observación modifica claramente el número de citas recibidas.

Por lo que respecta a la normalización, esta es necesaria porque no todas las materias investigadas son citadas por un igual. Como instrumento idóneo para ello tiene bastante aceptación el llamado Crown Indicator (indicador corona) propuesto por van Raan y colaboradores del Centre for Science and Technology Studies, de Leiden (Holanda). Estos autores proponen como indicador de impacto estandardizado internacionalmente el cociente: CPPx/FCSmx, donde CPPx corresponde a C/D sin autocitas, y FCSmx a la tasa media de citaciones de todos los artículos de un determinado campo científico. A partir de aquí se puede concluir que la calidad de un grupo científico está muy por debajo (<0,5), por debajo (0,5-0,8), en torno a (0,8-1,2), por encima (1,2-2,0) o muy por encima (>2,0) del nivel internacional. Cuanto más alta es la agregación de los investigadores o mayor es el volumen de publicaciones, más difícil es alcanzar un impacto por encima del nivel internacional.

 

Posted in MIR, Sanidad, Educación Médica, Investigación, Asistencia Médica, Universidad, Estadística, Arena MIR | 3 Comments »

Sobre la significación estadística y la relevancia clínica

Posted by blogderozman en febrero 2, 2010

No hay duda de que en la bibliografía científica se está abusando del término significación estadística. Por un lado, numerosos investigadores dan por supuesto que si en un estudio o experimento hallan una probabilidad (p) inferior a 0,05, ello certifica la existencia tanto de la  validez científica de su observación como de la relevancia clínica de la misma. Y ello está lejos de ser cierto.  Su fe ciega en el valor de la p contrasta con los detractores de su significado. Hace poco leí en la prensa médica la siguiente frase: ”Yo no creo en la estadística”, como si ello fuera una cuestión de fe.

La estadística constituye un instrumento científico que requiere el cumplimiento de numerosas condiciones para producir resultados válidos. Por un lado, es preciso que los experimentos tengan un diseño muy escrupuloso. Y por otro, es inexcusable aplicar en cada circunstancia aquellos métodos que en ella son idóneos y controlar rigurosamente su validez. Pero ni aún así es legítimo deducir que un resultado significativo es clínicamente relevante. Cabe recordar que una correlación entre dos variables acabará siendo siempre significativa si la muestra es lo suficientemente grande. Así, por ejemplo, si alguien comparara el número de lectores de un periódico de España con el número de conventos de monjas en EEUU de América, acabaría por demostrar su asociación estadística (p < 0,05) si la muestra fuese muy grande, aunque obviamente el coeficiente de correlación (r) sería muy pequeño. Parafraseando este experimento de nula relevancia, alguien comentó: “La estadística es un instrumento con el cual cabe demostrar cualquier mentira”.

La justificada corriente crítica contra el abuso de lo que es significativo no justifica, sin embargo, caer en el extremo opuesto, es decir, considerar los resultados de un estudio como válidos, sin su demostración científica. Afirmar que una cohorte de pacientes vive más que otra, sin objetivarlo mediante un análisis de supervivencia, sería igual de lamentable.

Posted in Arena MIR, Asistencia Médica, Educación Médica, Estadística, Investigación, Universidad | 2 Comments »

Recuerdos de un estadístico aficionado

Posted by blogderozman en enero 19, 2010

No rara vez se expresan en torno a la estadística opiniones contrapuestas, cuestión sobre la que pienso reflexionar en un próximo artículo. Como introducción a la materia, dirijo mi mirada hacia atrás para rememorar mis primeras incursiones en este terreno. Tales recuerdos constituyen en cierto modo una justificación del porqué me atrevo a abordar este tema. No reclamo para mí la consideración que merece un estadístico profesional y tal vez incluso el adjetivo de aficionado es demasiado presuntuoso.  Pero no es menos cierto que a lo largo de mi vida he dedicado muchas horas a la estadística, no como un pasatiempo sino por necesidad.

A mediados de la década de los setenta del siglo pasado, quisimos analizar con mis colaboradores la supervivencia de los pacientes afectos de leucemia linfática crónica. El Dr. Kanti Rai, quien más tarde habría de convertirse en excelente amigo a través los  intereses científicos comunes, acababa de publicar la clasificación por estadios clínicos de esta enfermedad. Quisimos reproducir sus resultados en nuestros pacientes, para lo cual teníamos la necesidad de aplicar el método de Kaplan y Meier, llamado también de producto límite, adecuado para estimar la supervivencia actuarial. Tengo grabada en mi memoria la imagen de Dr. Miquel Morey,  uno de mis residentes de entonces y hoy un destacado hematólogo del Hospital Son Dureta de Palma de Mallorca, quien de forma manual estaba realizando los cálculos pertinentes. Aún no había llegado la hora de las computadoras personales y menos la de los programas estadísticos comerciales. Estimulado por la necesidad desarrollé el citado programa sobre una rudimentaria computadora que utilizaba el Servicio de Neumología para la práctica de las espirometrías. A finales de 1978 fui invitado a dar una conferencia en San Juan de Puerto Rico. Debido a la frecuente niebla en el aeropuerto de Madrid, tuvimos que pasar una noche en la capital, ocasión que aproveché para visitar la Feria Internacional de Informática (SIMO). Adquirí una especie de computadora personal de sobremesa, la cual me sirvió para el desarrollo de numerosos programas. Diseñé una rudimentaria base de datos, amplié el programa de Kaplan y Meier con la generación de gráficos e incluso empecé mi inmersión en la estadística multivariante. Conseguí traducir del FORTRAN al lenguaje BASIC el método de regresión de Cox de riesgos proporcionales. Mi hija Olga, informática de profesión, adaptó parte de este software a otra computadora, la cual constituyó durante muchos años el soporte logístico esencial del PETHEMA (Programa Español de Tratamiento de las Hemopatías Malignas). A mediados de la década de los ochenta, recibí la visita de un hematólogo de otro hospital de Barcelona quien no acaba de coronar su proyecto de tesis doctoral. Vino a solicitar mi ayuda. Le indiqué que realizase algunos estudios de supervivencia. Al cabo de unas semanas me trajo unas gráficas realizadas con el programa que habíamos diseñado mi hija y yo. Al interrogarle acerca de cómo pudo acceder al mismo, me contestó que dicho software había viajado a Zaragoza y luego a varias ciudades de Andalucía, de una de las cuales le fue enviado a él. Con mi hija bromeamos: “Lástima de no haber exigido el copyright”.  En épocas posteriores no he dejado de ocuparme de numerosas cuestiones estadísticas diversas y así hasta hoy.

A pesar de mi condición de aficionado, fui probablemente el primero en España en utilizar los métodos mencionados. Considero que mi condición de pionero me autoriza a reflexionar, en un próximo artículo, sobre la estadística en general.

Posted in Arena MIR, Educación Médica, Estadística, Investigación, Universidad | 1 Comment »

Sobre la utilización incorrecta de la palabra «rango» en la bibliografía médica española

Posted by blogderozman en May 12, 2009

Bajo este título publiqué hace más de 20 años una carta (Med clin (Barc) 1988;90:308), a la que traigo a colación del artículo:”¡Patologías no, por favor!”, aparecido en este espacio electrónico personal el   10-2-2009.  En esa carta decía:

            “Desde hace unos 15 años estoy intentando llamar la atención, por cierto con poco éxito, sobre lo que considero una incorrecta utilización de la palabra “rango” en nuestros ambientes científicos…”. “La confusión procede de una incorrecta traducción a partir del inglés, de dos conceptos distintos: range y rank. Con el término range se entienden la “amplitud”, “recorrido” o “escala de variación” entre dos límites, de una variable concreta. Por ejemplo, un grupo de pacientes puede tener una edad media de 45 años, con la escala de variación entre 20 y 65 años. En este caso, utilizar la palabra “rango” es, a mi juicio, incorrecto, por cuanto el término “rango” tiene en castellano un sentido estadístico distinto. Esta palabra puede ser traducida como categoría o grado (por ejemplo, de un militar) y corresponde al vocablo rank también utilizado en estadística. En efecto, existen varias técnicas estadísticas no paramétricas consistentes en ordenar una serie de valores de mayor o menor, o sea, de acuerdo a su “rango” y proceder luego al tratamiento de valores así ordenados….”. “Aunque los intentos de erradicar malos hábitos suelen estar condenados al fracaso y por tanto es obligado ser algo escéptico, la fuerza de la palabra impresa me ha movido a escribir estas líneas con una remota esperanza de conseguir algo positivo. Y confío en que contribuya a ello la creciente difusión de nuestra Revista entre los médicos españoles, particularmente aquellos que con mayor frecuencia emplean términos estadísticos”.

            Mi escepticismo estaba plenamente justificado. La Real Academia Española se adaptó al lenguaje de los científicos y aceptó el término estadístico “rango” como  “Amplitud de la variación de un fenómeno entre un límite menor y otro mayor claramente especificados”, es decir, en el sentido de una incorrecta conversión a partir del inglés. Sugiero a la venerable institución que “limpia, pule y da esplendor” la inclusión en el vocablo “rango”, apartado 5º Estad., además del concepto mal traducido, el correspondiente al término estadístico rank del inglés.

Posted in Estadística, Investigación, Lenguaje | Leave a Comment »