Economía y salud
BOLETÍN INFORMATIVO - Año 2016. Abril. nº 85
www.aes.es
En este número Temas
Portada

Opinión
Temas
Tesis
Con acuse de recibo
Reseñas bibliográficas
Jornadas AES
Noticias
Buzón de sugerencias

La consolidación de los métodos bayesianos en la investigación en salud



Miguel Ángel Negrín Hernández
Departamento de Métodos Cuantitativos en Economía y Gestión
Universidad de las Palmas de Gran Canaria
Email: miguel.negrin@ulpgc.es

Es incuestionable el crecimiento que han tenido los métodos bayesianos en los últimos 25 años, y muy particularmente en el área de la investigación en salud (Figura 1). Aunque su desarrollo es muy anterior, los primeros trabajos formales de estadística bayesiana aparecen en los años sesenta. Sin embargo, su expansión sólo ha sido posible a raíz del desarrollo de los métodos de simulación Markov Chain Monte Carlo (MCMC) en los años noventa (Gelman et al., 1995; Gilks et al., 1996), que han permitido superar las limitaciones computacionales existentes hasta ese momento. En este trabajo se pretende explicar cuáles son las ventajas potenciales de la estadística bayesiana, en comparación con la frecuentista, que puedan explicar este desarrollo, y analizar en qué áreas la estadística bayesiana ha mostrado mayor crecimiento.

Figura 1. Referencias en PubMed que incluyan las palabras claves Bayes o Bayesian

  1. La definición de probabilidad subjetiva

Para entender el porqué del crecimiento de la metodología bayesiana, es necesario describir primero en qué consiste la estadística bayesiana y qué la diferencia de la perspectiva frecuentista. La primera diferencia fundamental la encontramos en el concepto de probabilidad. Desde el punto de vista bayesiano, la probabilidad es subjetiva y representa únicamente el grado de creencia o certidumbre sobre un determinado fenómeno. La probabilidad sobre un determinado evento está condicionada a las experiencias o conocimientos previos, pudiendo ocurrir que dos individuos distintos asignen probabilidades distintas a un mismo evento, dependiendo de su nivel de información. Seguramente, si se preguntase a los lectores de este artículo cuál es la probabilidad de supervivencia a una determinada enfermedad de un mismo paciente, cada uno respondería un valor distinto, en función de su nivel de información, que vendrá dado por sus estudios, trabajo, conocimiento de la enfermedad, la existencia de casos cercanos, etc. La definición frecuentista de probabilidad, basada fundamentalmente en la repetición, no admitiría la posibilidad de asignar probabilidades distintas a un mismo evento.

  1. La incorporación de información a priori

La diferente definición de probabilidad entre la estadística bayesiana y frecuentista no se limita a la discusión filosófica, sino que tiene importantes aplicaciones prácticas en la investigación.  La estadística bayesiana toma como base el Teorema de Bayes, enunciado por el reverendo Thomas Bayes en 1763:

P(θ|datos) ∝ P(θ) X P(datos|θ),
(Conocimiento a posteriori) ∝ (Conocimiento a priori) X (Información muestral)

Según el cual la información acerca de un determinado fenómeno tras el análisis de los datos (distribución a posteriori), se obtiene actualizando los conocimientos previos (distribución a priori) con los nuevos datos (información muestral).

La posibilidad de incorporar información a priori en el análisis ha sido una de las ventajas más populares de los métodos bayesianos, principalmente en la investigación clínica, donde la generación de nuevos conocimientos es constante y el método bayesiano se ajustaría a este comportamiento dinámico. En la evaluación económica de tecnologías sanitarias, área donde la estadística bayesiana ha tenido una gran aceptación, los primeros trabajos ya mostraban la utilidad de incorporar al análisis la información de estudios previos sobre la efectividad o el coste de los tratamientos (O’Hagan et al., 2001; O’Hagan y Stevens, 2001). Hay muchos ejemplos recientes de trabajos que incorporan información a priori. Por ejemplo, Walley et al. (2015) muestran cómo la incorporación de información a priori sobre los resultados del placebo puede reducir notablemente el tamaño muestral necesario para concluir si un tratamiento es efectivo o no. García-Barrado et al. (2016) demostraron cómo la incorporación de información a priori sobre la precisión de una prueba de referencia para analizar las propiedades diagnósticas de una combinación de biomarcadores mejora notablemente el ajuste frente a un modelo tradicional de regresión logística.

La incorporación de información a priori también puede ser utilizado para mejorar la precisión de las estimaciones (Kemper et al., 2015; Aven y Eidesen, 2007) o para complementar el análisis cuando el tamaño muestral es limitado (Baldwin y Fellingham, 2013; Hampson et al., 2014).

Otra aplicación inmediata del uso de la información a priori es el tratamiento de los valores perdidos. La perspectiva bayesiana permite incorporar de forma natural la información disponible sobre los valores perdidos y propagar la incertidumbre al resto de parámetros del modelo. Algunas aplicaciones recientes muestran su utilidad para imputar factores de riesgo no disponibles en el registro de los pacientes (Austin y Escobar, 2005) o completar respuestas con retraso en datos de ensayos clínicos (Cai et al., 2014).

  1. El análisis bayesiano objetivo

La posibilidad de incorporar información a priori supone una de las principales diferencias entre la estadística bayesiana y frecuentista. Sin embargo, lo que muchos consideran una ventaja, ha sido planteada por los detractores de la estadística bayesiana como su principal limitación. El análisis bayesiano ha sido criticado por su subjetividad, en contraposición con la supuesta objetividad de los métodos clásicos. Esta crítica, aunque confunde los conceptos de subjetividad y arbitrariedad, supuso un importante obstáculo a su expansión. Las publicaciones científicas exigían aclarar con detalle el origen de la información a priori, lo que dio lugar a una extensa bibliografía acerca del proceso en el cual los conocimientos a priori son plasmados en distribuciones de probabilidad, denominado en la bibliografía bayesiana como elicitación (Leal et al., 2007; Johnson et al., 2010; Sullivan y Payne, 2011).

Sin embargo, las ventajas de la estadística bayesiana no se limitan a la posibilidad de incorporar información a priori. Huyendo de las críticas a su falta de objetividad, se ha popularizado el denominado análisis bayesiano objetivo (Berger, 2006). Este análisis no incorpora información a priori y trata de representar esta carencia de información previa a través de distribuciones a priori no informativas. De esta forma, la distribución a posteriori recogería fundamentalmente la información aportada por los datos. Para lograr este objetivo, se han desarrollado una amplia variedad de distribuciones a priori no informativas (Lambert et al., 2005; Berger et al., 2015).

El análisis bayesiano objetivo sí se beneficia de las ventajas interpretativas y de aplicación de la estadística bayesiana. Los problemas que ha encontrado la aproximación clásica no siempre se han resuelto de forma coherente o sencilla. Ha sido necesario el uso de términos no siempre bien entendidos por los investigadores debido a su poca claridad. Me refiero a los debatidos valores-p, intervalos de confianza o pruebas de hipótesis clásicos de Neyman-Pearson. La realidad muestra que habitualmente estos valores son erróneamente interpretados como probabilidades, adoptando casi sin querer un posicionamiento bayesiano.

Desde la perspectiva frecuentista sólo pueden asignarse probabilidades a eventos aleatorios repetibles. Sin embargo, la perspectiva bayesiana admite la posibilidad de asignar probabilidades a cualquier evento o medida, siempre que sea incierta. Hablaremos, por tanto, de probabilidades asignadas a parámetros. Esto resuelve algunos problemas interpretativos de medidas tan usadas como la curva de aceptabilidad coste-efectividad (Fenwick et al., 2006). Dicha curva se obtiene a partir de la combinación lineal del coste y la efectividad incremental, parámetros poblacionales que, desde el punto de vista frecuentista, no son aleatorios. La interpretación en términos de probabilidad sólo es posible desde un punto de vista bayesiano (O’Hagan et al., 2000). Ocurre lo mismo con la interpretación de los intervalos de confianza. Un intervalo de confianza del 95% habitualmente se interpreta como si existiera una probabilidad del 95% de que el parámetro poblacional se encuentre dentro del intervalo. Esta interpretación sólo es posible desde el punto de vista bayesiano ya que el análisis frecuentista no permite asignar probabilidades a parámetros poblacionales. La interpretación frecuentista es tan poco natural que no se utiliza: si se repite el experimento en infinitas muestras y se construye el intervalo de confianza para cada una de ellas, el 95% de dichos intervalos contendrían al parámetro poblacional. Además de la evidente ventaja interpretativa, la flexibilidad del análisis bayesiano permite estimar intervalos de probabilidad en situaciones donde la aproximación frecuentista ha encontrado problemas, como por ejemplo la ratio coste-efectividad incremental (Polsky et al., 1997).

Esta forma natural de tratar la incertidumbre aporta a la visión bayesiana una flexibilidad de la que carece la estadística frecuentista. Un ejemplo paradigmático son los modelos jerárquicos, modelos que permiten incorporar estructuras complejas en los datos, combinando modelos parciales y distintas fuentes de variabilidad. Algunos ejemplos concretos serían los modelos multinivel (Browne y Draper, 2006), meta-análisis (Sutton y Abrams, 2001; Moreno et al., 2014), redes bayesianas (Yet et al., 2014), análisis espacial (Lawson, 2013), o los modelos de ecuaciones estructurales (Lee y Song, 2012; Yanuar et al., 2013). Cuanto mayor sea la complejidad del modelo, más fácil será encontrar propuestas bayesianas.

Al contrario que la aproximación frecuentista, el análisis bayesiano también permite asignar probabilidades a hipótesis, estimando la probabilidad de que sea cierta o no (Moreno y Girón, 2006). Los métodos bayesianos son, por tanto, ideales para la toma de decisiones, ya que nos informan de las medidas relevantes de un modo natural (por ejemplo, probabilidad de que un tratamiento sea más efectivo o más costoso). En este mismo apartado situaríamos la selección de modelos. El análisis bayesiano permite estimar la probabilidad a posteriori de distintos modelos propuestos para unos datos. Estos modelos pueden diferenciarse unos de otros en el número de variables explicativas que incluyen, permitiendo así la selección de variables a partir de la estimación del modelo más probable (Fouskakis et al., 2009; Fridley, 2009). En otras ocasiones se ha planteado como solución óptima la combinación de distintos modelos, ponderados por la probabilidad a posteriori de cada uno. Este procedimiento se denomina Bayesian Model Averaging (Jin et al., 2015; Hauck y Zhang, 2016).

  1. Conclusión

Aunque el proceso ha sido lento, hoy en día no se ponen en duda las ventajas del análisis bayesiano. En evaluación económica, por ejemplo, las principales agencias de evaluación de tecnologías sanitarias, NICE (The National Institute for Health and Care Excellence) en el Reino Unido o FDA (Food and Drug Administration) en los Estados Unidos aceptan desde hace más de 10 años la utilización de métodos bayesianos en sus informes. En otras áreas como la epidemiología, el crecimiento ha sido también muy rápido y destacan los tres artículos seminales publicados por Greenland entre 2006 y 2009 sobre el uso de los métodos bayesianos (Greenland, 2006, 2007, 2009).

La principal limitación de los métodos bayesianos ha sido en su complejidad metodológica y computacional, que ha impedido el desarrollo de software sencillo e intuitivo que generalice su uso. Estas barreras comienzan a salvarse a partir de finales de los años noventa, cuando aparece el WinBUGS (Lunn et al., 2000), una versión mucho más sencilla del clásico BUGS, que actualmente continúa su desarrollo con el nombre de OpenBUGS. Este software supuso una evolución fundamental ya que generalizó la estimación bayesiana con técnicas MCMC. En los últimos años se han añadido nuevos programas informáticos de estimación bayesiana, como son el INLA, MLwiN, etc., todos ellos con su adaptación para poder ser utilizados desde R. La evolución de los métodos bayesianos ha sido tal que el software eminentemente clásico (SAS o STATA) ha ido incorporando paulatinamente procesos bayesianos, como, por ejemplo, la versión 14 de Stata, que incluye un módulo específico de estimación bayesiana.

La búsqueda de modelos estadísticos y econométricos más sofisticados para dar solución a problemas complejos ha encontrado en la estadística bayesiana un gran aliado. La incorporación de más procesos bayesianos en software estadístico y econométrico comercial aumentará su aplicación, aunque en muchos casos el investigador no sea totalmente consciente de ello.


Referencias

Austin PC, Escobar MD (2005). Bayesian modeling of missing data in clinical research. Computational Statistics & Data Analysis, 49(3):821-836.

Aven T, Eidesen K (2007). A predictive Bayesian approach to risk analysis in health care. BMC Medical Research Methodology, 7:38.

Baldwin SA, Fellingham GW (2013). Bayesian methods for the analysis of small sample multilevel data with a complex variance structure. Psychological Methods, 18:151-164.

Bayes T (1763). An Essay towards solving a problem in the doctrine of chances. Philosophical Transactions of the Royal Society of London, 53:370-418.

Berger J (2006). The case for objective Bayesian analysis. Bayesian Analysis, 3:385-402.

Berger J, Bernardo JM, Sun D (2015). Overall objective priors. Bayesian Analysis, 10:189-221.

Brodersen KH, Gallusser F, Koehler J, Remy N, Scott SL (2015). Inferring causal impact using Bayesian structural time-series models. Annals of Applied Statistics, 9:247-274.

Browne WJ, Draper D (2006). A comparison of Bayesian and likelihood-based methods for fitting multilevel models. Bayesian Analysis, 3:475-514.

Cai C, Liu S, Yuan Y (2014). A Bayesian design for phase II clinical trials with delayed responses based on multiple imputation. Statistics in Medicine, 33:4017-4028.

Fenwick E, Marshall DA, Levy AR, Nichol G (2006). Using and interpreting cost-effectiveness acceptability curves: an example using data from a trial of management strategies for atrial fibrillation. BMC Health Services Research, 6:52.

Fouskakis D, Ntzoufras I, Draper D (2009). Bayesian variable selection using cost-adjusted BIC, with application to cost-effective measurement of quality of health care. Annals of Applied Statistics, 3:663-690.

Fridley BL (2009). Bayesian variable and model selection methods for genetic association studies. Genetic Epidemiology, 33:27-37.

García-Barrado L, Coart E, Burzykowski T, Alzheimer’s Disease Neuroimaging Initiative (2016). Development of a diagnostic test based on multiple continuous biomarkers with an imperfect reference test. Statistics in Medicine, 35:595-608.

Gelman A, Carlin J, Stern H, Rubin D (1995). Bayesian Data Analysis. Chapman and Hall, London.

Gilks W, Richardson S, Spiegelhalter D (1996). Markov Chain Monte Carlo in Practice. Chapman and Hall, London.

Greenland S (2006). Bayesian perspectives for epidemiological research: I. Foundations and basic methods. International Journal of Epidemiology, 35:765-775.

Greenland S (2007). Bayesian perspectives for epidemiological research: II. Regression analysis. International Journal of Epidemiology, 36:195-202.

Greenland S (2009). Bayesian perspectives for epidemiological research: III. Bias analysis via missing-data methods. International Journal of Epidemiology, 38:1662-1673.

Hampson LV, Whitehead J, Efeftheriou D, Brogan P (2014). Bayesian methods for the design and interpretation of clinical trials in very rare diseases. Statistics in Medicine, 33:4186-4201.

Hauck K, Zhang X (2016). Heterogeneity in the effect of common shocks on healthcare expenditure growth. Health Economics [en prensa].

Jin IH, Huo L, Yin G, Yuan Y. Phase I trial design for drug combinations with Bayesian model averaging. Pharmaceutical Statistics, 14(2):108-119.

Johnson SR, Tomlinson GA, Hawker GA, Granton JT, Feldman BM (2010). Methods to elicit beliefs for Bayesian priors: a systematic review. Journal of Clinical Epidemiology, 63:355-369.

Kemper KE, Reich CM, Bowman PJ, vander Jagt CJ, Chamberlain AJ, Mason BA, Hayes BJ, Goddard ME (2015). Improved precision of QTL mapping using a nonlinear Bayesian method in a multi-breed populations leads to greater accuracy of across-breed genomic predictions. Genetics Selection Evolution, 17:29.

Lambert PC, Sutton AJ, Burton PR, Abrams KR, Jones DR (2005). How vague is vague? A simulation study of the impact of the use of vague prior distributions in MCMC using WinBUGS. Statistics in Medicine, 15:2401-2428.

Lawson AB (2013). Bayesian Disease Mapping: Hierarchical modeling in spatial epidemiology. Chapman and Hall/CRC Interdisciplinary Statistics.

Leal J, Wordsworth S, Legood R, Blair E (2007). Eliciting expert opinion for economic models: an applied example. Value in Health, 10:195-203.

Lee SY, Song XY (2012). Basic and advanced Bayesian Structural Equation Modeling: with applications in the medical and behavioral sciences. Wiley Series in Probability and Statistics.

Lunn DJ, Thomas A, Best N, Spiegelhalter D (2000). WinBUGS: a Bayesian modelling framework: concepts, structure, and extensibility. Statistics and Computing, 10:325-337.

Moreno E, Girón FJ (2006). On the frequentist and Bayesian approaches to hypothesis testing. SORT, 30(1):3-28.

Moreno E, Vázquez-Polo FJ, Negrín M (2014). Objective Bayesian meta-analysis for sparse discrete data. Statistics in Medicine, 33:3676-3692.

O’Hagan A, Stevens J, Montmartin J (2000). Inference for the Cost-Effectiveness Acceptability Curve and Cost-Effectiveness Ratio. Pharmacoeconomics, 17:339-349.

O’Hagan A, Stevens J, Montmartin J (2001). Bayesian cost-effectiveness analysis from clinical trial data. Statistics in Medicine, 20:733-753.

O’Hagan A, Stevens J (2001). A framework for cost-effectiveness analysis from clinical trial data. Health Economics, 10:303-315.

Polsky D, Glick HA, Willke R, Schulman K (1997). Confidence intervals for cost-effectiveness ratios: a comparison of four methods. Health Economics, 6:243-252.

Sullivan W, Payne K (2011). The appropriate elicitation of expert opinion in economic models. Pharmacoeconomics, 29:455-459.

Sutton AJ, Abrams KR (2001). Bayesian methods in meta-analysis and evidence synthesis. Statistical Methods in Medical Research, 10:277-303.

Walley RJ, Smith CL, Gale JD, Woodward P (2015). Advantages of a wholly Bayesian approach to assessing efficacy in early drug development: a case study. Pharmaceutical Statistics, 14:205-215.

Yanuar F, Ibrahim K, Jemain AA (2013). Bayesian structural equation modeling for the health index. Journal of Applied Statistics, 40:1254-1269.

Yet B, Perkins ZB, Rasmussen TE, Tai NRM, Marsh WR (2014). Combining data and meta-analysis to build Bayesian networks for clinical decision support. Journal of Biomedical Informatics, 52:373-385.


Deja tu opinión:

Nombre:
E-mail: (No visible)
Titular:
Opinión:
¿Cuál es el número de en medio?
3 7 (9) 1 6


AES-Secretaría
TecnoCampus Mataró-Maresme
Edifici TCM2 | P2. O3.

Av. Ernest Lluch, 32
08302 Mataró (Barcelona)

Tel. 93 755 23 82
secretaria@aes.es
 

Editores del boletín: Carlos Campillo (campillo@ocea.es) y Cristina Hernández Quevedo (C.Hernandez-Quevedo@lse.ac.uk).

Editora de redacción: Cristina Hernández Quevedo (C.Hernandez-Quevedo@lse.ac.uk).

Comité de redacción:
José Mª Abellán Perpiñán, Manuel García Goñi, Ariadna García Prado, Miguel Ángel Negrín, Vicente Ortún, Luz María Peña.

Han colaborado en este número: Juan M. Cabasés, Jordi Colomer Mascaró, Asael Fernández Gómez, Xavier Labandeira, José M. Labeaga, Juan E. del Llano Señarís, Humberto Llavador, María Reyes Lorente Antoñanzas, Miguel Ángel Negrín Hernández, Marta Ortega Ortega, Vicente Ortún, José Antonio de la Rica Giménez, Marisol Rodríguez, Joan Salvà.