<?xml version="1.0" encoding="UTF-8"?><?xml-model type="application/xml-dtd" href="http://jats.nlm.nih.gov/publishing/1.1d3/JATS-journalpublishing1.dtd"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.1d3 20150301//EN" "http://jats.nlm.nih.gov/publishing/1.1d3/JATS-journalpublishing1.dtd">
<article xmlns:ali="http://www.niso.org/schemas/ali/1.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" dtd-version="1.1d3" specific-use="1.2" article-type="research-article" xml:lang="es">
<front>
<journal-meta>
<journal-id journal-id-type="pmc">2310</journal-id>
<journal-title-group>
<journal-title specific-use="original" xml:lang="es">Universitas Medica</journal-title>
<abbrev-journal-title abbrev-type="publisher" xml:lang="es">Univ. Med.</abbrev-journal-title>
</journal-title-group>
<issn pub-type="ppub">0041-9095</issn>
<issn pub-type="epub">2011-0839</issn>
<publisher>
<publisher-name>Pontificia Universidad Javeriana</publisher-name>
<publisher-loc>
<country>Colombia</country>
<email>revistascientificasjaveriana@gmail.com</email>
</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="art-access-id" specific-use="pmc">231068670004</article-id>
<article-id pub-id-type="doi">https://doi.org/10.11144/Javeriana.umed63-1.aphl</article-id>
<article-categories>
<subj-group subj-group-type="heading">
<subject>Revisión de tema</subject>
</subj-group>
</article-categories>
<title-group>
<article-title xml:lang="es">Abordaje práctico de la heterogeneidad en la lectura crítica de revisiones sistemáticas y metanálisis</article-title>
<trans-title-group>
<trans-title xml:lang="en">Practical Approach to Heterogeneity in Critical Appraisal of Systematic Reviews and Meta-analyses</trans-title>
</trans-title-group>
</title-group>
<contrib-group>
<contrib contrib-type="author" corresp="yes">
<contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-2552-9117</contrib-id>
<name name-style="western">
<surname>Pineda-Álvarez</surname>
<given-names>Mateo</given-names>
</name>
<xref ref-type="corresp" rid="corresp1"><sup>a</sup></xref>
<xref ref-type="aff" rid="aff1"/>
<email>mateo.pinedaa@udea.edu.co</email>
</contrib>
<contrib contrib-type="author" corresp="no">
<contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-1815-5583</contrib-id>
<name name-style="western">
<surname>Zapata-Ospina</surname>
<given-names>Juan Pablo</given-names>
</name>
<xref ref-type="aff" rid="aff2"/>
</contrib>
</contrib-group>
<aff id="aff1">
<institution content-type="original">Médico y cirujano, Facultad de Medicina, Universidad de Antioquia, Medellín</institution>
<institution content-type="orgname">Universidad de Antioquia</institution>
<country country="CO">Colombia</country>
</aff>
<aff id="aff2">
<institution content-type="original">Médico psiquiatra. Magíster en Epidemiología Clínica. Profesor del Instituto de Investigaciones Médicas, Facultad de Medicina, Universidad de Antioquia, Medellín, Colombia. Grupo Académico de Epidemiología Clínica (GRAEPIC).</institution>
<institution content-type="orgname">Universidad de Antioquia</institution>
<country country="CO">Colombia</country>
</aff>
<author-notes>
<corresp id="corresp1"><sup>a</sup> Autor de correspondencia: <email>mateo.pinedaa@udea.edu.co</email>
</corresp>
</author-notes>
<pub-date pub-type="epub-ppub">
<season>Enero-Marzo</season>
<year>2022</year>
</pub-date>
<volume>63</volume>
<issue>1</issue>
<history>
<date date-type="received" publication-format="dd/mm/yyyy">
<day>23</day>
<month>08</month>
<year>2021</year>
</date>
<date date-type="accepted" publication-format="dd/mm/yyyy">
<day>11</day>
<month>10</month>
<year>2021</year>
</date>
</history>
<permissions>
<ali:free_to_read/>
<license xlink:href="https://creativecommons.org/licenses/by/4.0/">
<ali:license_ref>https://creativecommons.org/licenses/by/4.0/</ali:license_ref>
<license-p>Esta obra está bajo una Licencia Creative Commons Atribución 4.0 Internacional.</license-p>
</license>
</permissions>
<abstract xml:lang="es">
<title>Resumen</title>
<p>Las revisiones sistemáticas de la literatura (RSL) y los metanálisis (MA) constituyen una herramienta confiable para la toma de decisiones dentro de la práctica de la medicina basada en la evidencia, por su alto poder y precisión, al combinar los resultados provenientes de estudios primarios. Uno de los problemas más frecuentes es que los resultados de los estudios varíen de manera significativa entre sí, lo que se conoce como heterogeneidad, esto es, la variabilidad existente entre los resultados de estudios primarios sobre un desenlace, que puede deberse a las diferencias inherentes a cada estudio. Esta se puede identificar a través de métodos estadísticos y gráficos. Y una vez identificada, se debe ahondar en las causas que la expliquen para comprender cómo pueden aplicarse los resultados. También es posible incorporar la heterogeneidad en el MA y minimizarla con modelos estadísticos para combinar los efectos. En la presente revisión narrativa de la literatura, se pretende definir la heterogeneidad en las RSL y MA y ofrecer un abordaje práctico para la lectura crítica de estos estudios secundarios.</p>
</abstract>
<trans-abstract xml:lang="en">
<title>Abstract</title>
<p>Systematic reviews (SR) and meta-analyses (MA) are studies that constitute a highly confident tool for decision-making within the practice of evidence-based medicine due to their high power and precision when combining the results of primary studies. One common issue in this type of study appears when there is a significant variation in the results of the primary studies, which is known as heterogeneity. Heterogeneity can be defined as the existing variability in measured outcomes between primary studies that can be explained by the inherent differences across individual studies. It can be detected through statistical and graphic methods. Once identified, the causes that explain such heterogeneity must be recognized to apply accurately the results. Heterogeneity can also be minimized in a MA by changing the statistical models used to combine the effects. The present narrative review aims to define heterogeneity in SR and MA and offer a practical approach to the critical appraising of these studies. Systematic literature reviews (RSL) and meta-analyzes (MA) due to their high power and precision when combining the results from primary studies</p>
</trans-abstract>
<kwd-group xml:lang="es">
<title>Palabras clave</title>
<kwd>revisión sistemática</kwd>
<kwd>metanálisis</kwd>
<kwd>métodos</kwd>
<kwd>medicina basada en la evidencia</kwd>
<kwd>sesgo</kwd>
</kwd-group>
<kwd-group xml:lang="en">
<title>Keywords</title>
<kwd>systematic review</kwd>
<kwd>meta-analysis</kwd>
<kwd>methods</kwd>
<kwd>evidence-based medicine</kwd>
<kwd>bias</kwd>
</kwd-group>
<counts>
<fig-count count="2"/>
<table-count count="0"/>
<equation-count count="0"/>
<ref-count count="26"/>
</counts>
<custom-meta-group>
<custom-meta>
<meta-name>Cómo citar</meta-name>
<meta-value>Pineda Álvarez M, Zapata-Ospina JP. Abordaje práctico de la heterogeneidad en la lectura crítica de revisiones sistemáticas y metanálisis. Univ. Med. 2022;63(1). <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.11144/Javeriana.umed63-1.aphl">https://doi.org/10.11144/Javeriana.umed63-1.aphl</ext-link>
</meta-value>
</custom-meta>
</custom-meta-group>
</article-meta>
</front>
<body>
<sec sec-type="intro">
<title><bold>Introducción</bold></title>
<p>El médico enfrenta problemas clínicos que lo harán plantearse preguntas que posiblemente deba responder con artículos científicos. Sin embargo, resulta poco práctico buscar todos los disponibles, pues la cantidad es exorbitante e incrementa continuamente. Para el 2017, por ejemplo, se registraron más de 800.000 artículos en Medline y para el año siguiente fueron 900.000 (<xref ref-type="bibr" rid="ref1">1</xref>). Por eso, las revisiones sistemáticas de la literatura (RSL) cumplen un papel fundamental, pues intentan resumir todos los artículos primarios sobre una pregunta clínica estructurada. A diferencia de las revisiones narrativas generales, la búsqueda de la literatura es explícita, para que sea reproducible y exhaustiva y para encontrar la mayor cantidad de artículos, de manera que se seleccionen luego los más apropiados.</p>
<p>Una RSL puede incluir diferentes tipos de estudios primarios, desde experimentales (como ensayos clínicos aleatorizados) hasta observacionales (como los de cohortes) (<xref ref-type="bibr" rid="ref2">2</xref>). Si los resultados son consistentes en todos los estudios, se pueden agrupar y sintetizar de forma cuantitativa o resumir estadísticamente, que es lo que conocemos como metanálisis (MA) (<xref ref-type="bibr" rid="ref2">2</xref>,<xref ref-type="bibr" rid="ref3">3</xref>). Muchos de estos estudios miden sus resultados con estimadores puntuales —por ejemplo, el riesgo relativo (RR), la razón de posibilidades u <italic>odds ratio</italic> (OR) o la diferencia de medias—, que se resumen en el MA. Así, se reúne información de distintas muestras para tener una mejor idea del universo de pacientes de la pregunta y alcanzar estimaciones más precisas. De hacerse de forma creíble, una RSL con MA opera como una lente que enfoca otros estudios y podría ser una herramienta muy confiable para la toma de decisiones dentro de la práctica de la medicina basada en la evidencia (<xref ref-type="bibr" rid="ref2">2</xref>,<xref ref-type="bibr" rid="ref4">4</xref>).</p>
<p>Uno de los problemas más frecuentes en las RSL es que los resultados de los estudios varíen de manera significativa entre sí, lo que conduce a una alta heterogeneidad al realizar el MA (<xref ref-type="bibr" rid="ref2">2</xref>). Debido a que las RSL siempre agruparán estudios de diferentes autores y características distintas, la heterogeneidad siempre estará presente en menor o mayor medida; de ahí la importancia de identificarla y analizarla para decidir si es tolerable, al punto de hacer confiable un MA. El objetivo de esta revisión narrativa es ofrecer una guía práctica dirigida a usuarios de la literatura médica para la comprensión de la heterogeneidad en las RSL.</p>
</sec>
<sec>
<title><bold>¿En qué consiste la heterogeneidad?</bold></title>
<p>La heterogeneidad es la variabilidad existente entre los resultados de los estudios primarios acerca de un desenlace y que puede explicarse por las diferencias inherentes a cada estudio (<xref ref-type="bibr" rid="ref5">5</xref>,<xref ref-type="bibr" rid="ref6">6</xref>). Por ello, se divide en tres tipos: clínica, que se refiere a diferencias en los pacientes, el escenario en que fue realizado o las intervenciones; metodológica, por diferencias en el diseño del estudio, su calidad o análisis realizado, y estadística, la variación de la estimación del efecto como tal, consecuencia de la heterogeneidad clínica, de la heterogeneidad metodológica o por azar (<xref ref-type="bibr" rid="ref7">7</xref>). Al combinar en un MA los resultados de varios estudios, es de esperarse que se obtenga un estimador puntual con intervalos de confianza mucho más estrechos y puedan aplicarse a una población más amplia. Pero si los estudios difieren mucho entre sí, estos cálculos pueden estar sesgados y llevar a conclusiones erróneas (<xref ref-type="bibr" rid="ref2">2</xref>).</p>
</sec>
<sec>
<title><bold>¿Cómo determinar que existe heterogeneidad?</bold></title>
<p>Debe comenzarse por la evaluación desde el punto de visto clínico. Para eso el lector debe saber sobre la enfermedad en estudio, para que al ver los estudios incluidos, pueda analizar las características de los participantes, las intervenciones (en estudio y cointervenciones), así como la medición de los desenlaces, y así determinar si alguno de esos factores plantea <italic>a priori</italic> un problema de estar combinando “peras y manzanas”. Luego puede evaluarse por medio de pruebas estadísticas y de gráficos.</p>
<sec>
<title><bold><italic>Pruebas estadísticas</italic></bold></title>
<sec>
<title><italic>Q de Cochran</italic></title>
<p>Las pruebas de hipótesis para calcular un valor de <italic>p</italic> son una forma estadística que se encuentra frecuentemente en la literatura médica. En este caso, esta prueba relaciona el aporte o peso de cada estudio con la medida resumen del MA. De esta forma se ve qué tan alejado está cada estudio de ese resumen. Con esa lógica, los autores usan este método para probar si hay homogeneidad o no, con la proposición de una hipótesis nula (que afirma que hay homogeneidad: los resultados son similares entre sí) y una hipótesis alterna (<italic>no</italic> hay homogeneidad: los resultados no son similares). Se estima una probabilidad sigue una distribución χ² (chi cuadrado), que no es más que una descripción de la forma abstracta que toman todos los valores posibles de esa probabilidad y con la que se define un punto crítico (o valor de <italic>p</italic>).</p>
<p>Lo que evalúan los autores al calcular ese valor de <italic>p</italic> es la probabilidad de que con los datos de todos los estudios se rechace o no la hipótesis nula. Como toda probabilidad, va de 0 a 1, y entre más cercano se encuentre del 0, es más probable que la hipótesis nula sea falsa y se rechace, es decir, es muy probable que no exista homogeneidad y los resultados sean heterogéneos. En cambio, entre más cercano se encuentre el valor de <italic>p</italic> al 1, más probabilidad hay de que con los datos la hipótesis nula sea verdadera y no se pueda rechazar. Ello indicará que los resultados son homogéneos (<xref ref-type="bibr" rid="ref8">8</xref>). En los MA, usualmente, se toma un valor crítico de <italic>p</italic> de 0,1 para mostrar que si es menor de ese valor, no hay homogeneidad; en tanto que si es mayor, existe homogeneidad (<xref ref-type="bibr" rid="ref9">9</xref>). Indica únicamente si hay o no heterogeneidad, y ante un número pequeño de estudios su poder estadístico es limitado (<xref ref-type="bibr" rid="ref10">10</xref>).</p>
</sec>
<sec>
<title><italic>Test de Breslow-Day</italic></title>
<p>Se utiliza específicamente para examinar la homogeneidad en las OR. Se calcula a partir del número de eventos observados frente a los esperados y cómo fueron en el grupo de intervención. Es una prueba de hipótesis donde la nula es que las OR son similares entre estudios y el valor de <italic>p</italic> también tiene una distribución χ². Tiene un bajo poder cuando el número de estudios es pequeño; lo ideal es más de 20 (<xref ref-type="bibr" rid="ref11">11</xref>). Por lo general, los autores de RSL anotan en la sección de métodos que usaron este test y el nivel de significancia que tomaron. Por ejemplo, en una RSL se comparó el uso de griseofulvina versus terbinafina para tratar la <italic>tinea capitis</italic> y se calculó una OR combinada de 0,86 en favor de la terbinafina, aunque no fue significativa (IC95 %: 0,57 a 1,27). El test de Breslow-Day dio un valor de <italic>p</italic> de 0,015, que fue considerado significativo, por ser menor de 0,05 (<xref ref-type="bibr" rid="ref12">12</xref>), e indica que los datos apoyan rechazar la hipótesis nula de homogeneidad, es decir, rechazar que las OR son similares, y habría heterogeneidad.</p>
</sec>
<sec>
<title><italic>Estadístico de inconsistencia (I</italic><sup><italic>2</italic></sup><italic>)</italic></title>
<p>Aunque toma como base la Q de Cochran, el I<sup>2</sup> permite cuantificar la heterogeneidad en lugar de probar si está o no presente. De ahí que sea más interpretable y la forma más frecuente en la que los autores reportan la heterogeneidad. Se calcula a partir de la resta del valor de la Q de Cochran y el conjunto de observaciones (estudios) con los que se estimó (llamado grados de libertad, que sería número de estudios menos 1) dividida por el valor de Q, lo cual se multiplica por 100 para calcular un porcentaje (<xref ref-type="bibr" rid="ref13">13</xref>). Lo que subyace en esta operación matemática es la variabilidad que se encuentra entre los estudios, que se debe a una verdadera variabilidad (es decir, debida a una verdadera heterogeneidad). Un porcentaje del 0 % indica que de la variabilidad que hay entre los estudios, ninguna se debe a una verdadera heterogeneidad. Por otro lado, un porcentaje del 100 % indica que toda la variabilidad entre estudios es por heterogeneidad. Se ha convenido utilizar la calificación de baja, moderada y alta para valores del I<sup>2</sup> de 25 %, 50 % y 75 %, respectivamente (<xref ref-type="bibr" rid="ref14">14</xref>).</p>
<p>A pesar de ser la medida más popular, se ha visto que el I<sup>2</sup> tiende a subestimar la heterogeneidad ante un número pequeño de estudios; por ejemplo, al combinar menos de siete estudios, el I<sup>2</sup> disminuye hasta 28 puntos (<xref ref-type="bibr" rid="ref15">15</xref>). También es necesario disminuir la incertidumbre sobre el verdadero valor del I<sup>2</sup>, por lo que idealmente los autores deben reportar el intervalo de confianza, que sería el rango en el que oscila ese valor, según los datos de los estudios incluidos (<xref ref-type="bibr" rid="ref16">16</xref>).</p>
</sec>
</sec>
<sec>
<title><bold><italic>Métodos gráficos</italic></bold></title>
<p>La inspección de gráficos complementa a la evaluación estadística.</p>
<sec>
<title><italic>Forest plot</italic></title>
<p>Consta de un eje vertical (<italic>y</italic>) en el que están los estudios incluidos, ordenados por algún criterio, como año de publicación o tamaño de muestra. En el eje horizontal (<italic>x</italic>) está la medida de efecto, que para el caso de los desenlaces dicotómicos (ocurrió/no ocurrió) sería el RR o la OR, y para los desenlaces cuantitativos (números), la diferencia de medias estandarizada (DME). El no efecto se representa con una línea sólida, que para el caso de medidas calculadas por división (RR u OR) sería el 1 o por sustracción (DME) sería el 0.</p>
<p>Cada estudio está representado por un cuadrado, cuyo tamaño depende del tamaño de la muestra y se ubicará en el eje horizontal según el efecto que reporten los autores. Cada cuadrado está inmerso en una línea horizontal que representa el intervalo de confianza de dicho estudio. Al final, se hace un acumulado del efecto total o, en otras palabras, la sumatoria del efecto de todos los estudios. Este acumulado está representado por un diamante, cuyo ancho representa su intervalo de confianza. Usualmente, hay una línea punteada que atraviesa el diamante por la mitad, es decir, pasa por el estimado del efecto acumulado. Si esta línea punteada atraviesa los intervalos de confianza de todos los estudios primarios, es posible que exista homogeneidad. Por el contrario, si hay estudios cuyos intervalos de confianza no son atravesados por la línea punteada, probablemente dichos estudios sean responsables de la heterogeneidad.</p>
<p>En la <xref ref-type="fig" rid="gf1">figura 1a</xref> se presenta el <italic>forest plot</italic> a partir de un ejemplo hipotético de los estudios que evaluaron el efecto sobre la mortalidad de una intervención, el cual es un desenlace dicotómico evaluado con el RR. Al ser el RR producto de una división, la línea sólida de este <italic>forest plot</italic> corresponde a la unidad. Se puede ver cómo el tamaño del estudio afecta su precisión; entonces, los estudios más grandes tienen intervalos de confianza más estrechos y el resumen final muestra un aumento del riesgo de morir en la intervención, que no es estadísticamente significativo (RR = 1,1; IC95 %: 0,98 a 1,32). Nótese cómo la línea punteada atraviesa los intervalos de confianza de todos los estudios, excepto del estudio 4, posible fuente de heterogeneidad para el MA.</p>
<p>Existe una variación conocida como <italic>forest plot acumulativo</italic>. Aquí se ordenan los estudios por un criterio establecido por los autores, y en lugar de mostrar el efecto de los estudios individuales, se muestra el efecto combinado a medida que se va sumando cada estudio (<xref ref-type="bibr" rid="ref17">17</xref>). En la <xref ref-type="fig" rid="gf1">figura 1b</xref> se muestra un ejemplo en el que se ven los estudios ordenados por año de publicación con su respectivo efecto y cómo, con cada estudio adicional, se calcula el nuevo estimado del efecto, por lo que, en lugar de un cuadrado, cada estudio se representa con diamantes, pues es un acumulado en sumatoria. Nótese que el intervalo de confianza se va volviendo cada vez más estrecho, debido a que se va sumando la muestra de los estudios anteriores, y el resultado es cada vez más preciso.</p>
<p>
<fig id="gf1">
<label>Figura 1</label>
<caption>
<title>Métodos gráficos para evaluar la heterogeneidad</title>
</caption>
<alt-text>Figura 1 Métodos gráficos para evaluar la heterogeneidad</alt-text>
<graphic xlink:href="231068670004_gf2.png" position="anchor" orientation="portrait"/>
</fig>
</p>
</sec>
<sec>
<title><italic>Gráfico de L’Abbé</italic></title>
<p>En el eje <italic>y</italic> se ubica el grupo de intervención, y en el eje <italic>x</italic>, el de control (<xref ref-type="fig" rid="gf1">figura 1c</xref>). La medida que se usa en este gráfico es RR u OR. Los estudios primarios están representados por círculos, cuyo tamaño dependerá de su tamaño muestral. Usualmente, encontraremos dos líneas en esta gráfica: una línea sólida que representa el no efecto (en el caso de RR y OR sería el número uno por tratarse de divisiones) y una línea punteada que representa el acumulado del efecto. Si los círculos se encuentran por debajo de la línea sólida, significa que el desenlace se presentó con menor frecuencia que en el grupo de control. Por el contrario, si los círculos están por encima de la línea sólida, el desenlace se dio con mayor frecuencia con la intervención.</p>
<p>Así, si el desenlace fuera mortalidad, los círculos por debajo de la línea sólida indicarían que la intervención es eficaz, puesto que representó menos muertes. O si el desenlace es curación, los círculos por encima de la línea sólida indicarían mayor eficacia de la intervención, porque la frecuencia del desenlace fue mayor. Es necesario analizar la cercanía de los círculos a la línea punteada: entre más cerca estén de la línea punteada y agrupados entre sí, significa poca heterogeneidad; y si los círculos están muy dispersos, la heterogeneidad es mayor. Se ha determinado, sin embargo, que el tamaño de la muestra afecta la distancia entre los círculos y la línea punteada, por lo que se debería realizar un ajuste por el tamaño de la muestra para evitar resultados espurios (<xref ref-type="bibr" rid="ref7">7</xref>,<xref ref-type="bibr" rid="ref11">11</xref>,<xref ref-type="bibr" rid="ref18">18</xref>). En la figura puede verse cómo los círculos más pequeños suelen estar más dispersos, y de ahí la importancia de hacer el ajuste por el tamaño de muestra.</p>
</sec>
<sec>
<title>
<italic>Gráfico del embudo </italic>(funnel plot)</title>
<p>Pretende detectar un sesgo de publicación al comparar la precisión de los estudios en el eje <italic>y</italic> (que está relacionado con el tamaño de la muestra) y la magnitud del efecto en el eje <italic>x</italic> (medido por el estimador puntual, por ejemplo: RR u OR). Una línea sólida representa el no efecto y se espera que los estudios más grandes sean más precisos; mientras que los pequeños, más imprecisos y con mayor riesgo de error aleatorio. Así, los estudios más pequeños estarán más dispersos y a ambos lados de la línea, lo que da una apariencia de embudo invertido (<xref ref-type="fig" rid="gf1">figura 1d</xref>). En la figura podemos observar que los estudios que están más abajo, en la base, son los estudios más pequeños y, por ende, más imprecisos. Los estudios que están en la parte superior son más precisos, probablemente por un mayor tamaño de muestra.</p>
<p>El objetivo con este gráfico es observar si hay simetría a simple vista o, idealmente, con pruebas estadísticas que lo confirmen. Una asimetría podría indicar sesgo de publicación y, al tener solo estudios tendientes a beneficiar la intervención, habría una homogeneidad artificial o sesgada. Este método requiere, por lo menos, 30 estudios para ser lo más confiable posible, aunque con 10 es factible. Resulta inconveniente que no existe una estandarización en la medida que se va a usar en el eje <italic>x</italic> e <italic>y</italic>, pues esto varía según el autor. Al cambiar la forma de medir el efecto, se altera la distribución del gráfico y, por tanto, su interpretación.</p>
<p>Conviene advertir que el sesgo de publicación no es la única explicación para la asimetría del embudo, así que su interpretación debe ser cuidadosa, pues puede darse por una verdadera heterogeneidad entre los estudios (<xref ref-type="bibr" rid="ref2">2</xref>,<xref ref-type="bibr" rid="ref11">11</xref>,<xref ref-type="bibr" rid="ref18">18</xref>). En el ejemplo presentado en la <xref ref-type="fig" rid="gf1">figura 1d</xref>, podemos notar que hay una aparente simetría visual, con más de 10 estudios incluidos. Sin embargo, sería ideal realizar pruebas estadísticas para verificar esta simetría aparente.</p>
</sec>
<sec>
<title><italic>Gráfico de Galbraith</italic></title>
<p>Se construye con una medida estandarizada del efecto en el eje ., que puede calcularse dividiendo el logaritmo natural de RR u OR sobre el error estándar (EE), es decir, <italic>lnRR/EE</italic>. El eje <italic>x</italic> representa una medida de la precisión de ese efecto, que generalmente es el inverso del error estándar, es decir, 1/EE. Así, la relación es entre el efecto obtenido y su precisión (<xref ref-type="fig" rid="gf1">figura 1e</xref>). Una línea sólida representa la medición acumulada del efecto y unas líneas punteadas representan el intervalo de confianza de dicho acumulado. Los estudios más pequeños e imprecisos se ubican muy cerca del origen de la gráfica, hacia la coordenada 0,0, y los más precisos se encuentran más alejados del origen.</p>
<p>Evaluamos la heterogeneidad viendo qué tan cerca están los estudios de la línea sólida: entre más equidistantes estén a la línea sólida, más homogéneos son (<xref ref-type="bibr" rid="ref7">7</xref>,<xref ref-type="bibr" rid="ref11">11</xref>,<xref ref-type="bibr" rid="ref18">18</xref>). Tomando el ejemplo de la <xref ref-type="fig" rid="gf1">figura 1e</xref>, se aprecia que la mayoría de los círculos se encuentran equidistantes a la línea sólida, pero hay un estudio impreciso que se localiza cerca del origen y otro más que se sale del límite de las líneas punteadas. Estos dos estudios podrían representar una fuente de heterogeneidad para la RSL.</p>
</sec>
</sec>
</sec>
<sec>
<title><bold>¿Qué hacer si se detecta heterogeneidad? </bold></title>
<p>Al encontrar evidencia de heterogeneidad, podemos decir que los resultados del efecto evaluado y que se pretenden combinar en el MA difieren mucho entre sí, más allá de lo esperado por errores del azar. Eso nos traería problemas si quisiéramos aplicar un tratamiento a nuevos pacientes, porque no estaríamos seguros de alcanzar el efecto visto en unos u otros estudios. La idea, entonces, es que los autores de RSL traten de explicar por qué se puede estar dando ese grado de inconsistencia y minimizarlo. Si los autores consideran que no es posible minimizar dicha inconsistencia, debería abandonarse la idea de combinar los resultados en el MA y únicamente describir los resultados de los estudios (síntesis cualitativa). Sabemos de casos en los que, aun en presencia de heterogeneidad alta, los autores de RSL presentan un MA, el cual debe criticarse y omitirse, porque estaría dando una combinación del efecto sesgada.</p>
<sec>
<title><bold><italic>Investigación de fuentes de heterogeneidad </italic></bold></title>
<sec>
<title><italic>Análisis clínico</italic></title>
<p>Como dijimos, el primer paso es evaluar la heterogeneidad que parte de los elementos de la pregunta PICO (población, intervención, comparador y <italic>outcomes</italic> o desenlaces). Se deben considerar las características de los participantes, de los estudios primarios incluidos y evaluar la edad, el sexo o comorbilidades y determinar qué tanta variación hay. En la intervención, evaluar dosificación, vía de administración o adherencia. También las comparaciones realizadas: ¿se usó placebo? Si se usó el tratamiento usual, ¿fue definido de la misma forma? ¿Se usó el mismo comparador? Si el comparador es otro medicamento, ¿cómo eran las dosis, vía de administración y adherencia? En cuanto a los desenlaces, se debe identificar si usaron instrumentos o definiciones operativas muy diferentes (<xref ref-type="bibr" rid="ref19">19</xref>,<xref ref-type="bibr" rid="ref20">20</xref>). El segundo paso es evaluar los aspectos metodológicos de los estudios. Si se están evaluando ensayos clínicos aleatorizados, se debe determinar si fueron adecuados la aleatorización, el cegamiento, el ocultamiento, el seguimiento de los pacientes, y si se presentaron conflictos de interés (<xref ref-type="bibr" rid="ref11">11</xref>,<xref ref-type="bibr" rid="ref19">19</xref>).</p>
</sec>
<sec>
<title><italic>Análisis de sensibilidad</italic></title>
<p>El objetivo es medir hasta qué punto las variables responsables de heterogeneidad repercuten en la medida del efecto del MA. Uno de ellos es la exclusión de <italic>outliers</italic> o resultados extremos, es decir, aquellos que se alejan tanto del promedio que afectan el resultado. Estos<italic> outliers</italic> pueden ser pacientes o estudios completos. El análisis de sensibilidad excluirá aquellos participantes o estudios que tengan resultados más extremos, para ver si se obtiene un resumen más homogéneo. Se pueden excluir estudios completos por problemas en su diseño. Así, un ensayo clínico aleatorizado, por ejemplo, podría ser excluido si no se realizó una adecuada aleatorización y ver cómo cambia el MA. Sin embargo, estas exclusiones pueden comprometer el rigor metodológico de la RSL (<xref ref-type="bibr" rid="ref11">11</xref>,<xref ref-type="bibr" rid="ref21">21</xref>) y lo que debemos analizar es cómo cambian los resultados con la exclusión y sin esta.</p>
</sec>
<sec>
<title><italic>Análisis por subgrupos</italic></title>
<p>La diversidad en las características de los pacientes de cada estudio puede afectar los resultados de un MA. Así, por ejemplo, si los pacientes de mayor edad tienden a morir más con la intervención que los de menor edad, puede haber un resultado sesgado en cuanto a mortalidad, por la diferencia que se presenta entre ambos subgrupos de edad, más que por efecto de la intervención. Los autores de una RSL deben identificar <italic>a priori</italic> aquellas variables que puedan explicar una posible heterogeneidad en los resultados, desde su conocimiento clínico y fisiopatológico. Esto se ve en un <italic>forest plot</italic> en el que se combina el efecto para un subgrupo y para el otro y se calcula el valor de <italic>p</italic> de la interacción o de la modificación del efecto. De encontrar significancia estadística, se sugiere que la variable que forma los subgrupos influye en el efecto de la intervención y los resultados pueden ser más homogéneos y aplicables a uno de los subgrupos. Se debe ser cuidadoso con este análisis, ya que puede dar resultados espurios y, por eso, las variables definidas deben estar bien sustentadas. Un análisis por subgrupos <italic>post hoc</italic> (después de tener los datos) no es recomendable (<xref ref-type="bibr" rid="ref2">2</xref>,<xref ref-type="bibr" rid="ref22">22</xref>).</p>
</sec>
<sec>
<title><italic>Metarregresión</italic></title>
<p>Se usa con variables cuantitativas que puedan explicar la heterogeneidad (como edad, peso corporal, concentraciones séricas de colesterol o año de publicación). Estas variables se denominan <italic>variables independientes</italic> y el efecto resumido es la variable dependiente. Se realiza un modelo estadístico de regresión que relaciona la variable dependiente y las independientes y se ve la significancia estadística de dicha relación. Entre más lineal sea la relación entre la variable independiente con la dependiente, mayor probabilidad hay de que la covariable esté contribuyendo con la heterogeneidad.</p>
<p>Por lo general, se informa el valor de <italic>p</italic> de dicha variable en la regresión. Por ejemplo, en una RSL sobre el efecto de la suplementación con vitamina D para prevención cardiovascular en jóvenes (<xref ref-type="bibr" rid="ref23">23</xref>), no se observó influencia de las concentraciones plasmáticas previas de S-25-hidroxivitamina D en el desenlace cardiovascular (valor de <italic>p</italic> &gt; 0,29). De todas formas, se debe tener en cuenta que la metarregresión es propensa a falsos positivos (<xref ref-type="bibr" rid="ref19">19</xref>,<xref ref-type="bibr" rid="ref24">24</xref>).</p>
</sec>
</sec>
<sec>
<title><bold><italic>Minimización de la heterogeneidad: modelos estadísticos para medir el efecto</italic></bold></title>
<p>Es posible para los autores incorporar la heterogeneidad en el MA a través de los modelos estadísticos para combinar los efectos. Por un lado, el modelo de efectos aleatorios se usa cuando la heterogeneidad es grande y el estimado del efecto tiene gran variabilidad entre estudios. Este modelo permite evaluar la variabilidad que hay dentro de cada estudio por sí solo y en todos los estudios entre sí. Los intervalos de confianza que se generan suelen ser más amplios y los estudios grandes tienen un peso menor (<xref ref-type="bibr" rid="ref25">25</xref>,<xref ref-type="bibr" rid="ref26">26</xref>).</p>
<p>Por otro lado, el modelo de efectos fijos se usa cuando la heterogeneidad no es muy grande, por lo que se considera que la variabilidad del estimador del efecto entre estudios no es tan alta. No se evalúa la variabilidad que hay entre los estudios, pero sí la variabilidad que hay dentro de cada estudio. Los intervalos de confianza en este modelo son más pequeños y se les da un mayor peso a los estudios que sean más grandes (<xref ref-type="bibr" rid="ref25">25</xref>).</p>
</sec>
</sec>
<sec sec-type="conclusions">
<title><bold>Conclusiones</bold></title>
<p>La heterogeneidad puede ser un problema al realizar las RSL, si los autores no la identifican y manejan adecuadamente para evitar presentar resultados sesgados. Los usuarios de la literatura médica deben tener en cuenta la heterogeneidad en las RSL y verificar que los autores sí la hayan explorado y minimizado, para poder creer y confiar en los resultados en el momento de aplicarlos en la práctica clínica. Con este fin se propone, a modo de resumen, un algoritmo para la identificación y evaluación de la heterogeneidad (<xref ref-type="fig" rid="gf2">figura 2</xref>).</p>
<p>
<fig id="gf2">
<label>Figura 2</label>
<caption>
<title>Cómo identificar y evaluar la heterogeneidad</title>
</caption>
<alt-text>Figura 2 Cómo identificar y evaluar la heterogeneidad</alt-text>
<graphic xlink:href="231068670004_gf3.png" position="anchor" orientation="portrait"/>
</fig>
</p>
</sec>
<sec>
<title><bold>Financiación</bold></title>
<p>No se recibió financiación de ningún ente público o privado para la realización de este artículo.</p>
</sec>
<sec>
<title><bold>Conflicto de intereses</bold></title>
<p>Ninguno por declarar.</p>
</sec>
</body>
<back>
<ref-list>
<title><bold>Referencias</bold></title>
<ref id="ref1">
<label>1.</label>
<mixed-citation>1. Citations Added to MEDLINE by Fiscal Year. Bethesda: U.S. National Library of Medicine; c2019 [citado 2020 abr 15]. Disponible en: <ext-link ext-link-type="uri" xlink:href="https://www.nlm.nih.gov/bsd/stats/cit_added.html">https://www.nlm.nih.gov/bsd/stats/cit_added.html</ext-link>
</mixed-citation>
<element-citation publication-type="webpage">
<person-group person-group-type="author">
<collab>U.S. National Library of Medicine</collab>
</person-group>
<source>Citations Added to MEDLINE by Fiscal Year</source>
<year>2019</year>
<publisher-loc>Bethesda</publisher-loc>
<publisher-name>U.S. National Library of Medicine</publisher-name>
<date-in-citation content-type="access-date" iso-8601-date="2020/04/15">2020/04/15</date-in-citation>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://www.nlm.nih.gov/bsd/stats/cit_added.html">https://www.nlm.nih.gov/bsd/stats/cit_added.html</ext-link>
</comment>
<comment>c2019</comment>
</element-citation>
</ref>
<ref id="ref2">
<label>2.</label>
<mixed-citation>2. Guyatt GH, Rennie D, Meade MO, Cook DJ, editores. Users′ guide to the medical literature: a manual for evidence-based clinical practice. 3.ª ed. New York: McGraw-Hill Education; 2015. p. 459-89.</mixed-citation>
<element-citation publication-type="book">
<person-group person-group-type="editor">
<name>
<surname>Guyatt</surname>
<given-names>GH</given-names>
</name>
<name>
<surname>Rennie</surname>
<given-names>D</given-names>
</name>
<name>
<surname>Meade</surname>
<given-names>MO</given-names>
</name>
<name>
<surname>Cook</surname>
<given-names>DJ</given-names>
</name>
</person-group>
<source>Users′ guide to the medical literature: a manual for evidence-based clinical practice</source>
<year>2015</year>
<fpage>459</fpage>
<lpage>489</lpage>
<publisher-loc>New York</publisher-loc>
<publisher-name>McGraw-Hill Education</publisher-name>
<edition>3.ª ed.</edition>
</element-citation>
</ref>
<ref id="ref3">
<label>3.</label>
<mixed-citation>3. García-Perdomo HA. Conceptos fundamentales de las revisiones sistemáticas/metanálisis. Rev Urol Colomb. 2015;XXIV(1):28-34.</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>García-Perdomo</surname>
<given-names>HA</given-names>
</name>
</person-group>
<article-title>Conceptos fundamentales de las revisiones sistemáticas/metanálisis</article-title>
<source>Rev Urol Colomb</source>
<year>2015</year>
<volume>XXIV</volume>
<issue>1</issue>
<fpage>28</fpage>
<lpage>34</lpage>
</element-citation>
</ref>
<ref id="ref4">
<label>4.</label>
<mixed-citation>4. Murad MH, Asi N, Alsawas M, Alahdab F. New evidence pyramid. BMJ Evidence-Based Medicine. 2016;21:125-127. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1136/ebmed-2016-110401">https://doi.org/10.1136/ebmed-2016-110401</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Murad</surname>
<given-names>MH</given-names>
</name>
<name>
<surname>Asi</surname>
<given-names>N</given-names>
</name>
<name>
<surname>Alsawas</surname>
<given-names>M</given-names>
</name>
<name>
<surname>Alahdab</surname>
<given-names>F</given-names>
</name>
</person-group>
<article-title>New evidence pyramid. BMJ Evidence-Based Medicine</article-title>
<source>BMJ Evidence-Based Medicine</source>
<year>2016</year>
<volume>21</volume>
<fpage>125</fpage>
<lpage>127</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1136/ebmed-2016-110401">https://doi.org/10.1136/ebmed-2016-110401</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1136/ebmed-2016-110401</pub-id>
</element-citation>
</ref>
<ref id="ref5">
<label>5.</label>
<mixed-citation>5. Thompson SG, Sharp SJ. Explaining heterogeneity in meta-analysis: a comparison of methods. Stat Med. 1999;18(20):2693-708. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/(sici)1097-0258(19991030)18:20&lt;2693::aid-sim235&gt;3.0.co;2-v">https://doi.org/10.1002/(sici)1097-0258(19991030)18:20&lt;2693::aid-sim235&gt;3.0.co;2-v</ext-link></mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Thompson</surname>
<given-names>SG</given-names>
</name>
<name>
<surname>Sharp</surname>
<given-names>SJ</given-names>
</name>
</person-group>
<article-title>Explaining heterogeneity in meta-analysis: a comparison of methods</article-title>
<source>Stat Med</source>
<year>1999</year>
<volume>18</volume>
<issue>20</issue>
<fpage>2693</fpage>
<lpage>2708</lpage>
<pub-id pub-id-type="doi">10.1002/(sici)1097-0258(19991030)18:20&lt;2693::aid-sim235&gt;3.0.co;2-v</pub-id>
</element-citation>
</ref>
<ref id="ref6">
<label>6.</label>
<mixed-citation>6. Engels EA, Schmid CH, Terrin N, Olkin I, Joseph L. Heterogeneity and statistical significance in meta-analysis: an empirical study of 125 meta-analyses. Stat Med. 2000;19(13):1707-28.<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/1097-0258(20000715)19:13&lt;1707::aid-sim491&gt;3.0.co;2-p"> https://doi.org/10.1002/1097-0258(20000715)19:13&lt;1707::aid-sim491&gt;3.0.co;2-p</ext-link></mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Engels</surname>
<given-names>EA</given-names>
</name>
<name>
<surname>Schmid</surname>
<given-names>CH</given-names>
</name>
<name>
<surname>Terrin</surname>
<given-names>N</given-names>
</name>
<name>
<surname>Olkin</surname>
<given-names>I</given-names>
</name>
<name>
<surname>Joseph</surname>
<given-names>L</given-names>
</name>
</person-group>
<article-title>Heterogeneity and statistical significance in meta-analysis: an empirical study of 125 meta-analyses</article-title>
<source>Stat Med</source>
<year>2020</year>
<volume>19</volume>
<issue>13</issue>
<fpage>1707</fpage>
<lpage>1728</lpage>
<pub-id pub-id-type="doi">10.1002/1097-0258(20000715)19:13&lt;1707::aid-sim491&gt;3.0.co;2-p</pub-id>
</element-citation>
</ref>
<ref id="ref7">
<label>7.</label>
<mixed-citation>7. Xu H, Platt RW, Luo ZC, Wei S, Fraser WD. Exploring heterogeneity in meta-analyses: needs, resources and challenges. Paediatr Perinat Epidemiol. 2008;22(Suppl 1):18-28. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1111/j.1365-3016.2007.00908.x">https://doi.org/10.1111/j.1365-3016.2007.00908.x</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Xu</surname>
<given-names>H</given-names>
</name>
<name>
<surname>Platt</surname>
<given-names>RW</given-names>
</name>
<name>
<surname>Luo</surname>
<given-names>ZC</given-names>
</name>
<name>
<surname>Wei</surname>
<given-names>S</given-names>
</name>
<name>
<surname>Fraser</surname>
<given-names>WD</given-names>
</name>
</person-group>
<article-title>Exploring heterogeneity in meta-analyses: needs, resources and challenges</article-title>
<source>Paediatr Perinat Epidemiol</source>
<year>2008</year>
<volume>22</volume>
<fpage>18</fpage>
<lpage>28</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1111/j.1365-3016.2007.00908.x">https://doi.org/10.1111/j.1365-3016.2007.00908.x</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1111/j.1365-3016.2007.00908.x</pub-id>
<supplement>Suppl 1</supplement>
</element-citation>
</ref>
<ref id="ref8">
<label>8.</label>
<mixed-citation>8. Dahiru T. P-value, a true test of statistical significance? a cautionary note. Ann Ib Postgrad Med. 2008;6(1):21-26.</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Dahiru</surname>
<given-names>T</given-names>
</name>
</person-group>
<article-title>P-value, a true test of statistical significance? a cautionary note</article-title>
<source>Ann Ib Postgrad Med</source>
<year>2008</year>
<volume>6</volume>
<issue>1</issue>
<fpage>21</fpage>
<lpage>26</lpage>
</element-citation>
</ref>
<ref id="ref9">
<label>9.</label>
<mixed-citation>9. Centro Cochrane Iberoamericano, traductores. Manual Cochrane de revisiones sistemáticas de intervenciones, versión 5.1.0 [actualizada en marzo de 2011] [internet]. Barcelona: Centro Cochrane Iberoamericano; 2012. Disponible en: <ext-link ext-link-type="uri" xlink:href="http://www.cochrane.es/?q=es/node/269">http://www.cochrane.es/?q=es/node/269</ext-link>
</mixed-citation>
<element-citation publication-type="book">
<person-group person-group-type="translator">
<collab>Centro Cochrane Iberoamericano</collab>
</person-group>
<source>Manual Cochrane de revisiones sistemáticas de intervenciones, versión 5.1.0</source>
<year>2012</year>
<publisher-loc>Barcelona</publisher-loc>
<publisher-name>Centro Cochrane Iberoamericano</publisher-name>
<date-in-citation content-type="updated" iso-8601-date="2011/03/01">2011/03/01</date-in-citation>
<comment>
<ext-link ext-link-type="uri" xlink:href="http://www.cochrane.es/?q=es/node/269">http://www.cochrane.es/?q=es/node/269</ext-link>
</comment>
<comment>internet</comment>
</element-citation>
</ref>
<ref id="ref10">
<label>10.</label>
<mixed-citation>10. Viechtbauer W. Hypothesis tests for population heterogeneity in meta-analysis. Br J Math Stat Psychol. 2007;60(1):29-60. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1348/000711005X64042">https://doi.org/10.1348/000711005X64042</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Viechtbauer</surname>
<given-names>W</given-names>
</name>
</person-group>
<article-title>Hypothesis tests for population heterogeneity in meta-analysis</article-title>
<source>Br J Math Stat Psychol</source>
<year>2007</year>
<volume>60</volume>
<issue>1</issue>
<fpage>29</fpage>
<lpage>60</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1348/000711005X64042">https://doi.org/10.1348/000711005X64042</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1348/000711005X64042</pub-id>
</element-citation>
</ref>
<ref id="ref11">
<label>11.</label>
<mixed-citation>11. Song F, Sheldon TA, Sutton AJ, Abrams KR, Jones DR. Methods for exploring heterogeneity in meta-analysis. Eval Health Prof. 2001;24(2):126-51.</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Song</surname>
<given-names>F</given-names>
</name>
<name>
<surname>Sheldon</surname>
<given-names>TA</given-names>
</name>
<name>
<surname>Sutton</surname>
<given-names>AJ</given-names>
</name>
<name>
<surname>Abrams</surname>
<given-names>KR</given-names>
</name>
<name>
<surname>Jones</surname>
<given-names>DR</given-names>
</name>
</person-group>
<article-title>Methods for exploring heterogeneity in meta-analysis</article-title>
<source>Eval Health Prof</source>
<year>2001</year>
<volume>24</volume>
<issue>2</issue>
<fpage>126</fpage>
<lpage>151</lpage>
</element-citation>
</ref>
<ref id="ref12">
<label>12.</label>
<mixed-citation>12. Fleece D, Gaughan JP, Aronoff SC. Griseofulvin versus terbinafine in the treatment of tinea capitis:a meta-analysis of randomized, clinical trials. Pediatrics. 2004;114(5):1312-5. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1177/016327870102400203">https://doi.org/10.1177/016327870102400203</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Fleece</surname>
<given-names>D</given-names>
</name>
<name>
<surname>Gaughan</surname>
<given-names>JP</given-names>
</name>
<name>
<surname>Aronoff</surname>
<given-names>SC</given-names>
</name>
</person-group>
<article-title>Griseofulvin versus terbinafine in the treatment of tinea capitis:a meta-analysis of randomized, clinical trials</article-title>
<source>Pediatrics</source>
<year>2004</year>
<volume>114</volume>
<issue>5</issue>
<fpage>1312</fpage>
<lpage>1315</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1177/016327870102400203">https://doi.org/10.1177/016327870102400203</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1177/016327870102400203</pub-id>
</element-citation>
</ref>
<ref id="ref13">
<label>13.</label>
<mixed-citation>13. Higgins JPT, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002;21(11):1539-58. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/sim.1186">https://doi.org/10.1002/sim.1186</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Higgins</surname>
<given-names>JPT</given-names>
</name>
<name>
<surname>Thompson</surname>
<given-names>SG</given-names>
</name>
</person-group>
<article-title>Quantifying heterogeneity in a meta-analysis</article-title>
<source>Stat Med</source>
<year>2002</year>
<volume>21</volume>
<issue>11</issue>
<fpage>1539</fpage>
<lpage>1558</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/sim.1186">https://doi.org/10.1002/sim.1186</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1002/sim.1186</pub-id>
</element-citation>
</ref>
<ref id="ref14">
<label>14.</label>
<mixed-citation>14. Higgins JPT, Thompson SG, Deeks JJ, Altman DG. Measuring inconsistency in meta-analyses. BMJ. 2003;327(7414):557-60. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1136/bmj.327.7414.557">https://doi.org/10.1136/bmj.327.7414.557</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Higgins</surname>
<given-names>JPT</given-names>
</name>
<name>
<surname>Thompson</surname>
<given-names>SG</given-names>
</name>
<name>
<surname>Deeks</surname>
<given-names>JJ</given-names>
</name>
<name>
<surname>Altman</surname>
<given-names>DG</given-names>
</name>
</person-group>
<article-title>Measuring inconsistency in meta-analyses</article-title>
<source>BMJ</source>
<year>2003</year>
<volume>327</volume>
<issue>7414</issue>
<fpage>557</fpage>
<lpage>560</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1136/bmj.327.7414.557">https://doi.org/10.1136/bmj.327.7414.557</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1136/bmj.327.7414.557</pub-id>
</element-citation>
</ref>
<ref id="ref15">
<label>15.</label>
<mixed-citation>15. Von Hippel PT. The heterogeneity statistic I(2) can be biased in small meta-analyses. BMC Med Res Methodol. 2015;15:35. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1186/s12874-015-0024-z">https://doi.org/10.1186/s12874-015-0024-z</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Von Hippel</surname>
<given-names>PT</given-names>
</name>
</person-group>
<article-title>The heterogeneity statistic I(2) can be biased in small meta-analyses</article-title>
<source>BMC Med Res Methodol</source>
<year>2015</year>
<volume>15</volume>
<fpage>35</fpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1186/s12874-015-0024-z">https://doi.org/10.1186/s12874-015-0024-z</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1186/s12874-015-0024-z</pub-id>
</element-citation>
</ref>
<ref id="ref16">
<label>16.</label>
<mixed-citation>16. Ioannidis JPA, Patsopoulos NA, Evangelou E. Uncertainty in heterogeneity estimates in meta-analyses. BMJ. 2007;335(7626):914-6. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1136/bmj.39343.408449.80">https://doi.org/10.1136/bmj.39343.408449.80</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Ioannidis</surname>
<given-names>JPA</given-names>
</name>
<name>
<surname>Patsopoulos</surname>
<given-names>NA</given-names>
</name>
<name>
<surname>Evangelou</surname>
<given-names>E</given-names>
</name>
</person-group>
<article-title>Uncertainty in heterogeneity estimates in meta-analyses</article-title>
<source>BMJ</source>
<year>2007</year>
<volume>335</volume>
<issue>7626</issue>
<fpage>914</fpage>
<lpage>916</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1136/bmj.39343.408449.80">https://doi.org/10.1136/bmj.39343.408449.80</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1136/bmj.39343.408449.80</pub-id>
</element-citation>
</ref>
<ref id="ref17">
<label>17.</label>
<mixed-citation>17. Lau J, Schmid CH, Chalmers TC. Cumulative meta-analysis of clinical trials builds evidence for exemplary medical care. J Clin Epidemiol. 1995;48(1):45-57. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/0895-4356(94)00106-z">https://doi.org/10.1016/0895-4356(94)00106-z</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Lau</surname>
<given-names>J</given-names>
</name>
<name>
<surname>Schmid</surname>
<given-names>CH</given-names>
</name>
<name>
<surname>Chalmers</surname>
<given-names>TC</given-names>
</name>
</person-group>
<article-title>Cumulative meta-analysis of clinical trials builds evidence for exemplary medical care</article-title>
<source>J Clin Epidemiol</source>
<year>1995</year>
<volume>48</volume>
<issue>1</issue>
<fpage>45</fpage>
<lpage>57</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/0895-4356(94)00106-z">https://doi.org/10.1016/0895-4356(94)00106-z</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1016/0895-4356(94)00106-z</pub-id>
</element-citation>
</ref>
<ref id="ref18">
<label>18.</label>
<mixed-citation>18. Bax L, Ikeda N, Fukui N, Yaju Y, Tsuruta H, Moons KGM. More than numbers: the power of graphs in meta-analysis. Am J Epidemiol. 2009;169(2):249-55. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/aje/kwn340">https://doi.org/10.1093/aje/kwn340</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Bax</surname>
<given-names>L</given-names>
</name>
<name>
<surname>Ikeda</surname>
<given-names>N</given-names>
</name>
<name>
<surname>Fukui</surname>
<given-names>N</given-names>
</name>
<name>
<surname>Yaju</surname>
<given-names>Y</given-names>
</name>
<name>
<surname>Tsuruta</surname>
<given-names>H</given-names>
</name>
<name>
<surname>Moons</surname>
<given-names>KGM</given-names>
</name>
</person-group>
<article-title>More than numbers: the power of graphs in meta-analysis</article-title>
<source>Am J Epidemiol</source>
<year>2009</year>
<volume>169</volume>
<issue>2</issue>
<fpage>249</fpage>
<lpage>255</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/aje/kwn340">https://doi.org/10.1093/aje/kwn340</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1093/aje/kwn340</pub-id>
</element-citation>
</ref>
<ref id="ref19">
<label>19.</label>
<mixed-citation>19. Petitti DB. Approaches to heterogeneity in meta-analysis. Stat Med. 2001;20(23):3625-33. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/sim.1091">https://doi.org/10.1002/sim.1091</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Petitti</surname>
<given-names>DB</given-names>
</name>
</person-group>
<article-title>Approaches to heterogeneity in meta-analysis</article-title>
<source>Stat Med</source>
<year>2001</year>
<volume>20</volume>
<issue>23</issue>
<fpage>3625</fpage>
<lpage>3633</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/sim.1091">https://doi.org/10.1002/sim.1091</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1002/sim.1091</pub-id>
</element-citation>
</ref>
<ref id="ref20">
<label>20.</label>
<mixed-citation>20. West SL, Gartlehner G, Mansfield AJ, Poole C, Tant E, Lenfestey N, et al. Comparative effectiveness review methods: clinical heterogeneity [internet]. Agency for Healthcare Research and Quality; September 2010. Disponible en: <ext-link ext-link-type="uri" xlink:href="http://effectivehealthcare.ahrq.gov">http://effectivehealthcare.ahrq.gov</ext-link>/</mixed-citation>
<element-citation publication-type="webpage">
<person-group person-group-type="author">
<name>
<surname>West</surname>
<given-names>SL</given-names>
</name>
<name>
<surname>Gartlehner</surname>
<given-names>G</given-names>
</name>
<name>
<surname>Mansfield</surname>
<given-names>AJ</given-names>
</name>
<name>
<surname>Poole</surname>
<given-names>C</given-names>
</name>
<name>
<surname>Tant</surname>
<given-names>E</given-names>
</name>
<name>
<surname>Lenfestey</surname>
<given-names>N</given-names>
</name>
</person-group>
<source>Comparative effectiveness review methods: clinical heterogeneity</source>
<year>2010</year>
<publisher-name>Agency for Healthcare Research and Quality</publisher-name>
<date-in-citation content-type="updated" iso-8601-date="2010/09/01">2010/09/01</date-in-citation>
<comment>
<ext-link ext-link-type="uri" xlink:href="http://effectivehealthcare.ahrq.gov">http://effectivehealthcare.ahrq.gov</ext-link>
</comment>
<comment>internet</comment>
</element-citation>
</ref>
<ref id="ref21">
<label>21.</label>
<mixed-citation>21. De Souza RJ, Eisen RB, Perera S, Bantoto B, Bawor M, Dennis BB, et al. Best (but oft-forgotten) practices: sensitivity analyses in randomized controlled trials. Am J of Clin Nutr. 2016;103(1):5-17. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3945/ajcn.115.121848">https://doi.org/10.3945/ajcn.115.121848</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>De Souza</surname>
<given-names>RJ</given-names>
</name>
<name>
<surname>Eisen</surname>
<given-names>RB</given-names>
</name>
<name>
<surname>Perera</surname>
<given-names>S</given-names>
</name>
<name>
<surname>Bantoto</surname>
<given-names>B</given-names>
</name>
<name>
<surname>Bawor</surname>
<given-names>M</given-names>
</name>
<name>
<surname>Dennis</surname>
<given-names>BB</given-names>
</name>
</person-group>
<article-title>Best (but oft-forgotten) practices: sensitivity analyses in randomized controlled trials</article-title>
<source>Am J of Clin Nutr</source>
<year>2016</year>
<volume>103</volume>
<issue>1</issue>
<fpage>5</fpage>
<lpage>17</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3945/ajcn.115.121848">https://doi.org/10.3945/ajcn.115.121848</ext-link>
</comment>
<pub-id pub-id-type="doi">10.3945/ajcn.115.121848</pub-id>
</element-citation>
</ref>
<ref id="ref22">
<label>22.</label>
<mixed-citation>22. Oxman AD, Guyatt GH. A consumer’s guide to subgroup analyses. Ann Intern Med. 1992;116(1):78-84. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.7326/0003-4819-116-1-78">https://doi.org/10.7326/0003-4819-116-1-78</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Oxman</surname>
<given-names>AD</given-names>
</name>
<name>
<surname>Guyatt</surname>
<given-names>GH</given-names>
</name>
</person-group>
<article-title>A consumer’s guide to subgroup analyses</article-title>
<source>Ann Intern Med</source>
<year>1992</year>
<volume>116</volume>
<issue>1</issue>
<fpage>78</fpage>
<lpage>84</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.7326/0003-4819-116-1-78">https://doi.org/10.7326/0003-4819-116-1-78</ext-link>
</comment>
<pub-id pub-id-type="doi">10.7326/0003-4819-116-1-78</pub-id>
</element-citation>
</ref>
<ref id="ref23">
<label>23.</label>
<mixed-citation>23. Hauger H, Laursen RP, Ritz C, Mølgaard C, Lind MV, Damsgaard CT. Effects of vitamin D supplementation on cardiometabolic outcomes in children and adolescents:a systematic review and meta-analysis of randomized controlled trials. Eur J Nutr. 2020;59(3):873-84. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s00394-019-02150-x">https://doi.org/10.1007/s00394-019-02150-x</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Hauger</surname>
<given-names>H</given-names>
</name>
<name>
<surname>Laursen</surname>
<given-names>RP</given-names>
</name>
<name>
<surname>Ritz</surname>
<given-names>C</given-names>
</name>
<name>
<surname>Mølgaard</surname>
<given-names>C</given-names>
</name>
<name>
<surname>Lind</surname>
<given-names>MV</given-names>
</name>
<name>
<surname>Damsgaard</surname>
<given-names>CT</given-names>
</name>
</person-group>
<article-title>Effects of vitamin D supplementation on cardiometabolic outcomes in children and adolescents:a systematic review and meta-analysis of randomized controlled trials</article-title>
<source>Eur J Nutr</source>
<year>2020</year>
<volume>59</volume>
<issue>3</issue>
<fpage>873</fpage>
<lpage>884</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s00394-019-02150-x">https://doi.org/10.1007/s00394-019-02150-x</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1007/s00394-019-02150-x</pub-id>
</element-citation>
</ref>
<ref id="ref24">
<label>24.</label>
<mixed-citation>24. Higgins JPT, Thompson SG. Controlling the risk of spurious findings from meta-regression. Stat Med. 2004;23(11):1663-82. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/sim.1752">https://doi.org/10.1002/sim.1752</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Higgins</surname>
<given-names>JPT</given-names>
</name>
<name>
<surname>Thompson</surname>
<given-names>SG</given-names>
</name>
</person-group>
<article-title>Controlling the risk of spurious findings from meta-regression</article-title>
<source>Stat Med</source>
<year>2004</year>
<volume>23</volume>
<issue>11</issue>
<fpage>1663</fpage>
<lpage>1682</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/sim.1752">https://doi.org/10.1002/sim.1752</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1002/sim.1752</pub-id>
</element-citation>
</ref>
<ref id="ref25">
<label>25.</label>
<mixed-citation>25. Hedges LV, Vevea JL. Fixed- and random-effects models in meta-analysis. Psychol Methods. 1998;3(4):486-504. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1037/1082-989X.3.4.486">https://doi.org/10.1037/1082-989X.3.4.486</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>Hedges</surname>
<given-names>LV</given-names>
</name>
<name>
<surname>Vevea</surname>
<given-names>JL</given-names>
</name>
</person-group>
<article-title>Fixed- and random-effects models in meta-analysis</article-title>
<source>Psychol Methods</source>
<year>1998</year>
<volume>3</volume>
<issue>4</issue>
<fpage>486</fpage>
<lpage>504</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1037/1082-989X.3.4.486">https://doi.org/10.1037/1082-989X.3.4.486</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1037/1082-989X.3.4.486</pub-id>
</element-citation>
</ref>
<ref id="ref26">
<label>26.</label>
<mixed-citation>26. DerSimonian R, Kacker R. Random-effects model for meta-analysis of clinical trials: an update. Contemp Clin Trials. 2007;28(2):105-14. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.cct.2006.04.004">https://doi.org/10.1016/j.cct.2006.04.004</ext-link>
</mixed-citation>
<element-citation publication-type="journal">
<person-group person-group-type="author">
<name>
<surname>DerSimonian</surname>
<given-names>R</given-names>
</name>
<name>
<surname>Kacker</surname>
<given-names>R</given-names>
</name>
</person-group>
<article-title>Random-effects model for meta-analysis of clinical trials: an update</article-title>
<source>Contemp Clin Trials</source>
<year>2007</year>
<volume>28</volume>
<issue>2</issue>
<fpage>105</fpage>
<lpage>114</lpage>
<comment>
<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.cct.2006.04.004">https://doi.org/10.1016/j.cct.2006.04.004</ext-link>
</comment>
<pub-id pub-id-type="doi">10.1016/j.cct.2006.04.004</pub-id>
</element-citation>
</ref>
</ref-list>
</back>
</article>