Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Charla: Intervalos de Confianza: Interpretación...

Charla: Intervalos de Confianza: Interpretación y Aplicación Práctica

Avatar for Abraham Zamudio

Abraham Zamudio

June 13, 2025
Tweet

More Decks by Abraham Zamudio

Other Decks in Education

Transcript

  1. ¿Qué Representa un Intervalo de Confianza Un intervalo de confianza

    representa un rango de valores calculado a partir de los datos de una muestra, dentro del cual se estima que se encuentra el valor real o parámetro desconocido de una población con un determinado nivel de confianza, como el 95% o 99% . Este intervalo refleja la variabilidad entre la medida obtenida en el estudio (muestra) y el valor verdadero de la población. Por ejemplo, un intervalo de confianza del 95% significa que si se repitiera el muestreo muchas veces, aproximadamente el 95% de esos intervalos calculados contendrían el valor real del parámetro poblacional . Es importante destacar que el intervalo no indica la probabilidad de que el parámetro esté dentro de ese intervalo específico calculado, sino que el proceso de construcción del intervalo tiene esa probabilidad de contener el valor verdadero . En la práctica, el intervalo de confianza se utiliza para: Por ejemplo, si una muestra arroja una media de 100 con un intervalo de confianza del 95% entre 95 y 105, se puede afirmar con un 95% de confianza que la media real de la población está en ese rango . En resumen, un intervalo de confianza es una herramienta estadística que proporciona un rango de valores dentro del cual, con un nivel de confianza predefinido, se espera que se encuentre el parámetro verdadero de la población, ayudando a interpretar y aplicar los resultados de estudios basados en muestras . ⁂ Intervalos de Confianza: Interpretación y Aplicación Práctica : [1] [2] [3] [4] [2] [5] [3] [5] [6] Estimar un rango plausible para un parámetro poblacional cuando no es posible medirlo directamente. Evaluar la precisión de una estimación, ya que un intervalo más estrecho indica mayor precisión. Tomar decisiones informadas en base a la certeza estadística que ofrece el nivel de confianza elegido . [1] [7] [8] [4] [3] [4] [1] [2] [5]
  2. La interpretación adecuada de un intervalo de confianza es fundamental

    para evitar errores en la toma de decisiones basadas en datos. El IC indica un rango plausible para un parámetro poblacional con un nivel de confianza asociado, pero no debe confundirse con probabilidades Interpretación Correcta vs. Malinterpretaciones de los Intervalos de Confianza Interpretación Correcta Un intervalo de confianza (IC) al 95% significa que si se repitiera el muestreo muchas veces y se construyeran intervalos para cada muestra, aproximadamente el 95% de esos intervalos contendrían el verdadero parámetro poblacional. No indica la probabilidad de que el parámetro esté dentro de un intervalo específico ya calculado, sino la confiabilidad del método usado para construirlo . [9] El IC proporciona un rango plausible donde se espera que se encuentre el parámetro poblacional, definido por un límite inferior y un límite superior que delimitan ese rango . [9] El parámetro poblacional es fijo y el intervalo es variable. La interpretación correcta es que el método tiene un 95% de éxito en capturar ese parámetro en el largo plazo, no que el parámetro se mueva dentro del intervalo . [9] El ancho del intervalo refleja la precisión de la estimación: un intervalo más estrecho suele indicar mayor precisión, pero esto debe evaluarse considerando el tamaño de la muestra y el nivel de confianza . [9] [10] Malinterpretaciones Comunes y Cómo Evitarlas 1. Confundir el nivel de confianza con la probabilidad de que el parámetro esté dentro del intervalo: Pensar que hay un 95% de probabilidad de que el parámetro esté dentro del intervalo calculado es incorrecto. El parámetro o está dentro o no; el 95% se refiere a la proporción de intervalos que contendrán el parámetro en repetidos muestreos . [9] 2. Suponer que el parámetro es igualmente probable en todo el intervalo: El IC no asigna probabilidades dentro del intervalo, solo indica un rango plausible. No implica que el parámetro esté más cerca del centro o que tenga igual probabilidad en cada punto del intervalo . [9] 3. Interpretar intervalos más estrechos como siempre más precisos o mejores: Un intervalo estrecho puede ser resultado de un tamaño de muestra pequeño o un nivel de confianza alto, lo que no garantiza mayor exactitud del parámetro estimado . [9] 4. Usar la superposición de intervalos para concluir ausencia de diferencias significativas: La superposición de IC no determina por sí sola la significación estadística entre grupos; se deben usar pruebas específicas para ello . [9] 5. Usar intervalos de confianza para predecir valores futuros individuales: Los IC estiman parámetros poblacionales, no rangos para observaciones futuras. Para predicciones se usan intervalos de predicción, que son conceptualmente distintos . [9] Resumen
  3. sobre un intervalo específico ni con predicciones individuales. Comprender estos

    matices mejora la precisión y utilidad de los análisis estadísticos . ⁂ Cuando la desviación estándar poblacional (σ) es conocida, el intervalo de confianza para la media poblacional se calcula con la fórmula: donde: Este intervalo asume que la distribución de la media muestral es normal o aproximadamente normal (por el Teorema Central del Límite cuando es grande). Para estimar la proporción poblacional , el intervalo de confianza se construye usando la proporción muestral y su error estándar, con la fórmula general: donde: Este método se basa en la aproximación normal a la distribución binomial cuando es suficientemente grande y no está cerca de 0 o 1 . [9] [11] [12] Intervalos de Confianza para Diferentes Parámetros 1. Intervalo de Confianza para la Media Poblacional (σ conocida) es la media muestral, es el valor crítico de la distribución normal estándar para el nivel de confianza deseado, es la desviación estándar poblacional, es el tamaño de la muestra. 2. Intervalo de Confianza para una Proporción Poblacional es la proporción muestral (x es el número de éxitos), es el valor crítico de la distribución normal estándar, es el tamaño de la muestra. [13] [14] [15]
  4. Cuando se comparan dos poblaciones, el intervalo de confianza para

    la diferencia entre sus medias ( ) se calcula como: donde: Si las desviaciones estándar poblacionales no se conocen, se usa la distribución t de Student con grados de libertad adecuados. Para comparar dos proporciones poblacionales y , el intervalo de confianza para la diferencia se calcula como: donde: Este intervalo permite evaluar diferencias significativas entre dos proporciones poblacionales . Estas fórmulas comparten el fundamento del Teorema Central del Límite, que permite aproximar la distribución de los estimadores muestrales a una normal para construir los intervalos de confianza . ⁂ 3. Intervalo de Confianza para la Diferencia de Medias son las medias muestrales de cada población, son las desviaciones estándar poblacionales conocidas, son los tamaños de muestra, es el valor crítico de la distribución normal estándar. 4. Intervalo de Confianza para la Diferencia de Proporciones son las proporciones muestrales, los tamaños de muestra, el valor crítico normal. [14] [13] [15] [16]
  5. Para comparar visualmente intervalos de confianza y valores p en

    Python, puedes usar librerías como matplotlib y seaborn para graficar los intervalos de confianza junto con la estimación puntual, y calcular los p-valores con pruebas estadísticas. Aquí te dejo un ejemplo práctico que ilustra cómo hacerlo para la media de una muestra: import numpy as np import scipy.stats as stats import matplotlib.pyplot as plt import seaborn as sns # Crear datos simulados np.random.seed(42) data = np.random.normal(loc=50, scale=10, size=30) # Estimación puntual (media muestral) mean = np.mean(data) # Calcular intervalo de confianza al 95% para la media (σ desconocida, t-student) conf_level = 0.95 n = len(data) sem = stats.sem(data) # error estándar de la media t_crit = stats.t.ppf((1 + conf_level) / 2, df=n-1) margin_error = t_crit * sem ci_lower = mean - margin_error ci_upper = mean + margin_error # Prueba de hipótesis: H0: media = 55 (por ejemplo) mu_0 = 55 t_stat, p_value = stats.ttest_1samp(data, mu_0) # Visualización plt.figure(figsize=(8,5)) # Graficar la media y el intervalo de confianza plt.errorbar(1, mean, yerr=margin_error, fmt='o', color='blue', label='Media y IC 95%') # Línea de referencia para la media hipotética (valor bajo H0) plt.hlines(mu_0, 0.8, 1.2, colors='red', linestyles='dashed', label=f'Media H0 = {mu_0}') # Texto con p-valor plt.text(1.1, mean, f'p-valor = {p_value:.3f}', verticalalignment='center') plt.xlim(0.5, 1.5) plt.xticks([]) plt.ylabel('Valor') plt.title('Comparación Intervalo de Confianza y p-valor') plt.legend() plt.show() Comparación Visual de los intervalos de confianza con los P-Valores usando python
  6. Este enfoque facilita visualizar cómo el intervalo de confianza y

    el p-valor aportan información complementaria: el IC muestra un rango plausible para la media, mientras que el p-valor evalúa la evidencia para rechazar un valor específico. Para más ejemplos y métodos para graficar intervalos de confianza con Python, puedes revisar recursos como el tutorial de Platzi sobre estadística inferencial con Python o el uso de seaborn para trazar ICs con lineplot() y regplot() . ⁂ Ventajas sobre p-valores: Los intervalos de confianza (IC) ofrecen ventajas claras sobre los valores p para la toma de decisiones en investigación y práctica clínica: En resumen, los intervalos de confianza no solo informan sobre la significancia estadística, sino que ofrecen una visión más completa y útil para la toma de decisiones, al integrar magnitud, relevancia y precisión del efecto observado, aspectos que los valores p por sí solos no permiten Explicación El error estándar y el valor crítico t permiten construir el intervalo de confianza para la media. El p-valor se calcula con una prueba t para comparar la media muestral contra un valor hipotético. En la gráfica, el punto azul con barras de error representa la media y su intervalo de confianza. La línea roja punteada muestra el valor hipotético contra el que se prueba la media. El p-valor indica la evidencia estadística contra la hipótesis nula. [17] [18] Toma de Decisiones con intervalos de confianza 1. Muestran magnitud del efecto (no solo significancia). 2. Permiten evaluar relevancia práctica. 3. Visualizan incertidumbre. 1. Muestran la magnitud del efecto: Mientras que el valor p solo indica si un efecto es estadísticamente significativo o no, el IC proporciona un rango plausible donde se encuentra el tamaño real del efecto, permitiendo conocer su magnitud y dirección . [19] [20] [21] 2. Permiten evaluar la relevancia práctica: Los IC ayudan a determinar si el efecto observado es clínicamente o prácticamente relevante, no solo si es estadísticamente significativo. Esto es fundamental para decidir si un tratamiento o intervención tiene un impacto útil en la realidad . [19] [22] [23] 3. Visualizan la incertidumbre: El ancho del intervalo refleja la precisión de la estimación. Un intervalo más estrecho indica mayor certeza sobre el valor estimado, mientras que uno más amplio señala mayor incertidumbre. Esto aporta información sobre la confiabilidad de los resultados que el valor p no brinda . [20] [24]
  7. evaluar adecuadamente . Por ello, muchas revistas y expertos recomiendan

    priorizar el uso de IC o usarlos en complemento con valores p para una interpretación más rica y práctica de los resultados . ⁂ En regresión logística, los coeficientes estimados representan cambios en las probabilidades logarítmicas del evento, y al exponenciarlos se obtienen los odds ratios (OR), que miden la fuerza y dirección de la asociación entre un predictor y el resultado binario. [19] [20] [22] [20] [22] Intervalos de Confianza Avanzados 1. Intervalos de Confianza para Odds Ratio en Regresión Logística El intervalo de confianza para un OR se calcula exponenciando los límites del intervalo de confianza del coeficiente de regresión (β). Esto da un rango plausible para el OR poblacional con un nivel de confianza (usualmente 95%). Si el IC incluye 1, se concluye que no hay evidencia estadísticamente significativa de asociación, ya que OR=1 indica "no efecto". Ejemplo: Un OR de 1.15 con IC 95% [1.05, 1.25] indica que cada unidad adicional en la variable predictora aumenta las probabilidades del evento en un 15%, con alta confianza en esta estimación . [25] [26] [27] [28] La interpretación correcta requiere considerar el OR, su IC y el valor p, además de evaluar el ajuste global del modelo (p. ej., prueba Hosmer-Lemeshow y pseudo R²) . [26] [29] 2. Intervalos de Confianza para Coeficientes de Regresión Lineal En regresión lineal, los coeficientes estiman el cambio esperado en la variable dependiente por unidad de cambio en el predictor. El intervalo de confianza para un coeficiente β se calcula como: donde es el error estándar del coeficiente y el valor crítico t para el nivel de confianza y grados de libertad. Este IC indica el rango plausible para el valor verdadero del coeficiente poblacional. Si el IC incluye 0, no se puede afirmar que el predictor tenga un efecto estadísticamente significativo sobre la variable respuesta. La interpretación también considera la magnitud y signo del coeficiente para evaluar la dirección y fuerza del efecto . [26]
  8. Estos intervalos avanzados permiten una interpretación más completa y flexible

    en análisis estadísticos complejos, especialmente en modelos no lineales como la regresión logística y en situaciones donde los supuestos clásicos no se cumplen, mejorando la precisión y validez de las inferencias. ⁂ 3. Intervalos de Confianza Bootstrap (No Paramétricos) El método bootstrap es una técnica computacional que permite estimar intervalos de confianza sin asumir distribuciones paramétricas específicas. Consiste en generar muchas muestras aleatorias (con reemplazo) a partir de la muestra original, calcular el estadístico de interés (media, coeficiente, OR, etc.) en cada muestra y construir el IC a partir de los percentiles de la distribución empírica obtenida. Es especialmente útil cuando las condiciones clásicas para construir IC (normalidad, tamaño de muestra grande) no se cumplen o para estimadores complejos. El IC bootstrap refleja la incertidumbre real del estimador basada en la variabilidad observada en la muestra y es robusto frente a violaciones de supuestos clásicos. Ejemplo: Para un coeficiente de regresión, se extraen 1000 muestras bootstrap, se calculan los coeficientes y se obtiene el IC entre los percentiles 2.5 y 97.5% de esa distribución . [26] Buenas Prácticas y Conclusiones sobre los Intervalos de Confianza Reglas de Oro para el Uso de Intervalos de Confianza Siempre reportar intervalos de confianza junto a las estimaciones puntuales: Esto aporta información sobre la precisión y la incertidumbre de la estimación, facilitando una interpretación más completa que solo el valor puntual . [30] [31] Preferir intervalos de confianza sobre valores p para decisiones estratégicas: Los IC muestran la magnitud y dirección del efecto, mientras que los valores p solo indican significancia estadística sin informar sobre relevancia ni tamaño del efecto . [31] Contextualizar los intervalos de confianza: Más allá de la significancia estadística, es crucial evaluar si el intervalo indica un efecto clínicamente, empresarialmente o socialmente relevante para la toma de decisiones informadas y prácticas . [31] Casos de Aplicación Práctica Business Intelligence: En la evaluación del retorno de inversión (ROI) de campañas, los IC permiten estimar un rango plausible del ROI real, ayudando a decidir si una campaña es rentable y con qué grado de certeza . [31] Medicina: Para la efectividad de tratamientos, los IC indican el rango probable del efecto terapéutico, permitiendo valorar si un tratamiento ofrece beneficios clínicos significativos y su magnitud, no solo si es estadísticamente significativo . [31]
  9. Los intervalos de confianza son herramientas fundamentales para la inferencia

    estadística que enriquecen la interpretación de los datos al ofrecer un rango plausible para parámetros poblacionales junto con un nivel de certeza cuantificable. Su uso adecuado, complementado con la contextualización del efecto y la consideración de su relevancia práctica, mejora la calidad de la toma de decisiones en múltiples ámbitos. Por ello, se recomienda siempre reportar IC junto a estimaciones puntuales y priorizarlos frente a valores p cuando se busque una comprensión más profunda y útil de los resultados . ⁂ Políticas Públicas: En la evaluación del impacto de intervenciones sociales o económicas, los IC ayudan a cuantificar la incertidumbre y la relevancia práctica del efecto estimado, facilitando decisiones basadas en evidencia sólida y contextualizada . [31] Conclusión [30] [32] [33] [31] 1. https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0034-98872005000900017 2. https://es.wikipedia.org/wiki/Intervalo_de_confianza 3. https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-statistics/supporting-topic s/basics/what-is-a-confidence-interval/ 4. https://economipedia.com/definiciones/intervalo-de-confianza.html 5. https://es.statisticseasily.com/interpreting-confidence-intervals/ 6. https://elmundodelosdatos.com/como-interpretar-un-intervalo-de-confianza-correctamente/ 7. https://www.questionpro.com/blog/es/intervalo-de-confianza/ 8. https://datatab.es/tutorial/confidence-interval 9. https://es.statisticseasily.com/interpreting-confidence-intervals/ 10. https://elmundodelosdatos.com/entendiendo-el-funcionamiento-de-los-intervalos-de-confianza-en-est adistica/ 11. https://datatab.es/tutorial/confidence-interval 12. https://es.wikipedia.org/wiki/Intervalo_de_confianza 13. https://openstax.org/books/introducción-estadística-empresarial/pages/8-3-un-intervalo-de-confianza -para-una-proporcion-de-poblacion 14. https://www5.uva.es/estadmed/inferen/estima_inter/intervalos3.htm 15. https://espanol.libretexts.org/Estadisticas/Estadistica_Aplicada/Libro: Estadisticas_de_negocios(OpenStax)/08:_Intervalos_de_confianza/8.03:_Un_intervalo_de_confianza_pa ra_una_proporci%C3%B3n_de_poblaci%C3%B3n 16. https://es.wikipedia.org/wiki/Intervalo_de_confianza 17. https://platzi.com/blog/estadistica-inferencial-con-python-intervalos-de-confianza-y-prueba-de-hipot esis/ 18. https://statologos.com/trazar-intervalo-de-confianza-python/ 19. https://www.medwave.cl/series/MBEyEpi/5892.html 20. https://www.scielosp.org/pdf/rpsp/v15n5/21999.pdf 21. https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0034-98872005000900017
  10. 22. https://www.elsevier.es/es-revista-cirugia-espanola-36-articulo-intervalos-confianza-por-que-usarlos- 13099760 23. http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S2448-91902017000400477 24. https://revistachilenadeanestesia.cl/intervalos-de-confianza/ 25. https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0034-98872013001000014 26.

    https://www.scielosp.org/pdf/rpsp/v1n3/0438.pdf 27. https://es.statisticseasily.com/cómo-informar-los-resultados-de-una-regresión-logística-binaria-simple/ 28. https://www.bioestadistica.uma.es/apuntesMaster/regresión-logística-binaria.html 29. https://support.minitab.com/es-mx/minitab/help-and-how-to/statistical-modeling/regression/how-to/fit- binary-logistic-model/interpret-the-results/all-statistics-and-graphs/odds-ratios/ 30. https://upcommons.upc.edu/bitstream/handle/2117/186420/08_intervalos_de_confianza-5331.pdf 31. https://es.statisticseasily.com/interpretar-intervalos-de-confianza/ 32. https://es.linkedin.com/advice/0/what-best-practices-reporting-confidence-intervals-5gqae?lang=es&l ang=es 33. https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0034-98872005000900017