Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Charla: El P-Valor: Definición, Interpretación ...

Charla: El P-Valor: Definición, Interpretación y Aplicación Práctica

Avatar for Abraham Zamudio

Abraham Zamudio

June 13, 2025
Tweet

More Decks by Abraham Zamudio

Other Decks in Education

Transcript

  1. Definición Precisa El p-valor es una medida estadística que indica

    la probabilidad de obtener un resultado igual o más extremo que el observado en un estudio, bajo la suposición de que la hipótesis nula es cierta. En otras palabras, es la probabilidad de que los datos observados se deban únicamente al azar si no existe un efecto real . Formalmente, el p-valor se define como: á donde es la hipótesis nula. Dependiendo del tipo de prueba estadística, esta probabilidad puede calcularse para una cola (derecha o izquierda) o para dos colas en la distribución del estadístico de prueba . El p-valor se utiliza para decidir si se rechaza o no la hipótesis nula. Si el p-valor es menor que un nivel de significancia preestablecido (comúnmente 0.05), se considera que el resultado es estadísticamente significativo y se rechaza la hipótesis nula. En caso contrario, no se rechaza . Es importante destacar que el p-valor no mide la magnitud del efecto ni su relevancia clínica, sino únicamente la evidencia contra la hipótesis nula basada en los datos y el azar. Por lo tanto, un p-valor pequeño indica que los datos observados serían poco probables si la hipótesis nula fuera cierta, pero no garantiza que el efecto sea clínicamente importante . En resumen, el p-valor es la probabilidad, bajo la hipótesis nula, de observar un resultado igual o más extremo que el obtenido, y se usa para evaluar la significación estadística de los resultados en pruebas de hipótesis . ⁂ La interpretación frecuentista del p-valor es la siguiente: El p-valor representa la probabilidad de obtener un estadístico de prueba igual o más extremo que el observado en la muestra, asumiendo que la hipótesis nula (H0) es verdadera. Es decir, mide la probabilidad de que el resultado observado se deba al azar bajo la hipótesis de no efecto o no asociación . Desde esta perspectiva, si el p-valor es menor o igual a un nivel de significancia predefinido (usualmente 0,05), se considera que el resultado es estadísticamente significativo y se rechaza la hipótesis nula, concluyendo que hay evidencia suficiente para aceptar la hipótesis alternativa. ¿Qué es el p-valor? [1] [2] [3] [4] [1] [1] [2] [5] [6] [7] [4] [1] [2] [5] Interpretación Frecuentista del p-value [8] [9]
  2. En cambio, si el p-valor es mayor que 0,05, no

    se rechaza la hipótesis nula, lo que implica que no hay evidencia suficiente para afirmar una asociación o efecto distinto de cero . Es importante destacar que bajo el enfoque frecuentista nunca se prueba directamente la probabilidad de que la hipótesis nula sea verdadera o falsa; el p-valor no es la probabilidad de la hipótesis nula, sino la probabilidad de los datos observados (o más extremos) bajo la hipótesis nula. Por ello, no se puede afirmar que un p-valor alto confirme la hipótesis nula, solo que no se tiene evidencia para rechazarla . Además, la interpretación del p-valor depende del tamaño del efecto y del tamaño de la muestra: con muestras grandes, incluso diferencias pequeñas pueden resultar en p-valores significativos, mientras que con muestras pequeñas puede no detectarse una diferencia aunque exista . En resumen, en la interpretación frecuentista el p-valor es una medida de la compatibilidad de los datos con la hipótesis nula, usada para decidir si se rechaza o no dicha hipótesis, pero no para calcular la probabilidad de que la hipótesis nula sea verdadera . ⁂ "p-valor = probabilidad de que (H_0) sea cierta" "p-valor pequeño = efecto grande" "p-valor > 0.05 = no efecto" "p-valor = tamaño del efecto" Los malentendidos comunes sobre el p-valor incluyen: [10] [11] [9] [12] [10] [11] [9] [11] Malentendidos Comunes : "p-valor = probabilidad de que la hipótesis nula (H0) sea cierta": Esto es falso. El p-valor no mide la probabilidad de que H0 sea verdadera dado los datos; más bien, es la probabilidad de obtener los datos observados (o más extremos) bajo la suposición de que H0 es verdadera . [13] [14] [15] [16] "p-valor pequeño = efecto grande": Un p-valor bajo no indica necesariamente que el efecto sea grande o clínicamente relevante. El p-valor solo indica evidencia contra H0, pero no cuantifica la magnitud del efecto, que debe evaluarse con estimaciones específicas como tamaños del efecto o intervalos de confianza . [17] [14] [18] "p-valor > 0.05 = no efecto": Un p-valor mayor que 0.05 no significa que no haya efecto, sino que no hay evidencia suficiente para rechazar H0 con el nivel de significancia elegido. La ausencia de significación estadística no implica equivalencia o ausencia de efecto . [17] [19] [18] "p-valor = tamaño del efecto": El p-valor no es una medida del tamaño del efecto. Su valor depende también del tamaño de la muestra y la variabilidad, por lo que efectos pequeños pueden ser significativos con muestras grandes y efectos grandes no significativos con muestras pequeñas . [14] [18]
  3. En resumen, el p-valor es una medida probabilística condicionada a

    la hipótesis nula, no una medida directa de la verdad de la hipótesis, ni del tamaño o importancia del efecto, y su correcta interpretación es fundamental para evitar conclusiones erróneas en la investigación . ⁂ El p-valor se calcula a partir del estadístico de prueba obtenido con los datos de la muestra y la distribución de muestreo bajo la hipótesis nula, considerando el tipo de prueba (cola inferior, cola superior o bilateral) . [17] [19] [13] [14] [15] [18] Formas de Calcular el P-Valor [20] [21] Pasos generales para calcular el p-valor 1. Definir hipótesis: Se establece la hipótesis nula (H0) y la alternativa (H1), que determinan el tipo de prueba (una cola o dos colas) . [22] 2. Calcular el estadístico de prueba: Dependiendo del test, se calcula un valor z, t, chi- cuadrado, F, etc., con los datos muestrales . [22] 3. Determinar la región crítica: Según el tipo de prueba, se define la región donde se rechaza H0 (cola inferior, superior o ambas) . [22] 4. Calcular el p-valor: Se obtiene la probabilidad de que el estadístico de prueba sea tan extremo o más que el observado, bajo H0, usando la función de distribución acumulativa (FDA) de la distribución correspondiente . [20] [21] Cálculo específico según el tipo de prueba Prueba de cola inferior: $ p = P(TS \leq t_{obs}) = FDA(t_{obs}) $ Prueba de cola superior: $ p = P(TS \geq t_{obs}) = 1 - FDA(t_{obs}) $ Prueba bilateral (dos colas): $ p = 2 \times \min{FDA(t_{obs}), 1 - FDA(t_{obs})} $ o, si la distribución es simétrica respecto a cero, $ p = 2 \times FDA(-|t_{obs}|) $ . [20] [21] Herramientas para el cálculo Tablas estadísticas: Se pueden usar tablas de valores críticos para distribuciones normales, t de Student, chi-cuadrado, etc., para encontrar el p-valor aproximado . [23] Software estadístico: Programas como Minitab, Statgraphics o calculadoras en línea permiten calcular automáticamente el p-valor a partir del estadístico de prueba y el tipo de prueba . [20] [24] [23] Excel: Funciones como T.TEST() facilitan el cálculo del p-valor para pruebas t comparando dos muestras . [25]
  4. En resumen, el p-valor se calcula evaluando la probabilidad acumulada

    del estadístico de prueba bajo la hipótesis nula, considerando el tipo de prueba y la distribución adecuada, con ayuda de tablas, software o funciones específicas. ⁂ La relación entre tamaño del efecto, poder estadístico y p-valor es fundamental para interpretar correctamente los resultados de un estudio estadístico: En conjunto: Por ello, es crucial reportar y considerar el tamaño del efecto junto con el p-valor y el poder del estudio para interpretar la relevancia y confiabilidad de los resultados, evitando conclusiones erróneas basadas solo en el valor p . ⁂ Relación: Tamaño del Efecto, Poder y P-Valor Tamaño del efecto (TE): Es una medida de la magnitud real de la diferencia o asociación entre grupos o variables, ajustada por la variabilidad. Indica qué tan grande o relevante es el efecto observado, independientemente del tamaño de la muestra . [26] [27] Poder estadístico: Es la probabilidad de detectar un efecto real (rechazar la hipótesis nula cuando es falsa). Depende directamente del tamaño del efecto, del tamaño de la muestra y del nivel de significancia (α, relacionado con el p-valor). A mayor tamaño del efecto y mayor tamaño muestral, mayor es el poder para detectar diferencias . [27] [28] [29] [30] P-valor: Indica la probabilidad de observar un resultado igual o más extremo que el obtenido, bajo la hipótesis nula. El p-valor depende del tamaño del efecto, pero también del tamaño de la muestra y la variabilidad de los datos. Por ejemplo, con muestras grandes, incluso efectos pequeños pueden producir p-valores significativos; con muestras pequeñas, un efecto grande puede no ser significativo . [31] [32] [29] [33] Un tamaño del efecto grande aumenta la probabilidad de obtener un p-valor pequeño, facilitando el rechazo de la hipótesis nula y aumentando el poder estadístico. Un poder bajo (por ejemplo, debido a un tamaño muestral pequeño) puede llevar a p- valores no significativos aunque exista un efecto real, aumentando el riesgo de error tipo II. El tamaño muestral modula la relación: muestras grandes reducen el error estándar, haciendo más probable obtener p-valores bajos para efectos pequeños, mientras que muestras pequeñas requieren efectos mayores para alcanzar significación estadística. [26] [27] [31] [28] [29] [33] Ejemplos y Aplicaciones en Pruebas Estadísticas : Prueba t (una y dos colas) Prueba z para proporciones Chi-cuadrado ANOVA
  5. Aquí tienes ejemplos y aplicaciones del p-valor en diferentes pruebas

    estadísticas comunes: En todos estos casos, el p-valor se calcula a partir del estadístico de prueba correspondiente (t, z, chi-cuadrado, F o t para regresión) y permite decidir si se rechaza la hipótesis nula, indicando Regresión lineal Prueba t (una y dos colas) Aplicación: Comparar medias de uno o dos grupos para determinar si hay diferencias significativas. Ejemplo una muestra: Evaluar si la media de los resultados de un examen cambió tras introducir un nuevo tutorial online, comparando con la media histórica (valor de referencia) . [34] Ejemplo dos muestras: Comparar la satisfacción media de clientes entre dos versiones de un producto para ver si difieren significativamente . [35] Una cola o dos colas: La prueba puede ser unilateral (por ejemplo, si se espera que un grupo sea mayor que otro) o bilateral (simplemente detectar diferencias sin dirección específica) . [36] [35] Prueba z para proporciones Aplicación: Comparar proporciones en muestras grandes o cuando la desviación estándar poblacional es conocida o se puede aproximar. Ejemplo: Determinar si la proporción de clientes satisfechos con un producto supera un valor esperado o comparar proporciones entre dos grupos grandes. Chi-cuadrado Aplicación: Evaluar asociación o independencia entre variables categóricas. Ejemplo: Analizar si existe relación entre género y preferencia por un tipo de producto o si la distribución observada de categorías difiere de una esperada. ANOVA (Análisis de Varianza) Aplicación: Comparar medias entre tres o más grupos para detectar diferencias significativas. Ejemplo: Comparar el rendimiento académico entre estudiantes de diferentes métodos de enseñanza o comparar la eficacia de varios tratamientos médicos. Regresión lineal Aplicación: Evaluar la relación entre una variable dependiente continua y una o más variables independientes. Ejemplo: Determinar si el ingreso (variable dependiente) se asocia significativamente con la educación y experiencia laboral (variables independientes), usando el p-valor para evaluar la significación de cada coeficiente.
  6. evidencia estadística de un efecto o asociación significativa . ⁂

    El p-valor es una herramienta útil para evaluar la evidencia contra la hipótesis nula, pero su interpretación requiere prudencia y debe complementarse con medidas de tamaño del efecto, intervalos de confianza y consideraciones sobre el poder estadístico. Evitar interpretaciones simplistas o erróneas del p-valor mejora la calidad y la validez de las conclusiones científicas. Incorporar análisis bayesianos y reportar tamaños de efecto estandarizados son buenas prácticas que enriquecen la interpretación estadística y la toma de decisiones en investigación . ⁂ [36] [35] [34] [37] [38] Buenas Prácticas y Conclusiones sobre el p-valor y los Intervalos de Confianza Reglas de oro Nunca interpretar el p-valor aisladamente: El p-valor por sí solo no proporciona información completa sobre la relevancia o magnitud del efecto. Debe interpretarse en el contexto del diseño del estudio, el tamaño del efecto y la variabilidad de los datos . [39] [40] [41] Reportar siempre tamaño del efecto e intervalos de confianza: Estos aportan información sobre la magnitud y precisión del efecto observado, complementando la significación estadística que indica el p-valor. Los intervalos de confianza permiten evaluar la incertidumbre y la posible relevancia clínica o práctica del resultado . [39] [41] [42] Considerar poder estadístico en el diseño experimental: El poder (probabilidad de detectar un efecto real) depende del tamaño del efecto esperado, el tamaño muestral y el nivel de significación. Un estudio con bajo poder puede no detectar efectos importantes, llevando a conclusiones erróneas basadas en p-valores no significativos . [40] [41] Alternativas y complementos al p-valor Análisis bayesiano (factores de Bayes): Ofrece una alternativa para cuantificar la evidencia a favor o en contra de hipótesis, expresando probabilidades directas sobre las hipótesis, lo que puede ser más intuitivo y útil en ciertos contextos que el p-valor tradicional . [39] Tamaños de efecto estandarizados: Facilitan la comparación entre estudios y la interpretación de la magnitud del efecto independientemente de la escala o unidad de medida, ayudando a contextualizar la importancia práctica de los hallazgos . [39] [42] Conclusión [39] [40] [41] [42] 1. https://es.wikipedia.org/wiki/Valor_p 2. https://datatab.es/tutorial/p-value
  7. 3. https://es.statisticseasily.com/2022/05/18/devuelve-el-valor-p/ 4. https://blog.minitab.com/es/como-interpretar-correctamente-los-valores-p 5. https://toolbox.eupati.eu/glossary/valor-p/?lang=es 6. https://economipedia.com/definiciones/valor-p.html 7. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1139-76322017000500014

    8. https://www.medwave.cl/series/MBEyEpi/5892.html 9. http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1726-46342024000400422 10. https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-40262008000100018 11. https://anestesiar.org/2020/rioja-o-ribera-estadistica-frecuentista-vs-bayesiana/ 12. https://revista.sati.org.ar/index.php/MI/article/download/593/pdf/2950 13. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1139-76322017000500014 14. https://www.redalyc.org/pdf/3498/349853220053.pdf 15. https://revista.sati.org.ar/index.php/MI/article/download/593/pdf/2950 16. https://es.linkedin.com/advice/3/what-misconceptions-p-value-should-you-aware-skills-statistics-l1xo c?lang=es&lang=es 17. https://www.physiotutors.com/es/wiki/p-value/ 18. https://medintensiva.org/es-interpretacion-resultados-estadisticos-articulo-S0210569118300135 19. https://www.elsevier.es/es-revista-atencion-primaria-27-articulo-interpretaciones-erroneas-los-valores -p-14186 20. https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-statistics/supporting-topic s/basics/manually-calculate-a-p-value/ 21. https://www.omnicalculator.com/es/estadistica/valor-p 22. https://www.ck12.org/flexi/es/grado-6/definicion-de-probabilidad/como-se-calcula-el-valor-p-de-una -estadistica-de-prueba/ 23. https://datatab.es/tutorial/p-value 24. https://halweb.uc3m.es/esp/Personal/personas/amalonso/esp/p-valor.pdf 25. https://www.datacamp.com/es/tutorial/how-to-find-p-value-in-excel 26. http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S2448-91902021000200128 27. https://www.redalyc.org/pdf/805/80511493002.pdf 28. https://www.maximaformacion.es/blog-dat/tamano-muestral-y-potencia-estadistica/ 29. https://estadisticacienciassocialesr.rbind.io/tamaño-del-efecto.html 30. https://www.fisterra.com/mbe/investiga/poder_estadistico/poder_estadistico2.pdf 31. https://www.physiotutors.com/es/wiki/p-value/ 32. https://es.linkedin.com/advice/0/how-do-you-assess-impact-sample-size-your-p-value-a2zgc?lang=e s 33. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1139-76322017000500014 34. https://datatab.es/tutorial/one-sample-t-test 35. https://www.questionpro.com/blog/es/prueba-t-de-student/ 36. https://www.jmp.com/es_pe/statistics-knowledge-portal/t-test.html 37. https://www.datacamp.com/es/tutorial/t-test-vs-z-test