Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Charla: Muestreo y Distribuciones Muestrales - ...

Avatar for Abraham Zamudio Abraham Zamudio
June 13, 2025
1

Charla: Muestreo y Distribuciones Muestrales - Teoría y Práctica con Python

Avatar for Abraham Zamudio

Abraham Zamudio

June 13, 2025
Tweet

Transcript

  1. Población y muestra son conceptos fundamentales en estadística y se

    utilizan para describir los conjuntos de elementos sobre los que se realiza un estudio. Concepto Población Muestra Definición Conjunto total de elementos a estudiar Subconjunto representativo de la población Tamaño Generalmente grande o total Menor, seleccionado de la población Ejemplo Todos los habitantes de un país 1,000 habitantes seleccionados al azar Uso Cuando es posible estudiar a todos los elementos Cuando no es posible estudiar a todos Objetivo Obtener datos exactos del conjunto total Inferir o estimar características de la población Diferencia entre Población y Muestra en Estadística Población Es el conjunto completo de elementos, individuos, objetos o datos que poseen una característica en común y que son objeto de estudio estadístico . [1] [2] [3] [4] También se le llama universo. Puede ser finita (cuando el número de elementos es conocido y limitado) o infinita (cuando no se puede determinar el número exacto de elementos) . [2] [5] Ejemplo: Todos los estudiantes de una universidad, todos los árboles de un bosque, o todos los autos fabricados por una empresa en un año . [4] Muestra Es un subconjunto de la población, seleccionado para representar al conjunto total . [1] [6] [2] [4] Se utiliza cuando estudiar toda la población es costoso, difícil o imposible. La muestra debe ser representativa de la población, es decir, debe reflejar sus características principales para que los resultados del estudio puedan generalizarse a toda la población . [3] [5] [7] Ejemplo: 100 estudiantes elegidos al azar de una universidad, 50 árboles seleccionados de un bosque de 1,000, o 200 autos de una línea de producción . [4] Comparación entre Población y Muestra
  2. Si una empresa quiere saber la satisfacción de sus clientes

    y tiene 10,000 clientes, sería costoso encuestar a todos. Por eso, selecciona una muestra de 500 clientes al azar. La población son los 10,000 clientes; la muestra, los 500 encuestados . En resumen, la población es el conjunto total que se desea estudiar, y la muestra es una parte de ese conjunto, seleccionada para hacer inferencias sobre la población de manera eficiente y práctica . ⁂ Parámetro y estadístico son conceptos esenciales en estadística, y aunque ambos resumen información, se diferencian por el conjunto de datos del que provienen y su función en el análisis. Importancia de la Muestra Representativa La representatividad es clave: si la muestra no refleja bien a la población, los resultados pueden estar sesgados y no ser válidos para generalizar . [5] [7] [8] Se utilizan técnicas de muestreo (probabilístico y no probabilístico) para seleccionar la muestra de manera adecuada . [6] [5] [7] Ejemplo Práctico [2] [4] [1] [6] [2] [4] Parámetro (poblacional) vs. Estadístico (muestral) en Estadística Parámetro (poblacional) Es una medida numérica que describe una característica específica de toda una población . [9] [10] [11] Representa un valor real, constante y único, aunque muchas veces es desconocido porque rara vez se estudia a toda la población . [12] [10] [9] Ejemplos de parámetros: la media poblacional (μ), la desviación estándar poblacional (σ), la proporción poblacional (p) . [10] [11] [9] Se calcula a partir de todos los datos de la población, por ejemplo, la edad promedio de todos los habitantes de un país . [13] [14] [9] Estadístico (muestral) Es una medida numérica calculada a partir de los datos de una muestra, es decir, de un subconjunto representativo de la población . [12] [10] [11] [9] Es variable, ya que su valor depende de la muestra seleccionada; diferentes muestras pueden dar diferentes valores estadísticos . [12] [10] Ejemplos de estadísticos: la media muestral ( ), la desviación estándar muestral (s), la proporción muestral ( ) . [12] [10] [14] [9] Se utiliza para estimar o inferir el valor del parámetro poblacional correspondiente . [10] [11] [9]
  3. Concepto Parámetro (poblacional) Estadístico (muestral) Definición Medida numérica de toda

    la población Medida numérica de una muestra Ejemplo Media poblacional (μ), proporción (p) Media muestral ( ), proporción ( ) Valor Fijo y único (pero usualmente desconocido) Variable, depende de la muestra Cálculo Con todos los datos de la población Con los datos de la muestra Uso Describir la población Estimar el parámetro poblacional En resumen, el parámetro describe a la población completa y es fijo, mientras que el estadístico describe a una muestra y es variable, sirviendo como base para inferir el valor del parámetro poblacional . ⁂ Los métodos de muestreo se dividen principalmente en dos grandes grupos: muestreo probabilístico y muestreo no probabilístico, cada uno con diferentes técnicas específicas. En este tipo, todos los elementos de la población tienen una probabilidad conocida y generalmente igual de ser seleccionados. Es el método más confiable para obtener muestras representativas. Comparación en Tabla Relación entre ambos El objetivo principal de la estadística inferencial es utilizar los estadísticos obtenidos de una muestra para hacer estimaciones o inferencias sobre los parámetros de la población . [10] [9] [11] Por ejemplo, si queremos saber la altura promedio de todos los estudiantes de una universidad (parámetro), pero solo medimos a 100 de ellos (muestra), la media de esos 100 (estadístico) nos ayuda a estimar la media real de toda la universidad . [13] [14] [9] [12] [10] [9] Tipos de Muestreo en Estadística Muestreo Probabilístico Muestreo Aleatorio Simple Cada individuo de la población tiene la misma probabilidad de ser elegido, seleccionándose al azar mediante sorteos o generadores de números aleatorios . [15] [16] [17] Muestreo Sistemático Se ordena a la población en una lista, se selecciona aleatoriamente el primer individuo y luego se eligen los siguientes con un intervalo fijo (por ejemplo, cada décimo elemento) . [18] [19] [15] [16] [17]
  4. En este tipo, no todos los elementos tienen la misma

    probabilidad de ser seleccionados, y la selección depende del juicio del investigador o de características específicas. Estos tipos de muestreo permiten adaptar la selección de la muestra según la naturaleza del estudio, el tamaño y características de la población, y los recursos disponibles, buscando siempre la mayor representatividad y validez de los resultados . ⁂ El Error Estándar de la Media (EEM) es una medida que estima la variabilidad o dispersión de las medias muestrales alrededor de la media poblacional. En otras palabras, indica qué tan lejos es probable que esté la media calculada en una muestra respecto a la verdadera media de la población . Muestreo Estratificado La población se divide en subgrupos o estratos con características comunes (edad, género, grado académico, etc.) y se seleccionan muestras aleatorias proporcionales de cada estrato para asegurar representatividad . [18] [20] [15] [16] [17] Muestreo por Conglomerados La población está dividida en grupos naturales o conglomerados (por ejemplo, escuelas, barrios). Se seleccionan aleatoriamente algunos conglomerados completos y se estudian todos o una muestra dentro de ellos . [18] [15] [16] [17] Muestreo No Probabilístico Muestreo por Conveniencia Se eligen individuos que están fácilmente disponibles o accesibles para el investigador . [18] Muestreo Deliberado o por Juicio El investigador selecciona sujetos que considera representativos o con conocimiento relevante para el estudio . [18] [21] Muestreo por Cuotas Se divide la población en estratos y se fija una cuota para cada uno, pero dentro de cada estrato la selección no es aleatoria, sino basada en conveniencia o juicio . [21] Muestreo Bola de Nieve Se utiliza para poblaciones difíciles de acceder o minoritarias. Se comienza con unos pocos sujetos y estos refieren a otros con características similares, ampliando la muestra progresivamente . [18] [21] [18] [15] [16] [21] Error Estándar de la Media [22] [23]
  5. Se calcula dividiendo la desviación estándar de la muestra (s)

    entre la raíz cuadrada del tamaño de la muestra (n): á Esta fórmula muestra que a medida que el tamaño de la muestra aumenta, el error estándar disminuye, lo que implica que la estimación de la media poblacional es más precisa con muestras grandes . Si una muestra tiene una media de 3.80 días y una desviación estándar de 1.43 días con un tamaño de 312 observaciones, el error estándar de la media sería: Esto indica que, si se tomaran múltiples muestras similares, la desviación típica de esas medias sería aproximadamente 0.08 días . En resumen, el error estándar de la media es una medida clave para cuantificar la precisión de la media muestral como estimador de la media poblacional, disminuyendo conforme aumenta el tamaño de la muestra. ⁂ La distribución muestral es la distribución de una estadística (como la media o la proporción) calculada a partir de todas las posibles muestras de un tamaño dado extraídas de una población. Es una herramienta fundamental para entender la variabilidad de las estimaciones basadas en muestras y para hacer inferencias sobre parámetros poblacionales . Cálculo [24] [22] [23] Interpretación El error estándar de la media refleja la variabilidad entre las medias que se obtendrían si se tomaran múltiples muestras del mismo tamaño de la misma población. No mide la variabilidad dentro de una muestra (eso lo hace la desviación estándar), sino la incertidumbre en la estimación de la media poblacional a partir de la media muestral . [24] [22] Es fundamental para construir intervalos de confianza y realizar pruebas de hipótesis sobre la media poblacional . [24] Ejemplo práctico [24] Distribución Muestral de la Media y de las Proporciones ¿Qué es la distribución muestral? [25]
  6. Aspecto Distribución Muestral de la Media Distribución Muestral de la

    Proporción Estadística considerada Media muestral ( ) Proporción muestral ( ) Media de la distribución Igual a la media poblacional Igual a la proporción poblacional Desviación estándar (Error estándar) Forma de la distribución Aproximadamente normal para muestras grandes (TLC) Aproximadamente normal para muestras grandes (TLC) Distribución Muestral de la Media Definición: Es la distribución de las medias calculadas a partir de todas las muestras posibles de tamaño extraídas de una población . [26] [27] [28] Características principales: La media de la distribución muestral de la media es igual a la media poblacional . La desviación estándar de esta distribución, llamada error estándar de la media, es , donde es la desviación estándar de la población y el tamaño de la muestra . [29] [27] [30] Según el Teorema del Límite Central, cuando el tamaño de la muestra es suficientemente grande, la distribución muestral de la media se aproxima a una distribución normal, independientemente de la forma de la distribución original de la población . [25] [27] [30] Importancia: Esta distribución permite calcular probabilidades y construir intervalos de confianza para la media poblacional a partir de la media muestral, facilitando la inferencia estadística . [27] [28] Distribución Muestral de la Proporción Definición: Es la distribución de las proporciones calculadas a partir de todas las muestras posibles de tamaño extraídas de una población. Características principales: La media de la distribución muestral de la proporción es igual a la proporción poblacional . La desviación estándar (error estándar) de la proporción muestral es . Para muestras grandes, la distribución muestral de la proporción se aproxima a una distribución normal, facilitando el uso de técnicas inferenciales. Importancia: Permite estimar y hacer inferencias sobre la proporción verdadera en la población basándose en la proporción observada en la muestra. Resumen Comparativo
  7. Aspecto Distribución Muestral de la Media Distribución Muestral de la

    Proporción Aplicación Estimación de medias poblacionales Estimación de proporciones poblacionales En conclusión, las distribuciones muestrales de la media y de la proporción son fundamentales para la estadística inferencial, ya que permiten entender cómo varían las estimaciones basadas en muestras y cómo se pueden hacer inferencias confiables sobre parámetros poblacionales . ⁂ El Teorema del Límite Central (TLC) es un principio fundamental en estadística que establece que la suma (o promedio) de un número grande de variables aleatorias independientes e idénticamente distribuidas (i.i.d.), con media μ y varianza finita σ², tiende a seguir una distribución normal conforme el tamaño de la muestra $ n $ tiende a infinito, sin importar la distribución original de dichas variables . [25] [27] [30] Teorema del Límite Central (TLC) Aplicado al Muestreo : La suma de ( n ) variables aleatorias independientes tiende a una distribución normal cuando n tiende al infinito, sin importar la distribución original. [31] [32] [33] Explicación detallada Sea una secuencia de variables aleatorias i.i.d. con media $ \mu $ y varianza $ \sigma^2 $. Definimos la media muestral como: El TLC afirma que la variable estandarizada converge en distribución a una distribución normal estándar $ N(0,1) $ cuando $ n \to \infty $ . [33] Condiciones importantes para que se cumpla el TLC Las variables deben ser independientes e idénticamente distribuidas (i.i.d.). La varianza poblacional debe ser finita. El tamaño de la muestra debe ser suficientemente grande (usualmente $ n \geq 30 $ es considerado adecuado, aunque depende de la forma de la distribución original) . [32] [34]
  8. Si lanzamos un dado muchas veces y calculamos la media

    de los resultados en muestras de tamaño $ n $, la distribución de esas medias tenderá a una curva normal conforme aumentamos $ n $, aunque la distribución original de un solo lanzamiento es uniforme discreta . En resumen, el Teorema del Límite Central garantiza que la suma o promedio de muchas variables aleatorias independientes se distribuye aproximadamente como una normal para muestras grandes, facilitando la inferencia estadística sin importar la forma original de la población. ⁂ Implicaciones prácticas Aunque la población original no sea normal, la distribución de la media muestral se aproximará a una normal para muestras grandes. Esto permite usar técnicas basadas en la normalidad (como intervalos de confianza y pruebas de hipótesis) para inferir sobre la media poblacional a partir de muestras. El TLC es la base para muchas aplicaciones en estadística inferencial y análisis de datos . [35] [34] [36] Ejemplo ilustrativo [32] Sesgo y Variabilidad en Estimaciones Estadísticas Sesgo El sesgo es la diferencia sistemática entre el valor esperado de un estimador y el verdadero valor del parámetro poblacional que se desea estimar. Matemáticamente, si $ T $ es un estimador del parámetro $ \theta $, el sesgo es: Un estimador es insesgado si su sesgo es cero, es decir, su valor esperado coincide con el parámetro real. El sesgo puede surgir por problemas en el diseño del estudio o en la recolección de datos, como: Sesgo de selección: cuando la muestra no representa adecuadamente a la población, por ejemplo, al elegir una muestra no aleatoria o sesgada hacia ciertos grupos. Sesgo de información: errores en la medición o registro de datos. Sesgo de confirmación: cuando se favorece información que confirma creencias previas. Ejemplo: en un muestreo no aleatorio donde se eligen sujetos por conveniencia, la estimación puede estar sistemáticamente desviada del parámetro real debido a que la muestra no es representativa . [37] [38] [39] [40]
  9. En resumen, el sesgo afecta la exactitud (corrección) de la

    estimación, mientras que la variabilidad afecta su precisión (consistencia). Controlar ambos es clave para obtener resultados estadísticos válidos y útiles en la investigación . ⁂ Variabilidad La variabilidad se refiere a la dispersión o fluctuación de un estimador alrededor de su valor esperado. Está relacionada con el error estándar, que mide cuánto varían las estimaciones de un estadístico (como la media muestral) entre diferentes muestras. A mayor variabilidad, menor precisión en la estimación. La variabilidad es inherente al proceso de muestreo y no implica necesariamente un error sistemático, sino la incertidumbre natural en la estimación. Trade-off: Reducir Sesgo vs. Reducir Variabilidad En estadística, existe un equilibrio o compromiso entre minimizar el sesgo y minimizar la variabilidad. Por ejemplo, un estimador puede ser insesgado pero con alta variabilidad, lo que hace que sus estimaciones sean poco precisas. Por otro lado, un estimador puede tener un pequeño sesgo pero menor variabilidad, resultando en estimaciones más estables. La selección de un buen estimador o método de muestreo implica balancear estos dos aspectos para obtener estimaciones confiables y representativas. [38] [39] [40] 1. https://www.uaeh.edu.mx/docencia/P_Presentaciones/b_sahagun/2019/dafr-estadistica.pdf 2. https://matemovil.com/poblacion-y-muestra-ejemplos-y-ejercicios/ 3. http://descargas.pntic.mec.es/cedec/mat3_2/contenidos/M3_U10/poblacin_y_muestra.html 4. https://www.ejemplos.co/poblacion-y-muestra/ 5. https://core.ac.uk/download/pdf/80531608.pdf 6. https://www.questionpro.com/blog/es/diferencia-entre-poblacion-y-muestra/ 7. https://es.wikipedia.org/wiki/Muestra_estadística 8. http://www.scielo.org.bo/scielo.php?script=sci_arttext&pid=S1815-02762004000100012 9. https://www.studocu.com/es-mx/messages/question/3063123/que-es-un-parametro-poblacional-que- es-una-estadistica-muestral-que-entendemos-por-la 10. https://es.wikipedia.org/wiki/Parámetro_estadístico 11. http://desirestadisticasbasicas.blogspot.com/2010/07/poblacion-parametro-muestra-estadistico.html 12. https://www.ucm.es/data/cont/media/www/pag-54183/APUNTES ESTADÍSTICA 3.pdf 13. https://www.youtube.com/watch?v=QDHL_pHy8VE 14. https://www.youtube.com/watch?v=nh7KWBGWwrI
  10. 15. https://peru.unir.net/revista/ingenieria/tipos-de-muestreo/ 16. https://www.sdelsol.com/blog/tendencias/tipos-de-muestreo/ 17. https://www.cimec.es/muestreo-probabilistico-y-no-probabilistico/ 18. https://www.questionpro.com/blog/es/tipos-de-muestreo-para-investigaciones-sociales/ 19. https://edu.gcfglobal.org/es/estadistica-basica/tipos-de-muestreo/1/

    20. https://universidadeuropea.com/blog/tipos-de-muestreo/ 21. https://es.wikipedia.org/wiki/Muestreo_(estadística) 22. https://es.wikipedia.org/wiki/Error_estándar 23. https://es.statisticseasily.com/glosario/¿Qué-es-el-error-estándar%3F/ 24. https://i4is.blackberrycross.com/error-estandar-de-la-media/ 25. https://es.wikipedia.org/wiki/Distribución_muestral 26. https://rpubs.com/mgsaavedraro/1209372 27. https://es.statisticseasily.com/glossario/what-is-sampling-distribution-of-the-mean/ 28. https://www.studocu.com/es-mx/document/instituto-tecnologico-de-tlahuac/probabilidad-y-estadistic a/distribucion-muestral/95593144 29. https://www.hiru.eus/es/matematicas/distribucion-muestral 30. https://www.chreinvent.com/recursos/distribución-de-medias 31. https://es.wikipedia.org/wiki/Teorema_del_límite_central 32. https://www.datacamp.com/es/tutorial/central-limit-theorem 33. https://cursosfinanzasdbf.com/teorema-central-del-limite/ 34. https://economipedia.com/definiciones/teorema-central-del-limite.html 35. https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-statistics/supporting-topic s/data-concepts/about-the-central-limit-theorem/ 36. https://elmundodelosdatos.com/el-teorema-del-limite-central-y-su-impacto-en-el-mundo-real/ 37. https://www.educaopen.com/digital-lab/blog/software/sesgo-estadistica 38. https://es.wikipedia.org/wiki/Sesgo_estadístico 39. https://mhaconsulting.mx/blogs/blog-mha/que-es-un-sesgo-estadistico 40. https://economipedia.com/definiciones/sesgo-estadistico.html