Want to make creations as awesome as this one?

Transcript

Tema 4.1

Estimación

La unidad anterior, te proporcionó el inicio de la relación entre la probabilidad y la estadística inferencial. Aprendiste que los valores de las medias muestrales se pueden considerar como una variable aleatoria, y, en consecuencia, puedes generar una distribución de medias muestrales. Además, que el teorema del límite central te dice que, aunque las poblaciones no sean normales, puedes tener que las distribuciones muestrales sean aproximadamente normales cuando el tamaño muestral es suficientemente grande. Y bueno, este tipo de herramientas son las que se usan para, hacer inferencias acerca de una población, usualmente, los métodos que nos permiten hacer inferencias sobre parámetros poblacionales son de una de dos categorías: Estimar o predecir el valor del parámetro y prueba de hipótesis. Comienza estudiando a la estimación del parámetro.

La estimación puntual se refiere al proceso de utilizar datos muestrales para proporcionar un valor único, o "punto", que sirve como la mejor estimación del parámetro de una población. A la regla o fórmula que describe este cálculo se denomina estimador puntual y el número resultante recibe el nombre de estimación puntual. Un posible estimador que podría usarse en la forma de estimación puntual es la media muestral, también la proporción muestral, la varianza muestral y la desviación estándar muestral. Para poder utilizar este tipo de estimación, es necesario suponer que la población de estudio se comporta como una distribución normal; de aquí que, la media aritmética de una muestra será el estimador de la media poblacional, la mediana muestral será un estimador de la mediana poblacional, la desviación estándar muestral será un estimador de la desviación estándar poblacional, y la proporción en una muestra podrá utilizarse como un estimador de la proporción de la población. La estimación puntual que se obtiene con un estadístico muestral cambia de valor de muestra en muestra, debido a que depende de los elementos que hayan sido seleccionados de la población para formar una muestra particular. Entonces, tendríamos una gran cantidad de muestras y estimaciones puntuales del parámetro de una población, es decir que la estimación puntual no ofrece información sobre el error o la incertidumbre de la estimación. Por esta razón, en muchos casos se prefiere complementar la estimación puntual con un intervalo de confianza, que ofrece un rango de valores dentro del cual se espera que se encuentre el parámetro poblacional con un cierto nivel de confianza.

4.1.1 Estimación puntual

A diferencia de la estimación puntual, que ofrece un solo valor estimado, los intervalos de confianza permiten cuantificar la incertidumbre asociada con la estimación, de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de dichos conjuntos con una probabilidad específica. Un estimador de intervalo es una regla para calcular dos números, por ejemplo, 𝑎 y 𝑏, para crear un intervalo (intervalo de confianza) del que se esté seguro de que contiene el parámetro de interés. Y la probabilidad de que el parámetro poblacional ocurra dentro de dicho intervalo se calcula a través del coeficiente de confianza (o nivel de confianza), designado por 1 - 𝛼. Esta probabilidad indicará qué tanta confianza tenemos de que la estimación de intervalo incluya al parámetro de la población.En la práctica los intervalos de confianza calculados son de 90%, 95% y 99%.A continuación, debes leer las páginas 292 y 293, del libro: Introducción a la probabilidad y estadística, donde aprenderás cómo construir un intervalo de confianza.

4.1.2 Estimación por intervalo

Lectura obligatoria 1. Douglas, A., William, M., & Samuel, W. (2015). Estadística aplicada a los negocios y la economía. México: McGrawHill education.

Como ya se indicó previamente, en estadística inferencial se parte de los datos de una muestra para encontrar el valor del parámetro de una población, entonces si se estima el valor de la media aritmética o de una proporción de una población conviene saber cómo encontrar un intervalo de confianza para ellos.

La idea general detrás de un intervalo de confianza (para distribuciones simétricas como las distribuciones normal y t) es que tenemos una estimación de un parámetro y calculamos un margen de error, añadiendo el margen a la estimación para obtener un límite superior y restando el margen de la estimación para obtener un límite inferior. Interpretar un intervalo de confianza requiere que demos una estimación de confianza.

4.1.3 Intervalo de confianza para la media y la proporción

A continuación, debes leer las páginas 300-303, 306-312, 313-316 del libro: Estadística aplicada a los negocios y la economía, ahí comprenderás como construir un intervalo de confianza para la media poblacional cuando se conoce la desviación estándar, construir un intervalo de confianza para la media muestral cuando se desconoce la desviación estándar y construir un Interval de confianza para una proporción de la población.

Lectura obligatoria 2. Douglas, A., William, M., & Samuel, W. (2015). Estadística aplicada a los negocios y la economía. México: McGrawHill education.

A continuación, se presenta un ejemplo básico de cómo construir un intervalo de confianza para la media de una muestra en R-Studio utilizando la función t.test() y un intervalo de confianza para una proporción utilizando la función confi.prop().

4.1.4 Construcción de intervalos en software

A continuación, desarrollemos una función en R-Studio, para estimar el tamaño de muestra requerido basándonos en las fórmulas que leíste en la lectura anterior.

Construir intervalos de confianza con R-Studio para la media y la proporción de una población es una herramienta poderosa en el análisis estadístico. R-Studio te facilita el proceso mediante funciones como t.test() para intervalos de confianza de la media y funciones personalizadas, como confi.prop(), para intervalos de confianza de proporciones. Estas herramientas te permiten realizar cálculos precisos y automatizados, asegurando que las estimaciones estén dentro de un rango confiable. En resumen, R-Studio no solo agiliza los cálculos, sino que también potencia el análisis estadístico al proporcionar resultados claros y reproducibles, esenciales para una comprensión profunda de los datos. A continuación, en lugar de crear un conjunto de valores en el que se espera que se presente el parámetro poblacional, se expone un procedimiento para probar la validez de un enunciado relativo a un parámetro poblacional.

En R-Studio, puedes construir intervalos de confianza utilizando diversas funciones y paquetes. Dependiendo del tipo de dato y del parámetro que desees estimar, las herramientas pueden variar. Por ejemplo, para intervalos de confianza para la media de una muestra con una distribución normal, puedes utilizar la función t.test() o confint.mean(), mientras que para proporciones puedes usar confi.prop().