REPASO ESTADISTICA DESCRIPTIVA
Juan Alberto Muñoz 0227-21-16473
Medida Tendencia Central
Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la distribución de la muestra o población estadística. Es común que siempre nos encontraremos en una empresa datos que requieren de mucha inforamción con datos donde deberemos reaizar cálculosmuy variables tales como sueldos, datos de ventas, planillas, productos, etc. El uso el cual considero nos es útil éstas medidas es para consguir objetivos que nos ayuden a justificar, plantear y trasladar la existencia de datos en general, para una fácil interpretación de mismos datos en diferentes ocasiones, diarios, semanales, quincenales, mensuales,anuales
Principales Medida Tendencia Central
MEDIA: valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores. Donde expondremos los datos a observar dividisos por la cantidad de cada uno de los datos, al final se saca el porcentaje final de lo observado. MEDIANA: La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas propuestas no nos darán el valor de la mediana, lo que nos darán será la posición en la que está dentro del conjunto de datos. Las fórmulas que indica la posición de la mediana en la serie son las siguientes MODA: a moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones de cada valor.
Medidas de Posición
Las medidas de posicion son valores que permiten dividir el conjunto de datos en partes porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los percentiles.
Medidas de Dispersión
Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el coeficiente de variación
Medidas de Forma
Las medidas de forma son aquellas que nos muestran si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución
GLOSARIO
AJUSTE DE BONFERRONI.- Técnica estadística que ajusta el nivel de significación en
relación al número de pruebas estadísticas realizadas simultáneamente sobre un conjunto de
datos. El nivel de significación para cada prueba se calcula dividiendo el error global de tipo I
entre el número de pruebas a realizar. El ajuste de Bonferroni se considera conservador. AMPLITUD O RANGO.- La diferencia entre el valor máximo y mínimo de los valores de una
variable se encuentran comprendidos el 100% de los valores muestrales. ANACOVA.- Análisis de la covarianza. Es una técnica estadística que combina ANOVA (pues
compara medias entre grupos) y análisis de regresión (ajusta las comparaciones de las medias
entre los grupos por variables continuas o covariables). ANOVA.- Análisis de la varianza. Es una técnica estadística que sirve para decidir / determinar
si las diferencias que existen entre las medias de tres o más grupos (niveles de clasificación) son
estadísticamente significativas. Las técnicas de ANOVA se basan en la partición de la varianza
para establecer si la varianza explicada por los grupos formados es suficientemente mayor que
la varianza residual o no explicada .ÁREA BAJO LA CURVA (entre dos puntos).- Si la curva viene dada por una función de
densidad teórica, representa la probabilidad de que la variable aleatoria tome un valor dentro del
intervalo determinado por esos dos puntos.
B
Ver ajuste de bonferroni.
CARACTERÍSTICAS.- Propiedades de las unidades o elementos que componen las muestras.
Se miden mediante variables. Se asume que los individuos presentan diferentes características. CAUSALIDAD.- Relación entre causa y efecto. Generalmente identificados como variables. No
hay que confundir causalidad con correlación. La correlación mide la similitud estructural
numérica entre dos variables. Normalmente la existencia de correlación es condición necesaria
para la causalidad. COEFICIENTE DE CORRELACIÓN.- Estadístico que cuantifica la correlación. Sus valores
están comprendidos entre –1 y 1
COEFICIENTE DE DETERMINACIÓN.- Es el cuadrado del coeficiente de correlación.
Expresado en tanto por ciento mide el grado de información compartida entre dos variables
continuas. COEFICIENTES DE REGRESIÓN.- En un modelo de regresión lineal son los valores de a y b
que determinan la expresión de la recta de regresión y = a + b * x
COEFICIENTE DE VARIACIÓN.- Es una medida de dispersión relativa. No tiene unidades y
se calcula dividiendo la cuasi-desviación típica entre la media muestral. Se suele expresar en
tanto por ciento
GLOSARIO
CONTRASTE BILATERAL.- Contraste de hipótesis en la que la hiópetesis alternativa da
opción a igualdad o superioridad.
CONTRASTE DE HIPÓTESIS.- Es el proceso estadístico que se sigue para la toma de
decisiones a partir de la información de la muestra. Comparando el valor del estadístico
experimental con el valor teórico rechazamos o no la hipótesis nula CONTRASTE UNILATERAL.- Contraste de hipótesis en la que la hipótesis alternativa de
opción a solo igualdad o a solo superioridad CORRELACIÓN.- Expresa la concordancia entre dos variables según el sentido de la relación
de éstas en términos de aumento ó disminución.
COVARIABLES.- Variables continuas independientes que junto a una o más variables (grupo
de tratamiento) sirven para explicar una variable respuesta continua. Supongamos que
pretendemos explicar las diferencias existentes en el nivel de cortisol en sangre por grupo de
tratamiento A / B, teniendo en cuenta el peso. La variable peso es una covariable. COVARIANZA.- Representa la media del producto de las desviaciones de dos variables en
relación a su media. CUARTILES.- Existen tres cuartiles: Q1, Q2 y Q3. Estos números dividen a los valores
muestrales, una vez ordenados, en cuatro partes homogéneas en cuanto a número de
observaciones. Así Q1 determina el valor que hace que haya un 25% de valores muestrales por
debajo de éste, y un 75% por encima de éste. Q2 es la mediana. CUASIVARIANZA.- Característica de una muestra o población que cuantifica su dispersión o
variabilidad. La cuasivarianza se obtiene multiplicando la varianza por n / (n-1). La
cuasivarianza muestral es un estimador centrado (no sesgado) de la varianza poblacional. DATOS CENSURADOS.- En análisis de supervivencia son datos donde no se conoce el tiempo
total hasta la aparición del fracaso / éxito bien porque el individuo se retiró del estudio, bien
porque se acabó el estudio (datos con censura administrativa). Existen datos censurados por la
izquierda y por la derecha. DATOS PAREADOS.- Datos de poblaciones dependientes, donde los datos de las variables van
emparejados por individuos, en contraposición con los datos independientes. DECILES.- Corresponden a los percentiles 10%, 20%, 30%, 40%, 50%, 60%, 70% 80%, 90% y
100%
DESCRIPTIVA.- Parte de la estadística que resume la información de la muestra. La
información recogida y resumida en los estadísticos se usa para la estimación de parámetros
poblacionales.
GLOSARIO
DESCRIPTIVA.- Parte de la estadística que resume la información de la muestra. La
información recogida y resumida en los estadísticos se usa para la estimación de parámetros
poblacionales. DESVIACIÓN ESTANDAR (TIPICA).- Característica de una muestra o población que
cuantifica su dispersión o variabilidad. Tiene las mismas unidades que la variable. La
desviación típica es invariante con respecto al origen de la distribución. Su cuadrado es la
varianza. DIAGRAMA DE PUNTOS.- Es un gráfico bidimensional o tridimensional que muestra la
variación de los valores muestrales de dos o tres variables. DIAGRAMAS DE BARRAS.- Representación gráfica para las variables discretas DIFERENCIAS ESTADÍSTICAMENTE SIGNIFICATIVAS.- Las diferencias entre lo
observado y lo supuesto en la hipótesis nula no puede ser explicado por el azar. DIFERENCIAS RELEVANTES.- Diferencia esperada o definida a priori con un valor
conceptual intrínseco. No confundir diferencias estadísticamente significativas que establece sí
una diferencia, cualquiera que sea su valor DIMENSIÓN.- Si estudiamos una única variable la dimensión es uno, si estudiamos la
información de dos variables en forma conjunta, la dimensión es dos.....
DISPERSIÓN.- Ver estadísticos de dispersión. DISTRIBUCIÓN DE DATOS.- En la realización de un experimento, corresponde a la recogida
de los datos experimentales para cada individuo y cada variable DISTRIBUCIÓN NORMAL O DE GAUSS.- Es una distribución teórica de probabilidad que se
usa tanto en la estadística aplicada como en la teórica. Aparece en la práctica con mucha
frecuencia como consecuencia del importante resultado que establece el teorema central del
límite. Tiene una forma de campana y viene caracterizada por únicamente dos valores: la media
y la varianz DISTRIBUCIÓN T STUDENT.- Distribución teórica de probabilidad. Se usa para la
comparación de dos medias en poblaciones independientes y normales
Tarea Repaso Estadistica
JUAN ALBERTO MUÑOZ VALDEZ
Created on February 6, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Interactive Onboarding Guide
View
Corporate Christmas Presentation
View
Business Results Presentation
View
Meeting Plan Presentation
View
Customer Service Manual
View
Business vision deck
View
Economic Presentation
Explore all templates
Transcript
REPASO ESTADISTICA DESCRIPTIVA
Juan Alberto Muñoz 0227-21-16473
Medida Tendencia Central
Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la distribución de la muestra o población estadística. Es común que siempre nos encontraremos en una empresa datos que requieren de mucha inforamción con datos donde deberemos reaizar cálculosmuy variables tales como sueldos, datos de ventas, planillas, productos, etc. El uso el cual considero nos es útil éstas medidas es para consguir objetivos que nos ayuden a justificar, plantear y trasladar la existencia de datos en general, para una fácil interpretación de mismos datos en diferentes ocasiones, diarios, semanales, quincenales, mensuales,anuales
Principales Medida Tendencia Central
MEDIA: valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores. Donde expondremos los datos a observar dividisos por la cantidad de cada uno de los datos, al final se saca el porcentaje final de lo observado. MEDIANA: La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas propuestas no nos darán el valor de la mediana, lo que nos darán será la posición en la que está dentro del conjunto de datos. Las fórmulas que indica la posición de la mediana en la serie son las siguientes MODA: a moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones de cada valor.
Medidas de Posición
Las medidas de posicion son valores que permiten dividir el conjunto de datos en partes porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los percentiles.
Medidas de Dispersión
Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el coeficiente de variación
Medidas de Forma
Las medidas de forma son aquellas que nos muestran si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución
GLOSARIO
AJUSTE DE BONFERRONI.- Técnica estadística que ajusta el nivel de significación en relación al número de pruebas estadísticas realizadas simultáneamente sobre un conjunto de datos. El nivel de significación para cada prueba se calcula dividiendo el error global de tipo I entre el número de pruebas a realizar. El ajuste de Bonferroni se considera conservador. AMPLITUD O RANGO.- La diferencia entre el valor máximo y mínimo de los valores de una variable se encuentran comprendidos el 100% de los valores muestrales. ANACOVA.- Análisis de la covarianza. Es una técnica estadística que combina ANOVA (pues compara medias entre grupos) y análisis de regresión (ajusta las comparaciones de las medias entre los grupos por variables continuas o covariables). ANOVA.- Análisis de la varianza. Es una técnica estadística que sirve para decidir / determinar si las diferencias que existen entre las medias de tres o más grupos (niveles de clasificación) son estadísticamente significativas. Las técnicas de ANOVA se basan en la partición de la varianza para establecer si la varianza explicada por los grupos formados es suficientemente mayor que la varianza residual o no explicada .ÁREA BAJO LA CURVA (entre dos puntos).- Si la curva viene dada por una función de densidad teórica, representa la probabilidad de que la variable aleatoria tome un valor dentro del intervalo determinado por esos dos puntos. B Ver ajuste de bonferroni. CARACTERÍSTICAS.- Propiedades de las unidades o elementos que componen las muestras. Se miden mediante variables. Se asume que los individuos presentan diferentes características. CAUSALIDAD.- Relación entre causa y efecto. Generalmente identificados como variables. No hay que confundir causalidad con correlación. La correlación mide la similitud estructural numérica entre dos variables. Normalmente la existencia de correlación es condición necesaria para la causalidad. COEFICIENTE DE CORRELACIÓN.- Estadístico que cuantifica la correlación. Sus valores están comprendidos entre –1 y 1 COEFICIENTE DE DETERMINACIÓN.- Es el cuadrado del coeficiente de correlación. Expresado en tanto por ciento mide el grado de información compartida entre dos variables continuas. COEFICIENTES DE REGRESIÓN.- En un modelo de regresión lineal son los valores de a y b que determinan la expresión de la recta de regresión y = a + b * x COEFICIENTE DE VARIACIÓN.- Es una medida de dispersión relativa. No tiene unidades y se calcula dividiendo la cuasi-desviación típica entre la media muestral. Se suele expresar en tanto por ciento
GLOSARIO
CONTRASTE BILATERAL.- Contraste de hipótesis en la que la hiópetesis alternativa da opción a igualdad o superioridad. CONTRASTE DE HIPÓTESIS.- Es el proceso estadístico que se sigue para la toma de decisiones a partir de la información de la muestra. Comparando el valor del estadístico experimental con el valor teórico rechazamos o no la hipótesis nula CONTRASTE UNILATERAL.- Contraste de hipótesis en la que la hipótesis alternativa de opción a solo igualdad o a solo superioridad CORRELACIÓN.- Expresa la concordancia entre dos variables según el sentido de la relación de éstas en términos de aumento ó disminución. COVARIABLES.- Variables continuas independientes que junto a una o más variables (grupo de tratamiento) sirven para explicar una variable respuesta continua. Supongamos que pretendemos explicar las diferencias existentes en el nivel de cortisol en sangre por grupo de tratamiento A / B, teniendo en cuenta el peso. La variable peso es una covariable. COVARIANZA.- Representa la media del producto de las desviaciones de dos variables en relación a su media. CUARTILES.- Existen tres cuartiles: Q1, Q2 y Q3. Estos números dividen a los valores muestrales, una vez ordenados, en cuatro partes homogéneas en cuanto a número de observaciones. Así Q1 determina el valor que hace que haya un 25% de valores muestrales por debajo de éste, y un 75% por encima de éste. Q2 es la mediana. CUASIVARIANZA.- Característica de una muestra o población que cuantifica su dispersión o variabilidad. La cuasivarianza se obtiene multiplicando la varianza por n / (n-1). La cuasivarianza muestral es un estimador centrado (no sesgado) de la varianza poblacional. DATOS CENSURADOS.- En análisis de supervivencia son datos donde no se conoce el tiempo total hasta la aparición del fracaso / éxito bien porque el individuo se retiró del estudio, bien porque se acabó el estudio (datos con censura administrativa). Existen datos censurados por la izquierda y por la derecha. DATOS PAREADOS.- Datos de poblaciones dependientes, donde los datos de las variables van emparejados por individuos, en contraposición con los datos independientes. DECILES.- Corresponden a los percentiles 10%, 20%, 30%, 40%, 50%, 60%, 70% 80%, 90% y 100% DESCRIPTIVA.- Parte de la estadística que resume la información de la muestra. La información recogida y resumida en los estadísticos se usa para la estimación de parámetros poblacionales.
GLOSARIO
DESCRIPTIVA.- Parte de la estadística que resume la información de la muestra. La información recogida y resumida en los estadísticos se usa para la estimación de parámetros poblacionales. DESVIACIÓN ESTANDAR (TIPICA).- Característica de una muestra o población que cuantifica su dispersión o variabilidad. Tiene las mismas unidades que la variable. La desviación típica es invariante con respecto al origen de la distribución. Su cuadrado es la varianza. DIAGRAMA DE PUNTOS.- Es un gráfico bidimensional o tridimensional que muestra la variación de los valores muestrales de dos o tres variables. DIAGRAMAS DE BARRAS.- Representación gráfica para las variables discretas DIFERENCIAS ESTADÍSTICAMENTE SIGNIFICATIVAS.- Las diferencias entre lo observado y lo supuesto en la hipótesis nula no puede ser explicado por el azar. DIFERENCIAS RELEVANTES.- Diferencia esperada o definida a priori con un valor conceptual intrínseco. No confundir diferencias estadísticamente significativas que establece sí una diferencia, cualquiera que sea su valor DIMENSIÓN.- Si estudiamos una única variable la dimensión es uno, si estudiamos la información de dos variables en forma conjunta, la dimensión es dos..... DISPERSIÓN.- Ver estadísticos de dispersión. DISTRIBUCIÓN DE DATOS.- En la realización de un experimento, corresponde a la recogida de los datos experimentales para cada individuo y cada variable DISTRIBUCIÓN NORMAL O DE GAUSS.- Es una distribución teórica de probabilidad que se usa tanto en la estadística aplicada como en la teórica. Aparece en la práctica con mucha frecuencia como consecuencia del importante resultado que establece el teorema central del límite. Tiene una forma de campana y viene caracterizada por únicamente dos valores: la media y la varianz DISTRIBUCIÓN T STUDENT.- Distribución teórica de probabilidad. Se usa para la comparación de dos medias en poblaciones independientes y normales