Want to create interactive content? It’s easy in Genially!

Get started free

Tarea Repaso Estadistica

JUAN ALBERTO MUÑOZ VALDEZ

Created on February 6, 2023

Start designing with a free template

Discover more than 1500 professional designs like these:

Interactive Onboarding Guide

Corporate Christmas Presentation

Business Results Presentation

Meeting Plan Presentation

Customer Service Manual

Business vision deck

Economic Presentation

Transcript

REPASO ESTADISTICA DESCRIPTIVA

Juan Alberto Muñoz 0227-21-16473

Medida Tendencia Central

Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la distribución de la muestra o población estadística. Es común que siempre nos encontraremos en una empresa datos que requieren de mucha inforamción con datos donde deberemos reaizar cálculosmuy variables tales como sueldos, datos de ventas, planillas, productos, etc. El uso el cual considero nos es útil éstas medidas es para consguir objetivos que nos ayuden a justificar, plantear y trasladar la existencia de datos en general, para una fácil interpretación de mismos datos en diferentes ocasiones, diarios, semanales, quincenales, mensuales,anuales

Principales Medida Tendencia Central

MEDIA: valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores. Donde expondremos los datos a observar dividisos por la cantidad de cada uno de los datos, al final se saca el porcentaje final de lo observado. MEDIANA: La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas propuestas no nos darán el valor de la mediana, lo que nos darán será la posición en la que está dentro del conjunto de datos. Las fórmulas que indica la posición de la mediana en la serie son las siguientes MODA: a moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones de cada valor.

Medidas de Posición

Las medidas de posicion son valores que permiten dividir el conjunto de datos en partes porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los percentiles.

Medidas de Dispersión

Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el coeficiente de variación

Medidas de Forma

Las medidas de forma son aquellas que nos muestran si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución

GLOSARIO

AJUSTE DE BONFERRONI.- Técnica estadística que ajusta el nivel de significación en relación al número de pruebas estadísticas realizadas simultáneamente sobre un conjunto de datos. El nivel de significación para cada prueba se calcula dividiendo el error global de tipo I entre el número de pruebas a realizar. El ajuste de Bonferroni se considera conservador. AMPLITUD O RANGO.- La diferencia entre el valor máximo y mínimo de los valores de una variable se encuentran comprendidos el 100% de los valores muestrales. ANACOVA.- Análisis de la covarianza. Es una técnica estadística que combina ANOVA (pues compara medias entre grupos) y análisis de regresión (ajusta las comparaciones de las medias entre los grupos por variables continuas o covariables). ANOVA.- Análisis de la varianza. Es una técnica estadística que sirve para decidir / determinar si las diferencias que existen entre las medias de tres o más grupos (niveles de clasificación) son estadísticamente significativas. Las técnicas de ANOVA se basan en la partición de la varianza para establecer si la varianza explicada por los grupos formados es suficientemente mayor que la varianza residual o no explicada .ÁREA BAJO LA CURVA (entre dos puntos).- Si la curva viene dada por una función de densidad teórica, representa la probabilidad de que la variable aleatoria tome un valor dentro del intervalo determinado por esos dos puntos. B Ver ajuste de bonferroni. CARACTERÍSTICAS.- Propiedades de las unidades o elementos que componen las muestras. Se miden mediante variables. Se asume que los individuos presentan diferentes características. CAUSALIDAD.- Relación entre causa y efecto. Generalmente identificados como variables. No hay que confundir causalidad con correlación. La correlación mide la similitud estructural numérica entre dos variables. Normalmente la existencia de correlación es condición necesaria para la causalidad. COEFICIENTE DE CORRELACIÓN.- Estadístico que cuantifica la correlación. Sus valores están comprendidos entre –1 y 1 COEFICIENTE DE DETERMINACIÓN.- Es el cuadrado del coeficiente de correlación. Expresado en tanto por ciento mide el grado de información compartida entre dos variables continuas. COEFICIENTES DE REGRESIÓN.- En un modelo de regresión lineal son los valores de a y b que determinan la expresión de la recta de regresión y = a + b * x COEFICIENTE DE VARIACIÓN.- Es una medida de dispersión relativa. No tiene unidades y se calcula dividiendo la cuasi-desviación típica entre la media muestral. Se suele expresar en tanto por ciento

GLOSARIO

CONTRASTE BILATERAL.- Contraste de hipótesis en la que la hiópetesis alternativa da opción a igualdad o superioridad. CONTRASTE DE HIPÓTESIS.- Es el proceso estadístico que se sigue para la toma de decisiones a partir de la información de la muestra. Comparando el valor del estadístico experimental con el valor teórico rechazamos o no la hipótesis nula CONTRASTE UNILATERAL.- Contraste de hipótesis en la que la hipótesis alternativa de opción a solo igualdad o a solo superioridad CORRELACIÓN.- Expresa la concordancia entre dos variables según el sentido de la relación de éstas en términos de aumento ó disminución. COVARIABLES.- Variables continuas independientes que junto a una o más variables (grupo de tratamiento) sirven para explicar una variable respuesta continua. Supongamos que pretendemos explicar las diferencias existentes en el nivel de cortisol en sangre por grupo de tratamiento A / B, teniendo en cuenta el peso. La variable peso es una covariable. COVARIANZA.- Representa la media del producto de las desviaciones de dos variables en relación a su media. CUARTILES.- Existen tres cuartiles: Q1, Q2 y Q3. Estos números dividen a los valores muestrales, una vez ordenados, en cuatro partes homogéneas en cuanto a número de observaciones. Así Q1 determina el valor que hace que haya un 25% de valores muestrales por debajo de éste, y un 75% por encima de éste. Q2 es la mediana. CUASIVARIANZA.- Característica de una muestra o población que cuantifica su dispersión o variabilidad. La cuasivarianza se obtiene multiplicando la varianza por n / (n-1). La cuasivarianza muestral es un estimador centrado (no sesgado) de la varianza poblacional. DATOS CENSURADOS.- En análisis de supervivencia son datos donde no se conoce el tiempo total hasta la aparición del fracaso / éxito bien porque el individuo se retiró del estudio, bien porque se acabó el estudio (datos con censura administrativa). Existen datos censurados por la izquierda y por la derecha. DATOS PAREADOS.- Datos de poblaciones dependientes, donde los datos de las variables van emparejados por individuos, en contraposición con los datos independientes. DECILES.- Corresponden a los percentiles 10%, 20%, 30%, 40%, 50%, 60%, 70% 80%, 90% y 100% DESCRIPTIVA.- Parte de la estadística que resume la información de la muestra. La información recogida y resumida en los estadísticos se usa para la estimación de parámetros poblacionales.

GLOSARIO

DESCRIPTIVA.- Parte de la estadística que resume la información de la muestra. La información recogida y resumida en los estadísticos se usa para la estimación de parámetros poblacionales. DESVIACIÓN ESTANDAR (TIPICA).- Característica de una muestra o población que cuantifica su dispersión o variabilidad. Tiene las mismas unidades que la variable. La desviación típica es invariante con respecto al origen de la distribución. Su cuadrado es la varianza. DIAGRAMA DE PUNTOS.- Es un gráfico bidimensional o tridimensional que muestra la variación de los valores muestrales de dos o tres variables. DIAGRAMAS DE BARRAS.- Representación gráfica para las variables discretas DIFERENCIAS ESTADÍSTICAMENTE SIGNIFICATIVAS.- Las diferencias entre lo observado y lo supuesto en la hipótesis nula no puede ser explicado por el azar. DIFERENCIAS RELEVANTES.- Diferencia esperada o definida a priori con un valor conceptual intrínseco. No confundir diferencias estadísticamente significativas que establece sí una diferencia, cualquiera que sea su valor DIMENSIÓN.- Si estudiamos una única variable la dimensión es uno, si estudiamos la información de dos variables en forma conjunta, la dimensión es dos..... DISPERSIÓN.- Ver estadísticos de dispersión. DISTRIBUCIÓN DE DATOS.- En la realización de un experimento, corresponde a la recogida de los datos experimentales para cada individuo y cada variable DISTRIBUCIÓN NORMAL O DE GAUSS.- Es una distribución teórica de probabilidad que se usa tanto en la estadística aplicada como en la teórica. Aparece en la práctica con mucha frecuencia como consecuencia del importante resultado que establece el teorema central del límite. Tiene una forma de campana y viene caracterizada por únicamente dos valores: la media y la varianz DISTRIBUCIÓN T STUDENT.- Distribución teórica de probabilidad. Se usa para la comparación de dos medias en poblaciones independientes y normales