Gnosis
Seminario de investigación cuantitativa
No hay enseñanza sin investigación, ni investigación sin enseñanza. Paulo Freire
Empezar
00
Genialy de la introducción con los componentes de los criterios de evaluación y del trabajo final
01
Es un error absurdo teorizar antes de tener datos. Sir Arthur Conan Doyle
Introducción al estudio de la estadística
Índice
aplicación de la estadística
Definición de estadística
Estadística descriptiva e inferencial
01
Desde comienzos de la civilización existen formas sencillas de estadística: representaciones gráficas, símbolos en pieles, rocas, palos de madera, cuevas, etc. para contar animales o ciertas cosas
Definición de estadística
“La Estadística estudia métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en dicho análisis”
Murray R. Spiegel
01
Historia de la estadística
Su trayectoria
- Estadística deriba del latín staticum collegium (consejo de estado)
- Derivado del italiano statista (hombre de estado)
- Grottfried Achenwall (1749) introdujo el término statistik. (análisis de datos del estado)
- Siglo XIX el término estadística vino a designar la colección y clasificación de datos.
- En sus inicios se asocio al control de datos poblacionales
- En el año 3000 los babilonios usaban pequeñas tablillas de arcilla para recopilar datos, sobre la producción agrícola.
- E incluso los libros bíblicos contienen estadística
- Utilizada también por los chinos y griegos en censos poblacionales y cobro de impuestos
Aplicación de la estadística
- En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos.
- Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad, estudios de consumidores, análisis de resultados en deportes, administración de instituciones, en la educación, organismos políticos, en la medicina y en otras muy distintas áreas
+ info
01
Usos de la estadística
- Definir la Características de las personas,
- Determinar la Infraestructura
- conocer los Recursos disponibles
- Todo lo que el estado necesite calcular con el fin de efectuar estudios económicos o militares
- Es una herramienta para la ciencia a través de la cual se aplica un análisis de los fenómenos a estudiar
- Instrumento de apoyo al método científico
- Su campo de acción es el de la incertidumbre medible
- Determina patrones de movimiento que rigen y permiten explicar fenómenos.
Estudio Estadístico
01
Objetivos de la estadística
- Planear investigaciones: Para ello utilizamos,el muestreo, diseño de experimentos y metodología de la investigación.
- Organizar y describir información de grupos: Para ello utilizamos la estadística descriptiva.
- Obtener conclusiones y comprobar hipótesis: Para ello utilizamos la estadística inferencial
Tipos de estadística
Estadística Inferencial o inductiva
Estadística descriptiva o deductiva
Usa la teoría de probabilidades para generalizar las características de una población a partir de las características de una muestra representativa. Utiliza estadísticas muestrales para obtener conclusiones sobre los verdaderos parámetros de la población. A partir de los resultados del experimento realizado con una muestra, se infiere sobre las características poblacionales.
Estudia los métodos para organizar, sumar y describir un conjunto de datos para que las características del tema analizado se vuelvan evidentes. Se divide en:
- Técnicas Gráficas
- Técnicas Numéricas
Tipos de estadística
Estadística descriptiva e inferencial
Determinar los elementos sustantivos de cada uno de los procesos estadísticos
https://www.youtube.com/watch?v=AJFi8GnmDA8&ab_channel=Excelyestad%C3%ADstica
01
Estdística descriptiva e inferencial: Características de un grupo
- Talla
- Peso
- Edad
- Coeficiente intelectual
- Ingreso mensual
Descripción sin conclusiones: Estadística Descriptiva Si inferimos: Estadística Inferencial
01
Estdística descriptiva e inferencial: Variables aleatorias
- Es una característica cuantitativa de los resultados de un espacio muestral.
- La variable aleatoria puede tomar un conjunto finito o infinito de valores numerables
01
Estdística descriptiva e inferencial: Variables aleatorias discretas y continuas
Variable aleatoria discreta
- Sus valores son posibles de contar
- Se representan con números enteros. Ejemplo: el lanzamiento de una moneda para saber si saldrá cruz o cara, que se representan con los valores de 1 o 0
Variable aleatoria continua Puede contar infinitos valores dentro de un intervalo
Ejemplo: Queremos conocer cuál es la duración promedio de una pila AAA. El conjunto de los posibles valores que componen el espacio muestral es infinito porque el tiempo se puede dividir en intervalos infinitesimales
01
Estdística descriptiva e inferencial: Notación matemática
La estadística trabaja con datos agrupados resultantes de medir una o más variables.
Los datos se obtienen de la muestra Y, en ocasión de poblaciones
Regularmente se utilizan las letras mayúsculas X y Y para representar las variables medibles: ejemplo X o Y representa la variable medible (edad)
N representa el número total de sujetos o datos (6)
Xi es el i-ésimo dato, donde i puede variar de 1 a N
01
Estdística descriptiva e inferencial: Sumativa
Una de las operaciones que se realizan con mayor frecuencia en la estadística, es la suma; la cual consiste en sumar todos o una parte de los datos. Su símbolo es la letra griega mayúscula sigma (Σ)
Su frase algebraica se lee como “la suma de la variable X de i = 1 a N”
Las notaciones abajo y arriba del signo indican los datos que deben incluirse en la operación
El término de abajo del signo de la sumatoria nos indica el primer dato en esta operación
Y el término de arriba indica el último dato.
Escalas de medición: nominal, ordinal, de intervalo y razón
01
Escalas de medición: nominal, ordinal, de intervalo y razón
01
Escalas de medición: nominal, ordinal, de intervalo y razón
01
Los datos que se asocian con las variables aleatorias pueden medirse con diferentes escalas dependiendo del tipo de dato que se trate. Las distintas medidas son:
Escalas de medición: nominal, ordinal, de intervalo y razón
01
a) Medidas por Escala Nominal:
- Nivel mínimo de medición
- Los datos son de tipo cualitativo
- Generalmente se le asigna un valor numérico a cada categoría nominal (codificar los datos/Clasificar)
- Caso especial: dicótomicas (solo admite dos valores). Muerto-Vivo; Hombre-Mujer, si-no, falso-verdadero, etc.
- Marcas de zapatos deportivos, tipos de fruta, música, días de la semana, nacionalidad, creencia religiosa, color de los ojos
- Son variables que indican cualidad o pertenencia
Escalas de medición: nominal, ordinal, de intervalo y razón
01
b) Medidas por Escala Ordinal:
- Representa el siguiente nivel de medición
- Son datos que pueden medirse con una escala nominal, en donde además existe un orden natural entre las categorías: (más, menos o la misma cantidad) A>B, A=B o A< B
- Se pueden realizar operaciones aritméticas con los números asignados a las categorías.
- Variables donde los datos se jerarquizan
Ejemplo: Los participantes de un concurso de oratoria (primero, segundo, tercero...)
- Los corredores de un maratón o carrera: primero, segundo, tercero....
- Orden de los profesore según su capacidad de enseñanza: escelente, muy bueno, bueno, regular, malo.
- Orden de los alumnos según su nivel de motivación: mucho, poco, regular, casi nada, nada.
Escalas de medición: nominal, ordinal, de intervalo y razón
01
c) Medidas por Escala de Intervalo:
- Representa un nivel superior de medición
- Los datos que se utilizan son cuantitativos y guardan las propiedades de magnitud e igualdad, no tienen un cero absoluto, es decir, el cero no implica necesariamente la ausencia del atributo en estudio.
- Posee las propiedades de la escala ordinal y tiene intervalos entre las unidades adyacentes
- Implican la asignación de números de modo que a iguales diferencias entre los grados del atributo, correspondan iguales diferencias entre los valores numéricos
- A=B, A>B, A<B una escala de intervalos sería: A-B=C-D, A-B>C-D, O A-B<C-D
- Intervalos iguales o similares
Ejemplo: edad, calificaciones, minutos, dia, grado, peso
Escalas de medición: nominal, ordinal, de intervalo y razón
01
d) Medidas por Escala de Razón:
- Datos que cumplen con las características necesarias para medirse con una escala de intervalo, y que además posee un cero natural.
- Tener un cero natural implica que el punto cero no es arbitrario y corresponde a una total ausencia del atributo en el estudio.
- Ejemplo: Escala Kelvin: cero absoluto (escala de proporciones/ausencia completa de calor)
02
Es un método tabular que resume la información contenida en un conjunto de datos, organizándolos según su clase y su frecuencia relativa. Puede ser utilizada para organizar datos cualitativos o datos cuantitativos
Organización gráfica y resumen de los datos
La representación gráfica de datos estadísticos tiene como objetivo ofrecer una visión del conjunto de hechos sometidos a investigación, de una manera más directa y perceptible que la mera presentación de los datos numéricos.
Índice
gráficas de barras y circular
Distribución de frecuencias
cuartiles, deciles y percentiles
Distribución de recuencias
- Las distribuciones de frecuencias son tablas en las que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.
+ info
02
Que tipo de frecuencias existen
Frecuencia relativa
Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia realtiva acumulada
Actividad 1
- Realiza las actividades que están en la pestaña de distribución de frecuencias archivo de google forms: https://docs.google.com/spreadsheets/d/1li6bQivSUrYLofazkG6o3GtqW8VGHCwMfJtkE_hhsog/edit?usp=sharing
- Una vez elaborado los ejercicios sube tu archivo en el padlet en la etiqueta 1. En el siguiente enlace o QR que se te proporciona: https://padlet.com/salimar277490/pr-ctica-1_distribucion_frecuencias_posici-n-eoaevaf66adxypfu
- Coloca el nombre de tu sala y el primer apellido y nombre de los integrantes de tu equipo
Realización de una distribución de frecuencias
Una explicación visual es mucho mas fácil para comprender los conceptos
Cuartiles, deciles y percentiles
https://www.youtube.com/watch?v=fSOl8fYheMY&t=2s&ab_channel=Matem%C3%A1ticasprofeAlex
https://www.youtube.com/watch?v=suSz9RXFNTs&t=833s&ab_channel=Matem%C3%A1ticasprofeAlex
https://www.youtube.com/watch?v=S-5OzIAXyUw&ab_channel=Matem%C3%A1ticasprofeAlex
Actividad 2
- Realiza las actividades que están en la pestaña de cuartiles, deciles y percentiles del archivo de google forms: https://docs.google.com/spreadsheets/d/1li6bQivSUrYLofazkG6o3GtqW8VGHCwMfJtkE_hhsog/edit?usp=sharing
- Una vez elaborado los ejercicios sube tu archivo en el padlet en la etiqueta 2. En el siguiente enlace o o QR que se te proporciona: https://padlet.com/salimar277490/pr-ctica-1_distribucion_frecuencias_posici-n-eoaevaf66adxypfu
- Coloca el nombre de tu sala y el primer apellido y nombre de los integrantes de tu equipo
Obtención de datos de posición
La aventura continuará
Gracias
contacto
03
Un análisis básico descriptivo implica el calcular las medidas simples de composición y distribución de variables. Dependiendo del tipo de datos, pueden ser proporciones, tasas, razones o promedio
Análisis descriptivo
El análisis descriptivo, como su nombre lo indica, consiste en describir las tendencias claves en los datos existentes y observar las situaciones que conduzcan a nuevos hechos. Este método se basa en una o varias preguntas de investigación y no tiene una hipótesis. Además, incluye la recopilación de datos relacionados, posteriormente los organiza, tabula y describe el resultado.
Índice
media ponderada
Media, mediana y moda
desviación media, varianza, desviación estándar y coeficiente de variación
rango, rango intercuartil, y semicuartil
procesO
Media
01
Media, mediana y moda
Mediana
Medidas de tendencia central
mODA
02
RAngo
mEDIA PONDERADA
Rango semiintercuartil
RAngo intercuartil
Medida de centralización de la media
03
Rango, rango intercuartil y semiintercuartil
idea
Desviación media
Varianza
Medidas de posición
03
Desviación media, varianza, Desviación estandar
coeficiente de variación
Desviación Estándar
Medidas de dispersión
Análisis descriptivo
Medidas de
tendencia central, de dispensión y de posición. https://www.youtube.com/watch?v=1myBo87lYyU&ab_channel=Matem%C3%A1ticasprofeAlex
Actividad 3
- Realiza las actividades que están en la pestaña de distirbución de frecuencias del excel que te fue enviado de la práctica 2
https://docs.google.com/spreadsheets/d/1iSnxeowi33E4gTk5TsAIZnuMGf7fWh8O/edit?usp=sharing&ouid=109349255074908221544&rtpof=true&sd=true
- Una vez elaborado los ejercicios sube tu archivo en el padlet en la etiqueta 3. En el siguiente enlace o o QR que se te proporciona: https://padlet.com/salimar277490/pr-ctica-1_distribucion_frecuencias_posici-n-eoaevaf66adxypfu
- Coloca el nombre de tu sala y el primer apellido y nombre de los integrantes de tu equipo
Obtención de análisis descriptivos
04
La probabilidad es el cálculo matemático que evalúa las posibilidades que existen de que una cosa suceda cuando interviene el azar
Elementos de probabilidad
La probabilidad es simplemente determinar qué tan posible es que ocurra un evento determinado.
Índice
cálculo de probabilidades
definición
esperanza matemática
ordenaciones, permutaciones y combinaciones
apA
Probabilidad es el cálculo matemático que establece todas las posibilidades que existen de que ocurra un fenómeno en determinadas circunstancias del azar.
Definición
Nos explica el comportamiento que puede tener un evento (suceso) que tiene incertidumbre
Es una herramienta básica para poder realizar inferencias estadísticas
Un suceso tiene incertidumbre cuando es aleatorio
Experimento aleatorio es el que se realiza bajo las mismas condiciones, puede arrojar diferentes resultados
DE PROBABILIDAD
ELEMENTOS LA
Un suceso es aleatorio cuando se encuentra contenido en un espacio muestral, en el que el suceso es un caso fortuito, su ocurrencia no depende del azar
Un espacio muestral es el conjunto de todos los posibles resultados que puede arrojar un ecxperimento aleatorio
+ info
04
Elementos de la probabilidad
El cálculo de probabilidad es el estudio de cómo se determina la probabilidad de ocurrencia de un suceso. Esto, cuando tiene injerencia el azar
La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio.
Ordenaciones son las relaciones de algún tipo de orden entre distribucione de probabilidad Las permutaciones son agrupaciones en las que importa el orden de los objetos. Las combinaciones son agrupaciones en las que el contenido importa pero el orden no.
04
Esperanza matemática
Ejemplo:
En estadística, la esperanza matemática, también llamada valor esperado, es un número que representa el valor medio de una variable aleatoria. La esperanza matemática es igual al sumatorio de todos los productos formados por los valores de los sucesos aleatorios y sus respectivas probabilidades de suceder.
El símbolo de la esperanza matemática es la E mayúscula, por ejemplo, la esperanza matemática de la variable estadística X se representa como E(X). Asimismo, el valor de la esperanza matemática de un conjunto de datos coincide con su media (media poblacional).
Una persona participa en un juego en el que puede ganar o perder dinero según el número que salga al lanzar un dado. Si sale un 1 gana $800, si sale un 2 o un 3 pierde $500, y si sale un 4, un 5 o un 6, gana $100. El precio por participar es de $50. ¿Recomendarías la participación en este juego de probabilidades?
Lo primero que debemos hacer es determinar la probabilidad de cada suceso. Como un dado tiene seis caras, la probabilidad de obtener cualquier número es: obtener un nmúmero 0 1/6 Por lo tanto, la probabilidad de ocurrencia de cada suceso es: p(ganar $800) = 1/6 p (perder $500) = 2. 1/6 = 2/6 p (ganar $100) = 3. 1/6 = 3/6 Ahora que ya sabemos la probabilidad de que ocurra cada evento, aplicamos la fórmula de la esperanza matemática: Y hacemos el cálculo de la esperanza matemática (o valor esperado): E(X) = 800*1/6 - 500*2/6 + 100*3/6 = $16.67
+ info
El valor de la esperanza matemática es menor que el precio por participar en este juego, por lo tanto, sería mejor no jugar ya que a la larga se acabará perdiendo dinero. Puede ser que si solo participas una vez toque un 1 y entonces saques un gran beneficio, pero la probabilidad de obtener pérdidas a largo plazo es alta.
Cabe destacar que el resultado de la esperanza matemática a veces es un valor imposible, por ejemplo, en este caso no se puede obtener $16,67.
LA ESPERANZA MATEMÁTICA
CONCEPTO
La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio https://www.youtube.com/watch?v=3W_nBWuCuOI&t=312s&ab_channel=PaolaRodr%C3%ADguez
04
Ejemplos
Ordenaciones
La fórmula de ordenaciones es: donde n es el número de objetos y r los que voy a seleccionar
04
Ejemplos
Permutaciones
Una permutación de objetos es cuando se ordenan todos los objetos del conjunto: Ejemplo
04
Ejemplos
Combinaciones
Si voy a selecionar tres números dintintos y no me interesa el orden uso combinaciones. La formula es la siguiente:
Permutaciones, Ordenaciones, Variaciones y Combinaciones
CONCEPTO
Las permutaciones son agrupaciones en las que importa el orden de los objetos. Las combinaciones son agrupaciones en las que el contenido importa pero el orden no. https://www.youtube.com/watch?v=EC_ZIuMW2AY&ab_channel=AugustoCoyoli
Actividad 4
- Realiza las actividades que están en la pestaña de distirbución de frecuencias del excel que te fue enviado de la práctica 2
- Una vez elaborado los ejercicios sube tu archivo en el padlet en la etiqueta 4. En el siguiente enlace o o QR que se te proporciona: https://padlet.com/salimar277490/pr-ctica-1_distribucion_frecuencias_posici-n-eoaevaf66adxypfu
- Coloca el nombre de tu sala y el primer apellido y nombre de los integrantes de tu equipo
Obtención de datos probabilisticos
La aventura continua
Gracias
contacto
05
La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria.
Distribución de probabilidad
Una distribución de probabilidad es aquella que permite establecer toda la gama de resultados probables de ocurrir en un esperimento determinado. Es decir, describe la probabilidad de que un evento se realice en el futuro
Índice
distribución normal y sus aplicaciones
Distribución bimodal
Distribución multinominal
Distribución de poisson
ajustes de distribuciones de frecuencias
Distribución de probabilidad
05
“Caballeros, ¿debo recordarles que, mis probabilidades de éxito, aumentan en cada nuevo intento?” Russell Crowe - John Nash.
Ajuste de distribución de frecuencia
Distribución de poisson
Distribución bimodal
Distribución multinominal
Distribución normal y sus aplicaciones
No olvides observar el video que se encuentra en algunos de los temas para mayor comprensión del tema
06
La teoría del muestreo se basa en la selección aleatoria de la muestra con algún instrumento de selección aleatoria. Ella permite seleccionar un subconjunto de la población y a través de ellos, con un grado de precisión y confiabilidad se estiman parámetros de la(s) población(es).
Teoría General del Muestreo
La teoría del muestreo hace referencia al método científico que pone en práctica principios estadísticos- matemáticos, que permiten obtener información de parte de los elementos de una población y hacer inferencias acerca de las características de la población de donde provienen.
Índice
tipos de muestreo
teoría del muestreo
estimación de parámetro de confiabiliadd muestral
estimación del tamaño de la muestra
Distribución multinominal
https://www.youtube.com/watch?v=vqAjfz_0hOE&ab_channel=Helingenier https://www.youtube.com/watch?v=LRlYx-FndYo&ab_channel=AprendiendoEstad%C3%ADstica
01
Teoría del muestreo
Muestreo
Se basa en la selección aleatoria de la muestra con algún instrumento de selección aleatoria
idea
02
Tipos de muestreo
idea
idea
Probabilístico y no probabilístico
03
EStimación del tamaño de la muestra
idea
idea
idea
Conjunto de datos e información a recolectar u obtener, por medio de la estadística, sobre una población.
idea
04
estimación del parámetro de confiabilidad muestral
idea
Se basa en la selección aleatoria de la muestra con algun instrumento de selección aleatoria
06
Muestreo aleatorio
Existen varios tipos de muestreo aleatorio
- Simple
- Sistemático
- Estratificado (subgrupos)
- Clúster o de racimos (por conglomerados/grupos)
Muestreo aleatorio simple
06
PSe utiliza cuando el grupo es homogéneo y para esto se numeran a los individuos y al azar se elige a los individuos
¿Azar?
Para asegurarse que existe el azar en la elección de los sujetos se emplean las llamadas “Tablas de Números Aleatorios”
Muestreo aleatorio sistemático
06
Se utiliza cada número “K” de la lista. Esto reduce la posibilidad de los miembros elegidos
Proceso
Dividir el tamaño de la población entre el número de la muestra, para determinar el número "K" El primer miembro se obtiene aleatoriamente
Una vez que se ha determinado el primer miembro, se selecciona cada K miembro de la población
Muestreo aleatorio estratificado
06
Se Debes asegurarte de que el perfil de la muestra concuerda con el perfil de la población
Procedimiento
- Identificar los estratos en la población
- Enlistar a los miembros de cada estrato por separado
- Seleccionar el número de miembros de cada estrato de acuerdo al % de la población
- Obtener la muestra por simple o sistemático
14 es el 100%
¿Cuántas niñas?
¿Cuántos niños?
Muestreo aleatorio de cluster o racimos
06
Son grupos que pueden aparecer juntos, se seleccionan grupos en lugar de individuos
Procedimiento:
- Se identifican los clusters
- Se selecciona aleatoriamente el número de racimos que conformen la muestra
06
Muestreo no aleatorio
Los dos tipos más utilizados son:
Conveniencia: La muestra que tenemos al alcance, no hay la misma oportunidad de ser elegidos.
Cuota: Se elige cada cierto tiempo o número a alguien para ser parte de la muestra.
población, muestra y unidad de análisis
Investgación o tesis
explicaremos qué es la población o universo, la muestra y las unidades de análisis, dentro de la investigación científica y para que nos sirven dentro de nuestras tesis. https://www.youtube.com/watch?v=MlhwCDxtpqg&ab_channel=TeoCom
Actividad 5
- Realiza las actividades que están en la pestaña de ejercicios de la práctica 3 de excel que te fue enviada
- Una vez elaborado los ejercicios sube tu archivo en el padlet en la etiqueta 5. En el siguiente enlace o o QR que se te proporciona: https://padlet.com/salimar277490/pr-ctica-1_distribucion_frecuencias_posici-n-eoaevaf66adxypfu
- Coloca el nombre de tu sala y el primer apellido y nombre de los integrantes de tu equipo
Tamaño Muestral
El final llego
Gracias
contacto
MODA
La moda es el valor que aparece más dentro de un conjunto de datos. A diferencia de la media y la mediana, la moda no requiere valores numéricos y puede utilizarse con datos categóricos o discretos.
Un conjunto de datos puede tener un modo, conocido como unimodal, o varios modos, denominados bimodal o multimodal. Se llama amodal cuando en un conglomerado no se repiten los valores.
Las principales características de la moda son:
- Es una muestra muy clara
- Las operaciones para determinar el resultado son muy fáciles de elaborar
- Los valores que se presentan pueden ser cualitativos y cuantitativos
Cómo calcular la esperanza matemática
Para calcular la esperanza matemática de una variable discreta se deben hacer los siguientes pasos:
- La esperanza matemática (o valor esperado) sirve para tener un valor de la cantidad que se espera ganar o perder a largo plazo en un espacio probabilístico. Es decir, la esperanza matemática indica el retorno que se obtendrá a largo plazo.
- Cuando alguien está meditando si hacer una inversión, como por ejemplo comprar acciones de una empresa, una de las métricas que debe considerar es la esperanza matemática. Ya que si hiciera muchísimas veces esa inversión, el retorno económico que obtendría sería el valor de la esperanza matemática. Se puede considerar como una media de las ganancias obtenidas.
- Asimismo, la esperanza matemática también se usa en otros campos como la econometría, la física cuántica, etc
Multiplicar cada posible suceso por su probabilidad de ocurrencia.
Sumar todos los resultados obtenidos en el paso anterior.
El valor obtenido es la esperanza matemática (o valor esperado) de la variable De modo que la fórmula para calcular la esperanza matemática (o valor esperado) de una variable discreta es la siguiente:
El muestreo probalisitico es:Cuantitativo, Tiene mayor inversión de tiempo y recursos, la muestra se puede escoger de una población estratificada, los elementos de una misma población tienen muchas probabilidades de ser escogidos estos son:Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerados o grupos, muesstreo sistemático. Muestreo no probabilistico es: Cualitativo, de muy bajo costo, los elemetnos son elegidos de acuerdo a los intereses de la investigación, el investigador debe conocer las características de la población y son: Muestreo por conveniencia, muestreo consecutivo, muestreo por cuotras, muestro intenciona o por juicio.
¿Por qué funciona el muestreo?
- El muestreo es muy útil, gracias a que podemos acompañarlo con un proceso inverso al cual llamamos generalización de resultados
- 1. Debemos extraer una muestra del mismo
- 2. Medir un dato u opinión
- 3. Se debe de proyectar en el universo el resultado observado en la muestra
TIPOS DE MUESTREO
- El muestro solamente presenta 2 tipos de los cuales son:
- Muestreo no probabilistico
- Muestro probabiistico
Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
- Clase,
- Frecuencia absoluta,
- frecuencia relativa,
- % de frecuencia relativa,
- frecuencia acumulada
- % de frecuencia acumulad.
- Realiza dos gráficos de tu elección
RANGOS
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos formula (R= VMx-Vmin)Rango intercualtil: Es una estimación estadística de la dispersión de una disribución de datos que eliminan la influencia de los valores extremos y que consiste en la diferencia entre el tercer y el primer cuartil. Es altamente recomendable cuando la medida de tendencia central utilizada es la mediana. Fórmula: RIQ= Q1-Q3 Rango semi cuartil. Es un medio de la diferencia entre el primer y tercer cuartil. Es la mitad de la distancia requerida para cubrir la mital de las cuentas.
La distribución de Poisson es una distribución de proba- bilidad discreta que expresa, a partir de una frecuencia de ocurrencia media λ, la probabilidad que ocurra un deter- minado número de eventos durante un intervalo de tiempo dado o una región específica. En la vida real se utiliza la distribución de Poisson para hacer cálculos de probabilidades donde se requiere contar el número de veces que se produce un suceso aleatorio durante un periodo determinado de tiempo (o también de distancia, área u otro parámetro). Aquí algunos ejemplos típicos de variables aleatorias que siguen una distribución de Poisson: El número de clientes que ingresan a un supermercado en un día. El número de accidentes registrados en una fábrica durante una semana. El número de llamadas que recibe una central telefónica en el período de un minuto.
¿Qué elementos participan en la distribución de Poisson?
Índice
3.1 Media.
3.2 Varianza.
3.3 Momentos.
3.4 Moda.
3.5 Función generadora de momentos. ¿Qué significa el modelo generalizado de Poisson y cuál es su utilidad? Los modelos de regresión de Poisson permiten representar la dependencia de una varia- ble respuesta resultado de un recuento, con respecto a una o varias variables explicativas, aproximando la variable respuesta discreta a partir de las variables explicativas con un cierto error.
Mediana
La mediana es un valor que se encuentra a la mitad de los otros valores, es decir, que al ordenar los número de menor a mayor, éste se encuentra justamente en medio entre los que están por arriba.
Algunas características de la media son:
- Las operaciones para calcular el valor son muy sencillas de realizar.
- La medida no depende de los valores de las variables, solamente de su orden.
- Generalmente, los valores son enteros.
- Se puede calcular aunque los números que se encuentren arriba y abajo no tengan límites.
Ejemplo de Mediana
La cantidad de valores es impar
Si se tienen los valores: 9,5,4,2,7, se ordenan: 2, 4, 5, 7, 9. El elemento de en medio es el 5, ya que se encuentra dos valores por encima y dos valores por debajo.
La cantidad de valores es par
Si se tienen los valores 9,5,4,2, se ordenan: 2,4,5,9. En este caso se toman los dos valores centrales 5 y 4, la mediana es el promedio de ambos: 9
Estimación del tamaño de la muestra
El tamaño de muestra permite a los investigadores saber cuántos individuos son necesarios estudiar, para poder estimar un parámetro determinado con el grado de confianza deseado, o el número necesario para poder detectar una determinada diferencia entre los grupos de estudio, suponiendo que existiese realmente
Varianza: Ejemplo
De una empresa multinacional se conoce el resultado económico que ha tenido durante los últimos cinco años, en la mayoría ha obtenido beneficios pero un año presentó unas pérdidas considerables: 11, 5, 2, -9, 7 millones de euros. Calcula la varianza de este conjunto de datos. Primero calcunlamos la media aritmética Ahorta ya podemos utilizar la fórmula de la varianza
Medidas de tendencia central
Media, mediana y moda
Media, también conocida como media aritmética. Es la suna de un conjunto de valores númericos dividida entre el número total de sumandos. La mediana es el valor medio de un conjunto de datos cuando los valores se ordenan de forma ascendente o descendente. La moda representa el valor o categoría más común dentro del conjunto de datos La media, la mediana y la moda son las tres medidas de tendencia central más usadas para poblaciones que no cuentan con demasiados datos, es decir, que no necesitan agruparse.
- Al hablar de medidas de tendencia central, nos referimos a medidas estadísticas que pretenden resumir en un único valor a un conjunto de valores.
- La media, mediana y moda se expresan en la misma unidad que los datos originales. Estas medidas proporcionan información sobre el valor central o típico de un conjunto de datos, ayudándonos a analizar y comparar diferentes datos.
Media ponderada
Entre los distintos tipos de medias, la media ponderada otorga distinta importancia a diferentes valores sobre los que se calcula. Todo profesor ha realizado alguna vez el cálculo de una media ponderada para poder calcular las notas de sus alumnos, pues es mucho más justa y ponderada en relación con los esfuerzos y pruebas realizadas. Se diferencia de la media aritmética en que no le da la misma importancia a todos los valores. De hecho, como veremos más tarde, en realidad la media aritmética es una media ponderada en la que todos los valores son igual de importantes.
La media ponderada se hace muy útil, por ejemplo, para calcular notas de una asignatura.
- Queremos tener en cuenta para valorar la nota final que un alumno haya realizado los ejercicios, los trabajos y haya participado en clase. Claro que, no podemos darle la misma importancia que al examen final. En el examen final debe mostrar que, efectivamente ,ha adquirido los conocimientos. Un profesor de matemáticas podría por ejemplo, indicar que la nota del examen tiene una ponderación del 70%, la realización de ejercicios un 20% y la participación en clase un 10%
- Para cada uno de los casos anteriores, tendremos una nota distinta. Por ejemplo, en el examen un 8.5, en los ejercicios un 7.3 y en la participación en clase un 9.3.
- ¿Cómo calculamos la media si tenemos valores diferentes, con diferentes porcentajes? Para ello se utiliza la media ponderada.
Rango
Si tienes datos no agrupados como: 7, 10, 9, 6, 1, 2, 6, 2, 6, 9, 3 1ro. se deben agrupar de forma descendente o ascendente 1, 2, 2, 3, 6, 6, 6, 7, 9, 9, 10 "Tomar la muestra (que son el dato menor y el dato mayor) 1- 10 3ro. se restan 9 Ese sería el rango de los datos
Ejemplo n. ° 3: puntuaciones de exámenesSuponga que un maestro da un examen a su clase de estudiantes. Algunos de los estudiantes estudiaron para el examen, mientras que otros no. Cuando el maestro crea un gráfico de los puntajes del examen, sigue una distribución bimodal con un pico alrededor de los puntajes bajos para los estudiantes que no estudiaron y otro pico alrededor de los puntajes altos para los estudiantes que sí estudiaron:
Ejemplo 2: Altura promedio de dos especies de plantas Suponga que recorremos un campo y medimos la altura de diferentes plantas. Sin darnos cuenta, midimos la altura de dos especies diferentes, una que es bastante alta y otra que es bastante baja. Si creara un gráfico para visualizar la distribución de alturas, seguiría una distribución bimodal:
¿Cómo se hace una distribución de frecuencias?
Se obtiene dividiendo la frecuencia absoluta entre el número total de datos y se puede expresar como una fracción, como un decimal o como un porcentaje. Se simboliza con f i / n donde n es el número de datos.
Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos y a cada uno de ellos le asigna una frecuencia que, en pocas palabras, son las veces que se repite un número o dato. Puedes usar las tablas de frecuencias para ordenar variables cuantitativas o cualitativas
Estudio Estadístico
- Se realizan observaciones de un fenómeno que no se puede predecir con anterioridad.
- Se realiza a través de un muestreo (se selecciona una muestra aleatoria y representativa de la población).
- Se recolectan datos de cada elemento muestreado (a través de diversos instrumentos como el cuestionario).
- Se analiza la muestra recolectada.
- El objetivo final es inferir estadísticamente algo sobre la población, deseamos concluir algo sobre alguna característica de la población en la que se realiza el estudio.
- Su objetivo no es obtener un resultado preciso sino el de hallar el resultado más probable o más próximo
Qué es la distribución de Poisson
La distribución de Poisson es una distribución de probabilidad discreta que se aplica a las ocurrencias de algún evento durante un periodo determinado. Es decir, es una distribución de probabilidad discreta en la que solo es necesario conocer los eventos y cuál es su frecuencia media de ocurrencia para poder conocer la probabilidad de que ocurran.
Una distribución es discreta cuando se toma un número de valor finito, mientras que las continuas usan un número infinito de valores. Para que una distribución sea considerada como distribución de Poisson debe cumplir con tres requisitos:
- La variable discreta “x” es el número de ocurrencias de un evento durante un intervalo determinado (de tiempo, espacio, etc.).
- Las ocurrencias deben ser aleatorias y no contener ningún factor que favorezca unas ocurrencias en favor de otras.
- Las ocurrencias deben estar uniformemente distribuidas dentro del intervalo que se emplee.
La distribución multinomial es una generalización de la distribución binomial. En este caso, en un experimento interesa estudiar no la ocurrencia de un único suceso o la de su contrario, sino la de varios sucesos (tres o más). Las distribuciones multinominales tratan específicamente de eventos que tienen múltiples resultados discretos. La distribución binomial es un subconjunto específico de distribuciones multinomiales en las que solo hay dos posibles resultados de un evento.
Las distribuciones multinomiales no se limitan a eventos que solo tienen resultados discretos. Es posible categorizar los resultados con distribuciones continuas a diferentes grados (alto, medio, bajo). Por ejemplo, el nivel del agua -una entidad continua- en un tanque de almacenamiento puede hacerse discreto categorizándolos en “deseables” o “no deseables”. Las distribuciones multinomiales, por lo tanto, tienen aplicaciones expansivas en el control de procesos.
Considera el escenario en el que arrojas un dado justo 12 veces. ¿Cuál es la probabilidad de que cada valor nominal (1-6) ocurra exactamente dos veces?
Solución
La probabilidad se puede determinar mediante una distribución multinomial en la que son posibles 6 resultados. Las probabilidades individuales son todas iguales dado que es un dado justo, p = 1/6. El número total de ensayos N es 12, y el número individual de ocurrencias en cada categoría n es 2 .
Por lo tanto, la probabilidad de rodar exactamente 2 de cada valor nominal en un dado justo es de aproximadamente 0.35%.
Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
- Clase,
- Frecuencia absoluta,
- frecuencia relativa,
- % de frecuencia relativa,
- frecuencia acumulada
- % de frecuencia acumulad.
- Realiza dos gráficos de tu elección
Esperanza matemática
Dicho de otra forma, es el valor medio de un conjunto de datos. Esto, teniendo en cuenta que el término esperanza matemática está acuñado por la teoría de la probabilidad. Ejemplo: Imaginemos una moneda. Dos caras, cara y cruz. ¿Cual sería la esperanza matemática (valor esperado) de que salga cara?
La esperanza matemática se calcularía como la probabilidad de que, tirando la moneda un número muy grande de veces, salga cara. Dado que la moneda solo puede caer en una de esas dos posiciones y ambas tienen la misma probabilidad de salir, diremos que la esperanza matemática de que salga cara es una de cada dos, o lo que es lo mismo, el 50% de las veces. Vamos a hacer una prueba y vamos a tirar una moneda 10 veces. Supongamos que la moneda es perfecta. Tiradas y resultados: Cara, Cruz, Cruz, Cara, Cruz, Cara, Cara, Cara, Cruz, Cruz, ¿Cuantas veces ha salido cara (contamos las Y)? 5 veces ¿Cuantas veces ha salido cruz (contamos las X)? 5 veces. La probabilidad de que salga cara será de 5/10=0,5 o, en porcentaje, del 50%.
¿Cuál es la estructura de la tabla de distribución de frecuencias?
Una tabla de frecuencia está compuesta por lo general por las columnas de la frecuencia absoluta (ni), la frecuencia absoluta acumulada (Ni), frecuencia relativa (fi), frecuencia relativa acumulada (Fi), frecuencia porcentual (n%) y frecuencia porcentual acumulada (F%), aunque estas son las columnas bases de las tablas ..
Actividad 2
Deciles, cuartiles y percentiles
Resuelve el ejercicio que se te presenta en la hoja de excel obteniendo los deciles, cuartiles o percentiles solicitados
Desviación Estándar
En primer lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto de datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las diferencias. Por último, dividiendo el resultado por el número total de observaciones (normalmente representado por la letra “n”) para llegar a un promedio de las distancias entre cada observación individual y la media. Este promedio de las distancias es la desviación estándar y de esta manera representa la dispersión. Por ejemplo, la distribución azul en la parte de abajo tiene una desviación estándar mayor que la distribución verde de arriba
Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
- Clase,
- Frecuencia absoluta,
- frecuencia relativa,
- % de frecuencia relativa,
- frecuencia acumulada
- % de frecuencia acumulad.
- Realiza los tres gráficos solicitados
Ejemplo 2: La planta física en el campus principal de una gran universidad estatal recibe diariamente solicitudes para reemplazar bombillas fluorescentes. La distribución del número de solicitudes diarias tiene forma de campana y tiene una media de 59 y una desviación estándar de 9. Usando la regla empírica, ¿cuál es el porcentaje aproximado de solicitudes de reemplazo de bombillas que suman entre 59 y 77? Solución
Ya que queremos utilizar la Regla Empírica, debemos dibujar una figura que refleje la Regla Empírica dada la media es 59 y la desviación estándar es 9 Recordemos, 1 desviación estándar de la media es 59±9, dos desviaciones estándar de la media es 59±2⋅9, y 3 desviaciones estándar de la media es 59±3⋅9 .
Una vez que hagamos esta cifra, podemos fácilmente calcular el porcentaje de solicitudes de reemplazo de bombilla numerando entre 59 y 77:
34%+13.5%=47.5%
Así, 47.5% de las solicitudes de sustitución de bombillas numeradas entre 59 y 77.
¿cuáles son las aplicaciones de la distribución normal?
La distribución normal sirve para conocer la probabilidad de encontrar un valor de la variable que sea igual o inferior a un cierto valor , conociendo la media, la desviación estándar, y la varianza de un conjunto de datos sustituyéndolos en la función que describe el modelo. En otras palabras, la distribución normal adapta una variable aleatoria a una función que depende de la media y la desviación típica
Usando una calculadora gráfica, podemos aproximar la probabilidad de que una iguana marina hembra sea menor a 400 gramos de la siguiente manera:
Supongamos que la distribución de las masas de iguanas marinas hembras en Puerto Villamil en las Islas Galápagos es aproximadamente normal, con una masa media de 950 g y una desviación estándar de 325 g. Hay muy pocas iguanas marinas jóvenes en las zonas pobladas de las islas, porque los gatos salvajes tienden a matarlas . ¿Qué tan raro es que encontremos en esta zona una iguana marina hembra con una masa inferior a 400 g?
Con una probabilidad de aproximadamente 0.045, o sólo alrededor del 5%, podríamos decir que es bastante improbable que encontremos una iguana tan pequeña.
Ejemplo:
Tengo 6 números de los cuáles voy a seleccionar 3 números pares distintos para formar una clave de acceso a un cajero- Lo importante es el orden, si tengo 4 numeros clases en primero pongo los 4, luego tres, postriormente 2. (si lo múltilico tengo 24 opciones de formar la clave
Ordenaciones es seleccionar y acomodar en lugares
Combinaciones solo es seleccionar
- Por ejemplo, supongamos que voy a lanzar un dado y deseo saber la probabilidad de obtener como resultado un múltiplo de tres:
Casos favorables: 3,6 : Dos casos.
Casos posibles: 1,2,3,4,5,6 : Seis casos.
Por tanto, la probabilidad sería: 2/6= 1/3= 0,3333= 33,33% Supongamos que una persona debe elegir al azar una carta de un mazo con 52 cartas. Son 13 cartas por cada uno de los cuatro palos (no estamos incluyendo al Joker). Por lo que, ¿cuál es la probabilidad de que saque una carta con el número 7?
Número de casos favorables: 4, uno por cada palo.
Número total de casos posibles: 52.
Probabilidad: 4/52= 1/13= 0,0769= 7,6923%.
Cálculo de probabilidad
El cálculo de probabilidades forma parte de la teoría de la probabilidad. Esta es aquella área de las matemáticas y la estadística que engloba todos los conocimientos relativos a la probabilidad. Dicho análisis es aplicado, por ejemplo, en los juegos de azar; como el póker.
En este sentido, debemos recordar que la probabilidad es la posibilidad de ocurrencia de un fenómeno o un hecho. Esto, cuando están dadas determinadas circunstancias. La fórmula básica para el cálculo de probabilidades que debemos tener en cuenta es la siguiente:
Número de casos favorables/Número total de casos posibles
Una distribución estadística es la frecuencia teórica de la ocurrencia de los valores que puede tomar una variable. En el nodo Ajustar simulación, se compara un conjunto de distribuciones estadísticas teóricas con cada uno de los campos de dato. El ajuste de una distribución comprueba si la distribución de una muestra de datos difiere significativamente de una distribución teórica
Se considera igualmente el nivel de confianza que fluctua entre 90 y 99%.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporción observada en la muestra es un estimador de la proporción en la población. ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho resultado muestral a la población total, de modo que lo estimado es el valor generalizado a la población. l tamaño de la muestra se determina basado en cuatro factores: La probabilidad ( p) del resultado, es decir, dada una entidad, la probabilidad de "éxito" frente a un "error".
Medidas de dispersión
Desviación media : es una medida que se utiliza para entender qué tanto se alejan los datos de un conjunto promedio.
Es una medida que nos ayuda a entender cuánto varían los datos de un conjunto promedio. Si la desviación es grande, significa que los datos están muy dispersos o variados, mientras que si es pequeña, significa que los datos están muy cercanos entre sí. La varianza es una medida de dispersión que indica la variabilidad de una variable aleatoria. La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones. la interpretación del valor de la varianza de una variable aleatoria es sencilla. Cuanto más grande sea el valor de la varianza, más dispersos están los datos. Y al revés, cuanto más pequeña sea el valor de la varianza, menos dispersión habrá en la serie de datos. La desviación estándar es una medida de extensión o variabilidad en la estadística descriptiva. Se utiliza para calcular la variación o dispersión en la que los puntos de datos individuales difieren de la media. El coeficiente de variación tambien llamado coeficiente de Pearson se utiliza para comparar conjuntos de datos pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida de dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones.
Distribución bimodal
Ejemplo
Una distribución bimodal es una distribución de probabilidad con dos modos.
A menudo usamos el término «moda» en las estadísticas descriptivas para referirnos al valor más común en un conjunto de datos, pero en este caso el término «moda» se refiere a un máximo local en un gráfico.
Cuando visualices una distribución bimodal, notarás dos “picos” distintos que representan estos dos modos. Ejemplo: horas pico de un restaurant Si creó un gráfico para visualizar la distribución de clientes en un determinado restaurante por hora, probablemente encontraremos que sigue una distribución bimodal con un pico durante las horas del almuerzo y otro pico durante las horas de la cena:
- Aunque la mayoría de los cursos de estadística utilizan distribuciones unimodales como la distribución normal para explicar diferentes temas, las distribuciones bimodales en realidad aparecen con bastante frecuencia en la práctica, por lo que es útil saber cómo reconocerlas e interpretarlas.
- Nota: Una distribución bimodal es un tipo específico de distribución multimodal
Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
- Clase,
- Frecuencia absoluta,
- frecuencia relativa,
- % de frecuencia relativa,
- frecuencia acumulada
- % de frecuencia acumulad.
- Realiza dos gráficos de tu elección
La distribucipon de freecuencias sirve para mostrar todos los tipos de frecuencia de un conjunto de datos Una distribucion de gfrecuencias incluye la frecuencia absoluta, la frecuencia absoluta acumulada, la frecuencia relativa y la frecuencia relativa acumulada Una de las características de las distribuciones de frecuencias es que son útiles para resumir una muestra estadística tanto de una variable cuantitativa como una variable cualitativa De esta manera, la bondad de ajusteconsiste en explorar un universo de infinitas posibles distribuciones estadísticaspara encontrar la que mejor se adapta a los datos Ajustar una forma funcional generalizada al conjunto de datos que tiene la capacidad de representar un número ilimitado de formas.
Media
La media, también conocida como promedio, es el valor que se obtiene al dividir la suma de un conglomerado de números entre la cantidad de ellos.
La media representa el punto de equilibrio de la distribución y está influida por los valores extremos. Proporciona una medida de la tendencia general o valor medio de los datos. Se calcula sumando todos los valores del conjunto de datos y dividiendo la suma por el número total de puntos de datos.Para obtener la Media de un conjunto solo tienes que seguir estos sencillos pasos: Determina el conjunto de valores que buscas promediar. Suma los valores para obtener el total Haz el conteo de la cantidad de valores en el conjunto. Divide la suma del conjunto entre la cantidad de números.
Algunas características de la media son:
- Considera todas las puntuaciones
- El numerador de la fórmula es la cantidad de valores
- Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra
Desviación media: ejemplo
un ejemplo sencillo de cómo calcular la desviación media:
Supongamos que tenemos el siguiente conjunto de datos: 2, 4, 6, 8, 10.
Para calcularla, primero necesitamos calcular la media de los datos:
X = (2 + 4 + 6 + 8 + 10) / 5 = 6
Ahora, podemos calcular la desviación utilizando la fórmula:
Desviación media = Σ | Xi – X | / N
DM = (|2 – 6| + |4 – 6| + |6 – 6| + |8 – 6| + |10 – 6|) / 5
DM = (4 + 2 + 0 + 2 + 4) / 5
DM = 2.4
Por lo tanto, la desviación de este conjunto de datos es de 2.4. Esto significa que, en promedio, los valores del conjunto difieren en 2.4 unidades de su media
Rango semicuartil
Para hallar el rango semi-intercuartil primero tenemos que determinar el primer y el tercer cuartil. Por ejemplo: El primer cuartil es la mediana de la primera mitad de valores, que corresponde al valor 8,95 €/acción.
Q_1=8,95 Por otro lado, el tercer cuartil es el valor intermedio de la segunda mitad de valores, esto es, 9,83 €/acción.
Q_3=9,83
Una vez que ya sabemos los valores del primer y el tercer cuartil, simplemente tenemos que aplicar la fórmula del rango semi-intercuartil para hallar su valor:
¿Cómo se aplica hoy la estadística
En la educación
La estadística es una herramienta fundamental en la Educación porque brinda las herramientas indispensables para que los estudiantes la apliquen en su vida profesional y personal, mejorando su desempeño laboral, personal y por ende su calidad de vida. La adquisición de ideas estadísticas es, por lo tanto, un asunto de gran importancia para la sociedad contemporánea
- Analizar la variabilidad,
- Determinar relaciones entre variables,
- Diseñar estudios y experimentos y
mejorar las predicciones son algunos de los aspectos que la estadística tiene en cuenta.
Probabilidad para variables discretas
Probabilidad para variables continuas
Las probabilidades de las variables aleatorias continuas (X) se definen como el área por debajo de la curva. Por lo tanto, solo los rangos de valores pueden tener una probabilidad diferente de cero. La probabilidad de que una variable aleatoria continua equivalga a algún valor siempre es cero. Las distribuciones de probabilidad de variable continua se definen por medio de una función y = f(x) que se llama función de probabilidad o función de densidad. Ha de ser f(x) ≥ 0 para todo x. Las probabilidades vienen dadas por el área bajo la curva. Por tanto, el área encerrada bajo la totalidad de la curva es 1.
El valor que indica la probabilidad de cada uno de esos posibles resultados puede tomar valores entre 0 y 1, siempre positivos
Si a un evento se le asigna el valor de 1 quiere decir que hay la certeza del 100% que el evento ocurrirá
Si se le asigna 0 el evento no ocurrirá
En una tabla de frecuencia, la probabilidad se estima con la frecuencia relativa:
Coeficiente de variación: Ejemplo
Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los elefantes es de apenas un 8%, mientras que el de las ratones es de un 33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la población con mayor dispersión, no es la que tiene una mayor desviación típica.
Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene un peso medio de 5.000 kilogramos y una desviación típica de 400 kilogramos. La población de ratones tiene un peso medio de 15 gramos y una desviación típica de 5 gramos. Si comparáramos la dispersión de ambas poblaciones mediante la desviación típica podríamos pensar que hay mayor dispersión para la población de elefantes que para la de los ratones Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos daríamos cuenta que es justo al contrario.
Elefantes: 400/5000=0,08
Ratones: 5/15=0,33
El tamaño de la muestra debe ser ideal, ni demasiado grande ni demasiado pequeño. Luego, una vez que se haya decidido el tamaño de la muestra, debe usarse una técnica sólida para recolectar la muestra de la población:
- El muestreo probabilístico utiliza la aleatorización para seleccionar miembros de la muestra. Conoce la probabilidad de inclusión de cada miembro potencial en la muestra. Por ejemplo, 1/100. Sin embargo, no es necesario que las probabilidades sean iguales. Algunos miembros pueden tener una probabilidad de 1/100 de ser elegidos, otros pueden tener 1/50.
- El muestreo no probabilístico utiliza técnicas no aleatorias (es decir, el juicio del investigador). No puede calcular las probabilidades de que se incluya un artículo, persona o cosa en particular en su muestra.
La teoría del muestreo proporciona estrategias en relación a la selección de muestras y estimaciones de parámetros poblacionales que ofrezcan la mayor cantidad de información al menor costo. La estimación muestral no es igual al valor del parámetro poblacional, esto es debido a que:
• Tomamos solo una parte de la población.
• Está sujeta a errores no debidos al muestreo (conocidos como sesgos).
La teoría del muestreo se basa en la selección aleatoria de la muestra con algún instrumento de selección aleatoria. Ella permite seleccionar un subconjunto de la población y a través de ellos, con un grado de precisión y confiabilidad se estiman parámetros de la(s) población(es). Se debe tomar muestras de forma tal que los errores del muestreo, debidos a él o no, sean mínimos.
Ejemplo: Un cuenco tiene 2 canicas de maíz, 3 canicas azules y 5 canicas blancas. Se selecciona al azar una canica y luego se vuelve a colocar en el bol. Esto lo haces 5 veces. ¿Cuál es la probabilidad de elegir 1 mármol de maíz, 1 mármol azul y 3 canicas blancas?
Solución N es el número de ensayos = 5
k es el número de resultados posibles = 3
n i es el número de ocurrencias del resultado i
p i es la probabilidad de ver el resultado i
Los tres posibles resultados son elegir una canicade maíz, una canica azul o un canica blanca.
Debemos determinar n i y p i para resolver la distribución multinomial.
El número de ocurrencias del resultado es el número de veces que deseamos ver cada resultado. Estos se dan en la declaración del problema.
n maíz = 1n azul = 1 n blanco = 3 La probabilidad de ver cada resultado es fácil de encontrar. Por ejemplo, hay dos de maíz en el tazón de 10, por lo que la probabilidad de elegir una canica de maíz es: Ahora podemos resolver la distribución multinominal como se muestra acontinuación. La probabilidad de elegir 1canica de maíz, 1 canica azul y 3 canicas blancos es de 0.15
SEMINARIO DE INVESTIGACIÓN CUANTITATIVA
sandra salimar canul
Created on July 4, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Animated Chalkboard Presentation
View
Genial Storytale Presentation
View
Blackboard Presentation
View
Psychedelic Presentation
View
Chalkboard Presentation
View
Witchcraft Presentation
View
Sketchbook Presentation
Explore all templates
Transcript
Gnosis
Seminario de investigación cuantitativa
No hay enseñanza sin investigación, ni investigación sin enseñanza. Paulo Freire
Empezar
00
Genialy de la introducción con los componentes de los criterios de evaluación y del trabajo final
01
Es un error absurdo teorizar antes de tener datos. Sir Arthur Conan Doyle
Introducción al estudio de la estadística
Índice
aplicación de la estadística
Definición de estadística
Estadística descriptiva e inferencial
01
Desde comienzos de la civilización existen formas sencillas de estadística: representaciones gráficas, símbolos en pieles, rocas, palos de madera, cuevas, etc. para contar animales o ciertas cosas
Definición de estadística
“La Estadística estudia métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en dicho análisis” Murray R. Spiegel
01
Historia de la estadística
Su trayectoria
Aplicación de la estadística
+ info
01
Usos de la estadística
Estudio Estadístico
01
Objetivos de la estadística
Tipos de estadística
Estadística Inferencial o inductiva
Estadística descriptiva o deductiva
Usa la teoría de probabilidades para generalizar las características de una población a partir de las características de una muestra representativa. Utiliza estadísticas muestrales para obtener conclusiones sobre los verdaderos parámetros de la población. A partir de los resultados del experimento realizado con una muestra, se infiere sobre las características poblacionales.
Estudia los métodos para organizar, sumar y describir un conjunto de datos para que las características del tema analizado se vuelvan evidentes. Se divide en:
Tipos de estadística
Estadística descriptiva e inferencial
Determinar los elementos sustantivos de cada uno de los procesos estadísticos
https://www.youtube.com/watch?v=AJFi8GnmDA8&ab_channel=Excelyestad%C3%ADstica
01
Estdística descriptiva e inferencial: Características de un grupo
- Talla
- Peso
- Edad
- Coeficiente intelectual
- Ingreso mensual
Descripción sin conclusiones: Estadística Descriptiva Si inferimos: Estadística Inferencial01
Estdística descriptiva e inferencial: Variables aleatorias
01
Estdística descriptiva e inferencial: Variables aleatorias discretas y continuas
Variable aleatoria discreta
- Sus valores son posibles de contar
- Se representan con números enteros. Ejemplo: el lanzamiento de una moneda para saber si saldrá cruz o cara, que se representan con los valores de 1 o 0
Variable aleatoria continua Puede contar infinitos valores dentro de un intervalo Ejemplo: Queremos conocer cuál es la duración promedio de una pila AAA. El conjunto de los posibles valores que componen el espacio muestral es infinito porque el tiempo se puede dividir en intervalos infinitesimales01
Estdística descriptiva e inferencial: Notación matemática
La estadística trabaja con datos agrupados resultantes de medir una o más variables. Los datos se obtienen de la muestra Y, en ocasión de poblaciones Regularmente se utilizan las letras mayúsculas X y Y para representar las variables medibles: ejemplo X o Y representa la variable medible (edad) N representa el número total de sujetos o datos (6) Xi es el i-ésimo dato, donde i puede variar de 1 a N
01
Estdística descriptiva e inferencial: Sumativa
Una de las operaciones que se realizan con mayor frecuencia en la estadística, es la suma; la cual consiste en sumar todos o una parte de los datos. Su símbolo es la letra griega mayúscula sigma (Σ) Su frase algebraica se lee como “la suma de la variable X de i = 1 a N” Las notaciones abajo y arriba del signo indican los datos que deben incluirse en la operación El término de abajo del signo de la sumatoria nos indica el primer dato en esta operación Y el término de arriba indica el último dato.
Escalas de medición: nominal, ordinal, de intervalo y razón
01
Escalas de medición: nominal, ordinal, de intervalo y razón
01
Escalas de medición: nominal, ordinal, de intervalo y razón
01
Los datos que se asocian con las variables aleatorias pueden medirse con diferentes escalas dependiendo del tipo de dato que se trate. Las distintas medidas son:
Escalas de medición: nominal, ordinal, de intervalo y razón
01
a) Medidas por Escala Nominal:
Escalas de medición: nominal, ordinal, de intervalo y razón
01
b) Medidas por Escala Ordinal:
- Son datos que pueden medirse con una escala nominal, en donde además existe un orden natural entre las categorías: (más, menos o la misma cantidad) A>B, A=B o A< B
- Se pueden realizar operaciones aritméticas con los números asignados a las categorías.
- Variables donde los datos se jerarquizan
Ejemplo: Los participantes de un concurso de oratoria (primero, segundo, tercero...)Escalas de medición: nominal, ordinal, de intervalo y razón
01
c) Medidas por Escala de Intervalo:
- Representa un nivel superior de medición
- Los datos que se utilizan son cuantitativos y guardan las propiedades de magnitud e igualdad, no tienen un cero absoluto, es decir, el cero no implica necesariamente la ausencia del atributo en estudio.
- Posee las propiedades de la escala ordinal y tiene intervalos entre las unidades adyacentes
- Implican la asignación de números de modo que a iguales diferencias entre los grados del atributo, correspondan iguales diferencias entre los valores numéricos
- A=B, A>B, A<B una escala de intervalos sería: A-B=C-D, A-B>C-D, O A-B<C-D
- Intervalos iguales o similares
Ejemplo: edad, calificaciones, minutos, dia, grado, pesoEscalas de medición: nominal, ordinal, de intervalo y razón
01
d) Medidas por Escala de Razón:
02
Es un método tabular que resume la información contenida en un conjunto de datos, organizándolos según su clase y su frecuencia relativa. Puede ser utilizada para organizar datos cualitativos o datos cuantitativos
Organización gráfica y resumen de los datos
La representación gráfica de datos estadísticos tiene como objetivo ofrecer una visión del conjunto de hechos sometidos a investigación, de una manera más directa y perceptible que la mera presentación de los datos numéricos.
Índice
gráficas de barras y circular
Distribución de frecuencias
cuartiles, deciles y percentiles
Distribución de recuencias
+ info
02
Que tipo de frecuencias existen
Frecuencia relativa
Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia realtiva acumulada
Actividad 1
Realización de una distribución de frecuencias
Una explicación visual es mucho mas fácil para comprender los conceptos
Cuartiles, deciles y percentiles
https://www.youtube.com/watch?v=fSOl8fYheMY&t=2s&ab_channel=Matem%C3%A1ticasprofeAlex
https://www.youtube.com/watch?v=suSz9RXFNTs&t=833s&ab_channel=Matem%C3%A1ticasprofeAlex
https://www.youtube.com/watch?v=S-5OzIAXyUw&ab_channel=Matem%C3%A1ticasprofeAlex
Actividad 2
Obtención de datos de posición
La aventura continuará
Gracias
contacto
03
Un análisis básico descriptivo implica el calcular las medidas simples de composición y distribución de variables. Dependiendo del tipo de datos, pueden ser proporciones, tasas, razones o promedio
Análisis descriptivo
El análisis descriptivo, como su nombre lo indica, consiste en describir las tendencias claves en los datos existentes y observar las situaciones que conduzcan a nuevos hechos. Este método se basa en una o varias preguntas de investigación y no tiene una hipótesis. Además, incluye la recopilación de datos relacionados, posteriormente los organiza, tabula y describe el resultado.
Índice
media ponderada
Media, mediana y moda
desviación media, varianza, desviación estándar y coeficiente de variación
rango, rango intercuartil, y semicuartil
procesO
Media
01
Media, mediana y moda
Mediana
Medidas de tendencia central
mODA
02
RAngo
mEDIA PONDERADA
Rango semiintercuartil
RAngo intercuartil
Medida de centralización de la media
03
Rango, rango intercuartil y semiintercuartil
idea
Desviación media
Varianza
Medidas de posición
03
Desviación media, varianza, Desviación estandar
coeficiente de variación
Desviación Estándar
Medidas de dispersión
Análisis descriptivo
Medidas de
tendencia central, de dispensión y de posición. https://www.youtube.com/watch?v=1myBo87lYyU&ab_channel=Matem%C3%A1ticasprofeAlex
Actividad 3
- Realiza las actividades que están en la pestaña de distirbución de frecuencias del excel que te fue enviado de la práctica 2
https://docs.google.com/spreadsheets/d/1iSnxeowi33E4gTk5TsAIZnuMGf7fWh8O/edit?usp=sharing&ouid=109349255074908221544&rtpof=true&sd=trueObtención de análisis descriptivos
04
La probabilidad es el cálculo matemático que evalúa las posibilidades que existen de que una cosa suceda cuando interviene el azar
Elementos de probabilidad
La probabilidad es simplemente determinar qué tan posible es que ocurra un evento determinado.
Índice
cálculo de probabilidades
definición
esperanza matemática
ordenaciones, permutaciones y combinaciones
apA
Probabilidad es el cálculo matemático que establece todas las posibilidades que existen de que ocurra un fenómeno en determinadas circunstancias del azar.
Definición
Nos explica el comportamiento que puede tener un evento (suceso) que tiene incertidumbre
Es una herramienta básica para poder realizar inferencias estadísticas
Un suceso tiene incertidumbre cuando es aleatorio
Experimento aleatorio es el que se realiza bajo las mismas condiciones, puede arrojar diferentes resultados
DE PROBABILIDAD
ELEMENTOS LA
Un suceso es aleatorio cuando se encuentra contenido en un espacio muestral, en el que el suceso es un caso fortuito, su ocurrencia no depende del azar
Un espacio muestral es el conjunto de todos los posibles resultados que puede arrojar un ecxperimento aleatorio
+ info
04
Elementos de la probabilidad
El cálculo de probabilidad es el estudio de cómo se determina la probabilidad de ocurrencia de un suceso. Esto, cuando tiene injerencia el azar
La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio.
Ordenaciones son las relaciones de algún tipo de orden entre distribucione de probabilidad Las permutaciones son agrupaciones en las que importa el orden de los objetos. Las combinaciones son agrupaciones en las que el contenido importa pero el orden no.
04
Esperanza matemática
Ejemplo:
En estadística, la esperanza matemática, también llamada valor esperado, es un número que representa el valor medio de una variable aleatoria. La esperanza matemática es igual al sumatorio de todos los productos formados por los valores de los sucesos aleatorios y sus respectivas probabilidades de suceder. El símbolo de la esperanza matemática es la E mayúscula, por ejemplo, la esperanza matemática de la variable estadística X se representa como E(X). Asimismo, el valor de la esperanza matemática de un conjunto de datos coincide con su media (media poblacional).
Una persona participa en un juego en el que puede ganar o perder dinero según el número que salga al lanzar un dado. Si sale un 1 gana $800, si sale un 2 o un 3 pierde $500, y si sale un 4, un 5 o un 6, gana $100. El precio por participar es de $50. ¿Recomendarías la participación en este juego de probabilidades? Lo primero que debemos hacer es determinar la probabilidad de cada suceso. Como un dado tiene seis caras, la probabilidad de obtener cualquier número es: obtener un nmúmero 0 1/6 Por lo tanto, la probabilidad de ocurrencia de cada suceso es: p(ganar $800) = 1/6 p (perder $500) = 2. 1/6 = 2/6 p (ganar $100) = 3. 1/6 = 3/6 Ahora que ya sabemos la probabilidad de que ocurra cada evento, aplicamos la fórmula de la esperanza matemática: Y hacemos el cálculo de la esperanza matemática (o valor esperado): E(X) = 800*1/6 - 500*2/6 + 100*3/6 = $16.67
+ info
El valor de la esperanza matemática es menor que el precio por participar en este juego, por lo tanto, sería mejor no jugar ya que a la larga se acabará perdiendo dinero. Puede ser que si solo participas una vez toque un 1 y entonces saques un gran beneficio, pero la probabilidad de obtener pérdidas a largo plazo es alta. Cabe destacar que el resultado de la esperanza matemática a veces es un valor imposible, por ejemplo, en este caso no se puede obtener $16,67.
LA ESPERANZA MATEMÁTICA
CONCEPTO
La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio https://www.youtube.com/watch?v=3W_nBWuCuOI&t=312s&ab_channel=PaolaRodr%C3%ADguez
04
Ejemplos
Ordenaciones
La fórmula de ordenaciones es: donde n es el número de objetos y r los que voy a seleccionar
04
Ejemplos
Permutaciones
Una permutación de objetos es cuando se ordenan todos los objetos del conjunto: Ejemplo
04
Ejemplos
Combinaciones
Si voy a selecionar tres números dintintos y no me interesa el orden uso combinaciones. La formula es la siguiente:
Permutaciones, Ordenaciones, Variaciones y Combinaciones
CONCEPTO
Las permutaciones son agrupaciones en las que importa el orden de los objetos. Las combinaciones son agrupaciones en las que el contenido importa pero el orden no. https://www.youtube.com/watch?v=EC_ZIuMW2AY&ab_channel=AugustoCoyoli
Actividad 4
Obtención de datos probabilisticos
La aventura continua
Gracias
contacto
05
La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria.
Distribución de probabilidad
Una distribución de probabilidad es aquella que permite establecer toda la gama de resultados probables de ocurrir en un esperimento determinado. Es decir, describe la probabilidad de que un evento se realice en el futuro
Índice
distribución normal y sus aplicaciones
Distribución bimodal
Distribución multinominal
Distribución de poisson
ajustes de distribuciones de frecuencias
Distribución de probabilidad
05
“Caballeros, ¿debo recordarles que, mis probabilidades de éxito, aumentan en cada nuevo intento?” Russell Crowe - John Nash.
Ajuste de distribución de frecuencia
Distribución de poisson
Distribución bimodal
Distribución multinominal
Distribución normal y sus aplicaciones
No olvides observar el video que se encuentra en algunos de los temas para mayor comprensión del tema
06
La teoría del muestreo se basa en la selección aleatoria de la muestra con algún instrumento de selección aleatoria. Ella permite seleccionar un subconjunto de la población y a través de ellos, con un grado de precisión y confiabilidad se estiman parámetros de la(s) población(es).
Teoría General del Muestreo
La teoría del muestreo hace referencia al método científico que pone en práctica principios estadísticos- matemáticos, que permiten obtener información de parte de los elementos de una población y hacer inferencias acerca de las características de la población de donde provienen.
Índice
tipos de muestreo
teoría del muestreo
estimación de parámetro de confiabiliadd muestral
estimación del tamaño de la muestra
Distribución multinominal
https://www.youtube.com/watch?v=vqAjfz_0hOE&ab_channel=Helingenier https://www.youtube.com/watch?v=LRlYx-FndYo&ab_channel=AprendiendoEstad%C3%ADstica
01
Teoría del muestreo
Muestreo
Se basa en la selección aleatoria de la muestra con algún instrumento de selección aleatoria
idea
02
Tipos de muestreo
idea
idea
Probabilístico y no probabilístico
03
EStimación del tamaño de la muestra
idea
idea
idea
Conjunto de datos e información a recolectar u obtener, por medio de la estadística, sobre una población.
idea
04
estimación del parámetro de confiabilidad muestral
idea
Se basa en la selección aleatoria de la muestra con algun instrumento de selección aleatoria
06
Muestreo aleatorio
Existen varios tipos de muestreo aleatorio
Muestreo aleatorio simple
06
PSe utiliza cuando el grupo es homogéneo y para esto se numeran a los individuos y al azar se elige a los individuos
¿Azar?
Para asegurarse que existe el azar en la elección de los sujetos se emplean las llamadas “Tablas de Números Aleatorios”
Muestreo aleatorio sistemático
06
Se utiliza cada número “K” de la lista. Esto reduce la posibilidad de los miembros elegidos
Proceso
Dividir el tamaño de la población entre el número de la muestra, para determinar el número "K" El primer miembro se obtiene aleatoriamente Una vez que se ha determinado el primer miembro, se selecciona cada K miembro de la población
Muestreo aleatorio estratificado
06
Se Debes asegurarte de que el perfil de la muestra concuerda con el perfil de la población Procedimiento
14 es el 100% ¿Cuántas niñas? ¿Cuántos niños?
Muestreo aleatorio de cluster o racimos
06
Son grupos que pueden aparecer juntos, se seleccionan grupos en lugar de individuos Procedimiento:
06
Muestreo no aleatorio
Los dos tipos más utilizados son: Conveniencia: La muestra que tenemos al alcance, no hay la misma oportunidad de ser elegidos. Cuota: Se elige cada cierto tiempo o número a alguien para ser parte de la muestra.
población, muestra y unidad de análisis
Investgación o tesis
explicaremos qué es la población o universo, la muestra y las unidades de análisis, dentro de la investigación científica y para que nos sirven dentro de nuestras tesis. https://www.youtube.com/watch?v=MlhwCDxtpqg&ab_channel=TeoCom
Actividad 5
Tamaño Muestral
El final llego
Gracias
contacto
MODA
La moda es el valor que aparece más dentro de un conjunto de datos. A diferencia de la media y la mediana, la moda no requiere valores numéricos y puede utilizarse con datos categóricos o discretos. Un conjunto de datos puede tener un modo, conocido como unimodal, o varios modos, denominados bimodal o multimodal. Se llama amodal cuando en un conglomerado no se repiten los valores.
Las principales características de la moda son:
Cómo calcular la esperanza matemática
Para calcular la esperanza matemática de una variable discreta se deben hacer los siguientes pasos:
Multiplicar cada posible suceso por su probabilidad de ocurrencia. Sumar todos los resultados obtenidos en el paso anterior. El valor obtenido es la esperanza matemática (o valor esperado) de la variable De modo que la fórmula para calcular la esperanza matemática (o valor esperado) de una variable discreta es la siguiente:
El muestreo probalisitico es:Cuantitativo, Tiene mayor inversión de tiempo y recursos, la muestra se puede escoger de una población estratificada, los elementos de una misma población tienen muchas probabilidades de ser escogidos estos son:Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerados o grupos, muesstreo sistemático. Muestreo no probabilistico es: Cualitativo, de muy bajo costo, los elemetnos son elegidos de acuerdo a los intereses de la investigación, el investigador debe conocer las características de la población y son: Muestreo por conveniencia, muestreo consecutivo, muestreo por cuotras, muestro intenciona o por juicio.
¿Por qué funciona el muestreo?
- El muestreo es muy útil, gracias a que podemos acompañarlo con un proceso inverso al cual llamamos generalización de resultados
- 1. Debemos extraer una muestra del mismo
- 2. Medir un dato u opinión
- 3. Se debe de proyectar en el universo el resultado observado en la muestra
TIPOS DE MUESTREOActividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
RANGOS
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos formula (R= VMx-Vmin)Rango intercualtil: Es una estimación estadística de la dispersión de una disribución de datos que eliminan la influencia de los valores extremos y que consiste en la diferencia entre el tercer y el primer cuartil. Es altamente recomendable cuando la medida de tendencia central utilizada es la mediana. Fórmula: RIQ= Q1-Q3 Rango semi cuartil. Es un medio de la diferencia entre el primer y tercer cuartil. Es la mitad de la distancia requerida para cubrir la mital de las cuentas.
La distribución de Poisson es una distribución de proba- bilidad discreta que expresa, a partir de una frecuencia de ocurrencia media λ, la probabilidad que ocurra un deter- minado número de eventos durante un intervalo de tiempo dado o una región específica. En la vida real se utiliza la distribución de Poisson para hacer cálculos de probabilidades donde se requiere contar el número de veces que se produce un suceso aleatorio durante un periodo determinado de tiempo (o también de distancia, área u otro parámetro). Aquí algunos ejemplos típicos de variables aleatorias que siguen una distribución de Poisson: El número de clientes que ingresan a un supermercado en un día. El número de accidentes registrados en una fábrica durante una semana. El número de llamadas que recibe una central telefónica en el período de un minuto.
¿Qué elementos participan en la distribución de Poisson? Índice 3.1 Media. 3.2 Varianza. 3.3 Momentos. 3.4 Moda. 3.5 Función generadora de momentos. ¿Qué significa el modelo generalizado de Poisson y cuál es su utilidad? Los modelos de regresión de Poisson permiten representar la dependencia de una varia- ble respuesta resultado de un recuento, con respecto a una o varias variables explicativas, aproximando la variable respuesta discreta a partir de las variables explicativas con un cierto error.
Mediana
La mediana es un valor que se encuentra a la mitad de los otros valores, es decir, que al ordenar los número de menor a mayor, éste se encuentra justamente en medio entre los que están por arriba. Algunas características de la media son:
Ejemplo de Mediana La cantidad de valores es impar Si se tienen los valores: 9,5,4,2,7, se ordenan: 2, 4, 5, 7, 9. El elemento de en medio es el 5, ya que se encuentra dos valores por encima y dos valores por debajo. La cantidad de valores es par Si se tienen los valores 9,5,4,2, se ordenan: 2,4,5,9. En este caso se toman los dos valores centrales 5 y 4, la mediana es el promedio de ambos: 9
Estimación del tamaño de la muestra
El tamaño de muestra permite a los investigadores saber cuántos individuos son necesarios estudiar, para poder estimar un parámetro determinado con el grado de confianza deseado, o el número necesario para poder detectar una determinada diferencia entre los grupos de estudio, suponiendo que existiese realmente
Varianza: Ejemplo
De una empresa multinacional se conoce el resultado económico que ha tenido durante los últimos cinco años, en la mayoría ha obtenido beneficios pero un año presentó unas pérdidas considerables: 11, 5, 2, -9, 7 millones de euros. Calcula la varianza de este conjunto de datos. Primero calcunlamos la media aritmética Ahorta ya podemos utilizar la fórmula de la varianza
Medidas de tendencia central
Media, mediana y moda
Media, también conocida como media aritmética. Es la suna de un conjunto de valores númericos dividida entre el número total de sumandos. La mediana es el valor medio de un conjunto de datos cuando los valores se ordenan de forma ascendente o descendente. La moda representa el valor o categoría más común dentro del conjunto de datos La media, la mediana y la moda son las tres medidas de tendencia central más usadas para poblaciones que no cuentan con demasiados datos, es decir, que no necesitan agruparse.
Media ponderada
Entre los distintos tipos de medias, la media ponderada otorga distinta importancia a diferentes valores sobre los que se calcula. Todo profesor ha realizado alguna vez el cálculo de una media ponderada para poder calcular las notas de sus alumnos, pues es mucho más justa y ponderada en relación con los esfuerzos y pruebas realizadas. Se diferencia de la media aritmética en que no le da la misma importancia a todos los valores. De hecho, como veremos más tarde, en realidad la media aritmética es una media ponderada en la que todos los valores son igual de importantes. La media ponderada se hace muy útil, por ejemplo, para calcular notas de una asignatura.
Rango
Si tienes datos no agrupados como: 7, 10, 9, 6, 1, 2, 6, 2, 6, 9, 3 1ro. se deben agrupar de forma descendente o ascendente 1, 2, 2, 3, 6, 6, 6, 7, 9, 9, 10 "Tomar la muestra (que son el dato menor y el dato mayor) 1- 10 3ro. se restan 9 Ese sería el rango de los datos
Ejemplo n. ° 3: puntuaciones de exámenesSuponga que un maestro da un examen a su clase de estudiantes. Algunos de los estudiantes estudiaron para el examen, mientras que otros no. Cuando el maestro crea un gráfico de los puntajes del examen, sigue una distribución bimodal con un pico alrededor de los puntajes bajos para los estudiantes que no estudiaron y otro pico alrededor de los puntajes altos para los estudiantes que sí estudiaron:
Ejemplo 2: Altura promedio de dos especies de plantas Suponga que recorremos un campo y medimos la altura de diferentes plantas. Sin darnos cuenta, midimos la altura de dos especies diferentes, una que es bastante alta y otra que es bastante baja. Si creara un gráfico para visualizar la distribución de alturas, seguiría una distribución bimodal:
¿Cómo se hace una distribución de frecuencias?
Se obtiene dividiendo la frecuencia absoluta entre el número total de datos y se puede expresar como una fracción, como un decimal o como un porcentaje. Se simboliza con f i / n donde n es el número de datos.
Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos y a cada uno de ellos le asigna una frecuencia que, en pocas palabras, son las veces que se repite un número o dato. Puedes usar las tablas de frecuencias para ordenar variables cuantitativas o cualitativas
Estudio Estadístico
Qué es la distribución de Poisson
La distribución de Poisson es una distribución de probabilidad discreta que se aplica a las ocurrencias de algún evento durante un periodo determinado. Es decir, es una distribución de probabilidad discreta en la que solo es necesario conocer los eventos y cuál es su frecuencia media de ocurrencia para poder conocer la probabilidad de que ocurran. Una distribución es discreta cuando se toma un número de valor finito, mientras que las continuas usan un número infinito de valores. Para que una distribución sea considerada como distribución de Poisson debe cumplir con tres requisitos:
La distribución multinomial es una generalización de la distribución binomial. En este caso, en un experimento interesa estudiar no la ocurrencia de un único suceso o la de su contrario, sino la de varios sucesos (tres o más). Las distribuciones multinominales tratan específicamente de eventos que tienen múltiples resultados discretos. La distribución binomial es un subconjunto específico de distribuciones multinomiales en las que solo hay dos posibles resultados de un evento. Las distribuciones multinomiales no se limitan a eventos que solo tienen resultados discretos. Es posible categorizar los resultados con distribuciones continuas a diferentes grados (alto, medio, bajo). Por ejemplo, el nivel del agua -una entidad continua- en un tanque de almacenamiento puede hacerse discreto categorizándolos en “deseables” o “no deseables”. Las distribuciones multinomiales, por lo tanto, tienen aplicaciones expansivas en el control de procesos.
- Ejemplo 1:
Considera el escenario en el que arrojas un dado justo 12 veces. ¿Cuál es la probabilidad de que cada valor nominal (1-6) ocurra exactamente dos veces? Solución La probabilidad se puede determinar mediante una distribución multinomial en la que son posibles 6 resultados. Las probabilidades individuales son todas iguales dado que es un dado justo, p = 1/6. El número total de ensayos N es 12, y el número individual de ocurrencias en cada categoría n es 2 . Por lo tanto, la probabilidad de rodar exactamente 2 de cada valor nominal en un dado justo es de aproximadamente 0.35%.Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
Esperanza matemática
Dicho de otra forma, es el valor medio de un conjunto de datos. Esto, teniendo en cuenta que el término esperanza matemática está acuñado por la teoría de la probabilidad. Ejemplo: Imaginemos una moneda. Dos caras, cara y cruz. ¿Cual sería la esperanza matemática (valor esperado) de que salga cara? La esperanza matemática se calcularía como la probabilidad de que, tirando la moneda un número muy grande de veces, salga cara. Dado que la moneda solo puede caer en una de esas dos posiciones y ambas tienen la misma probabilidad de salir, diremos que la esperanza matemática de que salga cara es una de cada dos, o lo que es lo mismo, el 50% de las veces. Vamos a hacer una prueba y vamos a tirar una moneda 10 veces. Supongamos que la moneda es perfecta. Tiradas y resultados: Cara, Cruz, Cruz, Cara, Cruz, Cara, Cara, Cara, Cruz, Cruz, ¿Cuantas veces ha salido cara (contamos las Y)? 5 veces ¿Cuantas veces ha salido cruz (contamos las X)? 5 veces. La probabilidad de que salga cara será de 5/10=0,5 o, en porcentaje, del 50%.
¿Cuál es la estructura de la tabla de distribución de frecuencias?
Una tabla de frecuencia está compuesta por lo general por las columnas de la frecuencia absoluta (ni), la frecuencia absoluta acumulada (Ni), frecuencia relativa (fi), frecuencia relativa acumulada (Fi), frecuencia porcentual (n%) y frecuencia porcentual acumulada (F%), aunque estas son las columnas bases de las tablas ..
Actividad 2
Deciles, cuartiles y percentiles
Resuelve el ejercicio que se te presenta en la hoja de excel obteniendo los deciles, cuartiles o percentiles solicitados
Desviación Estándar
En primer lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto de datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las diferencias. Por último, dividiendo el resultado por el número total de observaciones (normalmente representado por la letra “n”) para llegar a un promedio de las distancias entre cada observación individual y la media. Este promedio de las distancias es la desviación estándar y de esta manera representa la dispersión. Por ejemplo, la distribución azul en la parte de abajo tiene una desviación estándar mayor que la distribución verde de arriba
Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
Ejemplo 2: La planta física en el campus principal de una gran universidad estatal recibe diariamente solicitudes para reemplazar bombillas fluorescentes. La distribución del número de solicitudes diarias tiene forma de campana y tiene una media de 59 y una desviación estándar de 9. Usando la regla empírica, ¿cuál es el porcentaje aproximado de solicitudes de reemplazo de bombillas que suman entre 59 y 77? Solución Ya que queremos utilizar la Regla Empírica, debemos dibujar una figura que refleje la Regla Empírica dada la media es 59 y la desviación estándar es 9 Recordemos, 1 desviación estándar de la media es 59±9, dos desviaciones estándar de la media es 59±2⋅9, y 3 desviaciones estándar de la media es 59±3⋅9 .
Una vez que hagamos esta cifra, podemos fácilmente calcular el porcentaje de solicitudes de reemplazo de bombilla numerando entre 59 y 77: 34%+13.5%=47.5% Así, 47.5% de las solicitudes de sustitución de bombillas numeradas entre 59 y 77.
¿cuáles son las aplicaciones de la distribución normal?
La distribución normal sirve para conocer la probabilidad de encontrar un valor de la variable que sea igual o inferior a un cierto valor , conociendo la media, la desviación estándar, y la varianza de un conjunto de datos sustituyéndolos en la función que describe el modelo. En otras palabras, la distribución normal adapta una variable aleatoria a una función que depende de la media y la desviación típica
- Solución
Usando una calculadora gráfica, podemos aproximar la probabilidad de que una iguana marina hembra sea menor a 400 gramos de la siguiente manera:- Ejemplo 1:
Supongamos que la distribución de las masas de iguanas marinas hembras en Puerto Villamil en las Islas Galápagos es aproximadamente normal, con una masa media de 950 g y una desviación estándar de 325 g. Hay muy pocas iguanas marinas jóvenes en las zonas pobladas de las islas, porque los gatos salvajes tienden a matarlas . ¿Qué tan raro es que encontremos en esta zona una iguana marina hembra con una masa inferior a 400 g?Con una probabilidad de aproximadamente 0.045, o sólo alrededor del 5%, podríamos decir que es bastante improbable que encontremos una iguana tan pequeña.
Ejemplo:
Tengo 6 números de los cuáles voy a seleccionar 3 números pares distintos para formar una clave de acceso a un cajero- Lo importante es el orden, si tengo 4 numeros clases en primero pongo los 4, luego tres, postriormente 2. (si lo múltilico tengo 24 opciones de formar la clave
Ordenaciones es seleccionar y acomodar en lugares
Combinaciones solo es seleccionar
- Por ejemplo, supongamos que voy a lanzar un dado y deseo saber la probabilidad de obtener como resultado un múltiplo de tres:
Casos favorables: 3,6 : Dos casos. Casos posibles: 1,2,3,4,5,6 : Seis casos. Por tanto, la probabilidad sería: 2/6= 1/3= 0,3333= 33,33% Supongamos que una persona debe elegir al azar una carta de un mazo con 52 cartas. Son 13 cartas por cada uno de los cuatro palos (no estamos incluyendo al Joker). Por lo que, ¿cuál es la probabilidad de que saque una carta con el número 7? Número de casos favorables: 4, uno por cada palo. Número total de casos posibles: 52. Probabilidad: 4/52= 1/13= 0,0769= 7,6923%.Cálculo de probabilidad
El cálculo de probabilidades forma parte de la teoría de la probabilidad. Esta es aquella área de las matemáticas y la estadística que engloba todos los conocimientos relativos a la probabilidad. Dicho análisis es aplicado, por ejemplo, en los juegos de azar; como el póker. En este sentido, debemos recordar que la probabilidad es la posibilidad de ocurrencia de un fenómeno o un hecho. Esto, cuando están dadas determinadas circunstancias. La fórmula básica para el cálculo de probabilidades que debemos tener en cuenta es la siguiente: Número de casos favorables/Número total de casos posibles
Una distribución estadística es la frecuencia teórica de la ocurrencia de los valores que puede tomar una variable. En el nodo Ajustar simulación, se compara un conjunto de distribuciones estadísticas teóricas con cada uno de los campos de dato. El ajuste de una distribución comprueba si la distribución de una muestra de datos difiere significativamente de una distribución teórica
Se considera igualmente el nivel de confianza que fluctua entre 90 y 99%.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporción observada en la muestra es un estimador de la proporción en la población. ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho resultado muestral a la población total, de modo que lo estimado es el valor generalizado a la población. l tamaño de la muestra se determina basado en cuatro factores: La probabilidad ( p) del resultado, es decir, dada una entidad, la probabilidad de "éxito" frente a un "error".
Medidas de dispersión
Desviación media : es una medida que se utiliza para entender qué tanto se alejan los datos de un conjunto promedio. Es una medida que nos ayuda a entender cuánto varían los datos de un conjunto promedio. Si la desviación es grande, significa que los datos están muy dispersos o variados, mientras que si es pequeña, significa que los datos están muy cercanos entre sí. La varianza es una medida de dispersión que indica la variabilidad de una variable aleatoria. La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones. la interpretación del valor de la varianza de una variable aleatoria es sencilla. Cuanto más grande sea el valor de la varianza, más dispersos están los datos. Y al revés, cuanto más pequeña sea el valor de la varianza, menos dispersión habrá en la serie de datos. La desviación estándar es una medida de extensión o variabilidad en la estadística descriptiva. Se utiliza para calcular la variación o dispersión en la que los puntos de datos individuales difieren de la media. El coeficiente de variación tambien llamado coeficiente de Pearson se utiliza para comparar conjuntos de datos pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida de dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones.
Distribución bimodal
Ejemplo
Una distribución bimodal es una distribución de probabilidad con dos modos. A menudo usamos el término «moda» en las estadísticas descriptivas para referirnos al valor más común en un conjunto de datos, pero en este caso el término «moda» se refiere a un máximo local en un gráfico. Cuando visualices una distribución bimodal, notarás dos “picos” distintos que representan estos dos modos. Ejemplo: horas pico de un restaurant Si creó un gráfico para visualizar la distribución de clientes en un determinado restaurante por hora, probablemente encontraremos que sigue una distribución bimodal con un pico durante las horas del almuerzo y otro pico durante las horas de la cena:
Actividad 1
Distribución de frecuencias
Elabora con los datos proporcionados una distribución de frecuencias donde obtengas lo siguiente:
La distribucipon de freecuencias sirve para mostrar todos los tipos de frecuencia de un conjunto de datos Una distribucion de gfrecuencias incluye la frecuencia absoluta, la frecuencia absoluta acumulada, la frecuencia relativa y la frecuencia relativa acumulada Una de las características de las distribuciones de frecuencias es que son útiles para resumir una muestra estadística tanto de una variable cuantitativa como una variable cualitativa De esta manera, la bondad de ajusteconsiste en explorar un universo de infinitas posibles distribuciones estadísticaspara encontrar la que mejor se adapta a los datos Ajustar una forma funcional generalizada al conjunto de datos que tiene la capacidad de representar un número ilimitado de formas.
Media
La media, también conocida como promedio, es el valor que se obtiene al dividir la suma de un conglomerado de números entre la cantidad de ellos. La media representa el punto de equilibrio de la distribución y está influida por los valores extremos. Proporciona una medida de la tendencia general o valor medio de los datos. Se calcula sumando todos los valores del conjunto de datos y dividiendo la suma por el número total de puntos de datos.Para obtener la Media de un conjunto solo tienes que seguir estos sencillos pasos: Determina el conjunto de valores que buscas promediar. Suma los valores para obtener el total Haz el conteo de la cantidad de valores en el conjunto. Divide la suma del conjunto entre la cantidad de números.
Algunas características de la media son:
Desviación media: ejemplo
un ejemplo sencillo de cómo calcular la desviación media: Supongamos que tenemos el siguiente conjunto de datos: 2, 4, 6, 8, 10. Para calcularla, primero necesitamos calcular la media de los datos: X = (2 + 4 + 6 + 8 + 10) / 5 = 6 Ahora, podemos calcular la desviación utilizando la fórmula: Desviación media = Σ | Xi – X | / N DM = (|2 – 6| + |4 – 6| + |6 – 6| + |8 – 6| + |10 – 6|) / 5 DM = (4 + 2 + 0 + 2 + 4) / 5 DM = 2.4 Por lo tanto, la desviación de este conjunto de datos es de 2.4. Esto significa que, en promedio, los valores del conjunto difieren en 2.4 unidades de su media
Rango semicuartil
Para hallar el rango semi-intercuartil primero tenemos que determinar el primer y el tercer cuartil. Por ejemplo: El primer cuartil es la mediana de la primera mitad de valores, que corresponde al valor 8,95 €/acción. Q_1=8,95 Por otro lado, el tercer cuartil es el valor intermedio de la segunda mitad de valores, esto es, 9,83 €/acción. Q_3=9,83 Una vez que ya sabemos los valores del primer y el tercer cuartil, simplemente tenemos que aplicar la fórmula del rango semi-intercuartil para hallar su valor:
¿Cómo se aplica hoy la estadística
En la educación
La estadística es una herramienta fundamental en la Educación porque brinda las herramientas indispensables para que los estudiantes la apliquen en su vida profesional y personal, mejorando su desempeño laboral, personal y por ende su calidad de vida. La adquisición de ideas estadísticas es, por lo tanto, un asunto de gran importancia para la sociedad contemporánea
- Analizar la variabilidad,
- Determinar relaciones entre variables,
- Diseñar estudios y experimentos y
mejorar las predicciones son algunos de los aspectos que la estadística tiene en cuenta.Probabilidad para variables discretas
Probabilidad para variables continuas
Las probabilidades de las variables aleatorias continuas (X) se definen como el área por debajo de la curva. Por lo tanto, solo los rangos de valores pueden tener una probabilidad diferente de cero. La probabilidad de que una variable aleatoria continua equivalga a algún valor siempre es cero. Las distribuciones de probabilidad de variable continua se definen por medio de una función y = f(x) que se llama función de probabilidad o función de densidad. Ha de ser f(x) ≥ 0 para todo x. Las probabilidades vienen dadas por el área bajo la curva. Por tanto, el área encerrada bajo la totalidad de la curva es 1.
El valor que indica la probabilidad de cada uno de esos posibles resultados puede tomar valores entre 0 y 1, siempre positivos Si a un evento se le asigna el valor de 1 quiere decir que hay la certeza del 100% que el evento ocurrirá Si se le asigna 0 el evento no ocurrirá En una tabla de frecuencia, la probabilidad se estima con la frecuencia relativa:
Coeficiente de variación: Ejemplo
Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los elefantes es de apenas un 8%, mientras que el de las ratones es de un 33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la población con mayor dispersión, no es la que tiene una mayor desviación típica.
Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene un peso medio de 5.000 kilogramos y una desviación típica de 400 kilogramos. La población de ratones tiene un peso medio de 15 gramos y una desviación típica de 5 gramos. Si comparáramos la dispersión de ambas poblaciones mediante la desviación típica podríamos pensar que hay mayor dispersión para la población de elefantes que para la de los ratones Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos daríamos cuenta que es justo al contrario. Elefantes: 400/5000=0,08 Ratones: 5/15=0,33
El tamaño de la muestra debe ser ideal, ni demasiado grande ni demasiado pequeño. Luego, una vez que se haya decidido el tamaño de la muestra, debe usarse una técnica sólida para recolectar la muestra de la población:
La teoría del muestreo proporciona estrategias en relación a la selección de muestras y estimaciones de parámetros poblacionales que ofrezcan la mayor cantidad de información al menor costo. La estimación muestral no es igual al valor del parámetro poblacional, esto es debido a que: • Tomamos solo una parte de la población. • Está sujeta a errores no debidos al muestreo (conocidos como sesgos). La teoría del muestreo se basa en la selección aleatoria de la muestra con algún instrumento de selección aleatoria. Ella permite seleccionar un subconjunto de la población y a través de ellos, con un grado de precisión y confiabilidad se estiman parámetros de la(s) población(es). Se debe tomar muestras de forma tal que los errores del muestreo, debidos a él o no, sean mínimos.
Ejemplo: Un cuenco tiene 2 canicas de maíz, 3 canicas azules y 5 canicas blancas. Se selecciona al azar una canica y luego se vuelve a colocar en el bol. Esto lo haces 5 veces. ¿Cuál es la probabilidad de elegir 1 mármol de maíz, 1 mármol azul y 3 canicas blancas? Solución N es el número de ensayos = 5 k es el número de resultados posibles = 3 n i es el número de ocurrencias del resultado i p i es la probabilidad de ver el resultado i Los tres posibles resultados son elegir una canicade maíz, una canica azul o un canica blanca. Debemos determinar n i y p i para resolver la distribución multinomial. El número de ocurrencias del resultado es el número de veces que deseamos ver cada resultado. Estos se dan en la declaración del problema.
n maíz = 1n azul = 1 n blanco = 3 La probabilidad de ver cada resultado es fácil de encontrar. Por ejemplo, hay dos de maíz en el tazón de 10, por lo que la probabilidad de elegir una canica de maíz es: Ahora podemos resolver la distribución multinominal como se muestra acontinuación. La probabilidad de elegir 1canica de maíz, 1 canica azul y 3 canicas blancos es de 0.15