Want to create interactive content? It’s easy in Genially!

Get started free

Distribución de frecuencias

Jaime López Parra

Created on November 2, 2025

Start designing with a free template

Discover more than 1500 professional designs like these:

Psychedelic Presentation

Chalkboard Presentation

Witchcraft Presentation

Sketchbook Presentation

Genial Storytale Presentation

Vaporwave presentation

Animated Sketch Presentation

Transcript

Distribución de frecuencias, tabulación cruzada y pruebas de hipótesis.

Integrantes: Jaime López Parra 357293 Leonardo Torres Téllez 377760 Fabian Daniel Gutierrez 378423 Francisco Escarcega

INTRODUCCIÓN

El siguiente paso en el proceso de investigación de mercados es el análisis de los datos, el cual nos permitirá sacar conclusiones y tomar las decisiones pertinentes. En las primeras investigaciones que realizamos es frecuente que hagamos acopio de una gran cantidad de datos y cuando llega el momento de hacer el análisis no sabemos cómo empezar ni qué camino seguir.

El análisis puede ser tan complejo como lo sean los objetivos y la metodología del estudio. Para efectos de este capítulo comentaremos tres herramientas básicas para llevar a cabo el análisis la toma de decisiones. Éstas son la distribución de frecuencias, las tabulaciones cruzadas y las pruebas de hipótesis.

La distribución de frecuencias que resulta de la variable máximo nivel de estudios del encuestado indica que 54.1% de ellos tiene licenciatura, 16.7% maestría o master, y 12% doctorado. Esto puede interpretarse a priori como un buen nivel de preparación de los padres de familia quienes, en consecuencia, tienen una visión más amplia si se les compara con padres de familia con menos estudios.

Distribución de frecuencias

También conocida como desviación típica, es la medida de la dispersión de los valores respecto a la media o el valor promedio. En otras palabras, es la variación esperada con respecto a la media aritmética.

+info

Medidas de tendencia central

Este tipo de medidas corresponden a la investigación descriptiva. Recordemos que en una investigación descriptiva necesitamos establecer lo que está ocurriendo, cómo vamos, en dónde nos encontramos, sin preocuparnos todavía por el porqué. Es el tipo de investigación que genera datos de primera mano para realizar después un análisis general y presentar un panorama más profundo del problema. Las medidas de tendencia central suelen localizarse al centro de la distribución de los datos.

Las medidas de tendencia central son la media, la mediana y la moda.

La media

La media o promedio es la medida de tendencia central que se utiliza con mayor frecuencia. Es el cociente entre la suma de todos los datos y el número de ellos. Ejemplo: tienen las siguientes calificaciones: 8, 7, 9, 10 y 6. Sumas los datos: 8+7+9+10+6=40 Cuentas cuántos datos hay: 5 Divides: 40÷5=8 Entonces, la media o promedio es 8.

La mediana

Es el número intermedio de un grupo de datos; es decir, la primera mitad de los números son inferiores a la mediana y la segunda mitad de dichos números tiene valores superiores a la mediana.

Ejemplo: Vamos a suponer que hay 19 mendigos y un millonario en una habitación. Cada uno pone cinco pesos sobre la mesa, pero el millonario aporta un millón

En caso de tener numeros pares se promedian los dos valores centrales

La moda

Es el valor que aparece con mayor frecuencia en una distribución o en un grupo de números. En otras palabras, representa la cima de la distribución Ejemplo: En el caso de los 19 mendigos y un millonario, queda muy claro que la moda es de cinco pesos.

Medidas de dispersión

Las medidas de dispersión sirven para saber qué tanto se parecen o se alejan los datos entre sí.Mientras que las medidas de tendencia central (como la media o la mediana) te dicen dónde está el centro de los datos, las de dispersión te dicen qué tan “extendidos” o “variados” están esos datos alrededor del promedio.

La varianza

La varianza es una medida de dispersión que sirve para saber qué tanto se alejan los datos del promedio (media).

La desviación estándar

La desviación estándar —o desviación típica— es la medida de la dispersión de los valores respecto a la media o el valor promedio. Dicho de otra manera, la desviación estándar es el promedio o variación esperada en relación con la media aritmética.

Observaciones a la desviación típica y a la varianza

1. Ambas dependen de todos los valores de la distribución, así como de la media. 2. En los casos en que no sea posible calcular la media aritmética, tampoco se podrá obtener la desviación típica ni la varianza por ser funciones de la media. 3. La varianza tiene el inconveniente de que no aparece expresada en las mismas unidades que los datos, debido a que las desviaciones están elevadas al cuadrado.

Tabulación cruzada

Representa una extensión de la tabulación unidimensional que sólo muestra la distribución de una variable o de un atributo entre grupos. Por ejemplo, ¿qué tan probable es que usted inscriba a su hijo? ,tenemos la tabulación de las siguientes respuestas

Sin embargo, esto no ofrece suficiente información sobre las razones por las que los padres o sus hijos se inscribirían o no. Pero cuando agregamos la variable ciudad encontramos que la mayor proporción de encuestados que responde de manera favorable está en Córdoba.

La introducción de una tercera variable puede ayudar a confirmar o rechazar la relación original. Pueden añadirse variables adicionales siempre y cuando haya datos y la muestra sea lo bastante grande para que las fracciones permanezcan significativas. Aqui añade el grupo de estudiantes entrevistados.

PRUEBA DE HIPOTESIS EJEMPLO

Sigamos con el el ejemplo de la Universidad de Córdoba la cual planea planea abrir un nuevo plantel con un alto nivel académico y dormitorios para estudiantes de ciudades cercanas y lejanas. El objetivo es que los jóvenes vivan en el campus durante la semana, evitando perder tiempo en traslados y aprovechándolo para estudiar más o participar en actividades extracurriculares como cerámica, teatro y artes. De esta manera, la universidad busca ofrecer una formación integral, combinando la educación de calidad con un entorno que favorezca el desarrollo académico y personal de los estudiantes. Para que la inversión en el nuevo plantel sea rentable, los expertos en finanzas de la facultad han definido que se requiere que cuando menos 10% de los entrevistados, tanto padres como estudiantes, respondan que sí piensan ins cribirse para el siguiente año escolar, siempre y cuando se trate de una institución extranjera de prestigio que ofrezca educación de calidad con instalaciones seguras, aun cuando esté ubicada en otra ciudad. Una colegiatura razonable sería de 600 dólares mensuales.

De acuerdo con el cuadro 10.2, la proporción muestral p = 0.111, mien tras que la hipótesis planea nada más p = 0.10. La duda que persiste es sobre si la proporción real es estadísticamente significativa, de tal modo que indique fuera de toda duda que la proporción de la población será en realidad cercana a 10%

En otras palabras, los funcionarios de la universidad plantean que de una población de gente con edades entre 15 y 20 años de los niveles socioeconómi cos AB+, de las tres ciudades seleccionadas, cuando menos 10% debe inscri birse para que resulte un proyecto rentable. El porcentaje de aceptación de sus padres también debe ser superior a 10%.

¿QUE ES UNA HIPOTESIS?

Podemos definir la hipótesis como un intento de explicación o una respuesta provisional a un fenómeno. Su función consiste en delimitar el problema que se va a investigar según algunos elementos, como lugar, tiempo o características de los sujetos, entre otros.

OBJETIVO

El objetivo primordial de todo estudio que pretenda explicar algún campo de la realidad es comprobar, o rechazar, la hipótesis que se elaboró con antela ción, confrontando su enunciado teórico con los hechos empíricos. Para plantear una hipótesis adecuada debemos tener en cuenta los siguien tes puntos:

3. Las hipótesis deben ser objetivas y no llevar juicios de valor; es decir, no debe definirse el fenómeno con adjetivos tales como mejor o peor, sino tal y como pensamos que sucede en la realidad.

2. Las hipótesis que no tienen una referencia empírica constituyen un juicio de valor. Si una hipótesis no puede ser sometida a verificación empírica, desde el punto de vista científico no tiene validez. La veri ficación empírica toma sus datos y fundamenta sus conclusiones en la observación ordenada y sistemática de la realidad.

1. Los términos que empleen sobre las hipótesis deben ser claros y concretos para poder definirlos de manera operacional, a fin de que cual quier especialista que quiera replicar la investigación, pueda hacerlo. .

4. Deben ser específicas, no sólo en cuanto al problema, sino en cuanto a los indicadores que se van a emplear para medir las variables que esta mos estudiando. He aquí algunos ejemplos de indicadores: • La importancia relativa del patrocinio de una universidad extranjera. • La preocupación por la seguridad entre ambos grupos: padres o hijos. • La relevancia de las actividades extracurriculares como comple mento a la educación integral de los estudiantes.

6. Deben ser producto de la observación objetiva y su comprobación, así como estar al alcance del investigador. Desde este punto de vista, la información de los funcionarios de la Universidad de Córdoba es fundamental para proporcionar bases sólidas y objetivas. .

5. Deben estar relacionadas con los recursos y las técnicas disponibles. Esto quiere decir que cuando el investigador formule su hipótesis debe saber si los recursos que posee son adecuados para su comprobación.

REQUISITOS DE L A HIPOTESIS

3. Mantener la consistencia entre hechos e hipótesis, ya que éstas se funda mentan, al menos en parte, en hechos ya conocidos. Por lo tanto, las hipóte sis no deben establecer implicaciones contradictorias o inconsistentes con lo ya verificado en forma objetiva.

1. Las hipótesis deben establecer las variables a estudiar, es decir, especificar las, fijándoles un límite.

2. Establecer las relaciones entre las variables, es decir, la hipótesis debe ser especificada de tal manera que sirva de base a inferencias que nos ayuden a decidir si explica o no los fenómenos observados.

TIPOS DE HIPOTESIS

1. Hipótesis nula. Es aquella por la cual indicamos que la información a obtener es contraria a la hipótesis de trabajo. Al formular la hipótesis nula se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema debe rechazarse como tal.

EJEMPLO: un investigador cree que si un grupo de jóvenes se somete a un entrenamiento intensivo de natación, éstos serán mejores nadadores que quienes no recibieron entrenamiento. La hipótesis nula señalará que no hay diferencia en el desempeño de la natación entre el grupo de jóvenes que recibió el entrenamiento y el que no lo recibió.

2. Hipótesis de trabajo. Es aquella que le sirve al investigador como base de su investigación, o sea, trata de dar una explicación tentativa al fenómeno que se está investigando. Ésta es la hipótesis que el especialista tratará de aceptar como resultado de su investigación, rechazando la hipótesis nula. Se dice que la hipótesis de trabajo es operacional porque presenta de manera cuantitativa la hipótesis conceptual o general.

Los estudiantes que estudian con música obtienen mejores calificaciones que aquellos que estudian en silencio.

METODOS PARA ACEPTAR LA HIPOTESIS

Antes de plantear las hipótesis nula y de trabajo, es importante mencionar el error tipo I y el error tipo II. Ambos son tan sólo la consecuencia de las decisiones

Error tipo 1 y 2

Error tipo II. Ocurre cuando, con base en los resultados de la muestra, no se rechaza la hipótesis nula, aunque en realidad sea falsa. En nuestro ejemplo, el error consistiría en tomar el riesgo de la diferencia entre 11.1% y 10%, invertir en la construcción del nuevo campus y que la verdadera proporción de la población fuera menor a 10%.

Error tipo I. Ocurre cuando los resultados de la muestra revelan evidencia suficiente para el rechazo de la hipótesis nula, aunque en realidad sea verdadera. Universidad de Córdoba, el error tipo I consistiría en que la institución invirtiera en el nuevo campus, a pesar de que el estudio nos dice que 11.1% de los padres entrevistados contestó que en definitiva sí inscribiría a sus hijos.

DIFERENCIA DE PROPORCIONES

PASO 1 PLANTEAMENTO DEL PROBLEMA

• Se desea saber si al menos el 10% de los padres inscribirían a sus hijos. • Hipótesis nula (H₀): p < 0.10 • Hipótesis alternativa (H₁): p ≥ 0.10 • Se obtuvo una proporción muestral de p = 0.111. • Se busca determinar si esta diferencia con respecto al 0.10 es estadísticamente significativa.

Paso 2: CALCULO DEL ERROR ESTANDAR
El error estándar de la proporción mide la variabilidad esperada en diferentes muestras del mismo tamaño.
formula

• p = 0.111 • q = 1 - p = 0.889 • n = 912

Paso 3: PRUEBA ESTADISTICA

• Se utiliza una prueba de una cola (porque se quiere comprobar que p ≥ 0.10). • Los valores críticos dependen del nivel de confianza: 50% → K = 0.674 90% → k = 1.645 95% → k = 1.96 99% → k = 2.576

Intervalos de confianza: • 90%: 0.111 ± (1.645 × 0.0104) → [0.0939, 0.1280] • 95%: 0.111 ± (1.96 × 0.0104) → [0.0906, 0.1314]

Paso 4: Decisión

• El valor obtenido (0.111) cae dentro del intervalo de confianza, lo que indica que no se rechaza la hipótesis nula. • En otras palabras, no hay evidencia suficiente para afirmar que más del 10% de los padres inscribirían a sus hijos

CONCLUSION

• El resultado muestra que la diferencia entre 0.111 y 0.10 podría deberse al azar. • Se requiere una muestra más grande o un mayor cambio en la proporción para confirmar una diferencia real. • Este tipo de prueba ayuda a validar decisiones de mercado o educativas basadas en datos confiables.

Diferencia de medias

En el ejemplo de la Universidad de Córdoba, los directivos también plantean la hipótesis de que los alumnos que se inscriban deben estar dispuestos a pagar una colegiatura mensual de cuando menos 6000 pesos. Esta cifra se ha establecido a partir de que la universidad tiene la necesidad de percibir un mínimo de 1,200,000 pesos mensuales, que pueden provenir de 200 alumnos inscritos en el siguiente periodo escolar, cuyos padres puedan pagar la colegiatura mencionada.

Los padres entrevistados van a contestar que sólo pueden pagar menos de 6 000 pesos de colegiatura. Los padres entrevistados contestarán que pueden pagar 6 000 pesos o más de colegiatura.

u = 5683 pesos s= 1 441.10 pesos Para 90% de confianza: u士k (s) 5683 ‡1 645 (1441.10) 5683 + 2360.71 = 8043.71 5683 - 2360.71 = 3322.29

Para 95% de confianza u+ k (s) 5683 + 1.96 (1441.10) 5683 + 2824.56 = 8507.56 5683 - 0.0172 = 2628.44

probabilidad de que esté entre 2628 y 8508 pesos, lo cual abre mucho el rango de incertidumbre. Esto significaría que si la media de la muestra fue de 5683, habría que aceptar la hipótesis nula si, ya que este valor es mucho menor que el de la hipó-tesis planteada. Sin embargo, hay que recordar que el tamaño de muestra fue de sólo 191 padres de familia de los 450 que respondieron el cuestionario. Por ello, valdrá la pena ampliar el tamaño de muestra de 191 a 450, a fin de realizar una nueva prueba de hipótesis.

Gracias.

La distribución de frecuencias es una de las primeras formas de presentar la información para analizarla. Su objetivo es obtener el conteo de un número de respuestas asociadas con diferentes valores de una variable que se expresa en números o porcentajes. Una distribución de frecuencias para una variable produce una tabla de frecuencias.