Want to create interactive content? It’s easy in Genially!

DSA M4 09 GEN Scatter plot Y Scatter matrix plot

contenido

Created on April 20, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Syllabus Organizer for Higher Education

Internal Guidelines for Artificial Intelligence Use

Math Mission

Simulation: How to Act Against Bullying

World Ecosystems

AI Diagnostic Survey for the Corporate Environment

Video: Keys to Effective Communication

Explore all templates

Scatter plot

Los diagramas de dispersión son un conjunto de puntos que muestran cómo dos variables se relacionan; es decir, a través de ellos es posible distinguir el grado de correlación entre dichas variables. Utiliza este tipo de diagrama cuando desees identificar si hay correlación positiva, negativa o nula entre las columnas del dataframe.

Cuando se ocupa la función scatter de matplotlib se especifican las columnas del dataframe a relacionar. Del dataframe countries que hemos estado ocupando, dos que seguramente tendrán correlación son la superficie territorial y la población.

plt.scatter(x=countries['SurfaceArea'], y=countries['Population'])

Para obtener los mismos resultados usando la función de Pandas, ocupa el siguiente código: countries.plot.scatter(x='SurfaceArea', y='Population',logx=True, logy=True)

Boxplot con Pandas

Seaborn ocupa en su lugar scatterplot: sns.scatterplot(x=np.log(countries['SurfaceArea']), y=np.log(countries['Population']))

Boxplot con Seaborn

Reflexiona

Los scatter plot te ayudarán a encontrar relaciones entre las variables o columnas que poseen tus bases de datos. Muchas veces estas relaciones no son perceptibles o evidentes al revisar información tabular. Aunque el análisis de correlación es un primer paso en los modelos de aprendizaje automático, los descubrimientos podrían sorprenderte. Repasa nuevamente tus fuentes de información, considerando incluso el resultado de vincularlas: ¿Qué pares de variables o columnas tienen una relación indiscutible para ti? ¿La correlación entre dicha información es positiva o negativa? ¿Qué ventajas podría sacar tu organización de un análisis con scatter plot?

¡Ahora es tu turno!

Para culminar este subtema, completa lo siguiente: Con el dataframe countries genera un scatter plot, utilizando la plataforma de trazado que desees, para mostrar la relación entre el GNP y la expectativa de vida (LifeExpectancy) y responde los siguientes cuestionamientos: ¿Los resultados obtenidos coinciden con lo que esperabas? ¿Tuviste que modificar la escala de tus ejes? Puedes calcular con exactitud el coeficiente de correlación entre estas dos variables con la función corr, como se indica a continuación: countries['GNP'].corr(countries['LifeExpectancy'])

Scatter plot matrix

Una scatter matrix plot es un conjunto de scatter plots presentados en un formato de matriz. Normalmente se combinan con heatmaps (mapas de calor) para mostrar el valor exacto del índice de correlación en cada intersección. Utiliza este tipo de diagrama cuando desees analizar la relación entre todos los posibles pares de columnas en el dataframe. En términos generales, matplotlib no suele contener funciones de trazado que operen en más de un objeto. Por tanto, para hacer una matriz de dispersión tendrías que construirla con subplots e ir añadiendo una a la vez. Sin embargo, Pandas y Seaborn sí la pueden construir con una sola llamada a una función.

Scatter matrix con Pandas

Scatter matrix con Seaborn

Reflexiona

Las scatter matrix plots son un excelente punto de partida cuando no tengas pistas ni sospechas sobre las relaciones que hay en tus datos; pues verifican entre todos los posibles pares de variables o columnas numéricas. Combínalas con heatmaps para validar, con resultados numéricos, el índice de correlación. Durante esta semana realiza este análisis con tus fuentes de información. Puedes hacerlo empleando un único archivo o combinando aquellos que puedan ser vinculados a través de una o más de sus columnas. Los resultados podrían impresionarte.

View

Syllabus Organizer for Higher Education

View

Internal Guidelines for Artificial Intelligence Use

View

Math Mission

View

Simulation: How to Act Against Bullying

View

World Ecosystems

View

AI Diagnostic Survey for the Corporate Environment

View

Video: Keys to Effective Communication

DSA M4 09 GEN Scatter plot Y Scatter matrix plot

Start designing with a free template

View

Syllabus Organizer for Higher Education

View

Internal Guidelines for Artificial Intelligence Use

View

Math Mission

View

Simulation: How to Act Against Bullying

View

World Ecosystems

View

AI Diagnostic Survey for the Corporate Environment

View

Video: Keys to Effective Communication

Transcript