Want to create interactive content? It’s easy in Genially!

Get started free

Evidencia

Erik Sebastián Arratia Rodríguez

Created on November 27, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Corporate Christmas Presentation

Snow Presentation

Vintage Photo Album

Nature Presentation

Halloween Presentation

Tarot Presentation

Winter Presentation

Transcript

ciencia de datos

Erik Arratia, hector grijalva, luis necochea, osvaldo villegas Y GERARDO AGUIRRE

comenzar

Contexto

Durante esta presentación, se les explicará el proceso mediante el cual se obtuvo la predicción del comportamiento de las acciones de Microsoft (MSFT) en la base de datos del S&P 500, considerando un rango histórico de 7 años. Para ello, se empleó un modelo de regresión lineal, el cual permitió analizar la relación entre variables clave, como precios históricos, tendencias del mercado y factores económicos, para generar estimaciones precisas sobre el comportamiento futuro de las acciones. Además, se destacarán los pasos seguidos en la construcción, entrenamiento y validación del modelo, así como los resultados obtenidos y su interpretación.

íNDICE

Bases de datos

01.

04.

Conceptos de Ciencia de Datos

07.

Origen de Base de Datos
Gráficos

02.

05.

Variables Totales y Utilizadas
Base de Datos
Funcionamiento

08.

03.

Conclusiones

06.

Conceptos de Base de Datos
Esquema de Codigo

09.

Conceptos de Ciencia de Datos

La ciencia de datos es un campo multidisciplinario que combina técnicas de estadística, programación, aprendizaje automático y análisis de datos para extraer conocimiento, patrones y perspectivas útiles a partir de datos estructurados

+conceptos

índice

Variables Totales y Variables Utilizadas
  • Periodos de Inicio y Fin
  • Cuentas por pagar
  • Cuentas por cobrar
  • Gastos de capital
  • Superávit de capital
  • Ratio de efectivo
  • Cambios en los inventarios
  • Costo de ingresos
  • Cargos diferidos por activos
  • Cargos por pasivos diferidos
  • Depreciación
  • Activos fijos
  • Beneficio bruto
  • Impuesto sobre la renta
  • Flujos de efectivo netos - Financiamiento
  • Utilidad neta aplicable a los accionistas comunes
  • Pasivos y patrimonio totales
  • Ganancias por acción
  • Acciones propias

índice

Conceptos de Base de Datos

La base de datos a analizar tiene un enfoque financiero, ya que, como se mencionó anteriormente, está centrada en el S&P 500. Por lo tanto, es importante mencionar algunos conceptos clave que son fundamentales para comprender y analizar este tipo de información.

+conceptos

índice

Origen de la Base de Datos

La base de datos analizada es un informe obtenido de Wall Street sobre las 500 empresas más importantes, conocido como el S&P 500. Los datos recopilados abarcan desde el año 2010 en adelante, lo que proporciona una visión amplia y detallada del desempeño de estas empresas durante un periodo significativo, permitiendo el análisis de tendencias financieras y la realización de predicciones basadas en este histórico.

índice

Base de Datos

índice

Librerías

Esquema de Código

CSV

Columnas

Todo el código fue desarrollado en Python, utilizando librerías especializadas como Pandas para la manipulación y análisis de datos, y Scikit-learn (sklearn) para la implementación de modelos de aprendizaje automático y técnicas de análisis avanzado.

r^2

Convertir

SIguiente

Pruebas

Esquema de Código

Resolver

Predicción

Todo el código fue desarrollado en Python, utilizando librerías especializadas como Pandas para la manipulación y análisis de datos, y Scikit-learn (sklearn) para la implementación de modelos de aprendizaje automático y técnicas de análisis avanzado.

índice

R^2 = 0.999703901833

Funcionamiento

Una base de datos diseñada para realizar una regresión lineal y predecir las acciones de Microsoft (MSFT) funciona recopilando datos relevantes, como precios históricos, volumen de transacciones e indicadores económicos. Estos datos se almacenan en tablas bien estructuradas y se procesan utilizando Python y librerías como Pandas para la limpieza y organización. Posteriormente, se aplica un modelo de regresión lineal con Scikit-learn, entrenándolo con datos históricos y validándolo para garantizar precisión. Finalmente, el modelo genera predicciones sobre los precios futuros basándose en las tendencias detectadas.

índice

Conclusiones

Conceptos de Ciencia de Datos

  • Recolección de Datos
  • Análisis de Datos
  • Validación de Datos
  • Predicción de Modelos
  • Optimización de Procesos
  • Diagnósticos
  • Bases de Datos
Todos estos conceptos son elementos fundamentales en el ámbito de la ciencia de datos, la estadística y la gestión de información.

Variables Utilizadas

  • Activos de Apertura (0.87)
  • Activos de Cierre (0.76)
  • Activos Mínimos (0.54)
  • Activos Máximos (0.38)
  • Volumen Total de Activos en Circulación (0.29)
  • Esas son las X
  • Y es el valor de Cierre de la Accion
Todas estas variables se obtuvieron específicamente de las acciones de MSFT

import numpy as npimport pandas as pd import matplotlib.pyplot as plt

Conceptos de Base de Datos

  • Coeficiente de determinación (Que tan preciso es)
  • Training on Balanced Datasets (Sirve para balancear nuestra muestra y poder trabajar con ella)
  • Sample Weights (Valores positivos asociados con las observaciones en base a una muestra)
  • Regresión lineal múltiple (Modelo estadístico para evaluar relaciones de un conjunto y asi obtener una predicción)

import numpy as npimport pandas as pd import matplotlib.pyplot as plt