Want to create interactive content? It’s easy in Genially!
Evidencia
Erik Sebastián Arratia Rodríguez
Created on November 27, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
ciencia de datos
comenzar
Erik Arratia, hector grijalva, luis necochea, osvaldo villegas Y GERARDO AGUIRRE
Contexto
Durante esta presentación, se les explicará el proceso mediante el cual se obtuvo la predicción del comportamiento de las acciones de Microsoft (MSFT) en la base de datos del S&P 500, considerando un rango histórico de 7 años. Para ello, se empleó un modelo de regresión lineal, el cual permitió analizar la relación entre variables clave, como precios históricos, tendencias del mercado y factores económicos, para generar estimaciones precisas sobre el comportamiento futuro de las acciones. Además, se destacarán los pasos seguidos en la construcción, entrenamiento y validación del modelo, así como los resultados obtenidos y su interpretación.
Conclusiones
09.
Funcionamiento
08.
íNDICE
Bases de datos
01.
Conceptos de Ciencia de Datos
02.
Variables Totales y Utilizadas
03.
Conceptos de Base de Datos
04.
Origen de Base de Datos
05.
Base de Datos
06.
Esquema de Codigo
07.
Gráficos
Conceptos de Ciencia de Datos
índice
+conceptos
La ciencia de datos es un campo multidisciplinario que combina técnicas de estadística, programación, aprendizaje automático y análisis de datos para extraer conocimiento, patrones y perspectivas útiles a partir de datos estructurados
- Utilidad neta aplicable a los accionistas comunes
- Pasivos y patrimonio totales
- Ganancias por acción
- Acciones propias
- Activos fijos
- Beneficio bruto
- Impuesto sobre la renta
- Flujos de efectivo netos - Financiamiento
- Cambios en los inventarios
- Costo de ingresos
- Cargos diferidos por activos
- Cargos por pasivos diferidos
- Depreciación
- Periodos de Inicio y Fin
- Cuentas por pagar
- Cuentas por cobrar
- Gastos de capital
- Superávit de capital
- Ratio de efectivo
Variables Totales y Variables Utilizadas
índice
Conceptos de Base de Datos
índice
+conceptos
La base de datos a analizar tiene un enfoque financiero, ya que, como se mencionó anteriormente, está centrada en el S&P 500. Por lo tanto, es importante mencionar algunos conceptos clave que son fundamentales para comprender y analizar este tipo de información.
La base de datos analizada es un informe obtenido de Wall Street sobre las 500 empresas más importantes, conocido como el S&P 500. Los datos recopilados abarcan desde el año 2010 en adelante, lo que proporciona una visión amplia y detallada del desempeño de estas empresas durante un periodo significativo, permitiendo el análisis de tendencias financieras y la realización de predicciones basadas en este histórico.
Origen de la Base de Datos
índice
Base de Datos
índice
Esquema de Código
Todo el código fue desarrollado en Python, utilizando librerías especializadas como Pandas para la manipulación y análisis de datos, y Scikit-learn (sklearn) para la implementación de modelos de aprendizaje automático y técnicas de análisis avanzado.
Librerías
CSV
Columnas
r^2
Convertir
SIguiente
Esquema de Código
Todo el código fue desarrollado en Python, utilizando librerías especializadas como Pandas para la manipulación y análisis de datos, y Scikit-learn (sklearn) para la implementación de modelos de aprendizaje automático y técnicas de análisis avanzado.
Pruebas
Resolver
Predicción
índice
R^2 = 0.999703901833
Una base de datos diseñada para realizar una regresión lineal y predecir las acciones de Microsoft (MSFT) funciona recopilando datos relevantes, como precios históricos, volumen de transacciones e indicadores económicos. Estos datos se almacenan en tablas bien estructuradas y se procesan utilizando Python y librerías como Pandas para la limpieza y organización. Posteriormente, se aplica un modelo de regresión lineal con Scikit-learn, entrenándolo con datos históricos y validándolo para garantizar precisión. Finalmente, el modelo genera predicciones sobre los precios futuros basándose en las tendencias detectadas.
Funcionamiento
índice
Conclusiones
- Recolección de Datos
- Análisis de Datos
- Validación de Datos
- Predicción de Modelos
- Optimización de Procesos
- Diagnósticos
- Bases de Datos
Conceptos de Ciencia de Datos
- Activos de Apertura (0.87)
- Activos de Cierre (0.76)
- Activos Mínimos (0.54)
- Activos Máximos (0.38)
- Volumen Total de Activos en Circulación (0.29)
- Esas son las X
- Y es el valor de Cierre de la Accion
Variables Utilizadas
import numpy as npimport pandas as pd import matplotlib.pyplot as plt
- Coeficiente de determinación (Que tan preciso es)
- Training on Balanced Datasets (Sirve para balancear nuestra muestra y poder trabajar con ella)
- Sample Weights (Valores positivos asociados con las observaciones en base a una muestra)
- Regresión lineal múltiple (Modelo estadístico para evaluar relaciones de un conjunto y asi obtener una predicción)
Conceptos de Base de Datos
import numpy as npimport pandas as pd import matplotlib.pyplot as plt