Want to create interactive content? It’s easy in Genially!
Presentazione Big Data & IOT
HU LORENZO
Created on November 24, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
PRESENTATION
BIG DATA
Hu Lorenzo e Soliman Antonio
Big Data
Vantaggi di Hadoop
Hadoop
L'Ecosistema Hadoop
INDICE
Introduzione al Big Data
Definizione: Capacità di archiviare, elaborare e analizzare grandi quantità di dati. Origini dei dati: Macchine, multimedia, social network, transazioni. Evoluzione tecnologica: Cloud, mobile, social media. Obiettivo: Generare valore con tecnologie come il machine learning e l'intelligenza collettiva.
Google: Il Pioniere del Big Data
Innovazioni tecnologiche: Google File System (GFS): File system distribuito. MapReduce: Framework per l'elaborazione parallela. BigTable: Database non relazionale. Architettura: Data center modulari con server economici e software personalizzato. Impatto: Fondamenta dell’elaborazione distribuita e ispirazione per Hadoop.
Hadoop: L'Open-Source di Google
Origini: Ispirato alle tecnologie di Google. Componenti principali: HDFS: Archiviazione distribuita scalabile. MapReduce: Elaborazione parallela di dataset. YARN: Gestione avanzata delle risorse. HBase: Database NoSQL. Hive: Interfaccia SQL-like. Pig: Linguaggio di scripting.
Vantaggi di Hadoop
Economico: Funziona su hardware comune, riducendo i costi. Scalabile: Gestione di grandi dataset senza calo di prestazioni. Affidabile: Archiviazione ridondante per garantire continuità operativa. Flessibile: Supporto per dati strutturati e non strutturati.
L'Ecosistema Hadoop
Strumenti principali: Flume: Caricamento dati in HDFS. Sqoop: Scambio dati con database relazionali. Zookeeper: Sincronizzazione e coordinamento. Oozie: Pianificazione di flussi di lavoro. Hue: Interfaccia grafica user-friendly.