Want to create interactive content? It’s easy in Genially!

Get started free

Presentazione Big Data & IOT

HU LORENZO

Created on November 24, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

PRESENTATION

BIG DATA

Hu Lorenzo e Soliman Antonio

Big Data

Vantaggi di Hadoop

Hadoop

L'Ecosistema Hadoop

INDICE

Google

Introduzione al Big Data

Definizione: Capacità di archiviare, elaborare e analizzare grandi quantità di dati. Origini dei dati: Macchine, multimedia, social network, transazioni. Evoluzione tecnologica: Cloud, mobile, social media. Obiettivo: Generare valore con tecnologie come il machine learning e l'intelligenza collettiva.

Google: Il Pioniere del Big Data

Innovazioni tecnologiche: Google File System (GFS): File system distribuito. MapReduce: Framework per l'elaborazione parallela. BigTable: Database non relazionale. Architettura: Data center modulari con server economici e software personalizzato. Impatto: Fondamenta dell’elaborazione distribuita e ispirazione per Hadoop.

Hadoop: L'Open-Source di Google

Origini: Ispirato alle tecnologie di Google. Componenti principali: HDFS: Archiviazione distribuita scalabile. MapReduce: Elaborazione parallela di dataset. YARN: Gestione avanzata delle risorse. HBase: Database NoSQL. Hive: Interfaccia SQL-like. Pig: Linguaggio di scripting.

Vantaggi di Hadoop

Economico: Funziona su hardware comune, riducendo i costi. Scalabile: Gestione di grandi dataset senza calo di prestazioni. Affidabile: Archiviazione ridondante per garantire continuità operativa. Flessibile: Supporto per dati strutturati e non strutturati.

L'Ecosistema Hadoop

Strumenti principali: Flume: Caricamento dati in HDFS. Sqoop: Scambio dati con database relazionali. Zookeeper: Sincronizzazione e coordinamento. Oozie: Pianificazione di flussi di lavoro. Hue: Interfaccia grafica user-friendly.

GRAZIE PER LA VOSTRA ATTENZIONE