Want to create interactive content? It’s easy in Genially!

Get started free

COME FUNZIONA L'IA

Tommy 2103

Created on October 22, 2025

Start designing with a free template

Discover more than 1500 professional designs like these:

Dynamic Visual Presentation

Corporate Christmas Presentation

Customer Service Manual

Business Results Presentation

Meeting Plan Presentation

Business vision deck

Economic Presentation

Transcript

COME FUNZIONA L'IA

COME FUNZIONA L'IA

Come funzionano i modelli linguistici e le reti neurali
TOMMASO MESSINA 3ESDIA

Introduzione

Chatbot, predictive text e assistenti virtuali si basano su modelli linguistici.Ognuno di questi modelli è costruito in modo diverso, ma tutti trasformano il linguaggio in numeri e poi di nuovo in linguaggio. I modelli linguistici memorizzano le probabilità su quali parole potrebbero seguire date le parole precedenti e calcolano queste probabilità analizzando sequenze di parole all’interno di un corpus.

COME FUNZIONA L'IA

Gli N-gram

Un n-gram è una sequenza di n parole consecutive in un testo.Le predizioni del modello si basano sulla parola che di solito segue il contesto considerato. Esistono modelli come l’unigram, che produce previsioni senza considerare il contesto, il bigram, che si basa solo sull’ultima parola, e il trigram, che utilizza due parole di contesto. All’aumentare del numero di n, il modello tiene conto di un contesto più ampio, ma diventa anche più rigido e difficile da applicare. Gli n-gram funzionano grazie ad algoritmi che decidono se considerare le parole singolarmente, in coppie o in gruppi più grandi. Tuttavia, questi modelli non riescono a collegare informazioni distanti tra loro e vengono quindi sostituiti da modelli più complessi come le reti neurali.

COME FUNZIONA L'IA

La Temperatura

Anche se i modelli linguistici di grandi dimensioni sono addestrati su enormi quantità di dati, possono generare risposte sempre nuove grazie a un parametro chiamato temperatura, che controlla il livello di casualità dell’output.Con una temperatura bassa, il modello produce testi coerenti e prevedibili; con una temperatura alta, le risposte diventano più creative ma anche meno sensate. Non esiste una temperatura ideale: per un modello che scrive lettere di presentazione è preferibile una temperatura bassa, mentre per la scrittura di poesie può essere utile un valore medio, che bilanci prevedibilità e originalità.

COME FUNZIONA L'IA

01
02
03

EPOCHE

LOSS

OVER FITTING

Durante l’addestramento, un modello analizza i dati più volte.Ogni passaggio completo attraverso il dataset è chiamato epoca.

All’inizio le sue previsioni sono casuali, ma con il tempo diventano più accurate.La differenza tra i valori previsti e quelli reali si chiama loss e rappresenta l’errore del modello.

Man mano che l’allenamento prosegue, la loss diminuisce, ma se si continua troppo a lungo, il modello finisce per imparare troppo bene i dati di partenza, ripetendoli senza generare nuove combinazioni: questo fenomeno si chiama overfitting.Per evitarlo, bisogna interrompere l’addestramento quando la loss smette di migliorare.

COME FUNZIONA L'IA

Il Preprocessing

Il Dataset Pulito

Il preprocessing consiste nel trattare capitalizzazione e punteggiatura.Nei modelli semplici questi elementi vengono rimossi per ridurre la complessità del vocabolario, mentre nei grandi modelli linguistici vengono mantenuti perché i dataset sono molto ampi. Alcuni algoritmi aggiungono simboli speciali all’inizio e alla fine di ogni frase per segnalarne i confini, oppure trattano i segni di punteggiatura come parole indipendenti. La capitalizzazione e la punteggiatura possono anche aiutare i modelli a riconoscere, ad esempio, email di spam.

Per addestrare un modello linguistico servono dati “puliti”.Questo processo prevede due fasi fondamentali:il preprocessing e la tokenizzazione.Nel preprocessing si prepara il testo da dare in pasto al modello, mentre nella tokenizzazione lo si scompone in unità chiamate token.

La Tokenizzazione

La tokenizzazione suddivide un testo in piccole unità chiamate token, che possono essere parole intere, parti di parole o segni di punteggiatura.Esistono vari metodi: quello basato sugli spazi bianchi, quello che separa radici e affissi e l’algoritmo Byte-Pair Encoding (BPE), usato nei moderni modelli linguistici. Questo metodo unisce progressivamente le coppie di lettere più comuni fino a formare un vocabolario di token. I modelli vengono poi addestrati su miliardi di questi token per imparare a generare testo coerente.

COME FUNZIONA L'IA

deep networks

Le reti neurali profonde sono modelli predittivi che trasformano gli input in previsioni.La loro forza risiede nel grande numero di parametri che possono adattarsi per rappresentare schemi complessi nei dati. GPT-4, ad esempio, contiene circa 1,7 trilioni di parametri. Un modello semplice come la regressione lineare può già fare previsioni basandosi su un pattern nei dati, ma le reti neurali possono riconoscere strutture molto più complesse. Durante l’addestramento, i parametri vengono continuamente modificati per ridurre l’errore e migliorare le previsioni.

COME FUNZIONA L'IA

La Discesa del Gradiente

L’algoritmo principale per addestrare le reti neurali si chiama discesa del gradiente.L’idea è semplice: seguire la direzione in cui la perdita diminuisce più rapidamente, come una palla che rotola giù per una collina fino al punto più basso. Ogni passo riduce un po’ la loss e migliora le prestazioni del modello. Tutte le reti neurali moderne si basano su questo principio o su sue varianti.

COME FUNZIONA L'IA

Le Reti Neurali

Le reti neurali artificiali si ispirano al cervello umano.Sono costituite da strati di nodi che elaborano i dati numerici e imparano a riconoscere schemi. Un esempio intuitivo è il riconoscimento dei colori in un’immagine: la rete può imparare a distinguere il rosso dal blu osservando molti esempi e identificando le caratteristiche che li separano. Una volta addestrata, può prevedere correttamente a quale gruppo appartiene un nuovo punto non ancora visto.

COME FUNZIONA L'IA

CONLCUSIONI

I moderni modelli di intelligenza artificiale combinano tecniche di tokenizzazione avanzata, reti neurali profonde e un addestramento accurato per generare testi coerenti, analizzare il linguaggio e fare previsioni sempre più simili a quelle umane. Comprendere il loro funzionamento ci aiuta a usarli con consapevolezza e a coglierne i limiti, ma anche le straordinarie potenzialità.

GRAZIE PER L'ASCOLTO

TOMMASO MESSINA 3ESDIA