COME FUNZIONA L'IA
COME FUNZIONA L'IA
Come funzionano i modelli linguistici e le reti neurali
TOMMASO MESSINA 3ESDIA
Introduzione
Chatbot, predictive text e assistenti virtuali si basano su modelli linguistici.Ognuno di questi modelli è costruito in modo diverso, ma tutti trasformano il linguaggio in numeri e poi di nuovo in linguaggio. I modelli linguistici memorizzano le probabilità su quali parole potrebbero seguire date le parole precedenti e calcolano queste probabilità analizzando sequenze di parole all’interno di un corpus.
COME FUNZIONA L'IA
Gli N-gram
Un n-gram è una sequenza di n parole consecutive in un testo.Le predizioni del modello si basano sulla parola che di solito segue il contesto considerato. Esistono modelli come l’unigram, che produce previsioni senza considerare il contesto, il bigram, che si basa solo sull’ultima parola, e il trigram, che utilizza due parole di contesto. All’aumentare del numero di n, il modello tiene conto di un contesto più ampio, ma diventa anche più rigido e difficile da applicare. Gli n-gram funzionano grazie ad algoritmi che decidono se considerare le parole singolarmente, in coppie o in gruppi più grandi. Tuttavia, questi modelli non riescono a collegare informazioni distanti tra loro e vengono quindi sostituiti da modelli più complessi come le reti neurali.
COME FUNZIONA L'IA
La Temperatura
Anche se i modelli linguistici di grandi dimensioni sono addestrati su enormi quantità di dati, possono generare risposte sempre nuove grazie a un parametro chiamato temperatura, che controlla il livello di casualità dell’output.Con una temperatura bassa, il modello produce testi coerenti e prevedibili; con una temperatura alta, le risposte diventano più creative ma anche meno sensate. Non esiste una temperatura ideale: per un modello che scrive lettere di presentazione è preferibile una temperatura bassa, mentre per la scrittura di poesie può essere utile un valore medio, che bilanci prevedibilità e originalità.
COME FUNZIONA L'IA
01
02
03
EPOCHE
LOSS
OVER FITTING
Durante l’addestramento, un modello analizza i dati più volte.Ogni passaggio completo attraverso il dataset è chiamato epoca.
All’inizio le sue previsioni sono casuali, ma con il tempo diventano più accurate.La differenza tra i valori previsti e quelli reali si chiama loss e rappresenta l’errore del modello.
Man mano che l’allenamento prosegue, la loss diminuisce, ma se si continua troppo a lungo, il modello finisce per imparare troppo bene i dati di partenza, ripetendoli senza generare nuove combinazioni: questo fenomeno si chiama overfitting.Per evitarlo, bisogna interrompere l’addestramento quando la loss smette di migliorare.
COME FUNZIONA L'IA
Il Preprocessing
Il Dataset Pulito
Il preprocessing consiste nel trattare capitalizzazione e punteggiatura.Nei modelli semplici questi elementi vengono rimossi per ridurre la complessità del vocabolario, mentre nei grandi modelli linguistici vengono mantenuti perché i dataset sono molto ampi. Alcuni algoritmi aggiungono simboli speciali all’inizio e alla fine di ogni frase per segnalarne i confini, oppure trattano i segni di punteggiatura come parole indipendenti. La capitalizzazione e la punteggiatura possono anche aiutare i modelli a riconoscere, ad esempio, email di spam.
Per addestrare un modello linguistico servono dati “puliti”.Questo processo prevede due fasi fondamentali:il preprocessing e la tokenizzazione.Nel preprocessing si prepara il testo da dare in pasto al modello, mentre nella tokenizzazione lo si scompone in unità chiamate token.
La Tokenizzazione
La tokenizzazione suddivide un testo in piccole unità chiamate token, che possono essere parole intere, parti di parole o segni di punteggiatura.Esistono vari metodi: quello basato sugli spazi bianchi, quello che separa radici e affissi e l’algoritmo Byte-Pair Encoding (BPE), usato nei moderni modelli linguistici. Questo metodo unisce progressivamente le coppie di lettere più comuni fino a formare un vocabolario di token. I modelli vengono poi addestrati su miliardi di questi token per imparare a generare testo coerente.
COME FUNZIONA L'IA
deep networks
Le reti neurali profonde sono modelli predittivi che trasformano gli input in previsioni.La loro forza risiede nel grande numero di parametri che possono adattarsi per rappresentare schemi complessi nei dati. GPT-4, ad esempio, contiene circa 1,7 trilioni di parametri. Un modello semplice come la regressione lineare può già fare previsioni basandosi su un pattern nei dati, ma le reti neurali possono riconoscere strutture molto più complesse. Durante l’addestramento, i parametri vengono continuamente modificati per ridurre l’errore e migliorare le previsioni.
COME FUNZIONA L'IA
La Discesa del Gradiente
L’algoritmo principale per addestrare le reti neurali si chiama discesa del gradiente.L’idea è semplice: seguire la direzione in cui la perdita diminuisce più rapidamente, come una palla che rotola giù per una collina fino al punto più basso. Ogni passo riduce un po’ la loss e migliora le prestazioni del modello. Tutte le reti neurali moderne si basano su questo principio o su sue varianti.
COME FUNZIONA L'IA
Le Reti Neurali
Le reti neurali artificiali si ispirano al cervello umano.Sono costituite da strati di nodi che elaborano i dati numerici e imparano a riconoscere schemi. Un esempio intuitivo è il riconoscimento dei colori in un’immagine: la rete può imparare a distinguere il rosso dal blu osservando molti esempi e identificando le caratteristiche che li separano. Una volta addestrata, può prevedere correttamente a quale gruppo appartiene un nuovo punto non ancora visto.
COME FUNZIONA L'IA
CONLCUSIONI
I moderni modelli di intelligenza artificiale combinano tecniche di tokenizzazione avanzata, reti neurali profonde e un addestramento accurato per generare testi coerenti, analizzare il linguaggio e fare previsioni sempre più simili a quelle umane.
Comprendere il loro funzionamento ci aiuta a usarli con consapevolezza e a coglierne i limiti, ma anche le straordinarie potenzialità.
GRAZIE PER L'ASCOLTO
TOMMASO MESSINA 3ESDIA
COME FUNZIONA L'IA
Tommy 2103
Created on October 22, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Dynamic Visual Presentation
View
Corporate Christmas Presentation
View
Customer Service Manual
View
Business Results Presentation
View
Meeting Plan Presentation
View
Business vision deck
View
Economic Presentation
Explore all templates
Transcript
COME FUNZIONA L'IA
COME FUNZIONA L'IA
Come funzionano i modelli linguistici e le reti neurali
TOMMASO MESSINA 3ESDIA
Introduzione
Chatbot, predictive text e assistenti virtuali si basano su modelli linguistici.Ognuno di questi modelli è costruito in modo diverso, ma tutti trasformano il linguaggio in numeri e poi di nuovo in linguaggio. I modelli linguistici memorizzano le probabilità su quali parole potrebbero seguire date le parole precedenti e calcolano queste probabilità analizzando sequenze di parole all’interno di un corpus.
COME FUNZIONA L'IA
Gli N-gram
Un n-gram è una sequenza di n parole consecutive in un testo.Le predizioni del modello si basano sulla parola che di solito segue il contesto considerato. Esistono modelli come l’unigram, che produce previsioni senza considerare il contesto, il bigram, che si basa solo sull’ultima parola, e il trigram, che utilizza due parole di contesto. All’aumentare del numero di n, il modello tiene conto di un contesto più ampio, ma diventa anche più rigido e difficile da applicare. Gli n-gram funzionano grazie ad algoritmi che decidono se considerare le parole singolarmente, in coppie o in gruppi più grandi. Tuttavia, questi modelli non riescono a collegare informazioni distanti tra loro e vengono quindi sostituiti da modelli più complessi come le reti neurali.
COME FUNZIONA L'IA
La Temperatura
Anche se i modelli linguistici di grandi dimensioni sono addestrati su enormi quantità di dati, possono generare risposte sempre nuove grazie a un parametro chiamato temperatura, che controlla il livello di casualità dell’output.Con una temperatura bassa, il modello produce testi coerenti e prevedibili; con una temperatura alta, le risposte diventano più creative ma anche meno sensate. Non esiste una temperatura ideale: per un modello che scrive lettere di presentazione è preferibile una temperatura bassa, mentre per la scrittura di poesie può essere utile un valore medio, che bilanci prevedibilità e originalità.
COME FUNZIONA L'IA
01
02
03
EPOCHE
LOSS
OVER FITTING
Durante l’addestramento, un modello analizza i dati più volte.Ogni passaggio completo attraverso il dataset è chiamato epoca.
All’inizio le sue previsioni sono casuali, ma con il tempo diventano più accurate.La differenza tra i valori previsti e quelli reali si chiama loss e rappresenta l’errore del modello.
Man mano che l’allenamento prosegue, la loss diminuisce, ma se si continua troppo a lungo, il modello finisce per imparare troppo bene i dati di partenza, ripetendoli senza generare nuove combinazioni: questo fenomeno si chiama overfitting.Per evitarlo, bisogna interrompere l’addestramento quando la loss smette di migliorare.
COME FUNZIONA L'IA
Il Preprocessing
Il Dataset Pulito
Il preprocessing consiste nel trattare capitalizzazione e punteggiatura.Nei modelli semplici questi elementi vengono rimossi per ridurre la complessità del vocabolario, mentre nei grandi modelli linguistici vengono mantenuti perché i dataset sono molto ampi. Alcuni algoritmi aggiungono simboli speciali all’inizio e alla fine di ogni frase per segnalarne i confini, oppure trattano i segni di punteggiatura come parole indipendenti. La capitalizzazione e la punteggiatura possono anche aiutare i modelli a riconoscere, ad esempio, email di spam.
Per addestrare un modello linguistico servono dati “puliti”.Questo processo prevede due fasi fondamentali:il preprocessing e la tokenizzazione.Nel preprocessing si prepara il testo da dare in pasto al modello, mentre nella tokenizzazione lo si scompone in unità chiamate token.
La Tokenizzazione
La tokenizzazione suddivide un testo in piccole unità chiamate token, che possono essere parole intere, parti di parole o segni di punteggiatura.Esistono vari metodi: quello basato sugli spazi bianchi, quello che separa radici e affissi e l’algoritmo Byte-Pair Encoding (BPE), usato nei moderni modelli linguistici. Questo metodo unisce progressivamente le coppie di lettere più comuni fino a formare un vocabolario di token. I modelli vengono poi addestrati su miliardi di questi token per imparare a generare testo coerente.
COME FUNZIONA L'IA
deep networks
Le reti neurali profonde sono modelli predittivi che trasformano gli input in previsioni.La loro forza risiede nel grande numero di parametri che possono adattarsi per rappresentare schemi complessi nei dati. GPT-4, ad esempio, contiene circa 1,7 trilioni di parametri. Un modello semplice come la regressione lineare può già fare previsioni basandosi su un pattern nei dati, ma le reti neurali possono riconoscere strutture molto più complesse. Durante l’addestramento, i parametri vengono continuamente modificati per ridurre l’errore e migliorare le previsioni.
COME FUNZIONA L'IA
La Discesa del Gradiente
L’algoritmo principale per addestrare le reti neurali si chiama discesa del gradiente.L’idea è semplice: seguire la direzione in cui la perdita diminuisce più rapidamente, come una palla che rotola giù per una collina fino al punto più basso. Ogni passo riduce un po’ la loss e migliora le prestazioni del modello. Tutte le reti neurali moderne si basano su questo principio o su sue varianti.
COME FUNZIONA L'IA
Le Reti Neurali
Le reti neurali artificiali si ispirano al cervello umano.Sono costituite da strati di nodi che elaborano i dati numerici e imparano a riconoscere schemi. Un esempio intuitivo è il riconoscimento dei colori in un’immagine: la rete può imparare a distinguere il rosso dal blu osservando molti esempi e identificando le caratteristiche che li separano. Una volta addestrata, può prevedere correttamente a quale gruppo appartiene un nuovo punto non ancora visto.
COME FUNZIONA L'IA
CONLCUSIONI
I moderni modelli di intelligenza artificiale combinano tecniche di tokenizzazione avanzata, reti neurali profonde e un addestramento accurato per generare testi coerenti, analizzare il linguaggio e fare previsioni sempre più simili a quelle umane. Comprendere il loro funzionamento ci aiuta a usarli con consapevolezza e a coglierne i limiti, ma anche le straordinarie potenzialità.
GRAZIE PER L'ASCOLTO
TOMMASO MESSINA 3ESDIA