Inteligență artificială - Proiect PREVENT
Teorie
Începe
Teoria Inteligenței Artificiale
FG
Descoperiri în AI
Clasificarea imaginilor
Traducerea automată
Din 2015, computerele pot fi antrenate pentru a performa mai bine decât oamenii la sarcinile de clasificare a imaginilor.
Din 2016, am realizat performanțe aproape umane în traducerea între limbi folosind tehnici avansate de AI.
"Je suis étudiant"
Inteligența artificială este noua electricitate
"Aproximativ 100 de ani în urmă, electricitatea a transformat fiecare industrie majoră. Inteligența artificială a avansat până acolo încât are puterea de a transforma fiecare sector important în anii următori."
- Andrew Ng, Universitatea Stanford
Definiții
Inteligență Artificială
Cel mai larg concept
Învățare Automată
Un subset al AI
Învățare Profundă
Un subset al ÎA
Inteligență artificială
Definiție Merriam-Webster
Definiție Intel
"Un program care poate percepe, raționa, acționa și se adaptează."
"O ramură a informaticii care se ocupă cu simularea comportamentului inteligent în calculatoare."
Definiție Wikipedia
"În limbaj comun, termenul 'inteligență artificială' se aplică atunci când o mașină imită funcții 'cognitive' pe care oamenii le asociază cu alte minți umane, precum 'învățarea' și 'rezolvarea problemelor'."
Învățare automată
„Studiul și construcția de programe care nu sunt programate explicit, ci învață modele pe măsură ce sunt expuse la mai multe date în timp."
Învățare Automată
Date de Intrare
Seturi mari de date alimentează programul
Recunoaștere de Tipare
Programul identifică tipare fără programare explicită
Învățare
Sistemul se îmbunătățește cu mai multe exemple
Clasificare
Ia decizii pe date noi
Aceste programe învață din vederea repetată a datelor, mai degrabă decât fiind programate explicit de către oameni.
Terminologie de învățare automată
Caracteristici
Atributele datelor (coloanele de intrare)
Țintă
Coloana de prezis (ieșire)
Acest exemplu învață să clasifice o specie dintr-un set de caracteristici de măsurare.
Cele două principale tipuri de învățare automată
Învățare supravegheată
Învățare nesupravegheată
Set de date: Are o coloană țintă
Set de date: Nu are o coloană țintă
Scop: Realizează predicții
Scop: Găsește structură în date
Exemplu: Detectarea fraudei
Exemplu: Segmentarea clienților
Exemplu de Învățare Automată
Detecția Fraudelor
Caracteristici Cheie
Algoritmii ML pot identifica activități neobișnuite în tranzacțiile financiare.
Limitările în Învățarea Automată
Provocarea Ingineriei Caracteristicilor
Soluția Învățării Profunde
Pentru sarcini complexe, precum recunoașterea imaginilor, definirea caracteristicilor eficiente este dificilă.
Învățarea profundă depășește această limitare prin învățarea automată a celor mai relevante caracteristici din datele brute.
Ce caracteristici ai folosi pentru a diferenția o pisică de un câine?
Învățare profundă
"Învățarea automată care implică utilizarea unor modele foarte complicate numite 'rețele neuronale profunde'."
Modelele de învățare profundă determină cea mai bună reprezentare a datelor originale. În învățarea automată clasică, oamenii trebuie să creeze manual aceste caracteristici.
Exemplu de Învățare Profundă
Învățare Automată Clasică
Învățare Profundă
Pasul 1: Determină caracteristicile manual
Pașii 1 și 2 sunt combinați într-un singur pas
Pasul 2: Introdu-le în model
Rețeaua neuronală extrage automat caracteristicile relevante
Istoria AI
Algoritmi timpurii
Anii 1950-1960: S-au stabilit fundamentele AI
Prima iarnă AI
Sfârșitul anilor 1960-1970: Reduceri de fonduri după progrese limitate
Sisteme expert
Anii 1980: Sistemele bazate pe reguli au avut succes comercial
A doua iarnă AI
Sfârșitul anilor 1980-1990: Progrese limitate au dus la scăderea interesului
Învățarea automată
Anii 1990-2000: Abordările statistice au câștigat teren
Anii 2010-prezent: Rețeaua neuronală a revoluționat domeniul
Învățarea profundă
2010s-Present: Neural networks revolutionized the field
Anii 1950: AI timpurie
1950: Testul Turing
1956: Conferința Dartmouth
Alan Turing a dezvoltat un test pentru inteligența mașinilor
Inteligența artificială acceptată ca domeniu academic formal
1957: Perceptron
1959: Învățarea automată
Frank Rosenblatt a inventat precursorul rețelelor neuronale
Programul de dame al lui Arthur Samuel a învățat din experiență
Primul "Iarnă" a AI
1966: Raportul ALPAC
Comitetul a evaluat tehnicile AI pentru traducere automată și a constatat un randament slab al investiției
1969: Limitările perceptronului
Cartea lui Marvin Minsky a evidențiat limitările rețelelor neuronale, încetinind cercetarea
1973: Raportul Lighthill
A evidențiat eșecul AI de a îndeplini promisiunile, conducând la reduceri de finanțare
Impact
Aceste rapoarte au condus la reduceri semnificative ale finanțării guvernamentale pentru cercetarea AI
Boom-ul AI din anii 1980
Sisteme Expert
Sisteme cu reguli programate, concepute pentru a imita experții umani, au câștigat adopție comercială
Calculatoare mainframe
Rulează pe hardware specializat folosind limbaje precum LISP
Succes comercial
Două treimi din companiile Fortune 500 foloseau sisteme expert la apogeul lor
Revivalul rețelelor neuronale
În 1986, algoritmul "Backpropagation" a permis antrenarea rețelelor multilayer
O a doua iarnă a AI (sfârșitul anilor 1980 – începutul anilor 1990)
Integrarea tehnologică
Progresul a încetinit
Sistemele expert au devenit funcții în aplicațiile generale de afaceri
Impactul sistemelor expert asupra problemelor de afaceri a stagnat
Revoluția PC
Software-ul s-a mutat de pe mainframe-uri pe calculatoare personale
Dezinteres crescend
Probleme de scalare
Entuziasmul pentru AI în afaceri a scăzut semnificativ
Rețelele neuronale nu puteau gestiona probleme mari
Sfârșitul anilor 1990 până la începutul anilor 2000: Învățare automată clasică
Algoritmul SVM
Aplicații practice
Integrare
Mașina de vectori de suport a devenit metoda principală de învățare automată
Soluțiile AI au avut succes în recunoașterea vorbirii, diagnostic medical și robotică
Algoritmii AI au fost integrați în sisteme mai mari din diverse industrii
2006: Ascensiunea Învățării Profunde
2006
Geoffrey Hinton publică un articol revoluționar despre pre-antrenamentul nesupravegheat pentru rețele neuronale mai profunde
2009
Baza de date ImageNet cu imagini etichetate de oameni prezentată la conferința CVPR
2010
Prima competiție ImageNet lansează algoritmi care concurează în sarcini de recunoaștere vizuală
Rebranding
Rebranding-ul rețelelor neuronale ca "învățare profundă" pentru a reflecta potențialul lor reînnoit
Revoluții în Învățarea Profundă (2012 – Prezent)
2012
2013
2014
Modelele de învățare profundă depășesc dramatic metodele anterioare în competiția ImageNet
Modelele de învățare profundă încep să înțeleagă "sensul conceptual" al cuvintelor
Apari avansuri similare în sarcinile de traducere a limbajului
Impact
Progresele au dus la îmbunătățiri în căutarea pe web, căutarea de documente, rezumat și traducere
Realizări în Învățarea Profundă (2012 – Prezent)
2014
Algoritmii de viziune computerizată încep să învețe să descrie fotografiile cu limbaj natural
2015
Google lansează TensorFlow, făcând instrumentele de învățare profundă accesibile pe scară largă
2016
AlphaGo de la DeepMind învinge maestrul de GO Lee Se-dol, o realizare importantă
Impact
Aceste realizări au demonstrat capacitatea AI de a stăpâni sarcini considerate anterior a necesita intuiție umană
Inteligența artificială modernă (2012 – Prezent): Impactul învățării profunde
Mașini autonome
Sănătate
Comunicare
Detecția avansată a obiectelor permite navigarea autonomă în medii complexe
Sistemele AI îmbunătățesc acuratețea diagnosticelor în diverse specialități medicale
Sistemele de traducere neurală ating calitatea umană în multe perechi de limbi
Cum este diferită această eră a AI?
Calculatoare mai rapide
Puterea de calcul modernă, în special GPU-urile, permite antrenarea modelelor complexe
Seturi de date mai mari
Colectarea de date la scară largă pe internet furnizează resurse vaste pentru antrenament
Rețele neuronale avansate
Arhitecturi sofisticate pot învăța modele complexe autonom
Rezultate interdisciplinare
Progresele AI beneficiază mai multe domenii simultan
Alți factori AI moderni
Ecosistemul open source
Biblioteci open source
Date deschise
Seturile de date mari etichetate permit antrenarea unor modele mai sofisticate
Instrumentele bazate pe Python au democratizat accesul la învățarea automată
Cadrul de învățare profundă de top sunt disponibile gratuit pentru cercetători și dezvoltatori
Cercetare colaborativă
Colaborarea între mediul academic și industrie accelerează progresul
Schimbări transformative în domeniul sănătății
Diagnostice îmbunătățite
Descoperirea medicamentelor
Îngrijirea pacientului
- Sistemele AI analizează imaginile medicale cu acuratețe de nivel expert
- AI accelerează identificarea compușilor terapeutici potențiali
- Sistemele de monitorizare detectează schimbări subtile în condiția pacientului
- Detecția timpurie a condițiilor îmbunătățește rezultatele tratamentului
- Reduce timpul de dezvoltare de la ani la luni
- Algoritmii predictivi identifică pacienți cu risc crescut
- Reduce erorile de diagnostic și îmbunătățește îngrijirea pacientului
- Permite abordări personalizate în medicină
- Asistenți virtuali sprijină gestionarea pacientului
Schimbări transformatoare în finanțe
Tranzacționare algoritmică
Sistemele AI iau decizii de tranzacționare la viteză mare bazate pe modele de piață
Detecția fraudei
Modelele ML identifică tranzacțiile suspecte cu mare acuratețe
Evaluarea riscurilor
AI evaluează cererile de împrumut și oportunitățile de investiții
Finanțe personale
Chatboți și robo-advisors oferă ghidaj financiar
Schimbări transformative în guvern
24/7
Servicii pentru cetățeni
Sisteme bazate pe AI oferă asistență non-stop cetățenilor
50%
Câștiguri de eficiență
Automatizarea proceselor reduce costurile administrative și timpul
90%
Detectarea amenințărilor
Sistemele AI identifică riscurile de securitate cu mare precizie
75%
Optimizarea resurselor
Aplicațiile pentru orașe inteligente îmbunătățesc gestionarea resurselor urbane
Schimbări Transformatoare în Transport
Vehicule Autonome
Optimizarea Logisticii
Răspuns de Urgență
Mașinile autonome folosesc AI pentru a naviga în medii complexe în siguranță
Sistemele AI gestionează flote și optimizează rutele de livrare
Dronele și roboții asistă în operațiuni de căutare și salvare
Învățare supravegheată
Date etichetate
Antrenarea modelului
Setul de date include caracteristici de intrare și ieșirea dorită
Algoritmul învață modele între intrări și ieșiri
Evaluare
Previziune
Performanța evaluată pe datele de testare reținute
Modelul antrenat aplicat pe date noi, nevăzute
Învățare Automată
Tip
Set de date
Învățare Supravegheată
Punctele de date au rezultat cunoscut
Învățare Nesupravegheată
Punctele de date au rezultat necunoscut
Studiul și construcția programelor care învață din vizionarea repetată a datelor, mai degrabă decât să fie programate explicit de către oameni.
Ținta vs. Caracteristici
Caracteristici
Țintă
Proprietățile datelor utilizate pentru predicție (coloane non-țintă)
Coloana de prezis - rezultatul de interes
- Variabile de intrare pe care le folosește modelul
- Variabila de ieșire pe care modelul învață să o prezică
- În gestionarea situațiilor de urgență: date despre vreme, densitatea populației, starea infrastructurii
- În gestionarea situațiilor de urgență: nivelul riscului de inundație, necesitatea evacuării, resursele necesare
Exemplu: Problema de Învățare Supravegheată
Scop
Prezice dacă un email este spam sau nu
Date
Email-uri istorice etichetate ca spam sau nu spam
Caracteristici
Textul email-ului, subiectul, timpul trimiterii, informații despre expeditor
Țintă
Clasificare binară: spam sau nu spam
Exemplu: Problema de învățare supravegheată
Detecția obiectelor pentru răspuns de urgență
Sistemele AI pot identifica persoane, vehicule și structuri avariate în zonele de dezastru.
- Obiectiv: Prezicerea locației cutiilor de delimitare în jurul obiectelor
- Date: Imagini cu locațiile de cutii de delimitare annotate
- Caracteristici: Pixelii și modelele imaginilor
- Țintă: Coordonatele cutiilor de delimitare ale obiectelor
Aplicații pentru managementul situațiilor de urgență
Detectarea dezastrelor
Predicția riscurilor
Alocarea resurselor
AI poate analiza rapid imaginile din satelit și drone pentru a identifica impactul și severitatea dezastrelor
Modelele ML pot prezice traiectoriile dezastrelor bazându-se pe date despre vreme și teren
AI optimizează resursele de răspuns la urgențe bazându-se pe evaluarea nevoilor în timp real
Formularea unei probleme de învățare supravegheată
Colectează set de date etichetat
Adună date cu caracteristici și etichete țintă relevante pentru problema ta
Alege un model
Selectează algoritmul cel mai potrivit pentru tipul tău de date și problemă
Definește metricile de evaluare
Stabilește modul de măsurare a performanței în funcție de obiectivele tale specifice
Selectează metoda de optimizare
Alege modul de găsire a configurației modelului care maximizează performanța
Care Model?
Decizie Arbore
Cel Mai Apropiat Vecin
Rețea Neuronală
Face predicții prin punerea unei serii de întrebări da/nu despre caracteristici
Face predicții bazate pe similaritatea cu exemplele de antrenament
Face predicții folosind straturi interconectate de neuroni artificiali
Care Model?
Atunci când alegi un model pentru aplicații de gestionare a situațiilor de urgență, ia în considerare acești factori cheie. Complexitatea problemei și cerințele de date depășesc adesea alte considerente datorită naturii critice a răspunsului de urgență.
Măsurătoarea de evaluare
Precizie
Eroarea medie pătratică
Alte măsurători
Proporția predicțiilor corecte
Diferența medie pătratică între predicții și valori reale
- Precizie: Acuratețea predicțiilor pozitive
Util când clasele sunt echilibrate
- Recall: Capacitatea de a găsi toate cazurile pozitive
Folosit pentru probleme de regresie
- F1-Score: Media armonică a preciziei și recall-ului
- AUC-ROC: Aria sub curba caracteristicii receptorului
Măsurătoarea de evaluare
Metoda greșită poate fi înșelătoare
În managementul situațiilor de urgență
Luați în considerare utilizarea acurateței pentru detectarea spamului cu 99% emailuri spam. Un model care prezice "spam" pentru fiecare email ar avea 99% acuratețe, dar ar putea rata emailuri legitime importante.
Fals negative (omisiunea unei urgențe) sunt adesea mai costisitoare decât fals positive (alerte false). Măsurătorile ar trebui să reflecte acest cost asimetric.
Contextul contează
Alegeți măsurători care se aliniază cu impactul real al predicțiilor. Pentru deciziile de evacuare, recall-ul (identificarea tuturor cazurilor care necesită evacuare) poate fi mai important decât precizia.
Instruire
Date de instruire
Optimizare
Pentru managementul situațiilor de urgență
Setul de date utilizat pentru a învăța modelul modele între caracteristici și ținte
Procesul de configurare a modelului pentru cea mai bună performanță
Modelele trebuie să fie antrenate pe scenarii diverse pentru a gestiona natura imprevizibilă a dezastrelor
- Situații de urgență istorice cu rezultate
- Ajustează parametrii modelului pentru a minimiza erorile
- Scenarii de dezastre sintetice
- Folosește algoritmi precum gradient descent
- Date din simulări și exerciții
- Poate necesita mai multe iterații
Antrenament
Date de intrare
Exemplele etichetate sunt introduse în model
Pasul înainte
Modelul generează predicții bazate pe configurația curentă
Calculul erorii
Se măsoară diferența dintre predicții și țintele reale
Pasul înapoi
Parametrii modelului sunt ajustați pentru a reduce erorile
Itarație
Procesul se repetă până când performanța nu se mai îmbunătățește
Inferență
Date noi
Exemplele nevăzute sunt furnizate modelului antrenat
Procesare
Modelul aplică modelele învățate pentru a analiza datele
Previziune
Modelul generează rezultate bazate pe antrenamentul său
Decizie
Previziunile informează acțiunile de gestionare a situațiilor de urgență
Antrenament vs. Inference
Aspect
Antrenament
Inferență
Obiectiv
Învățarea modelelor din date
Aplicarea modelelor pe date noi
Intrare
Date etichetate (caracteristici + ținte)
Date neetichetate (doar caracteristici)
Ieșire
Parametrii modelului antrenat
Predicții
Calcul
Intensiv, adesea necesită GPU-uri
Relativ ușor
Deplasare
De obicei offline, în dezvoltare
În timp real, în producție
Prezentare generală a învățării supravegheate
Faza de antrenament
Faza de inferență
Date cu răspunsuri + Model → Model antrenat
Date noi + Model antrenat → Predicții
Evaluare
Refinare
Compară predicțiile cu rezultatele reale
Îmbunătățește modelul pe baza performanței
Scopul final este de a dezvolta un model care performează bine pe date nevăzute, făcând predicții fiabile în situații de urgență noi.
Exemplu de management al situațiilor de urgență
Previziune incendii de vegetație
Evaluarea riscului de inundații
Evaluarea daunelor
Modelele AI prezic răspândirea incendiilor în funcție de vreme, vegetație și topografie
Algoritmii ML estimează probabilitatea de inundații folosind date despre precipitații și teren
Algoritmii de viziune computerizată identifică rapid daunele structurale după cutremure
Ajustarea curbei: Exempel de supraînvățare vs. subînvățare
Obiectiv
Provocare
Potrivește o curbă cu punctele de date pentru a modela relația de bază
Găsirea complexității potrivite pentru model pentru a captura adevărata relație fără a se potrivi zgomotului
În gestionarea situațiilor de urgență: modelează relația dintre condițiile meteorologice și severitatea inundațiilor
Potrivirea curbei: Exemplar de subpotrivire
Curba Este Prea Simplă
Modelul nu reușește să captureze modele importante din date
Performanță slabă în antrenament
Eroare ridicată chiar și pe datele folosite pentru antrenament
Performanță slabă la testare
Nu poate generaliza situații noi
În managementul situațiilor de urgență
Un model subpotrivit poate rata semnele critice ale unui dezastru iminent
Potrivirea curbei: Exemplu de supraînvățare
Curba este prea complexă
Modelul capturează zgomotul aleatoriu în loc de modele reale
Performanță excelentă în antrenament
Aproape perfectă potrivire cu datele de antrenament
Performanță slabă la testare
Nu poate generaliza la situații noi
În managementul situațiilor de urgență
Un model supraînvățat poate genera alarme false sau poate omite situații de urgență reale în condiții ușor diferite
Problema de ajustare a curbei
Provocare
Risc
Pentru gestionarea situațiilor de urgență
Datele nevăzute nu sunt disponibile în timpul antrenamentului, ceea ce face dificilă evaluarea performanței în scenarii noi
Când se măsoară performanța doar pe datele de antrenament, modelele tind să se potrivească excesiv
Găsirea echilibrului corect este crucială - modelele trebuie să generalizeze la scenarii noi de dezastre, menținând sensibilitatea la semnele de avertizare
Soluție: Împărțirea datelor în două seturi
Set de antrenament
Set de testare
Date folosite pentru învățarea modelului
Date folosite pentru evaluarea performanței
- 70-80% din datele disponibile
- 20-30% din datele disponibile
- Folosit pentru ajustarea parametrilor modelului
- Simulează scenarii nevăzute
- Modelul vede aceste date în timpul învățării
- Modelul nu vede aceste date în timpul antrenamentului
Împărțirea Antrenament-Test
Faza de Antrenament
Ajustarea Greutății Modelului
Faza de Testare
Evaluarea Performanței
Modelul învață modele din datele de antrenament
Modelul antrenat este evaluat pe date de test nevăzute anterior
Parametrii optimizați pe baza performanței de antrenament
Rezultatele testului estimează performanța în lumea reală
Această abordare simulează modul în care modelul va performa în situații de urgență reale, pe care nu le-a întâlnit anterior.
Validarea încrucișată pentru modelele de urgență
Împărțirea datelor
Iterează
Antrenează pe toate fold-urile, testând pe fold-ul rămas
Divizează setul de date în mai multe fold-uri
Rotire
Medie
Repetă folosind fold-ul diferit ca set de test
Calculează performanța pe toate iterațiile
Validarea încrucișată oferă o estimare mai robustă a performanței, fiind deosebit de importantă pentru modelele de gestionare a situațiilor de urgență, unde datele pot fi limitate și variabilitatea ridicată.
Învățare profundă
"Învățarea automată care implică utilizarea unor modele foarte complicate numite 'rețele neuronale profunde'."
Aceste modele sofisticate determină automat cea mai bună reprezentare a datelor, eliminând necesitatea ingineriei manuale a caracteristicilor, pe care o necesită în mod tradițional în învățarea automată.
Diferențe între Învățarea Profundă
Învățarea Mașinii Clasică
Învățarea Profundă
Doi pași distincti:
Abordare integrată:
- Oamenii determină manual caracteristicile
- Extracția caracteristicilor și modelarea combinate
- Caracteristicile sunt introduse în model
- Datele brute procesate prin multiple straturi
- Fiecare strat învață caracteristici din ce în ce mai abstracte
Tipuri de probleme în învățarea profundă
Analiza imaginilor
- Clasificarea tipurilor de dezastre
- Detecție de obiecte în zonele afectate
- Segmentare semantică a zonelor de deteriorare
Procesarea limbajului natural
- Monitorizarea rețelelor sociale pentru rapoarte de urgență
- Analiza sentimentelor în timpul crizelor
- Comunicare automată de urgență
Analiza seriilor temporale
- Predicția modelelor meteorologice
- Monitorizarea datelor senzorilor
- Forecasting-ul răspândirii epidemiei
Recunoașterea vorbirii
- Procesarea apelurilor de urgență
- Sisteme de răspuns activate vocal
- Suport pentru comunicare multilingvă
Clasificare și Detecție
Detecție Obiecte
Aplicații de Urgență
Procesare în Timp Real
Localizează și identifică obiecte specifice în imagini sau cadre video
Identifică victime, structuri avariate, drumuri blocate și vehicule de urgență
Permite răspuns rapid la situații în evoluție
Segmentare semantică
Clasificare la nivel de pixel
Etichetează fiecare pixel dintr-o imagine, creând hărți detaliate ale diferitelor elemente
În gestionarea situațiilor de urgență:
- Evaluare precisă a daunelor
- Cartografiere precisă a extinderii inundațiilor
- Detecție detaliată a limitei incendiilor de vegetație
- Identificarea zonelor sigure față de zonele periculoase
Recuperarea obiectelor din limbaj natural
Căutare vizuală ghidată de text
Aplicații de urgență
Gestionarea resurselor
Sistemele pot localiza obiecte în imagini pe baza descrierilor în limbaj natural
Permite operațiuni de căutare și salvare bazate pe descrierile martorilor
Identifică rapid infrastructura sau resursele specifice necesare în timpul răspunsului
Recunoaștere vocală și traducere în limbaj
Comunicare între limbi
Procesarea apelurilor de urgență
Comenzi vocale
Operare hands-free a sistemelor de urgență prin recunoaștere vocală
AI permite comunicarea eficientă între răspunsători și populația afectată, indiferent de barierele lingvistice
Transcrierea și analiza automată a apelurilor de urgență ajută la prioritizarea răspunsului
Comunicare radio
Transcriere în timp real a comunicațiilor radio din teren pentru centrele de coordonare
Rețea complet conectată
FG
Formularea instrumentelor de învățare supravegheată
Colectarea setului de date
Adunați caracteristici și etichete țintă care reprezintă problema pe care o rezolvați.
Selecția modelului
Alegeți o arhitectură potrivită în funcție de tipul problemei dvs.
Metrica de evaluare
Definiți modul în care veți măsura performanța și succesul.
Metoda de optimizare
Stabiliți modul în care veți găsi configurația optimă a modelului.
Ce model?
Modelele diferite reprezintă probleme în mod unic, fiecare având avantaje distincte pentru scenarii specifice.
Inspirație biologică
Blocuri de construcție ale neuronilor
Modelele de învățare profundă se inspiră din creierul uman și din structura sa neurală.
Componenta centrală a rețelelor neuronale este neuronul artificial, care procesează intrările în rezultate semnificative.
Mecanica neuronilor
Caracteristici de intrare
X1, X2, X3 sunt intrări numerice care reprezintă caracteristicile datelor.
Sumă ponderată
Fiecare intrare este multiplicată cu o greutate (W1, W2, W3), apoi însumată.
Valoarea de ieșire
Z = X1W1 + X2W2 + X3W3 reprezintă rezultatul calculului ponderat.
Funcții de activare
Scop
Varietate
Non-liniaritate
Transformă suma ponderată într-o valoare de ieșire semnificativă.
Există mai multe funcții, fiecare cu proprietăți matematice specifice.
Majoritatea funcțiilor de activare introduc proprietăți non-lineare, permițând învățarea modelelor complexe.
Modelul Perceptron
Semnificație Istorică
Separare Liniară
Arhitectură Simplă
Unul dintre cele mai vechi modele de rețea neuronală, dezvoltat în anii 1950.
Poate rezolva doar probleme în care clasele pot fi separate printr-o linie dreaptă.
Folosește funcții de activare de bază pentru a clasifica intrările în categorii binare.
Limitările Perceptronului
Probleme Non-Lineare
Problema XOR
Catalizator pentru Iarnă AI
Perceptronii eșuează atunci când punctele de date nu pot fi separate de o singură linie.
Un exemplu faimos în care perceptronii eșuează, necesitând multiple limite de decizie.
Această limitare a contribuit la reducerea interesului și finanțării în cercetarea rețelelor neuronale.
Rețele complet conectate
Stratul de ieșire
Predicții finale
Straturi ascunse
Extracție complexă de caracteristici
Stratul de intrare
Caracteristici ale datelor brute
Rețelele complet conectate organizează neuronii în straturi. Fiecare neuron se conectează la fiecare neuron din straturile adiacente. Fiecare conexiune are o greutate separată. Această structură permite rezolvarea problemelor complexe, non-lineare, transformând datele prin straturi succesive.
Arhitectură de Învățare Profundă
Compresia Caracteristicilor
Procesarea Intrării
Fiecare strat rezumă informații importante
Datele brute intră în rețea
Extracția Relevanței
Generarea Rezultatului
Se identifică modele specifice sarcinii
Predicțiile finale apar
Învățarea profundă utilizează multe straturi, deseori reducându-se în lățime. Arhitecturile moderne pot conține sute de straturi, fiecare extrăgând caracteristici din ce în ce mai abstracte din date.
Construirea unei rețele complet conectate
Arhitectura rețelei
Definește straturile și neuronii
Funcții de activare
Alege funcțiile potrivite
Măsurători de evaluare
Selectează măsurile de performanță
Antrenarea ponderilor
Învață parametrii optimi
Când creezi o rețea neuronală, trebuie să decizi numărul de straturi, neuronii pe strat și funcțiile de activare potrivite. Greutățile modelului sunt învățate automat în timpul antrenamentului.
Metrici de evaluare
Regresie
Clasificare
Multi-etichetă
Eroarea medie pătratică (MSE) măsoară diferența pătratică medie între predicții și valorile reale.
Eroarea încrucișată categorică măsoară cât de bine prezice modelul probabilitățile claselor.
Eroarea binară încrucișată evaluează acuratețea predicției atunci când elementele pot aparține mai multor clase.
Limitări ale rețelelor complet conectate
10^9+
Numărul de parametri
Rețelele mari pot conține miliarde de greutăți.
TB
Utilizarea memoriei
Necesar semnificativ de RAM pentru antrenare și inferență.
100x
Calcul
Este nevoie de mult mai multă putere de procesare decât modelele mai simple.
Scăzută
Detecția caracteristicilor
Nu este optim pentru modele spațiale în imagini sau secvențe.
CNN: Revoluție în procesarea vizuală
Rețelele neuronale convoluționale reprezintă o schimbare fundamentală în modul în care computerele procesează informațiile vizuale. Inspirate de sistemele vizuale biologice, CNN-urile au transformat recunoașterea imaginilor, detectarea obiectelor și multe alte sarcini vizuale.
Rețele neuronale convoluționale
Conexiuni localizate
Partajare de greutăți
Fiecare neuron se conectează doar la o regiune mică a stratului anterior.
Aceeași set de greutăți se aplică pe întregul input.
Caracteristici spațiale
Eficiență în utilizarea resurselor
Excelent la recunoașterea modelelor indiferent de poziție.
Necesită mai puține conexiuni decât rețelele complet conectate.
Convoluțiile ca Detectoare de Caracteristici
Detector de Linii Verticale Detector de Linii Orizontale
Detector de Colțuri
Convoluțiile acționează ca detectoare locale de caracteristici care identifică modele specifice. Fiecare filtru răspunde la diferiți elemente vizuale din imaginea de intrare.
Operație de convoluție
Aplicare filtru
Crearea hărții de caracteristici
Câmpul de convoluție alunecă peste imaginea de intrare, realizând multiplicarea element cu element și sumarea.
Rezultatul este o imagine nouă care evidențiază unde apar caracteristicile specifice în intrarea originală.
Arhitectură CNN
Strat de intrare
Datele brute ale imaginii intră în rețea pentru procesare.
Straturi convoluționale
Filtre multiple extrag caracteristici variate din intrare.
Straturi de pooling
Reduce dimensiunea hărților de caracteristici pentru a diminua încărcătura computațională.
Straturi complet conectate
Combină caracteristicile extrase pentru clasificare finală sau regresie.
Învățarea prin transfer: Construind pe urmele giganților
Învățarea prin transfer valorifică rețele neuronale pre-antrenate pentru a rezolva probleme noi cu date limitate. Prin reutilizarea cunoștințelor din modelele existente, putem obține rezultate excelente mai eficient.
Provocări în dezvoltarea CNN
Cerinte de date
Antrenarea eficientă a CNN-urilor necesită de obicei seturi de date uriașe, cu milioane de exemple.
Cereri computaționale
Antrenarea modelului poate dura zile sau săptămâni, chiar și cu hardware GPU specializat.
Ajustarea hiperparametrilor
Găsirea configurațiilor optime ale rețelei implică experimente extinse.
Barieră de expertiză
Construirea unor modele competitive de la zero necesită cunoștințe tehnice profunde.
Principiile Învățării Transferului
Caracteristici ale Stratelor Timpurii
Caracteristici ale Stratelor Mijlocii
Specificitatea Stratelor Ulterioare
Straturile inițiale învață caracteristici vizuale universale precum muchii, colțuri și texturi. Acestea durează cel mai mult pentru a fi antrenate, dar se aplică în majoritatea sarcinilor de imagine.
Straturile mijlocii combină caracteristici primitive în forme și modele mai complexe. Acestea au o specificitate moderată pentru sarcină.
Straturile finale învață caracteristici foarte specifice sarcinii. Acestea răspund rapid la antrenament și sunt cele mai adaptabile pentru sarcini noi.
Beneficiile învățării transferului
Cerere redusă de date
Antrenament mai rapid
Performanță mai bună
Ajustarea fină durează ore în loc de săptămâni, comparativ cu antrenamentul de la zero.
Rețelele pre-antrenate necesită mult mai puține date pentru a se adapta noilor sarcini.
Modelele construite pe arhitecturi consacrate adesea obțin rezultate superioare.
Portabilitate
Greutățile antrenate sunt ușor stocate și partajate pentru implementare.
Implementarea Învățării prin Transfer
Selectează Modelul de Bază
Alege o rețea pre-antrenată precum ResNet, VGG sau EfficientNet.
Îngheață Primele Straturi
Blochează greutățile în straturile timpurii pentru a păstra detectarea generală a caracteristicilor.
Înlocuiește Straturile de Clasificare
Adaugă straturi noi specifice sarcinii tale (de exemplu, detectarea urgențelor).
Ajustare fină pe datele țintă
Antrenează straturile noi menținând straturile înghețate fixe.
os
Strategii de ajustare fină
Timp de antrenament
Date necesare
Performanță
Diagrama compară diferite abordări de ajustare fină pe scale relative (1-10). Luați în considerare datele disponibile, resursele de calcul și cerințele de performanță atunci când alegeți o strategie. Pentru sistemele de detectare a urgențelor, "Ultimele câteva straturi" oferă adesea cel mai bun echilibru.
PREVENT Artificial Intelligence Theory (UVIGO) - RO
Cristina López Bravo
Created on November 7, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Essential Business Proposal
View
Project Roadmap Timeline
View
Step-by-Step Timeline: How to Develop an Idea
View
Artificial Intelligence History Timeline
View
Momentum: First Operational Steps
View
Momentum: Employee Introduction Presentation
View
Mind Map: The 4 Pillars of Success
Explore all templates
Transcript
Inteligență artificială - Proiect PREVENT
Teorie
Începe
Teoria Inteligenței Artificiale
FG
Descoperiri în AI
Clasificarea imaginilor
Traducerea automată
Din 2015, computerele pot fi antrenate pentru a performa mai bine decât oamenii la sarcinile de clasificare a imaginilor.
Din 2016, am realizat performanțe aproape umane în traducerea între limbi folosind tehnici avansate de AI.
"Je suis étudiant"
Inteligența artificială este noua electricitate
"Aproximativ 100 de ani în urmă, electricitatea a transformat fiecare industrie majoră. Inteligența artificială a avansat până acolo încât are puterea de a transforma fiecare sector important în anii următori."
- Andrew Ng, Universitatea Stanford
Definiții
Inteligență Artificială
Cel mai larg concept
Învățare Automată
Un subset al AI
Învățare Profundă
Un subset al ÎA
Inteligență artificială
Definiție Merriam-Webster
Definiție Intel
"Un program care poate percepe, raționa, acționa și se adaptează."
"O ramură a informaticii care se ocupă cu simularea comportamentului inteligent în calculatoare."
Definiție Wikipedia
"În limbaj comun, termenul 'inteligență artificială' se aplică atunci când o mașină imită funcții 'cognitive' pe care oamenii le asociază cu alte minți umane, precum 'învățarea' și 'rezolvarea problemelor'."
Învățare automată
„Studiul și construcția de programe care nu sunt programate explicit, ci învață modele pe măsură ce sunt expuse la mai multe date în timp."
Învățare Automată
Date de Intrare
Seturi mari de date alimentează programul
Recunoaștere de Tipare
Programul identifică tipare fără programare explicită
Învățare
Sistemul se îmbunătățește cu mai multe exemple
Clasificare
Ia decizii pe date noi
Aceste programe învață din vederea repetată a datelor, mai degrabă decât fiind programate explicit de către oameni.
Terminologie de învățare automată
Caracteristici
Atributele datelor (coloanele de intrare)
Țintă
Coloana de prezis (ieșire)
Acest exemplu învață să clasifice o specie dintr-un set de caracteristici de măsurare.
Cele două principale tipuri de învățare automată
Învățare supravegheată
Învățare nesupravegheată
Set de date: Are o coloană țintă
Set de date: Nu are o coloană țintă
Scop: Realizează predicții
Scop: Găsește structură în date
Exemplu: Detectarea fraudei
Exemplu: Segmentarea clienților
Exemplu de Învățare Automată
Detecția Fraudelor
Caracteristici Cheie
Algoritmii ML pot identifica activități neobișnuite în tranzacțiile financiare.
Limitările în Învățarea Automată
Provocarea Ingineriei Caracteristicilor
Soluția Învățării Profunde
Pentru sarcini complexe, precum recunoașterea imaginilor, definirea caracteristicilor eficiente este dificilă.
Învățarea profundă depășește această limitare prin învățarea automată a celor mai relevante caracteristici din datele brute.
Ce caracteristici ai folosi pentru a diferenția o pisică de un câine?
Învățare profundă
"Învățarea automată care implică utilizarea unor modele foarte complicate numite 'rețele neuronale profunde'."
Modelele de învățare profundă determină cea mai bună reprezentare a datelor originale. În învățarea automată clasică, oamenii trebuie să creeze manual aceste caracteristici.
Exemplu de Învățare Profundă
Învățare Automată Clasică
Învățare Profundă
Pasul 1: Determină caracteristicile manual
Pașii 1 și 2 sunt combinați într-un singur pas
Pasul 2: Introdu-le în model
Rețeaua neuronală extrage automat caracteristicile relevante
Istoria AI
Algoritmi timpurii
Anii 1950-1960: S-au stabilit fundamentele AI
Prima iarnă AI
Sfârșitul anilor 1960-1970: Reduceri de fonduri după progrese limitate
Sisteme expert
Anii 1980: Sistemele bazate pe reguli au avut succes comercial
A doua iarnă AI
Sfârșitul anilor 1980-1990: Progrese limitate au dus la scăderea interesului
Învățarea automată
Anii 1990-2000: Abordările statistice au câștigat teren
Anii 2010-prezent: Rețeaua neuronală a revoluționat domeniul
Învățarea profundă
2010s-Present: Neural networks revolutionized the field
Anii 1950: AI timpurie
1950: Testul Turing
1956: Conferința Dartmouth
Alan Turing a dezvoltat un test pentru inteligența mașinilor
Inteligența artificială acceptată ca domeniu academic formal
1957: Perceptron
1959: Învățarea automată
Frank Rosenblatt a inventat precursorul rețelelor neuronale
Programul de dame al lui Arthur Samuel a învățat din experiență
Primul "Iarnă" a AI
1966: Raportul ALPAC
Comitetul a evaluat tehnicile AI pentru traducere automată și a constatat un randament slab al investiției
1969: Limitările perceptronului
Cartea lui Marvin Minsky a evidențiat limitările rețelelor neuronale, încetinind cercetarea
1973: Raportul Lighthill
A evidențiat eșecul AI de a îndeplini promisiunile, conducând la reduceri de finanțare
Impact
Aceste rapoarte au condus la reduceri semnificative ale finanțării guvernamentale pentru cercetarea AI
Boom-ul AI din anii 1980
Sisteme Expert
Sisteme cu reguli programate, concepute pentru a imita experții umani, au câștigat adopție comercială
Calculatoare mainframe
Rulează pe hardware specializat folosind limbaje precum LISP
Succes comercial
Două treimi din companiile Fortune 500 foloseau sisteme expert la apogeul lor
Revivalul rețelelor neuronale
În 1986, algoritmul "Backpropagation" a permis antrenarea rețelelor multilayer
O a doua iarnă a AI (sfârșitul anilor 1980 – începutul anilor 1990)
Integrarea tehnologică
Progresul a încetinit
Sistemele expert au devenit funcții în aplicațiile generale de afaceri
Impactul sistemelor expert asupra problemelor de afaceri a stagnat
Revoluția PC
Software-ul s-a mutat de pe mainframe-uri pe calculatoare personale
Dezinteres crescend
Probleme de scalare
Entuziasmul pentru AI în afaceri a scăzut semnificativ
Rețelele neuronale nu puteau gestiona probleme mari
Sfârșitul anilor 1990 până la începutul anilor 2000: Învățare automată clasică
Algoritmul SVM
Aplicații practice
Integrare
Mașina de vectori de suport a devenit metoda principală de învățare automată
Soluțiile AI au avut succes în recunoașterea vorbirii, diagnostic medical și robotică
Algoritmii AI au fost integrați în sisteme mai mari din diverse industrii
2006: Ascensiunea Învățării Profunde
2006
Geoffrey Hinton publică un articol revoluționar despre pre-antrenamentul nesupravegheat pentru rețele neuronale mai profunde
2009
Baza de date ImageNet cu imagini etichetate de oameni prezentată la conferința CVPR
2010
Prima competiție ImageNet lansează algoritmi care concurează în sarcini de recunoaștere vizuală
Rebranding
Rebranding-ul rețelelor neuronale ca "învățare profundă" pentru a reflecta potențialul lor reînnoit
Revoluții în Învățarea Profundă (2012 – Prezent)
2012
2013
2014
Modelele de învățare profundă depășesc dramatic metodele anterioare în competiția ImageNet
Modelele de învățare profundă încep să înțeleagă "sensul conceptual" al cuvintelor
Apari avansuri similare în sarcinile de traducere a limbajului
Impact
Progresele au dus la îmbunătățiri în căutarea pe web, căutarea de documente, rezumat și traducere
Realizări în Învățarea Profundă (2012 – Prezent)
2014
Algoritmii de viziune computerizată încep să învețe să descrie fotografiile cu limbaj natural
2015
Google lansează TensorFlow, făcând instrumentele de învățare profundă accesibile pe scară largă
2016
AlphaGo de la DeepMind învinge maestrul de GO Lee Se-dol, o realizare importantă
Impact
Aceste realizări au demonstrat capacitatea AI de a stăpâni sarcini considerate anterior a necesita intuiție umană
Inteligența artificială modernă (2012 – Prezent): Impactul învățării profunde
Mașini autonome
Sănătate
Comunicare
Detecția avansată a obiectelor permite navigarea autonomă în medii complexe
Sistemele AI îmbunătățesc acuratețea diagnosticelor în diverse specialități medicale
Sistemele de traducere neurală ating calitatea umană în multe perechi de limbi
Cum este diferită această eră a AI?
Calculatoare mai rapide
Puterea de calcul modernă, în special GPU-urile, permite antrenarea modelelor complexe
Seturi de date mai mari
Colectarea de date la scară largă pe internet furnizează resurse vaste pentru antrenament
Rețele neuronale avansate
Arhitecturi sofisticate pot învăța modele complexe autonom
Rezultate interdisciplinare
Progresele AI beneficiază mai multe domenii simultan
Alți factori AI moderni
Ecosistemul open source
Biblioteci open source
Date deschise
Seturile de date mari etichetate permit antrenarea unor modele mai sofisticate
Instrumentele bazate pe Python au democratizat accesul la învățarea automată
Cadrul de învățare profundă de top sunt disponibile gratuit pentru cercetători și dezvoltatori
Cercetare colaborativă
Colaborarea între mediul academic și industrie accelerează progresul
Schimbări transformative în domeniul sănătății
Diagnostice îmbunătățite
Descoperirea medicamentelor
Îngrijirea pacientului
Schimbări transformatoare în finanțe
Tranzacționare algoritmică
Sistemele AI iau decizii de tranzacționare la viteză mare bazate pe modele de piață
Detecția fraudei
Modelele ML identifică tranzacțiile suspecte cu mare acuratețe
Evaluarea riscurilor
AI evaluează cererile de împrumut și oportunitățile de investiții
Finanțe personale
Chatboți și robo-advisors oferă ghidaj financiar
Schimbări transformative în guvern
24/7
Servicii pentru cetățeni
Sisteme bazate pe AI oferă asistență non-stop cetățenilor
50%
Câștiguri de eficiență
Automatizarea proceselor reduce costurile administrative și timpul
90%
Detectarea amenințărilor
Sistemele AI identifică riscurile de securitate cu mare precizie
75%
Optimizarea resurselor
Aplicațiile pentru orașe inteligente îmbunătățesc gestionarea resurselor urbane
Schimbări Transformatoare în Transport
Vehicule Autonome
Optimizarea Logisticii
Răspuns de Urgență
Mașinile autonome folosesc AI pentru a naviga în medii complexe în siguranță
Sistemele AI gestionează flote și optimizează rutele de livrare
Dronele și roboții asistă în operațiuni de căutare și salvare
Învățare supravegheată
Date etichetate
Antrenarea modelului
Setul de date include caracteristici de intrare și ieșirea dorită
Algoritmul învață modele între intrări și ieșiri
Evaluare
Previziune
Performanța evaluată pe datele de testare reținute
Modelul antrenat aplicat pe date noi, nevăzute
Învățare Automată
Tip
Set de date
Învățare Supravegheată
Punctele de date au rezultat cunoscut
Învățare Nesupravegheată
Punctele de date au rezultat necunoscut
Studiul și construcția programelor care învață din vizionarea repetată a datelor, mai degrabă decât să fie programate explicit de către oameni.
Ținta vs. Caracteristici
Caracteristici
Țintă
Proprietățile datelor utilizate pentru predicție (coloane non-țintă)
Coloana de prezis - rezultatul de interes
Exemplu: Problema de Învățare Supravegheată
Scop
Prezice dacă un email este spam sau nu
Date
Email-uri istorice etichetate ca spam sau nu spam
Caracteristici
Textul email-ului, subiectul, timpul trimiterii, informații despre expeditor
Țintă
Clasificare binară: spam sau nu spam
Exemplu: Problema de învățare supravegheată
Detecția obiectelor pentru răspuns de urgență
Sistemele AI pot identifica persoane, vehicule și structuri avariate în zonele de dezastru.
Aplicații pentru managementul situațiilor de urgență
Detectarea dezastrelor
Predicția riscurilor
Alocarea resurselor
AI poate analiza rapid imaginile din satelit și drone pentru a identifica impactul și severitatea dezastrelor
Modelele ML pot prezice traiectoriile dezastrelor bazându-se pe date despre vreme și teren
AI optimizează resursele de răspuns la urgențe bazându-se pe evaluarea nevoilor în timp real
Formularea unei probleme de învățare supravegheată
Colectează set de date etichetat
Adună date cu caracteristici și etichete țintă relevante pentru problema ta
Alege un model
Selectează algoritmul cel mai potrivit pentru tipul tău de date și problemă
Definește metricile de evaluare
Stabilește modul de măsurare a performanței în funcție de obiectivele tale specifice
Selectează metoda de optimizare
Alege modul de găsire a configurației modelului care maximizează performanța
Care Model?
Decizie Arbore
Cel Mai Apropiat Vecin
Rețea Neuronală
Face predicții prin punerea unei serii de întrebări da/nu despre caracteristici
Face predicții bazate pe similaritatea cu exemplele de antrenament
Face predicții folosind straturi interconectate de neuroni artificiali
Care Model?
Atunci când alegi un model pentru aplicații de gestionare a situațiilor de urgență, ia în considerare acești factori cheie. Complexitatea problemei și cerințele de date depășesc adesea alte considerente datorită naturii critice a răspunsului de urgență.
Măsurătoarea de evaluare
Precizie
Eroarea medie pătratică
Alte măsurători
Proporția predicțiilor corecte
Diferența medie pătratică între predicții și valori reale
Util când clasele sunt echilibrate
Folosit pentru probleme de regresie
Măsurătoarea de evaluare
Metoda greșită poate fi înșelătoare
În managementul situațiilor de urgență
Luați în considerare utilizarea acurateței pentru detectarea spamului cu 99% emailuri spam. Un model care prezice "spam" pentru fiecare email ar avea 99% acuratețe, dar ar putea rata emailuri legitime importante.
Fals negative (omisiunea unei urgențe) sunt adesea mai costisitoare decât fals positive (alerte false). Măsurătorile ar trebui să reflecte acest cost asimetric.
Contextul contează
Alegeți măsurători care se aliniază cu impactul real al predicțiilor. Pentru deciziile de evacuare, recall-ul (identificarea tuturor cazurilor care necesită evacuare) poate fi mai important decât precizia.
Instruire
Date de instruire
Optimizare
Pentru managementul situațiilor de urgență
Setul de date utilizat pentru a învăța modelul modele între caracteristici și ținte
Procesul de configurare a modelului pentru cea mai bună performanță
Modelele trebuie să fie antrenate pe scenarii diverse pentru a gestiona natura imprevizibilă a dezastrelor
Antrenament
Date de intrare
Exemplele etichetate sunt introduse în model
Pasul înainte
Modelul generează predicții bazate pe configurația curentă
Calculul erorii
Se măsoară diferența dintre predicții și țintele reale
Pasul înapoi
Parametrii modelului sunt ajustați pentru a reduce erorile
Itarație
Procesul se repetă până când performanța nu se mai îmbunătățește
Inferență
Date noi
Exemplele nevăzute sunt furnizate modelului antrenat
Procesare
Modelul aplică modelele învățate pentru a analiza datele
Previziune
Modelul generează rezultate bazate pe antrenamentul său
Decizie
Previziunile informează acțiunile de gestionare a situațiilor de urgență
Antrenament vs. Inference
Aspect
Antrenament
Inferență
Obiectiv
Învățarea modelelor din date
Aplicarea modelelor pe date noi
Intrare
Date etichetate (caracteristici + ținte)
Date neetichetate (doar caracteristici)
Ieșire
Parametrii modelului antrenat
Predicții
Calcul
Intensiv, adesea necesită GPU-uri
Relativ ușor
Deplasare
De obicei offline, în dezvoltare
În timp real, în producție
Prezentare generală a învățării supravegheate
Faza de antrenament
Faza de inferență
Date cu răspunsuri + Model → Model antrenat
Date noi + Model antrenat → Predicții
Evaluare
Refinare
Compară predicțiile cu rezultatele reale
Îmbunătățește modelul pe baza performanței
Scopul final este de a dezvolta un model care performează bine pe date nevăzute, făcând predicții fiabile în situații de urgență noi.
Exemplu de management al situațiilor de urgență
Previziune incendii de vegetație
Evaluarea riscului de inundații
Evaluarea daunelor
Modelele AI prezic răspândirea incendiilor în funcție de vreme, vegetație și topografie
Algoritmii ML estimează probabilitatea de inundații folosind date despre precipitații și teren
Algoritmii de viziune computerizată identifică rapid daunele structurale după cutremure
Ajustarea curbei: Exempel de supraînvățare vs. subînvățare
Obiectiv
Provocare
Potrivește o curbă cu punctele de date pentru a modela relația de bază
Găsirea complexității potrivite pentru model pentru a captura adevărata relație fără a se potrivi zgomotului
În gestionarea situațiilor de urgență: modelează relația dintre condițiile meteorologice și severitatea inundațiilor
Potrivirea curbei: Exemplar de subpotrivire
Curba Este Prea Simplă
Modelul nu reușește să captureze modele importante din date
Performanță slabă în antrenament
Eroare ridicată chiar și pe datele folosite pentru antrenament
Performanță slabă la testare
Nu poate generaliza situații noi
În managementul situațiilor de urgență
Un model subpotrivit poate rata semnele critice ale unui dezastru iminent
Potrivirea curbei: Exemplu de supraînvățare
Curba este prea complexă
Modelul capturează zgomotul aleatoriu în loc de modele reale
Performanță excelentă în antrenament
Aproape perfectă potrivire cu datele de antrenament
Performanță slabă la testare
Nu poate generaliza la situații noi
În managementul situațiilor de urgență
Un model supraînvățat poate genera alarme false sau poate omite situații de urgență reale în condiții ușor diferite
Problema de ajustare a curbei
Provocare
Risc
Pentru gestionarea situațiilor de urgență
Datele nevăzute nu sunt disponibile în timpul antrenamentului, ceea ce face dificilă evaluarea performanței în scenarii noi
Când se măsoară performanța doar pe datele de antrenament, modelele tind să se potrivească excesiv
Găsirea echilibrului corect este crucială - modelele trebuie să generalizeze la scenarii noi de dezastre, menținând sensibilitatea la semnele de avertizare
Soluție: Împărțirea datelor în două seturi
Set de antrenament
Set de testare
Date folosite pentru învățarea modelului
Date folosite pentru evaluarea performanței
Împărțirea Antrenament-Test
Faza de Antrenament
Ajustarea Greutății Modelului
Faza de Testare
Evaluarea Performanței
Modelul învață modele din datele de antrenament
Modelul antrenat este evaluat pe date de test nevăzute anterior
Parametrii optimizați pe baza performanței de antrenament
Rezultatele testului estimează performanța în lumea reală
Această abordare simulează modul în care modelul va performa în situații de urgență reale, pe care nu le-a întâlnit anterior.
Validarea încrucișată pentru modelele de urgență
Împărțirea datelor
Iterează
Antrenează pe toate fold-urile, testând pe fold-ul rămas
Divizează setul de date în mai multe fold-uri
Rotire
Medie
Repetă folosind fold-ul diferit ca set de test
Calculează performanța pe toate iterațiile
Validarea încrucișată oferă o estimare mai robustă a performanței, fiind deosebit de importantă pentru modelele de gestionare a situațiilor de urgență, unde datele pot fi limitate și variabilitatea ridicată.
Învățare profundă
"Învățarea automată care implică utilizarea unor modele foarte complicate numite 'rețele neuronale profunde'."
Aceste modele sofisticate determină automat cea mai bună reprezentare a datelor, eliminând necesitatea ingineriei manuale a caracteristicilor, pe care o necesită în mod tradițional în învățarea automată.
Diferențe între Învățarea Profundă
Învățarea Mașinii Clasică
Învățarea Profundă
Doi pași distincti:
Abordare integrată:
Tipuri de probleme în învățarea profundă
Analiza imaginilor
Procesarea limbajului natural
Analiza seriilor temporale
Recunoașterea vorbirii
Clasificare și Detecție
Detecție Obiecte
Aplicații de Urgență
Procesare în Timp Real
Localizează și identifică obiecte specifice în imagini sau cadre video
Identifică victime, structuri avariate, drumuri blocate și vehicule de urgență
Permite răspuns rapid la situații în evoluție
Segmentare semantică
Clasificare la nivel de pixel
Etichetează fiecare pixel dintr-o imagine, creând hărți detaliate ale diferitelor elemente
În gestionarea situațiilor de urgență:
Recuperarea obiectelor din limbaj natural
Căutare vizuală ghidată de text
Aplicații de urgență
Gestionarea resurselor
Sistemele pot localiza obiecte în imagini pe baza descrierilor în limbaj natural
Permite operațiuni de căutare și salvare bazate pe descrierile martorilor
Identifică rapid infrastructura sau resursele specifice necesare în timpul răspunsului
Recunoaștere vocală și traducere în limbaj
Comunicare între limbi
Procesarea apelurilor de urgență
Comenzi vocale
Operare hands-free a sistemelor de urgență prin recunoaștere vocală
AI permite comunicarea eficientă între răspunsători și populația afectată, indiferent de barierele lingvistice
Transcrierea și analiza automată a apelurilor de urgență ajută la prioritizarea răspunsului
Comunicare radio
Transcriere în timp real a comunicațiilor radio din teren pentru centrele de coordonare
Rețea complet conectată
FG
Formularea instrumentelor de învățare supravegheată
Colectarea setului de date
Adunați caracteristici și etichete țintă care reprezintă problema pe care o rezolvați.
Selecția modelului
Alegeți o arhitectură potrivită în funcție de tipul problemei dvs.
Metrica de evaluare
Definiți modul în care veți măsura performanța și succesul.
Metoda de optimizare
Stabiliți modul în care veți găsi configurația optimă a modelului.
Ce model?
Modelele diferite reprezintă probleme în mod unic, fiecare având avantaje distincte pentru scenarii specifice.
Inspirație biologică
Blocuri de construcție ale neuronilor
Modelele de învățare profundă se inspiră din creierul uman și din structura sa neurală.
Componenta centrală a rețelelor neuronale este neuronul artificial, care procesează intrările în rezultate semnificative.
Mecanica neuronilor
Caracteristici de intrare
X1, X2, X3 sunt intrări numerice care reprezintă caracteristicile datelor.
Sumă ponderată
Fiecare intrare este multiplicată cu o greutate (W1, W2, W3), apoi însumată.
Valoarea de ieșire
Z = X1W1 + X2W2 + X3W3 reprezintă rezultatul calculului ponderat.
Funcții de activare
Scop
Varietate
Non-liniaritate
Transformă suma ponderată într-o valoare de ieșire semnificativă.
Există mai multe funcții, fiecare cu proprietăți matematice specifice.
Majoritatea funcțiilor de activare introduc proprietăți non-lineare, permițând învățarea modelelor complexe.
Modelul Perceptron
Semnificație Istorică
Separare Liniară
Arhitectură Simplă
Unul dintre cele mai vechi modele de rețea neuronală, dezvoltat în anii 1950.
Poate rezolva doar probleme în care clasele pot fi separate printr-o linie dreaptă.
Folosește funcții de activare de bază pentru a clasifica intrările în categorii binare.
Limitările Perceptronului
Probleme Non-Lineare
Problema XOR
Catalizator pentru Iarnă AI
Perceptronii eșuează atunci când punctele de date nu pot fi separate de o singură linie.
Un exemplu faimos în care perceptronii eșuează, necesitând multiple limite de decizie.
Această limitare a contribuit la reducerea interesului și finanțării în cercetarea rețelelor neuronale.
Rețele complet conectate
Stratul de ieșire
Predicții finale
Straturi ascunse
Extracție complexă de caracteristici
Stratul de intrare
Caracteristici ale datelor brute
Rețelele complet conectate organizează neuronii în straturi. Fiecare neuron se conectează la fiecare neuron din straturile adiacente. Fiecare conexiune are o greutate separată. Această structură permite rezolvarea problemelor complexe, non-lineare, transformând datele prin straturi succesive.
Arhitectură de Învățare Profundă
Compresia Caracteristicilor
Procesarea Intrării
Fiecare strat rezumă informații importante
Datele brute intră în rețea
Extracția Relevanței
Generarea Rezultatului
Se identifică modele specifice sarcinii
Predicțiile finale apar
Învățarea profundă utilizează multe straturi, deseori reducându-se în lățime. Arhitecturile moderne pot conține sute de straturi, fiecare extrăgând caracteristici din ce în ce mai abstracte din date.
Construirea unei rețele complet conectate
Arhitectura rețelei
Definește straturile și neuronii
Funcții de activare
Alege funcțiile potrivite
Măsurători de evaluare
Selectează măsurile de performanță
Antrenarea ponderilor
Învață parametrii optimi
Când creezi o rețea neuronală, trebuie să decizi numărul de straturi, neuronii pe strat și funcțiile de activare potrivite. Greutățile modelului sunt învățate automat în timpul antrenamentului.
Metrici de evaluare
Regresie
Clasificare
Multi-etichetă
Eroarea medie pătratică (MSE) măsoară diferența pătratică medie între predicții și valorile reale.
Eroarea încrucișată categorică măsoară cât de bine prezice modelul probabilitățile claselor.
Eroarea binară încrucișată evaluează acuratețea predicției atunci când elementele pot aparține mai multor clase.
Limitări ale rețelelor complet conectate
10^9+
Numărul de parametri
Rețelele mari pot conține miliarde de greutăți.
TB
Utilizarea memoriei
Necesar semnificativ de RAM pentru antrenare și inferență.
100x
Calcul
Este nevoie de mult mai multă putere de procesare decât modelele mai simple.
Scăzută
Detecția caracteristicilor
Nu este optim pentru modele spațiale în imagini sau secvențe.
CNN: Revoluție în procesarea vizuală
Rețelele neuronale convoluționale reprezintă o schimbare fundamentală în modul în care computerele procesează informațiile vizuale. Inspirate de sistemele vizuale biologice, CNN-urile au transformat recunoașterea imaginilor, detectarea obiectelor și multe alte sarcini vizuale.
Rețele neuronale convoluționale
Conexiuni localizate
Partajare de greutăți
Fiecare neuron se conectează doar la o regiune mică a stratului anterior.
Aceeași set de greutăți se aplică pe întregul input.
Caracteristici spațiale
Eficiență în utilizarea resurselor
Excelent la recunoașterea modelelor indiferent de poziție.
Necesită mai puține conexiuni decât rețelele complet conectate.
Convoluțiile ca Detectoare de Caracteristici
Detector de Linii Verticale Detector de Linii Orizontale
Detector de Colțuri
Convoluțiile acționează ca detectoare locale de caracteristici care identifică modele specifice. Fiecare filtru răspunde la diferiți elemente vizuale din imaginea de intrare.
Operație de convoluție
Aplicare filtru
Crearea hărții de caracteristici
Câmpul de convoluție alunecă peste imaginea de intrare, realizând multiplicarea element cu element și sumarea.
Rezultatul este o imagine nouă care evidențiază unde apar caracteristicile specifice în intrarea originală.
Arhitectură CNN
Strat de intrare
Datele brute ale imaginii intră în rețea pentru procesare.
Straturi convoluționale
Filtre multiple extrag caracteristici variate din intrare.
Straturi de pooling
Reduce dimensiunea hărților de caracteristici pentru a diminua încărcătura computațională.
Straturi complet conectate
Combină caracteristicile extrase pentru clasificare finală sau regresie.
Învățarea prin transfer: Construind pe urmele giganților
Învățarea prin transfer valorifică rețele neuronale pre-antrenate pentru a rezolva probleme noi cu date limitate. Prin reutilizarea cunoștințelor din modelele existente, putem obține rezultate excelente mai eficient.
Provocări în dezvoltarea CNN
Cerinte de date
Antrenarea eficientă a CNN-urilor necesită de obicei seturi de date uriașe, cu milioane de exemple.
Cereri computaționale
Antrenarea modelului poate dura zile sau săptămâni, chiar și cu hardware GPU specializat.
Ajustarea hiperparametrilor
Găsirea configurațiilor optime ale rețelei implică experimente extinse.
Barieră de expertiză
Construirea unor modele competitive de la zero necesită cunoștințe tehnice profunde.
Principiile Învățării Transferului
Caracteristici ale Stratelor Timpurii
Caracteristici ale Stratelor Mijlocii
Specificitatea Stratelor Ulterioare
Straturile inițiale învață caracteristici vizuale universale precum muchii, colțuri și texturi. Acestea durează cel mai mult pentru a fi antrenate, dar se aplică în majoritatea sarcinilor de imagine.
Straturile mijlocii combină caracteristici primitive în forme și modele mai complexe. Acestea au o specificitate moderată pentru sarcină.
Straturile finale învață caracteristici foarte specifice sarcinii. Acestea răspund rapid la antrenament și sunt cele mai adaptabile pentru sarcini noi.
Beneficiile învățării transferului
Cerere redusă de date
Antrenament mai rapid
Performanță mai bună
Ajustarea fină durează ore în loc de săptămâni, comparativ cu antrenamentul de la zero.
Rețelele pre-antrenate necesită mult mai puține date pentru a se adapta noilor sarcini.
Modelele construite pe arhitecturi consacrate adesea obțin rezultate superioare.
Portabilitate
Greutățile antrenate sunt ușor stocate și partajate pentru implementare.
Implementarea Învățării prin Transfer
Selectează Modelul de Bază
Alege o rețea pre-antrenată precum ResNet, VGG sau EfficientNet.
Îngheață Primele Straturi
Blochează greutățile în straturile timpurii pentru a păstra detectarea generală a caracteristicilor.
Înlocuiește Straturile de Clasificare
Adaugă straturi noi specifice sarcinii tale (de exemplu, detectarea urgențelor).
Ajustare fină pe datele țintă
Antrenează straturile noi menținând straturile înghețate fixe.
os
Strategii de ajustare fină
Timp de antrenament
Date necesare
Performanță
Diagrama compară diferite abordări de ajustare fină pe scale relative (1-10). Luați în considerare datele disponibile, resursele de calcul și cerințele de performanță atunci când alegeți o strategie. Pentru sistemele de detectare a urgențelor, "Ultimele câteva straturi" oferă adesea cel mai bun echilibru.