Want to create interactive content? It’s easy in Genially!

Reuse this genially

PREVENT Artificial Intelligence Theory (UVIGO) - RO

Cristina López Bravo

Created on November 7, 2025

Start designing with a free template

Discover more than 1500 professional designs like these:

Essential Business Proposal

Project Roadmap Timeline

Step-by-Step Timeline: How to Develop an Idea

Artificial Intelligence History Timeline

Momentum: First Operational Steps

Momentum: Employee Introduction Presentation

Mind Map: The 4 Pillars of Success

Transcript

Inteligență artificială - Proiect PREVENT

Teorie

Începe

Teoria Inteligenței Artificiale

FG

Descoperiri în AI

Clasificarea imaginilor

Traducerea automată

Din 2015, computerele pot fi antrenate pentru a performa mai bine decât oamenii la sarcinile de clasificare a imaginilor.

Din 2016, am realizat performanțe aproape umane în traducerea între limbi folosind tehnici avansate de AI.

"Je suis étudiant"

Inteligența artificială este noua electricitate

"Aproximativ 100 de ani în urmă, electricitatea a transformat fiecare industrie majoră. Inteligența artificială a avansat până acolo încât are puterea de a transforma fiecare sector important în anii următori."

- Andrew Ng, Universitatea Stanford

Definiții

Inteligență Artificială

Cel mai larg concept

Învățare Automată

Un subset al AI

Învățare Profundă

Un subset al ÎA

Inteligență artificială

Definiție Merriam-Webster

Definiție Intel

"Un program care poate percepe, raționa, acționa și se adaptează."

"O ramură a informaticii care se ocupă cu simularea comportamentului inteligent în calculatoare."

Definiție Wikipedia

"În limbaj comun, termenul 'inteligență artificială' se aplică atunci când o mașină imită funcții 'cognitive' pe care oamenii le asociază cu alte minți umane, precum 'învățarea' și 'rezolvarea problemelor'."

Învățare automată

„Studiul și construcția de programe care nu sunt programate explicit, ci învață modele pe măsură ce sunt expuse la mai multe date în timp."

Învățare Automată

Date de Intrare

Seturi mari de date alimentează programul

Recunoaștere de Tipare

Programul identifică tipare fără programare explicită

Învățare

Sistemul se îmbunătățește cu mai multe exemple

Clasificare

Ia decizii pe date noi

Aceste programe învață din vederea repetată a datelor, mai degrabă decât fiind programate explicit de către oameni.

Terminologie de învățare automată

Caracteristici

Atributele datelor (coloanele de intrare)

Țintă

Coloana de prezis (ieșire)

Acest exemplu învață să clasifice o specie dintr-un set de caracteristici de măsurare.

Cele două principale tipuri de învățare automată

Învățare supravegheată

Învățare nesupravegheată

Set de date: Are o coloană țintă

Set de date: Nu are o coloană țintă

Scop: Realizează predicții

Scop: Găsește structură în date

Exemplu: Detectarea fraudei

Exemplu: Segmentarea clienților

Exemplu de Învățare Automată

Detecția Fraudelor

Caracteristici Cheie

Algoritmii ML pot identifica activități neobișnuite în tranzacțiile financiare.

  • Timpul tranzacției
  • Sumă tranzacție
  • Locația tranzacției
  • Categoria achiziției

Limitările în Învățarea Automată

Provocarea Ingineriei Caracteristicilor

Soluția Învățării Profunde

Pentru sarcini complexe, precum recunoașterea imaginilor, definirea caracteristicilor eficiente este dificilă.

Învățarea profundă depășește această limitare prin învățarea automată a celor mai relevante caracteristici din datele brute.

Ce caracteristici ai folosi pentru a diferenția o pisică de un câine?

Învățare profundă

"Învățarea automată care implică utilizarea unor modele foarte complicate numite 'rețele neuronale profunde'."

Modelele de învățare profundă determină cea mai bună reprezentare a datelor originale. În învățarea automată clasică, oamenii trebuie să creeze manual aceste caracteristici.

Exemplu de Învățare Profundă

Învățare Automată Clasică

Învățare Profundă

Pasul 1: Determină caracteristicile manual

Pașii 1 și 2 sunt combinați într-un singur pas

Pasul 2: Introdu-le în model

Rețeaua neuronală extrage automat caracteristicile relevante

Istoria AI

Algoritmi timpurii

Anii 1950-1960: S-au stabilit fundamentele AI

Prima iarnă AI

Sfârșitul anilor 1960-1970: Reduceri de fonduri după progrese limitate

Sisteme expert

Anii 1980: Sistemele bazate pe reguli au avut succes comercial

A doua iarnă AI

Sfârșitul anilor 1980-1990: Progrese limitate au dus la scăderea interesului

Învățarea automată

Anii 1990-2000: Abordările statistice au câștigat teren

Anii 2010-prezent: Rețeaua neuronală a revoluționat domeniul

Învățarea profundă

2010s-Present: Neural networks revolutionized the field

Anii 1950: AI timpurie

1950: Testul Turing

1956: Conferința Dartmouth

Alan Turing a dezvoltat un test pentru inteligența mașinilor

Inteligența artificială acceptată ca domeniu academic formal

1957: Perceptron

1959: Învățarea automată

Frank Rosenblatt a inventat precursorul rețelelor neuronale

Programul de dame al lui Arthur Samuel a învățat din experiență

Primul "Iarnă" a AI

1966: Raportul ALPAC

Comitetul a evaluat tehnicile AI pentru traducere automată și a constatat un randament slab al investiției

1969: Limitările perceptronului

Cartea lui Marvin Minsky a evidențiat limitările rețelelor neuronale, încetinind cercetarea

1973: Raportul Lighthill

A evidențiat eșecul AI de a îndeplini promisiunile, conducând la reduceri de finanțare

Impact

Aceste rapoarte au condus la reduceri semnificative ale finanțării guvernamentale pentru cercetarea AI

Boom-ul AI din anii 1980

Sisteme Expert

Sisteme cu reguli programate, concepute pentru a imita experții umani, au câștigat adopție comercială

Calculatoare mainframe

Rulează pe hardware specializat folosind limbaje precum LISP

Succes comercial

Două treimi din companiile Fortune 500 foloseau sisteme expert la apogeul lor

Revivalul rețelelor neuronale

În 1986, algoritmul "Backpropagation" a permis antrenarea rețelelor multilayer

O a doua iarnă a AI (sfârșitul anilor 1980 – începutul anilor 1990)

Integrarea tehnologică

Progresul a încetinit

Sistemele expert au devenit funcții în aplicațiile generale de afaceri

Impactul sistemelor expert asupra problemelor de afaceri a stagnat

Revoluția PC

Software-ul s-a mutat de pe mainframe-uri pe calculatoare personale

Dezinteres crescend

Probleme de scalare

Entuziasmul pentru AI în afaceri a scăzut semnificativ

Rețelele neuronale nu puteau gestiona probleme mari

Sfârșitul anilor 1990 până la începutul anilor 2000: Învățare automată clasică

Algoritmul SVM

Aplicații practice

Integrare

Mașina de vectori de suport a devenit metoda principală de învățare automată

Soluțiile AI au avut succes în recunoașterea vorbirii, diagnostic medical și robotică

Algoritmii AI au fost integrați în sisteme mai mari din diverse industrii

2006: Ascensiunea Învățării Profunde

2006

Geoffrey Hinton publică un articol revoluționar despre pre-antrenamentul nesupravegheat pentru rețele neuronale mai profunde

2009

Baza de date ImageNet cu imagini etichetate de oameni prezentată la conferința CVPR

2010

Prima competiție ImageNet lansează algoritmi care concurează în sarcini de recunoaștere vizuală

Rebranding

Rebranding-ul rețelelor neuronale ca "învățare profundă" pentru a reflecta potențialul lor reînnoit

Revoluții în Învățarea Profundă (2012 – Prezent)

2012

2013

2014

Modelele de învățare profundă depășesc dramatic metodele anterioare în competiția ImageNet

Modelele de învățare profundă încep să înțeleagă "sensul conceptual" al cuvintelor

Apari avansuri similare în sarcinile de traducere a limbajului

Impact

Progresele au dus la îmbunătățiri în căutarea pe web, căutarea de documente, rezumat și traducere

Realizări în Învățarea Profundă (2012 – Prezent)

2014

Algoritmii de viziune computerizată încep să învețe să descrie fotografiile cu limbaj natural

2015

Google lansează TensorFlow, făcând instrumentele de învățare profundă accesibile pe scară largă

2016

AlphaGo de la DeepMind învinge maestrul de GO Lee Se-dol, o realizare importantă

Impact

Aceste realizări au demonstrat capacitatea AI de a stăpâni sarcini considerate anterior a necesita intuiție umană

Inteligența artificială modernă (2012 – Prezent): Impactul învățării profunde

Mașini autonome

Sănătate

Comunicare

Detecția avansată a obiectelor permite navigarea autonomă în medii complexe

Sistemele AI îmbunătățesc acuratețea diagnosticelor în diverse specialități medicale

Sistemele de traducere neurală ating calitatea umană în multe perechi de limbi

Cum este diferită această eră a AI?

Calculatoare mai rapide

Puterea de calcul modernă, în special GPU-urile, permite antrenarea modelelor complexe

Seturi de date mai mari

Colectarea de date la scară largă pe internet furnizează resurse vaste pentru antrenament

Rețele neuronale avansate

Arhitecturi sofisticate pot învăța modele complexe autonom

Rezultate interdisciplinare

Progresele AI beneficiază mai multe domenii simultan

Alți factori AI moderni

Ecosistemul open source

Biblioteci open source

Date deschise

Seturile de date mari etichetate permit antrenarea unor modele mai sofisticate

Instrumentele bazate pe Python au democratizat accesul la învățarea automată

Cadrul de învățare profundă de top sunt disponibile gratuit pentru cercetători și dezvoltatori

Cercetare colaborativă

Colaborarea între mediul academic și industrie accelerează progresul

Schimbări transformative în domeniul sănătății

Diagnostice îmbunătățite

Descoperirea medicamentelor

Îngrijirea pacientului

  • Sistemele AI analizează imaginile medicale cu acuratețe de nivel expert
  • AI accelerează identificarea compușilor terapeutici potențiali
  • Sistemele de monitorizare detectează schimbări subtile în condiția pacientului
  • Detecția timpurie a condițiilor îmbunătățește rezultatele tratamentului
  • Reduce timpul de dezvoltare de la ani la luni
  • Algoritmii predictivi identifică pacienți cu risc crescut
  • Reduce erorile de diagnostic și îmbunătățește îngrijirea pacientului
  • Permite abordări personalizate în medicină
  • Asistenți virtuali sprijină gestionarea pacientului

Schimbări transformatoare în finanțe

Tranzacționare algoritmică

Sistemele AI iau decizii de tranzacționare la viteză mare bazate pe modele de piață

Detecția fraudei

Modelele ML identifică tranzacțiile suspecte cu mare acuratețe

Evaluarea riscurilor

AI evaluează cererile de împrumut și oportunitățile de investiții

Finanțe personale

Chatboți și robo-advisors oferă ghidaj financiar

Schimbări transformative în guvern

24/7

Servicii pentru cetățeni

Sisteme bazate pe AI oferă asistență non-stop cetățenilor

50%

Câștiguri de eficiență

Automatizarea proceselor reduce costurile administrative și timpul

90%

Detectarea amenințărilor

Sistemele AI identifică riscurile de securitate cu mare precizie

75%

Optimizarea resurselor

Aplicațiile pentru orașe inteligente îmbunătățesc gestionarea resurselor urbane

Schimbări Transformatoare în Transport

Vehicule Autonome

Optimizarea Logisticii

Răspuns de Urgență

Mașinile autonome folosesc AI pentru a naviga în medii complexe în siguranță

Sistemele AI gestionează flote și optimizează rutele de livrare

Dronele și roboții asistă în operațiuni de căutare și salvare

Învățare supravegheată

Date etichetate

Antrenarea modelului

Setul de date include caracteristici de intrare și ieșirea dorită

Algoritmul învață modele între intrări și ieșiri

Evaluare

Previziune

Performanța evaluată pe datele de testare reținute

Modelul antrenat aplicat pe date noi, nevăzute

Învățare Automată

Tip

Set de date

Învățare Supravegheată

Punctele de date au rezultat cunoscut

Învățare Nesupravegheată

Punctele de date au rezultat necunoscut

Studiul și construcția programelor care învață din vizionarea repetată a datelor, mai degrabă decât să fie programate explicit de către oameni.

Ținta vs. Caracteristici

Caracteristici

Țintă

Proprietățile datelor utilizate pentru predicție (coloane non-țintă)

Coloana de prezis - rezultatul de interes

  • Variabile de intrare pe care le folosește modelul
  • Variabila de ieșire pe care modelul învață să o prezică
  • În gestionarea situațiilor de urgență: date despre vreme, densitatea populației, starea infrastructurii
  • În gestionarea situațiilor de urgență: nivelul riscului de inundație, necesitatea evacuării, resursele necesare

Exemplu: Problema de Învățare Supravegheată

Scop

Prezice dacă un email este spam sau nu

Date

Email-uri istorice etichetate ca spam sau nu spam

Caracteristici

Textul email-ului, subiectul, timpul trimiterii, informații despre expeditor

Țintă

Clasificare binară: spam sau nu spam

Exemplu: Problema de învățare supravegheată

Detecția obiectelor pentru răspuns de urgență

Sistemele AI pot identifica persoane, vehicule și structuri avariate în zonele de dezastru.

  • Obiectiv: Prezicerea locației cutiilor de delimitare în jurul obiectelor
  • Date: Imagini cu locațiile de cutii de delimitare annotate
  • Caracteristici: Pixelii și modelele imaginilor
  • Țintă: Coordonatele cutiilor de delimitare ale obiectelor

Aplicații pentru managementul situațiilor de urgență

Detectarea dezastrelor

Predicția riscurilor

Alocarea resurselor

AI poate analiza rapid imaginile din satelit și drone pentru a identifica impactul și severitatea dezastrelor

Modelele ML pot prezice traiectoriile dezastrelor bazându-se pe date despre vreme și teren

AI optimizează resursele de răspuns la urgențe bazându-se pe evaluarea nevoilor în timp real

Formularea unei probleme de învățare supravegheată

Colectează set de date etichetat

Adună date cu caracteristici și etichete țintă relevante pentru problema ta

Alege un model

Selectează algoritmul cel mai potrivit pentru tipul tău de date și problemă

Definește metricile de evaluare

Stabilește modul de măsurare a performanței în funcție de obiectivele tale specifice

Selectează metoda de optimizare

Alege modul de găsire a configurației modelului care maximizează performanța

Care Model?

Decizie Arbore

Cel Mai Apropiat Vecin

Rețea Neuronală

Face predicții prin punerea unei serii de întrebări da/nu despre caracteristici

Face predicții bazate pe similaritatea cu exemplele de antrenament

Face predicții folosind straturi interconectate de neuroni artificiali

Care Model?

Atunci când alegi un model pentru aplicații de gestionare a situațiilor de urgență, ia în considerare acești factori cheie. Complexitatea problemei și cerințele de date depășesc adesea alte considerente datorită naturii critice a răspunsului de urgență.

Măsurătoarea de evaluare

Precizie

Eroarea medie pătratică

Alte măsurători

Proporția predicțiilor corecte

Diferența medie pătratică între predicții și valori reale

  • Precizie: Acuratețea predicțiilor pozitive

Util când clasele sunt echilibrate

  • Recall: Capacitatea de a găsi toate cazurile pozitive

Folosit pentru probleme de regresie

  • F1-Score: Media armonică a preciziei și recall-ului
  • AUC-ROC: Aria sub curba caracteristicii receptorului

Măsurătoarea de evaluare

Metoda greșită poate fi înșelătoare

În managementul situațiilor de urgență

Luați în considerare utilizarea acurateței pentru detectarea spamului cu 99% emailuri spam. Un model care prezice "spam" pentru fiecare email ar avea 99% acuratețe, dar ar putea rata emailuri legitime importante.

Fals negative (omisiunea unei urgențe) sunt adesea mai costisitoare decât fals positive (alerte false). Măsurătorile ar trebui să reflecte acest cost asimetric.

Contextul contează

Alegeți măsurători care se aliniază cu impactul real al predicțiilor. Pentru deciziile de evacuare, recall-ul (identificarea tuturor cazurilor care necesită evacuare) poate fi mai important decât precizia.

Instruire

Date de instruire

Optimizare

Pentru managementul situațiilor de urgență

Setul de date utilizat pentru a învăța modelul modele între caracteristici și ținte

Procesul de configurare a modelului pentru cea mai bună performanță

Modelele trebuie să fie antrenate pe scenarii diverse pentru a gestiona natura imprevizibilă a dezastrelor

  • Situații de urgență istorice cu rezultate
  • Ajustează parametrii modelului pentru a minimiza erorile
  • Scenarii de dezastre sintetice
  • Folosește algoritmi precum gradient descent
  • Date din simulări și exerciții
  • Poate necesita mai multe iterații

Antrenament

Date de intrare

Exemplele etichetate sunt introduse în model

Pasul înainte

Modelul generează predicții bazate pe configurația curentă

Calculul erorii

Se măsoară diferența dintre predicții și țintele reale

Pasul înapoi

Parametrii modelului sunt ajustați pentru a reduce erorile

Itarație

Procesul se repetă până când performanța nu se mai îmbunătățește

Inferență

Date noi

Exemplele nevăzute sunt furnizate modelului antrenat

Procesare

Modelul aplică modelele învățate pentru a analiza datele

Previziune

Modelul generează rezultate bazate pe antrenamentul său

Decizie

Previziunile informează acțiunile de gestionare a situațiilor de urgență

Antrenament vs. Inference

Aspect

Antrenament

Inferență

Obiectiv

Învățarea modelelor din date

Aplicarea modelelor pe date noi

Intrare

Date etichetate (caracteristici + ținte)

Date neetichetate (doar caracteristici)

Ieșire

Parametrii modelului antrenat

Predicții

Calcul

Intensiv, adesea necesită GPU-uri

Relativ ușor

Deplasare

De obicei offline, în dezvoltare

În timp real, în producție

Prezentare generală a învățării supravegheate

Faza de antrenament

Faza de inferență

Date cu răspunsuri + Model → Model antrenat

Date noi + Model antrenat → Predicții

Evaluare

Refinare

Compară predicțiile cu rezultatele reale

Îmbunătățește modelul pe baza performanței

Scopul final este de a dezvolta un model care performează bine pe date nevăzute, făcând predicții fiabile în situații de urgență noi.

Exemplu de management al situațiilor de urgență

Previziune incendii de vegetație

Evaluarea riscului de inundații

Evaluarea daunelor

Modelele AI prezic răspândirea incendiilor în funcție de vreme, vegetație și topografie

Algoritmii ML estimează probabilitatea de inundații folosind date despre precipitații și teren

Algoritmii de viziune computerizată identifică rapid daunele structurale după cutremure

Ajustarea curbei: Exempel de supraînvățare vs. subînvățare

Obiectiv

Provocare

Potrivește o curbă cu punctele de date pentru a modela relația de bază

Găsirea complexității potrivite pentru model pentru a captura adevărata relație fără a se potrivi zgomotului

În gestionarea situațiilor de urgență: modelează relația dintre condițiile meteorologice și severitatea inundațiilor

Potrivirea curbei: Exemplar de subpotrivire

Curba Este Prea Simplă

Modelul nu reușește să captureze modele importante din date

Performanță slabă în antrenament

Eroare ridicată chiar și pe datele folosite pentru antrenament

Performanță slabă la testare

Nu poate generaliza situații noi

În managementul situațiilor de urgență

Un model subpotrivit poate rata semnele critice ale unui dezastru iminent

Potrivirea curbei: Exemplu de supraînvățare

Curba este prea complexă

Modelul capturează zgomotul aleatoriu în loc de modele reale

Performanță excelentă în antrenament

Aproape perfectă potrivire cu datele de antrenament

Performanță slabă la testare

Nu poate generaliza la situații noi

În managementul situațiilor de urgență

Un model supraînvățat poate genera alarme false sau poate omite situații de urgență reale în condiții ușor diferite

Problema de ajustare a curbei

Provocare

Risc

Pentru gestionarea situațiilor de urgență

Datele nevăzute nu sunt disponibile în timpul antrenamentului, ceea ce face dificilă evaluarea performanței în scenarii noi

Când se măsoară performanța doar pe datele de antrenament, modelele tind să se potrivească excesiv

Găsirea echilibrului corect este crucială - modelele trebuie să generalizeze la scenarii noi de dezastre, menținând sensibilitatea la semnele de avertizare

Soluție: Împărțirea datelor în două seturi

Set de antrenament

Set de testare

Date folosite pentru învățarea modelului

Date folosite pentru evaluarea performanței

  • 70-80% din datele disponibile
  • 20-30% din datele disponibile
  • Folosit pentru ajustarea parametrilor modelului
  • Simulează scenarii nevăzute
  • Modelul vede aceste date în timpul învățării
  • Modelul nu vede aceste date în timpul antrenamentului

Împărțirea Antrenament-Test

Faza de Antrenament

Ajustarea Greutății Modelului

Faza de Testare

Evaluarea Performanței

Modelul învață modele din datele de antrenament

Modelul antrenat este evaluat pe date de test nevăzute anterior

Parametrii optimizați pe baza performanței de antrenament

Rezultatele testului estimează performanța în lumea reală

Această abordare simulează modul în care modelul va performa în situații de urgență reale, pe care nu le-a întâlnit anterior.

Validarea încrucișată pentru modelele de urgență

Împărțirea datelor

Iterează

Antrenează pe toate fold-urile, testând pe fold-ul rămas

Divizează setul de date în mai multe fold-uri

Rotire

Medie

Repetă folosind fold-ul diferit ca set de test

Calculează performanța pe toate iterațiile

Validarea încrucișată oferă o estimare mai robustă a performanței, fiind deosebit de importantă pentru modelele de gestionare a situațiilor de urgență, unde datele pot fi limitate și variabilitatea ridicată.

Învățare profundă

"Învățarea automată care implică utilizarea unor modele foarte complicate numite 'rețele neuronale profunde'."

Aceste modele sofisticate determină automat cea mai bună reprezentare a datelor, eliminând necesitatea ingineriei manuale a caracteristicilor, pe care o necesită în mod tradițional în învățarea automată.

Diferențe între Învățarea Profundă

Învățarea Mașinii Clasică

Învățarea Profundă

Doi pași distincti:

Abordare integrată:

  1. Oamenii determină manual caracteristicile
  • Extracția caracteristicilor și modelarea combinate
  1. Caracteristicile sunt introduse în model
  • Datele brute procesate prin multiple straturi
  • Fiecare strat învață caracteristici din ce în ce mai abstracte

Tipuri de probleme în învățarea profundă

Analiza imaginilor

  • Clasificarea tipurilor de dezastre
  • Detecție de obiecte în zonele afectate
  • Segmentare semantică a zonelor de deteriorare

Procesarea limbajului natural

  • Monitorizarea rețelelor sociale pentru rapoarte de urgență
  • Analiza sentimentelor în timpul crizelor
  • Comunicare automată de urgență

Analiza seriilor temporale

  • Predicția modelelor meteorologice
  • Monitorizarea datelor senzorilor
  • Forecasting-ul răspândirii epidemiei

Recunoașterea vorbirii

  • Procesarea apelurilor de urgență
  • Sisteme de răspuns activate vocal
  • Suport pentru comunicare multilingvă

Clasificare și Detecție

Detecție Obiecte

Aplicații de Urgență

Procesare în Timp Real

Localizează și identifică obiecte specifice în imagini sau cadre video

Identifică victime, structuri avariate, drumuri blocate și vehicule de urgență

Permite răspuns rapid la situații în evoluție

Segmentare semantică

Clasificare la nivel de pixel

Etichetează fiecare pixel dintr-o imagine, creând hărți detaliate ale diferitelor elemente

În gestionarea situațiilor de urgență:

  • Evaluare precisă a daunelor
  • Cartografiere precisă a extinderii inundațiilor
  • Detecție detaliată a limitei incendiilor de vegetație
  • Identificarea zonelor sigure față de zonele periculoase

Recuperarea obiectelor din limbaj natural

Căutare vizuală ghidată de text

Aplicații de urgență

Gestionarea resurselor

Sistemele pot localiza obiecte în imagini pe baza descrierilor în limbaj natural

Permite operațiuni de căutare și salvare bazate pe descrierile martorilor

Identifică rapid infrastructura sau resursele specifice necesare în timpul răspunsului

Recunoaștere vocală și traducere în limbaj

Comunicare între limbi

Procesarea apelurilor de urgență

Comenzi vocale

Operare hands-free a sistemelor de urgență prin recunoaștere vocală

AI permite comunicarea eficientă între răspunsători și populația afectată, indiferent de barierele lingvistice

Transcrierea și analiza automată a apelurilor de urgență ajută la prioritizarea răspunsului

Comunicare radio

Transcriere în timp real a comunicațiilor radio din teren pentru centrele de coordonare

Rețea complet conectată

FG

Formularea instrumentelor de învățare supravegheată

Colectarea setului de date

Adunați caracteristici și etichete țintă care reprezintă problema pe care o rezolvați.

Selecția modelului

Alegeți o arhitectură potrivită în funcție de tipul problemei dvs.

Metrica de evaluare

Definiți modul în care veți măsura performanța și succesul.

Metoda de optimizare

Stabiliți modul în care veți găsi configurația optimă a modelului.

Ce model?

Modelele diferite reprezintă probleme în mod unic, fiecare având avantaje distincte pentru scenarii specifice.

Inspirație biologică

Blocuri de construcție ale neuronilor

Modelele de învățare profundă se inspiră din creierul uman și din structura sa neurală.

Componenta centrală a rețelelor neuronale este neuronul artificial, care procesează intrările în rezultate semnificative.

Mecanica neuronilor

Caracteristici de intrare

X1, X2, X3 sunt intrări numerice care reprezintă caracteristicile datelor.

Sumă ponderată

Fiecare intrare este multiplicată cu o greutate (W1, W2, W3), apoi însumată.

Valoarea de ieșire

Z = X1W1 + X2W2 + X3W3 reprezintă rezultatul calculului ponderat.

Funcții de activare

Scop

Varietate

Non-liniaritate

Transformă suma ponderată într-o valoare de ieșire semnificativă.

Există mai multe funcții, fiecare cu proprietăți matematice specifice.

Majoritatea funcțiilor de activare introduc proprietăți non-lineare, permițând învățarea modelelor complexe.

Modelul Perceptron

Semnificație Istorică

Separare Liniară

Arhitectură Simplă

Unul dintre cele mai vechi modele de rețea neuronală, dezvoltat în anii 1950.

Poate rezolva doar probleme în care clasele pot fi separate printr-o linie dreaptă.

Folosește funcții de activare de bază pentru a clasifica intrările în categorii binare.

Limitările Perceptronului

Probleme Non-Lineare

Problema XOR

Catalizator pentru Iarnă AI

Perceptronii eșuează atunci când punctele de date nu pot fi separate de o singură linie.

Un exemplu faimos în care perceptronii eșuează, necesitând multiple limite de decizie.

Această limitare a contribuit la reducerea interesului și finanțării în cercetarea rețelelor neuronale.

Rețele complet conectate

Stratul de ieșire

Predicții finale

Straturi ascunse

Extracție complexă de caracteristici

Stratul de intrare

Caracteristici ale datelor brute

Rețelele complet conectate organizează neuronii în straturi. Fiecare neuron se conectează la fiecare neuron din straturile adiacente. Fiecare conexiune are o greutate separată. Această structură permite rezolvarea problemelor complexe, non-lineare, transformând datele prin straturi succesive.

Arhitectură de Învățare Profundă

Compresia Caracteristicilor

Procesarea Intrării

Fiecare strat rezumă informații importante

Datele brute intră în rețea

Extracția Relevanței

Generarea Rezultatului

Se identifică modele specifice sarcinii

Predicțiile finale apar

Învățarea profundă utilizează multe straturi, deseori reducându-se în lățime. Arhitecturile moderne pot conține sute de straturi, fiecare extrăgând caracteristici din ce în ce mai abstracte din date.

Construirea unei rețele complet conectate

Arhitectura rețelei

Definește straturile și neuronii

Funcții de activare

Alege funcțiile potrivite

Măsurători de evaluare

Selectează măsurile de performanță

Antrenarea ponderilor

Învață parametrii optimi

Când creezi o rețea neuronală, trebuie să decizi numărul de straturi, neuronii pe strat și funcțiile de activare potrivite. Greutățile modelului sunt învățate automat în timpul antrenamentului.

Metrici de evaluare

Regresie

Clasificare

Multi-etichetă

Eroarea medie pătratică (MSE) măsoară diferența pătratică medie între predicții și valorile reale.

Eroarea încrucișată categorică măsoară cât de bine prezice modelul probabilitățile claselor.

Eroarea binară încrucișată evaluează acuratețea predicției atunci când elementele pot aparține mai multor clase.

Limitări ale rețelelor complet conectate

10^9+

Numărul de parametri

Rețelele mari pot conține miliarde de greutăți.

TB

Utilizarea memoriei

Necesar semnificativ de RAM pentru antrenare și inferență.

100x

Calcul

Este nevoie de mult mai multă putere de procesare decât modelele mai simple.

Scăzută

Detecția caracteristicilor

Nu este optim pentru modele spațiale în imagini sau secvențe.

CNN: Revoluție în procesarea vizuală

Rețelele neuronale convoluționale reprezintă o schimbare fundamentală în modul în care computerele procesează informațiile vizuale. Inspirate de sistemele vizuale biologice, CNN-urile au transformat recunoașterea imaginilor, detectarea obiectelor și multe alte sarcini vizuale.

Rețele neuronale convoluționale

Conexiuni localizate

Partajare de greutăți

Fiecare neuron se conectează doar la o regiune mică a stratului anterior.

Aceeași set de greutăți se aplică pe întregul input.

Caracteristici spațiale

Eficiență în utilizarea resurselor

Excelent la recunoașterea modelelor indiferent de poziție.

Necesită mai puține conexiuni decât rețelele complet conectate.

Convoluțiile ca Detectoare de Caracteristici

Detector de Linii Verticale Detector de Linii Orizontale

Detector de Colțuri

Convoluțiile acționează ca detectoare locale de caracteristici care identifică modele specifice. Fiecare filtru răspunde la diferiți elemente vizuale din imaginea de intrare.

Operație de convoluție

Aplicare filtru

Crearea hărții de caracteristici

Câmpul de convoluție alunecă peste imaginea de intrare, realizând multiplicarea element cu element și sumarea.

Rezultatul este o imagine nouă care evidențiază unde apar caracteristicile specifice în intrarea originală.

Arhitectură CNN

Strat de intrare

Datele brute ale imaginii intră în rețea pentru procesare.

Straturi convoluționale

Filtre multiple extrag caracteristici variate din intrare.

Straturi de pooling

Reduce dimensiunea hărților de caracteristici pentru a diminua încărcătura computațională.

Straturi complet conectate

Combină caracteristicile extrase pentru clasificare finală sau regresie.

Învățarea prin transfer: Construind pe urmele giganților

Învățarea prin transfer valorifică rețele neuronale pre-antrenate pentru a rezolva probleme noi cu date limitate. Prin reutilizarea cunoștințelor din modelele existente, putem obține rezultate excelente mai eficient.

Provocări în dezvoltarea CNN

Cerinte de date

Antrenarea eficientă a CNN-urilor necesită de obicei seturi de date uriașe, cu milioane de exemple.

Cereri computaționale

Antrenarea modelului poate dura zile sau săptămâni, chiar și cu hardware GPU specializat.

Ajustarea hiperparametrilor

Găsirea configurațiilor optime ale rețelei implică experimente extinse.

Barieră de expertiză

Construirea unor modele competitive de la zero necesită cunoștințe tehnice profunde.

Principiile Învățării Transferului

Caracteristici ale Stratelor Timpurii

Caracteristici ale Stratelor Mijlocii

Specificitatea Stratelor Ulterioare

Straturile inițiale învață caracteristici vizuale universale precum muchii, colțuri și texturi. Acestea durează cel mai mult pentru a fi antrenate, dar se aplică în majoritatea sarcinilor de imagine.

Straturile mijlocii combină caracteristici primitive în forme și modele mai complexe. Acestea au o specificitate moderată pentru sarcină.

Straturile finale învață caracteristici foarte specifice sarcinii. Acestea răspund rapid la antrenament și sunt cele mai adaptabile pentru sarcini noi.

Beneficiile învățării transferului

Cerere redusă de date

Antrenament mai rapid

Performanță mai bună

Ajustarea fină durează ore în loc de săptămâni, comparativ cu antrenamentul de la zero.

Rețelele pre-antrenate necesită mult mai puține date pentru a se adapta noilor sarcini.

Modelele construite pe arhitecturi consacrate adesea obțin rezultate superioare.

Portabilitate

Greutățile antrenate sunt ușor stocate și partajate pentru implementare.

Implementarea Învățării prin Transfer

Selectează Modelul de Bază

Alege o rețea pre-antrenată precum ResNet, VGG sau EfficientNet.

Îngheață Primele Straturi

Blochează greutățile în straturile timpurii pentru a păstra detectarea generală a caracteristicilor.

Înlocuiește Straturile de Clasificare

Adaugă straturi noi specifice sarcinii tale (de exemplu, detectarea urgențelor).

Ajustare fină pe datele țintă

Antrenează straturile noi menținând straturile înghețate fixe.

os

Strategii de ajustare fină

Timp de antrenament

Date necesare

Performanță

Diagrama compară diferite abordări de ajustare fină pe scale relative (1-10). Luați în considerare datele disponibile, resursele de calcul și cerințele de performanță atunci când alegeți o strategie. Pentru sistemele de detectare a urgențelor, "Ultimele câteva straturi" oferă adesea cel mai bun echilibru.