Duboko učenje

Duboko učenje je podskup metoda mašinskog učenja zasnovanih na neuronskim mrežama. Pridev "duboko" odnosi se na upotrebu više slojeva u mreži.

Korišćene metode mogu biti supervizirane, polusupervizirane ili nesupervizirane.[1]

Arhitekture dubokog učenja kao što su duboke neuronske mreže, mreže dubokih verovanja, rekurentne neuronske mreže, konvolucione neuronske mreže i transformeri primenjuju se u oblastima uključujući računarsku viziju, prepoznavanje govora, prirodno jezičko procesiranje, mašinsko prevođenje, bioinformatiku, dizajn lekova, analiza medicinskih slika, klimatske nauke, inspekciju materijala i programe za društvene igre, gde su postigli rezultate koji su ponekad nadmašili ljudsku stručnost.

Rani oblici neuronskih mreža inspirisane su procesiranjem informacija i distribuiranim komunikacionim čvorovima u biološkim sistemima, posebno u ljudskom mozgu. Međutim, trenutne neuronske mreže ne pokušavaju da modeliraju funkciju mozga organizama i generalno se smatraju modelima niskog kvaliteta za tu svrhu.[2]

Pregled

Moderni algoritmi dubokog učenja se zasnivaju na neuronskim mrežama sa više slojeva. Slojevi se sastoje od neurona. Neki od tipa neuronskih mreža koje imaju ovakvu arhitekturu jesu konvolucione neuronske mreže, kao i transformeri.

U suštini, duboko učenje se odnosi na algoritme mašinskog učenja koji imaju određenu hijerarhiju slojeva. Ova sekvencija slojeva služi da pretvori ulazne podatke u neku određenu astrakciju i složenu reprezentaciju tog ulaza. U slučaju računarskoj vida, prvi sloj može predstavljati apstrakcije u vidu linija i krugova, zatim drugi sloj, može prepoznati ivice, dok sledeći sloj može prepoznavati kompleksnije oblike, poput nosa, usta i očiju u slučaju rešavanja problema detekcije lica.

Ono što razlikuje duboko učenje od klasičnih metoda mašinskog učenja jeste mogućnost da algoritmi dubokog učenja, prilikom treniniranja, nauče sami gde da smeste određene karakteristike problema koji rešavaju. Kod klasičnih metoda, te karakteristike su uglavnom bile ručno interpretirane, postavljanje i obrađivane.

Reč "duboko" u frazi "duboko učenje" se odnosi na broj slojeva neuronske mreže koji su potrebni da ona nauči karakteristike nad određenim skupom podataka.

Neuronske mreže

Neuronske mreže su odreženi algoritmi koji su šturo inspirisani principom funkcionisana mozgova ljudskih bića.

Veštaćka neuronska mreža (ANN-Artificial Neural Network ) se sastoji od jedinica koji se zovu neuroni. Neuroni su raspodeljeni u slojeve.

Izvori

  1. LeCun, Yann; Bengio, Yoshua; Hinton, Geoffrey (2015). „Deep learning”. Nature 521: 436–444. DOI:10.1038/nature14539. PMID 26017442. 
  2. Marcus, Gary (2018). „Deep Learning: A Critical Appraisal”. arXiv. DOI:10.48550/arXiv.1801.00631.