Mašinsko učenje (eng. machine learning – ML) je polje proučavanja koje računarima daje mogućnost učenja bez izričitog programiranja i instrukcija od strane ljudi. Vrijeme je da se iskoristi ogromna količina podataka, sve jača snaga procesora i sve brža mrežna uvezanost.
Vještačka inteligencija (AI) je, bez dvojbe, najdominantiji motiv SF (naučna fantastika) stvaralaštva u posljednjih stotinu godina. Brojne novele, a kasnije i filmska ostvarenja, dala su nam mogućnost da zamislimo svijet budućnosti u svjetlu zajedničkog života ljudi i mašina. Mašinsko učenje je ogromno naučno polje, koje iz dana u dan doživljava rađanje sve više svojih particija i sub-particija, a najbolje bi se moglo opisati citatom Arthura Samuela, IBM-ovog programera i profesora sa Stanforda, koji je rekao: Mašinsko učenje je polje proučavanja koje računarima daje mogućnost učenja bez izričitog programiranja (Machine Learning is the field of study that gives computers the ability to learn without being explicitly programmed).
Kako radi Machine Learning?
Mašinsko učenje se bazira na principu korištenja generičkih algoritama na velikim skupovima podataka, koji kao rezultat daju predviđanje određene vrijednosti ili kreiranje logike korelacije među datim podacima. Jednostavnije rečeno – određeni skup podataka biva ubačen u generički algoritam, koji potom, bez pisanja specifičnog koda za dati problem, uviđa logiku među unesenim informacijama, te ga je moguće primijeniti na više različitih skupova podataka.
Mašinsko učenje bazira se na dvije osnovne vrste generičkih algoritama – nadgledano i nenadgledano učenje.
Nadgledano učenje
Nadgledano učenje podrazumijeva treniranje programa unošenjem velikog broja “riješenih primjera”; cilj je unijeti što više poznatih vrijednosti funkcije f(x) za određene vrijednosti varijable x, na osnovu kojih bi program bio sposoban kao rezultat dati (približno) tačnu vrijednost funkcije za neko novo x, sa kojim se prvi put sreće.
Nadgledano učenje podrazumjeva da ste vi unijeli u sistem „trening podatke“ odnosno podatke na osnovu kojih će sistem napraviti program koji će procijeniti vrijednost koja vam je potrebna. Kako biste napravili svoju aplikaciju, unesete trening podatke u algoritam za mašinsko učenje. Algoritam pokušava da shvati koje matematičke operacije trebaju da se obave da bi sve imalo smisla. U nadgledanom učenju vi dajete kompjutere da uradi za vas te podatke. A kada računar shvati te algoritme vi ćete imati odgovor na zahtjevana pitanja.
Uprostićemo. Uspješan agent za nekretnine ispred sebe ima podatke o svakoj kući koju je prodao – lokaciju, broj kvadrata, broj spavaćih soba i, naravno, cijenu po kojoj je određena nekretnina prodata. Da bi bio sposoban procijeniti cijenu svake naredne nekretnine koja mu bude ponuđena, agent sve podatke koje ima, unosi u algoritam i na taj način ga trenira da uvidi matematičke korelacije kojima bi dati brojevi dobili smisao. Na osnovu utvrđenih odnosa među unesenim parametrima (lokacija, broj kvadrata, broj spavaćih soba), vođen logikom ranije definisanih primjera, algoritam će biti sposoban da predloži cijenu za neku novu nekretninu, uz minimalan procenat greške. Slične zadatke riješavali smo i sami – u školi su nam davali tri broja bez aritmetičkih znakova među njima, i rezultat:
6 _ 2 _ 2 = 10
Na nama je bilo da odredimo logiku među datim brojevima, postavimo znakove, i dobijemo traženu jednakost. Sličnim principom, u nadgledanom učenju, algoritam zaključuje na koji je način, u svakom od “riješenih primjera”, postignut traženi rezultat, te postaje sposoban to znanje primjeniti na novounesene podatke i dati odgovarajuću krajnju vrijednost. Naravno, unošenjem više primjera u algoritam, procenat moguće greške se smanjuje i naš program postaje “pametniji”. Ako želite možete naučiti više o ovjoj vrsti ML na online kursu.
Nenadgledano mašinsko učenje
Nenadgledano mašinsko učenje oslanja se na ideju da u program unesemo određenu količinu podataka, među kojima on treba da pronađe povezanosti i korelacije, bez ranije definisanih “riješenih primjera”, odnosno, bez definisane tražene vrijednosti ili rezultata. Uzećemo našeg agenta za nekretnine kao primjer, ponovo. Recimo da imamo parametre (lokacija, broj kvadrata, broj spavaćih soba) za svaku unesenu nekretninu, ali ni za jednu ne postoji definisana cijena. Ipak, i ovdje imamo mnoštvo interesantnih podataka. Unošenjem informacija u razvijen algoritam nenadgledanog učenja, kao rezultat možemo dobiti činjenicu da se na određenoj lokaciji bolje prodaju stanovi sa manje kvadrata, dok na drugoj većina nekretnina ima veći broj spavaćih soba od prosjeka. Na osnovu ovih saznanja, agent je spreman pravilo usmjeriti svoje marketinške aktivnosti na određenu lokaciju. Također, program nam, kao rezultat može dati određene nekretnine koje bitno odskaču od prosjeka unesenih parametara, govoreći nam da se radi o velikim, potencijalno skupim nekretninama, na koje treba obratiti posebnu pažnju. Besplatan online kurs o nenadgledanom mašinskom učenju.
Primjeri mašinskog učenja iz stvarnog života
Prepoznavanje slike
Prepoznavanje slike jedna je od najčešćih upotreba mašinskog učenja. Mnogo je situacija u kojima objekt možete klasificirati kao digitalnu sliku. Naprimjer, u slučaju crno-bijele slike, intenzitet svakog piksela služi kao jedno od mjerenja. Na obojenim slikama svaki piksel pruža tri mjerenja intenziteta u tri različite boje – crvenoj, zelenoj i plavoj (RGB). Mašinsko učenje se može koristiti i za otkrivanje lica na slici. Za svaku osobu postoji posebna kategorija u bazi podataka od nekoliko osoba. Mašinsko učenje se također koristi za prepoznavanje znakova radi raspoznavanja rukopisa i štampanih slova. Dio segmenta možemo segmentirati u manje slike, od kojih svaka sadrži jedan znak.
Prepoznavanje govora
Prepoznavanje govora je prijevod izgovorenih riječi u tekst. Poznato je i kao računarsko prepoznavanje govora ili automatsko prepoznavanje govora. Ovdje softverska aplikacija može prepoznati riječi izgovorene u audio isječku ili datoteci, a zatim audio pretvoriti u tekstualnu datoteku. Mjerenje u ovoj aplikaciji može biti skup brojeva koji predstavljaju govorni signal. Govorni signal također možemo segmentirati po intenzitetima u različitim vremensko-frekvencijskim opsezima. Prepoznavanje govora koristi se u aplikacijama poput glasovnog korisničkog interfejsa, glasovnih pretraga i još mnogo toga. Govorna korisnička sučelja uključuju glasovno biranje, usmjeravanje poziva i kontrolu uređaja.
Medicinska dijagnoza
Mašinsko učenje može se koristiti u tehnikama i alatima koji mogu pomoći u dijagnozi bolesti. Koristi se za analizu kliničkih parametara i njihovu kombinaciju za predviđanje primjera prognoze napredovanja bolesti za izdvajanje medicinskog znanja za istraživanje ishoda, za planiranje terapije i praćenje pacijenta. Ovo su uspješne implementacije metoda mašinskog učenja. Može pomoći u integraciji računarskih sistema u zdravstvu.
Statistička arbitraža
U finansijama, arbitraža se odnosi na automatizirane strategije trgovanja koje su kratkoročne i uključuju veliki broj vrijednosnih papira. U ovim strategijama korisnik se usredotočuje na primjenu algoritma trgovanja za niz vrijednosnih papira na osnovu količina poput povijesnih korelacija i općih ekonomskih varijabli. Metode mašinskog učenja primjenjuju se za dobijanje strategije arbitraže indeksa. Primjenjujemo linearnu regresiju i Support Vector Machine na cijene tokova zaliha.
Asocijacije za učenje
Asocijacije za učenje proces su razvijanja uvida u različite asocijacije između proizvoda. Dobar primjer je kako nepovezani proizvodi mogu biti povezani jedni s drugima. Jedna od aplikacija mašinskog učenja je proučavanje povezanosti proizvoda koje ljudi kupuju. Ako osoba kupi proizvod, pokazat će mu se slični proizvodi jer postoji povezanost između dva proizvoda. Kada se bilo koji novi proizvod lansira na tržište, povezan je sa starim kako bi povećao prodaju.
Klasifikacija
Klasifikacija je postupak smještanja svakog pojedinca u studije razrede. Klasifikacija pomaže analizirati mjere objekta kako bi se identificirala kategorija kojoj taj objekt pripada. Da bi uspostavili efikasnu vezu, analitičari koriste podatke. Naprimjer, prije nego što banka odluči podijeliti kredite, ona procjenjuje klijente na njihovu sposobnost da plate kredite.
Predviđanje
Mašinsko učenje se također može koristiti u sistemima predviđanja. Uzimajući u obzir primjer zajma, kako bi izračunao vjerovatnoću greške, sistem će trebati klasificirati dostupne podatke u grupe. Definiran je skupom pravila koja propisuju analitičari. Jednom kada je klasifikacija izvršena, možemo izračunati vjerovatnoću kvara. Ova izračunavanja mogu računati u svim sektorima u različite svrhe. Predviđanje je jedna od najboljih aplikacija za mašinsko učenje.
Ekstrakcija
Izdvajanje informacija jedna je od najboljih aplikacija mašinskog učenja. To je postupak izdvajanja strukturiranih informacija iz nestrukturiranih podataka. Naprimjer, web stranice, članci, blogovi, poslovni izvještaji i e-adrese. Relacijska baza podataka održava izlaz proizveden ekstrakcijom informacija. Proces izdvajanja uzima skup dokumenata kao ulaz i izlazi na strukturirane podatke.
Regresija
U regresiji možemo koristiti princip mašinskog učenja za optimizaciju parametara. Također se može koristiti za smanjenje pogreške aproksimacije i izračunavanje najbližeg mogućeg ishoda.
Finansijske usluge
Mašinsko učenje ima puno potencijala u finansijskom i bankarskom sektoru. To je pokretačka snaga popularnosti finansijskih usluga. Mašinsko učenje može pomoći bankama i finansijskim institucijama da donesu pametnije odluke. Mašinsko učenje može pomoći finansijskim službama da uoče zatvaranje računa prije nego što se dogodi, te može izvršiti analizu tržišta. Pametne mašine mogu se obučiti za praćenje obrazaca potrošnje. Algoritmi mogu lako prepoznati tendencije i mogu reagirati u stvarnom vremenu.
Jednom kada shvatite koliko je jednostavno primijeniti tehnike mašinskog učenja na probleme koji djeluju baš teško (kao što je prepoznavanje rukopisa), imat ćete osjećaj da mašinsko učenje možete da primijenite za rješavanje bilo kojeg problema i da ćete, ako imate dovoljno podataka, dobiti rješenje. Samo ubacite podatke i gledajte kako kompjuter “magično” dolazi do jednačine koja odgovara podacima!
Izvori:
- https://webonline.international/blog/index.php/artificial-intelligence-ai-visionary-arthur-samuel/
- https://bigdata-madesimple.com/the-deep-learning-robot-that-recognizes-your-face/
- https://bigdata-madesimple.com/top-10-real-life-examples-of-machine-learning/#:~:text=For%20example%2C%20medical%20diagnosis%2C%20image,past%20experience%20or%20historical%20data
- https://www.zendesk.tw/blog/machine-learning-and-deep-learning/
- https://www.coursera.org/lecture/machine-learning/supervised-learning-1VkCb