Intervju: Amila Akagić, WiDS ambasadorica i organizatorica konferencije “Žene u nauci o podacima”

WiDS UNSA
Širite znanje

Nakon konferencije koja je predstavila mnoge naučnice i njihove radove i istraživanja u oblasti nauke o podacima postavili smo osam pitanja organizatorici konferencije, Amili Akagić koja je i ambasadorica za Bosnu i Hercegovinu ispred inicijative WiDS

Razgovarao: Dženan Buzadžić

N: Možete li se predstaviti kao i reći nešto o samoj konferenciji?

Amila AkagićZovem se Amila Akagić. Radim na Elektrotehničkom fakultetu, Univerziteta u Sarajevu, kao vanredna profesorica na Odsjeku za Računarstvo i informatiku. Konferencija “Women in Data Science Sarajevo @ University of Sarajevo” održana je 19. juna preko Zoom platforme. Ovo je prva konferencija ovog tipa koju organizuje Elektrotehnički fakultet (ETF), Univerziteta u Sarajevu. Cilj konferencije je da inspiriše, educira i podrži žene koje se bave naukom o podacima (Data Science), bez obzira da li one dolaze iz industrije ili rade kao profesori ili istraživači na nekom od Univerziteta u BiH. Naravno, ovdje treba obavezno spomenuti i studentice koje studiraju na nekom od tehničkih i drugih fakulteta u BiH. S obzirom na to da konferencija ove vrste nema mnogo, i da se nauka o podacima nalazi na presjeku između nekoliko izuzetno važnih oblasti istraživanja, kao što su na primjer, računarske nauke, informacione tehnologije, matematika, statistika, domensko i poduzetničko znanje, itd., ove godine smo na konferenciji mogli čuti veoma različite teme i ideje, a to je i bio osnovni cilj organizatora. Iako konferencija u nazivu ima riječ “žene”, moram naglasiti da mi nastojimo uključiti sve rodove (gender-e) u proces edukacije.
Naša konferencija se podudara sa godišnjom globalnom konferencijom istog imena (Women in Data Science) koja se održava na Stanford Univerzitetu, kao i 200+ drugih lokacija širom svijeta. Osnovna svrha ovih konferencija je podrška i podsticanje pozitivne energija za nastavak trenutnih i pokretanje novih istraživanja.

N: Prva WiDS konferencija je iza vas. Koji su generalni utisci, a imajući u vidu da se organizovala kao virtualna konferencija putem ZOOM platforme?

Konferencija je prvobitno bila planirana da se organizuje uživo u prostorijama ETF-a, međutim zbog situacije sa COVID-19 konferenciju smo ipak odlučili organizovati virtuelno preko Zoom platforme. Konferencija je organizovana kao jednodnevni virtuelni događaj sa tri sesije koje smo nazvali “Technology Vision Talks”. U svakoj sesiji smo imali po tri govornice i trudili smo se da su sve dobne skupine podjednako zastupljene, tj. da svima damo istu šansu da izlože svoje trenutne ideje, projekte ili istraživanja.

Nije bilo lako donijeti odluku o načinu organizovanja ove konferencije. Naime, u jednom trenutku zatišja od coronavirusa kada je bilo dozvoljeno okupljanje do 100 ljudi u jednoj prostoriji, nismo se i dalje usuđivali organizovati konferenciju uživo jer se situacija mijenjala iz dana u dan.  Dva dana prije održavanja konferencije su opet uvedene restrikcije, pa se na kraju pokazalo da smo kao organizatori ipak donijeli dobru odluku da se konferencija organizuje virtuelno.

Ovo je prvi put da organizujem jednu konferenciju preko virtuelne platforme, i moram reći da je sve prošlo mnogo bolje od očekivanog. Interesantno je napomenuti da je nakon objave o virtuelnom načinu održavanja konferencije značajno povećan broj zainteresovanih, tačnije ukupno smo imali više od 100 registracija, od kojih je skoro 2/3 bilo došlo nakon objave o virtuelnom održavanju događaju. Ako se uzme u obzir da je WiDS u Tokiju, u organizaciji IBM-a, imao oko 300 registracija, mislim da trebamo biti zadovoljni postignutim odzivom. Moje je mišljenje da će iduća godina imati i veći odziv.  

N: Koja je vaša procjena o saradnji između data scientists u akademskom (univerziteti, instituti), javnom (ministarstva, agencije, zavodi) i biznis profitnom sektora (privatni sektor)?

Određena vrsta saradnje svakako postoji, ali je nedovoljna i vrlo često neproduktivna. Saradnju bi trebalo intenzivirati i što više raditi na konkretnim problemima koji se tiču običnog čovjeka, tj. imaju veću društvenu korist. Ne treba zanemariti ni probleme na apstraktnijem nivou, tj. istraživanja na kojima trenutno rade naučnici širom svijeta, pa i naučnici u našoj zemlji. Saradnja između akademskog i biznis sektora se najčešće realizuje kroz izradu magistarskih, master ili doktorskih radova, gdje kandidati najčešće rade na konkretnim problemima s kojima se susreću u praksi. Ova rješenja mogu imati veliki uticaj na biznis neke kompanije, međutim ne moraju imati veliki društveni značaj. Saradnja između akademskog i javnog sektora se najčešće ogleda kroz projekte koje akademska zajednica predlaže, a javni sektor finansira, i to obično putem Federalnog Ministarstva obrazovanja i nauke, Ministarstva za obrazovanje, nauke i mlade Kantona Sarajevo i Ministarstva Civilnih Poslova. Nažalost, izdvajanja od strane Ministarstava često nisu dovoljna da se projekti u cijelosti realizuju i poprime značaj mnogo većih razmjera.
U nekoj bliskoj budućnosti voljela bih da vidim rješavanje konkretnih problema sa širokom društvenom korisnošću od strane akademske zajednice, prvenstveno za probleme koji su prepoznati u društvu, a podržani od strane javnog sektora. Primjera radi, na ETF-u imamo izuzetnih studenata koji bi kroz svoje završne radove na I i II ciklusu mogli raditi na projektima koji se bar djelimično finansiraju od strane Javnog sektora. To može biti izrada nekih vrlo jednostavnih web, mobilnih ili desktop aplikacija, do izrade nekih složenijih aplikacija koje imaju mogućnost učenja nad “živim” podacima. Naravno, svaki od ovih projekata bi trebao da ima razne faze testiranja, tj. timove koji bi provjeravali ispravnost, funkcionalnost i kvalitet, kao i nadzor od strane neke stručne osobe. Mislim da bi se na ovaj način povećao društveno-koristan rad, mladi bi imali priliku da pokažu šta znaju i dobiju priliku za zaposlenje. Mi na ETF-u imamo još uvijek sreću da svaki naš student dobije zaposlenje, tako da studenti generalno nisu pesimistični u pogledu zaposlenja, ali se čovjek osjeća dobro kada uradi nešto više za društvenu zajednicu i kada njegov/njen rad bude prepoznat.

N: Možete li nam navesti jedan ili dva primjera rada data scientists gdje je cilj poboljšanje života građana BiH u bliskoj i daljnjoj budućnosti?

Na konferenciji smo razgovarali o poznatoj rečenici “Data is the new oil” ili “Podaci su nova nafta”, čime se simbolično označio početak nove tehnološke ili digitalne industrijske revolucije, koju još nazivamo Industrija 4.0. U središtu ove revolucije su podaci. Podaci mogu da ispričaju priču za koju niste ni znali da postoji, mogu da definišu nova pravila koja će poboljšati kvalitet naših života, mogu da dekodiraju neka naša ponašanja za koja ne znamo ni da postoje. Sirovi podaci (raw data) nemaju nikakav kontekst koji je od značaja. Međutim, dobrom organizacijom podataka i postavljanjem podataka u kontekst dobije se informacija koja može dati odgovor na pitanja: ŠTA? KAKO? KADA? i GDJE? Analizom informacija možemo da razvijemo znanje o određenim fenomenima. Kada imamo znanje, onda možemo da odgovorimo na pitanje KAKO? I na kraju, kada se znanju doda i iskustvo, imamo mudrost koja nam pomaže da spoznamo šta je ispravno i tačno, tj. odgovorimo na pitanje ZAŠTO?

Naša država je u određenim segmentima već ranije krenula sa procesom informatizacije, i rezultati ovog procesa su trenutno najviše vidljivi u administraciji. Sistemi se prave da olakšaju određene procese, i trebali bi da imaju svrhu reduciranja potrebnog vremena u procesu administracije. Međutim, dovoljno je da odete na bilo koji šalter i sigurna sam da ćete naići na građane koji nevoljno i nestripljivo čekaju u redu. Ovo je naročito vidljivo u vrijeme COVID-19 pandemije, gdje boravak u tom redu može ugroziti zdravlje čovjeka. Dobra stvar kod procesa informatizacije je što se podaci ovako ili onako skupljaju. Loša stvar je što ih niko ne analizira niti izvlači neki koristan zaključak (informaciju) o određenim fenomenima (npr. Kada se stvaraju gužve? Da li možemo u tim vremenskim intervalima da povećamo broj ljudi na šalterima?). Drugim riječima, ove odluke isto tako može donositi algoritam i na taj način smanjiti eventualne malverzacije.

Bitno je naglasiti da podatak nije samo tekst, nego i slika, video, audio, ili neki senzorski izlaz (generalno, signal). Još jedan primjer aplikacije na kojoj trenutno radim je analiza slika u svrhu detekciji određenih anomalija. Primjer takvih anomalija može biti vatra, dim, pukotina na asfaltu, betonu, zidu (oštećena zgrada) ili detekcija rupa na cesti radi pravovremene popravke, signalizacije (self-driving cars). Algoritmi koji pretražuju sliku ili video su trenutno aktuelni u automobilskoj industriji, medicinskim istraživanjima, proizvodnji, poljoprivredi, šumarstvu i generalno industriji.

Ovakvih primjera ili primjena ima veoma puno i trebalo bi mi više prostora i vremena da ih sve navedem. Neki primjeri su detekcija prevara, detekcija i upravljanje rizikom, analiza medicinskih slika, analiza genoma u svrhu razumijevanja ljudskog DNA, razvoj lijekova na bazi ove analize, razvoj novih marketing taktika, prepoznavanje objekata na slici, prepoznavanje govora, prepoznavanje emocija na osnovu analize slike ili audio signala, planiranje putanja za avione, analiza računarskih igrica i poboljšavanje algoritama za kreiranje igrica, potpomognuti razvoj novih tehnologija, kao što je Augmented Reality, i niz drugih.

Država bi također trebala razmisliti o formiranju Data Science Instituta, po uzoru na postojeće Institute u svijetu. Misija ovakvog Instituta bi trebala biti praćenje trendova iz oblasti nauke o podacima, transformacija svih oblasti i profesija kroz primjene nauke o podacima, te osiguravanje odgovornog korištenja podataka u svrhu dobrobiti našeg društva. Ako su podaci nova nafta, onda naša država treba da prepozna ovu priliku i počne ulagati u nauku.

N: Prva riječ u nazivu profesije je data ili podaci. Očigledno imamo naučnice i naučnike. A imamo li kvalitetne podatke, koji je kvalitet istih i kako ocjenjujete trenutnu situaciju u BiH u kontekstu prikupljanja i čuvanja podataka?

To je jako teško pitanje i teško je dati precizan odgovor. Nisam sigurna da li bi iko u ovom trenutku mogao dati precizan odgovor. Neki podaci koji nastaju u sklopu sistema ličnih karata, pasoša i drugih ličnih dokumenata se sasvim sigurno arhiviraju i čuvaju, ali oni možda i nisu najbitniji za analizu. Mislim da većina podataka završi u nekoj bazi podataka, odakle se iščitavaju samo radi provjere tačnosti podataka, tako da se može reći da tu ima malo analize. U zadnje vrijeme, ljudi postaju svjesni značaja podataka, tako da sada već traže specifične algoritme koji im mogu omogućiti znatno bolje pretraživanje istih. Važno je napomenuti da iako postoji veliki broj generalnih algoritama, ne mora da znači da ćete s njima moći izvući kvalitetnu informaciju. Vrlo često je neophodno napraviti novi algoritam ili prilagoditi postojeći algoritam prema nekom specifičnom problemu.

N: Kako vidite mogućnost unapređenja statusa data scientists u javnom sektoru gdje odlučivanje na osnovu podataka i analize istih postaje (srećom) sve popularnije?

Da, mislim da se svjesnost o važnosti podataka značajno povećava u zadnje vrijeme. Taj interes je veoma bitan. S druge strane, nedostaje poznavanje algoritama i adekvatnosti njihove primjene u realnim okolnostima i problema koji se pokušavaju riješiti. Na ETF-u smo u zadnjih nekoliko godina počeli intenzivnije izučavati predmete koji obrađuju ovu tematiku, tako da su studenti bolje  upoznati s tematikom i mogućnostima istih pri rješavanju nešto složenijih problema. Na njima je da ih sada primijene u praksi.

S druge strane, u naučnoj literaturi se svakodnevno pojavljuju novi algoritmi i potrebno ih je pratiti. Također, potrebno je prepoznati kvalitetan naučni rad od nekvalitetnog rada. Trenutno samo akademska zajednica prati naučne trendove i mislim da bi se kroz Data Science Institut mogla ostvariti izuzetno dobra saradnja između javnog sektora i akademske zajednice. Obim posla jednog akademskog radnika je danas podijeljen na nastavu, istraživanje, projekte i sastanke (osoblja, studenata, itd.) i vrlo često ni deset sati dnevno nije dovoljno da se kvalitetno posvetite svim obavezama.

N: Šta biste poboljšali u obrazovnom sistemu BiH kako bi imali kvalitetnije i spremnije data scientists u okruženju u kojem je sve više podataka?

Kao što sam i prethodno rekla, rješenje bi bilo u formiranju Data Science Instituta putem kojeg bi se radili projekti koji su veoma značajni za javni sektor i društvo generalno. Radom u Institutu, profesori bi mogli da se značajnijim dijelom posvete istraživanju što bi doprinijelo  kvalitetnijim naučnim rezultatima. Na ovaj način bi se popravili i nastavni procesi, jer bi dio stečenog znanja bio prenesen u nastavu, a što bi kao krajnji rezultat imalo za posljedicu bolji kadar za poslovni sektor. Na Univerzitet u Sarajevu trenutno imamo samo pet Instituta od kojih niti jedan nije posvećen izučavanju računarskih nauka, što je donekle apsurdno s obzirom na to da živimo u digitalnom svijetu.

N: I za kraj imamo li neku našu riječ za data scientists koja je i formalna? Recimo naučnice ili naučnici o podacima?

Nažalost, nemamo! Pitanje prevođenja engleskih termina je jedno od onih pitanja koje je u potpunosti zanemareno. Svojevremeno sam radila na lokalizaciji Desktop okruženja za Linux Operativni sistem prije više od 15 godina i imali smo izuzetno kvalitetne rasprave o tome kako i šta prevesti, međutim nismo smatrali da smo mi oni koji trebaju dati konačnu riječ o tome kako nešto prevesti. Očekivali smo da će se neko stručno tijelo uključiti u taj proces, ali nažalost to se nije desilo. Vrlo često čekamo da susjedi u Hrvatskoj ili komšije u Srbiji prevedu neku englesku riječ koju ili prihvatima ili je ismijavamo, što uglavnom zavisi od konteksta. To je naša svakodnevnica. Pogotovo je teško kada pišete neku knjigu i odlučite koristiti bosanski jezik, pa naiđete na neki termin ili riječ koju ama baš nikako ne možete prevesti.

“Data scientist” je također vrlo izazovno prevesti, zato što ne razlikuje inženjera/inženjerku podataka i naučnika/naučnicu podataka, a kod nas se to pogrešno izjednačava. Između ova dva pojma je ogromna razlika. Inženjer/Inženjerka podataka zna koji algoritam/metodu primijeniti nad kojim podacima, a posao naučnika/naučnice je da smišlja nove algoritme koristeći se naučnim metodama.

 


Širite znanje