Na prvý pohľad ide o dve úplne odlišné veci – no spája ich spôsob spracovania obrazových dát. Michal Kováč, doktorand z Ústavu robotiky a kybernetiky FEI STU, sa venuje výskumu, ktorý prepája medicínu, umelú inteligenciu aj robotiku. V rozhovore hovorí nielen o vývoji generatívnej AI pre medicínu a o práci s multispektrálnymi dátami pre autonómne systémy, ale aj o tom, ako vyzerá doktorandské štúdium, medzinárodná spolupráca či príprava vedeckého workshopu na prestížnej konferencii International Conference on Computer Vision.
Začiatky a motivácia
Ako ste sa dostali k robotike a kybernetike?
K technológiám a robotike som mal blízko už od detstva. Začalo to jednoduchými projektami s Arduinom a postupne sa to prehĺbilo vďaka štúdiu na FEI STU. Fascinovalo ma, že kombináciou softvéru a hardvéru môžeme stvárniť správanie strojov a dať im schopnosť vnímať a reagovať na okolie.
Čo vás na technológiách najviac fascinuje?
Najviac ma baví, že pomocou technológií vieme riešiť reálne problémy – niečo, čo má priamy dopad. Momentálne pracujem na generatívnej AI pre medicínu a je fascinujúce sledovať, ako dokážeme pomocou umelej inteligencie rozširovať malé datasety, ktoré by inak nestačili na vývoj spoľahlivých diagnostických nástrojov. V medicíne často chýbajú dáta a AI môže pomôcť práve tam. Páči sa mi, že nejde len o teóriu – tie veci môžu mať reálny prínos pre lekárov a pacientov.
Výskum a doktorandské štúdium
Prečo ste sa rozhodli pre doktorát?
Chcel som ísť viac do hĺbky, nestačilo mi používať existujúce nástroje, chcel som ich vytvárať. Doktorát mi dáva priestor skúmať nové prístupy, tvoriť vlastné algoritmy a zároveň byť súčasťou komunity, ktorá posúva vedu dopredu.
Už ste naznačili, na čom pracujete. Povedali by si o tom viac?
S tímom vyvíjame modely schopné generovať realistické fundus obrazy s cieľom rozšíriť existujuce, často veľmi malopočetné, medicínske datasety. Tieto syntetické dáta môžu pomôcť zlepšiť diagnostiku a skríning ochorení ako diabetická retinopatia či glaukóm, a tým prispieť k dostupnejšej a presnejšej zdravotnej starostlivosti.
Čo sú to fundus obrazy?
Fundus obraz je snímka zadnej časti oka, teda sietnice, zrakového nervu a ciev. Sú to kľúčové dáta v očnom lekárstve, ale často je problém ich získať dostatok na trénovanie AI modelov.
Už sa vám niečo podarilo pretaviť do skutočnosti? Spolupracujete s nejakou nemocnicou alebo ako vyzerá taký prenos “produktov” z vedy do praxe?
Áno, spolupracujeme s viacerými nemocnicami, hlavne pri zbere dát a validácii výsledkov. Lekári nám pomáhajú hodnotiť, ako dobre funguje automatická diagnostika alebo aká je kvalita generovaných obrazov. Ich spätná väzba je pre nás kľúčová, vďaka nej vieme modely upravovať tak, aby mali reálny prínos v praxi. Zatiaľ sme ešte len vo výskumnej fáze, ale práve tieto konzultácie s odborníkmi z terénu sú prvým krokom k tomu, aby sa výsledky dali neskôr aj reálne použiť.

Aké sú najväčšie výzvy a čo vám štúdium dáva?
Výzvou je nájsť rovnováhu medzi výskumom, publikovaním a praktickou implementáciou riešení. Doktorát mi však dáva obrovskú slobodu, sebavedomie a schopnosť pracovať s top odborníkmi zo sveta.
V čom spočíva tá sloboda?
Hlavne v tom, že si môžem vybrať, akým smerom pôjde môj výskum, či už tematicky alebo technicky. Nie som viazaný konkrétnym produktom alebo cieľom, ako je to napríklad v priemysle. Môžem experimentovať, skúšať nové veci, hoci nie všetky vedú k výsledku. Zároveň sa môžem učiť od ľudí zo sveta a prepájať témy, ktoré by sa inde možno neprepájali.
S odborníkmi z akých krajín, prípadne centier, ste mali možnosť spolupracovať?
Najviac som spolupracoval s výskumníkmi z Yonsei University v Južnej Kórei, kde som mal možnosť absolvovať stáž a zapojiť sa do výskumu zameraného na vnímanie prostredia pre autonómne autá. Bola to veľmi intenzívna a praktická skúsenosť. Aktuálne v rámci príprav MIRA workshopu pracujem v tíme s ľuďmi z viacerých špičkových univerzít, napríklad zo Seoul National University, Tongji University v Číne, Karlsruhe Institute of Technology v Nemecku či Carnegie Mellon University v USA. Je to naozaj pestrá skupina ľudí z rôznych častí sveta, a práve to, že každý z nás má iné skúsenosti a pohľad na vec, robí tú spoluprácu zaujímavou a inšpiratívnou.

Úspech na medzinárodnej scéne
Spomenuli ste prípravu MIRA workshopu. Čo to je a ako ste sa dostali do výboru International Conference on Computer Vision (ICCV)?
MIRA workshop je skratka z Multispectral Imaging for Robotics and Automation Workshop, ktorý bude prebiehať ako súčasť prestížnej konferencie ICCV 2025 v Honolulu. Možnosť zapojiť sa do jeho organizácie vznikla vďaka stáži, ktorú som absolvoval v septembri minulého roka na Yonsei University v Soule v laboratóriu Seamless Trans-X Lab pod vedením profesora Shiho Kima. Počas stáže som spolupracoval na výskume vnímania pre autonómne vozidlá s využitím multispektrálnych kamier, kde som sa stretol aj s výskumníkom Yagizom Nalçakanom. Práve on inicioval vznik MIRA workshopu a pozval ma do organizačného tímu.
Pre mňa je to skvelá príležitosť pokračovať v medzinárodnej spolupráci, nadviazať kontakt s odborníkmi z celého sveta a aktívne prispieť k tvorbe programu pre prestížne podujatie, ktoré sa zameriava na najnovšie trendy vo využití multispektrálneho zobrazovania v robotike.
Okrem využitia AI v medicíne sa venujete aj ďalšej vedeckej téme? Nie je potom ťažké nájsť si dostatok času pre každú z nich?
Áno, popri generatívnej AI v medicíne sa venujem aj spracovaniu obrazu v kontexte autonómnych vozidiel, konkrétne s využitím multispektrálnych kamier. Na prvý pohľad sú to odlišné oblasti, ale v skutočnosti majú veľa spoločného. Stále ide o analýzu obrazových dát, trénovanie modelov a riešenie problémov spojených s nedostatkom kvalitných vstupov. Mnohé princípy, ako napríklad augmentácia dát, hodnotenie kvality výstupov či zvyšovanie robustnosti modelov, sú použiteľné v oboch prípadoch. Takže, aj keď prepínam medzi dvoma témami, veľa poznatkov viem využiť naprieč nimi.
Vráťme sa ešte k pripravovanému workshopu. Čo obnáša jeho organizácia?
Práca na workshope zahŕňa komunikáciu s pozvanými rečníkmi, koordináciu technických príspevkov, hodnotenie článkov a spoluprácu na celkovom programe. Ide o vytvorenie priestoru, kde sa stretávajú špičkoví vedci z celého sveta a diskutujú o budúcnosti robotiky a senzoriky.

Ako vyzerá spolupráca s odborníkmi z univerzít ako Yonsei alebo Carnegie Mellon?
Je to super skúsenosť! Každý z nás má iné zázemie a prístup k problémom, takže sa od seba veľa učíme. Niekedy riešime úplné technické detaily, inokedy sa rozprávame o tom, kam by sa výskum mohol posunúť a čo by mohol reálne zmeniť. Občas sú tie diskusie poriadne živé, ale práve z nich často vznikajú najlepšie nápady.
Prebiehajú takéto podobné debaty aj u vás na ústave? Inšpirujete sa navzájom?
Áno, určite. Máme veľmi dobrý tím doktorandov aj postdoktorandov, s ktorými sa často rozprávame o výskume, článkoch, trendoch. Často si navzájom ukazujeme, čo kto robí, pýtame sa na názor alebo si len tak brainstormujeme nové nápady.
Vízia do budúcnosti
Kam by ste sa chceli v budúcnosti posunúť – akademický svet, priemysel, startupy?
Zaujíma ma prepojenie výskumu s reálnym využitím. V budúcnosti by som sa rád uplatnil ako výskumník v technologickej firme alebo výskumnom centre, kde by som mohol aplikovať výsledky akademického výskumu do konkrétnych produktov alebo služieb. Startupové prostredie je pre mňa zaujímavé najmä kvôli dynamike a možnosti rýchlo testovať nové nápady, zatiaľ čo akademický svet ponúka možnosť hlbšieho systematického skúmania problémov. Uvažujem aj o kombinácii týchto svetov – napríklad spoluprácou medzi univerzitami a priemyslom.
Čo by ste odkázali študentom, ktorí rozmýšľajú o výskumnej dráhe?
Ak vás baví rozmýšľať nad vecami do hĺbky, hľadať odpovede na otázky, na ktoré ešte nikto neodpovedal, určite to skúste. Výskum nie je len o sedení v labáku – je hlavne o spolupráci, zdieľaní nápadov a trpezlivom hľadaní riešení. Niekedy to ide pomaly, niekedy to frustruje, ale ten pocit, keď niečo nové objavíte alebo pochopíte, stojí za to!