P2-0041 Računalniški sistemi, metodologije in inteligentne storitve

O programski skupini

Osnovne informacije

Vodja: prof. dr. Borut Žalik
Obdobje: 11. 2015 - 31. 12. 2019
Obseg: 3,60 FTE

Povzetek

Predlagana raziskava bo preučevala skupne značilnosti in zakonitosti nestrukturiranih in heterogenih masivnih podatkovnih virov in tokov, ki jih vsakodnevno srečujemo v računalništvu in informatiki (na primer, svetovni splet, sistemi za zajemanje podatkov o površju Zemlje, biomedicinski sistemi). Njihova obsežnost, dinamika in raznolikost nudijo veliko raziskovalnih izzivov, katerih primarni cilj je poenotiti njihovo obdelavo na ustreznem nivoju abstrakcije. V ta namen bomo posamezne podatkovne vire in tokove, ki so praviloma potopljeni v močan informacijski in instrumentalni šum, razstavili na osnovne pomenske gradnike (simbole), kar bo omogočilo njihovo učinkovito razšumljanje, strukturiranje in poravnavo. Napredne metode za bogatenje podatkov bomo izvedli v obliki šibko sklopljenih storitev, katerih orkestracija nas bo vodila do širokega nabora uporabniških aplikacij. V ta namen bomo ključne raziskovalne paradigme povezali v trinivojsko storitveno arhitekturo, kjer bo prvi nivo skrbel za domenskospecifično upravljanje s podatkovnimi viri in za interoperabilni dostop storitev z drugega nivoja. Ta nivo se osredotoča na bogatenja podatkov, pri čemer bomo veliko pozornosti posvetili pridobivanju osnovnih podatkovnih gradnikov. Osredotočili se bomo predvsem na razvoj dveh nedavno predlaganih paradigem: algebraični formalizaciji atributnih filtrov, ki temeljijo na matematični morfologiji, in analizi skritih komponent. Prva paradigma omogoča natančno ocenjevanje lastnosti vzorcev s selektivnim in povsem samodejnim prilagajanjem iskanih geometrijskih struktur vhodnim množicam podatkov, druga paradigma pa izkorišča časovno-prostorske odvisnosti podatkovnih gradnikov (simbolov) za ločevanje sestavljenih podatkovnih tokov na prispevke različnih izvorov. Hevristično znanje o karakteristikah dobljenih osnovnih podatkovnih gradnikov bomo iskali s pomočjo algoritmov strojnega učenja in jih preko njihovih medsebojnih relacij povezali v višjepomenske sklope. Zadnji nivo naše arhitekture je aplikacijski nivo, kjer bomo uporabili storitve drugega nivoja ter na pomensko zelo različnih področjih pokazali njihovo univerzalnost in interoperabilnost. Kot značilna primera navajamo zaznavo nepravilne mišične skrčitve s pomočjo neinvazivno zajetih površinskih elektromiogramov in oceno sprememb zemeljskega površja, zaradi plazenja, erozije vode ali vetra. Obe omenjeni aplikaciji naslavljata aktualne družbeno-ekonomske izzive, povezujejo pa ju strmo naraščajoči stroški, ki jih povzročajo demografske in podnebne spremembe. Za učinkovito sprejemanje strategij na nacionalnem in evropskem nivoju je ključna prav izdatna informacijska podpora, ki temelji na zbiranju in verodostojni interpretaciji preverljivih podatkov. Predlagani razvoj računalniških algoritmov bo omogočil učinkovitejšo, zanesljivejšo in hitrejšo obdelavo obstoječih podatkovnih zbirk na omenjenih področjih, s tem pa izdatno podprl tudi številna druga znanstvena področja.