Fakulteta za elektrotehniko, računalništvo in informatiko Fakulteta za elektrotehniko, računalništvo in informatiko Laboratorij za sistemsko programsko opremo Slovensko društvo za razpoznavanje vzorcev Slovenska sekcija IEEE

Program konference

Prenos programa konference: PDF

Navodila za predstavitev: PDF

Zadnja navodila pred konferenco: PDF

Prostor konference: G2-Beta (UM-FERI)

8:30 – 9:00 Registracija
9:00 – 9:20 Pozdravni nagovor
Dopoldanska sekcija
9:20 – 9:50 Vabljeno predavanje
Borut Batagelj.

Uporaba metod računalniškega vida pri delu sodnega izvedenca
(več...)

Ko sodišče presodi, da mu je pri njihovi presoji potrebna pomoč strokovnjaka zaprosi sodnega izvedenca za izdelavo mnenja glede strokovnih vprašanj. Predavatelj bo predstavil težave in izzive s katerimi se kot sodni izvedenec srečuje pri svojem delu na področju biometričnih prepoznav obrazov in avtentičnosti slik.

Preden lahko na sliki iz nadzorne kamere uporabimo sistem za samodejno prepoznavo obrazov, jo moramo z različnimi metodami za obdelavo slik izboljšati in popraviti. Z metodo računalniškega vida iz slik rekonstruiramo 3D informacije. Včasih je treba potrditi tudi pristnost videomateriala, za kar lahko uporabimo različne tehnike na podlagi poznavanja formata zapisa in delovanja algoritmov za obdelavo slike in videa. Če identifikacija na osnovi obraza ni mogoča ali je neuspešna, lahko uporabimo tudi druge biometrične karakteristike osebe − mehke biometrike. Sodni izvedenec zaslikovno biometrijo mora razumeti in znati uporabiti različne metode za obdelavo slik in različna orodja računalniškega vida. Sposoben mora biti tudi razložiti svoje ugotovitve in oceniti verjetnost končnega rezultata.

Predstavitev: pdf
9:50 – 10:05 Nejc Vesel idr.
Staranje obrazov s pomočjo globokih generativnih nevronskih mrež
(več...)

Staranje obrazov je področje, ki se ukvarja z modeliranjem staranja osebe iz ene same referenčne slike. Želimo ustvariti generativni model, ki nam s pomočjo nevronskih mrež ustvari slike referenčne osebe pri različnih starostnih skupinah. Pri našem pristopu smo želeli cilj doseči z uporabo različnih generativnih arhitektur. Implementirali smo različne generativne modele, podrobneje pa predstavimo arhitekturo nasprotniškega avtoenkoderja naučenega v namene staranja obrazov. Dobljene rezultate ovrednotimo tako kvalitativno kot kvantitativno.

Predstavitev: pdf
10:05 – 10:20 Marija Ivanovska idr.
Detekcija razpok v steklu - klasična metoda proti globoki nevronski mreži
(več...)

Predstavljena je problematika detekcije razpok v steklu z uporabo cenene strojne opreme (osvetlitev v vidnem spektru in RGB kamera). Kot primer so uporabljene steklene viale, kjer smo na množici vial umetno povzročili razpoke. Slike vial so bile zajete v nadzorovanem okolju, kjer smo lahko vialo nadzorovano rotirali okrog glavne osi, ter spreminjali smer osvetlitve. Zasnovali smo klasično metodo strojnega vida, ki temelji na strokovnem znanju avtorjev, za primerjavo pa smo uporabili še prilagojeno globoko nevronsko mrežo VGG-16. Obe metodi dosežeta 100% delovanje, iz ablacijske študije pa je očitno da je najbolj pomemben faktor pri obeh metodah ravno velika, redundantna količina vhodne slikovne informacije.

Predstavitev: pdf
10:20 – 10:35 Matej Vitek idr.
Učenje igranja računalniških iger z globoko obdelavo slik in drevesnim preiskovanjem Monte Carlo
(več...)

Področje globokega učenja je v zadnjem desetletju doživelo precejšen razcvet. Uporablja se za reševanje premnogih problemov, v zadnjih petih letih pa precej tudi za igranje iger. Dva pomembna dosežka sta bila globoke Q-mreže (DQN) in Alpha-Zero. DQN se je naučila igrati klasične igre za Atari 2600 (Pong, Space Invaders, itd.), AlphaZero pa se je s samo-igranjem naučil igrati šah, šogi in Go. Mi smo na temelju AlphaZero poskusili zgraditi agenta FighterZero, ki bi se prav tako s samo-igranjem naučil igrati pretepaške računalniške igre. Rezultati so bili manj uspešni, kot smo pričakovali, saj se je časovna zahtevnost izkazala za nepremagljivo oviro.

Predstavitev: pdf
10:35 – 10:50 Martin Pernuš idr.
Poravnava 3D modelov objektov na realne 3D oblake točk
(več...)

Predstavljena je problematika poravnavanja trodimenzionalnih modelov objektov na trodimenzionalne oblake točk, ki so bili zajeti z realnimi (neidealnimi) 3D senzorji. Ker gre za šestdimenzionalen optimizacijski problem, je zelo verjetno, da se bo poravnava ustavila v lokalnem minimumu in bo končni rezultat neuporaben. Predlagano delo temelji na metodi Drosta in soavtorjev, predstavljeni na CVPR 2010, ki jo najdemo v knjižnici OpenCV ter v komercialni programski opremi za strojni vid. Po naših izkušnjah je samo na podlagi dostopne dokumentacije nemogoče doseči dobro delovanje na realističnih podatkih, zato v tem članku na kratko predstavimo metodo, predvsem pa damo praktične napotke, kako pripraviti podatke ter nastaviti parametre, da bo metoda dobro delovala in jo bo mogoče uporabiti tudi v industrijski robotiki.

Predstavitev: pdf
10:50 – 11:05 Jurij Munda idr.
Spletni sistem in javna podatkovna baza USOVA3D za nepristrano validiranje postopkov detektiranja jajčnih mešičkov na 3D ultrazvočnih posnetkih jajčnikov
(več...)

V tem prispevku predstavljamo spletni sistem in javno podatkovno bazo USOVA3D, namenjena nepristranemu ocenjevanju uspešnosti algoritmov detektiranja mešičkov na 3D ultrazvočnih posnetkih jajčnikov. Podatkovna baza vsebuje 44 zapisov, pri čemer vsak zapis sestoji iz ultrazvočnega posnetka jajčnika pacientke ter volumenskih datotek z označbami jajčnika in mešičkov. Vsak posnetek sta ločeno označila dva neodvisna eksperta ginekologa. Vsi podatki so popolnoma anonimizirani ter so shranjeni v volumenskih datotekah v formatu VTK. Spletni sistem zagotavlja dostop do podatkovne baze USOVA3D, hkrati pa natančno predpisuje protokol validiranja in nudi programske rutine za nepristrano vrednotenje algoritmov detektiranja mešičkov. Ta sistem tudi beleži in omogoča vizualiziranje rezultatov validiranja.

Predstavitev: pdf
Odmor za kavo
11:45 – 12:00 Študentski prispevki
Luka Loboda idr.

Contactless fingerprint identification using mobile phone camera
(več...)

Fingerprint systems typically use images acquired with contact based sensors. This poses a problem as additional hardware is needed and full cooperation of the user is required. To address these issues we test the possibility of using mobile phone’s camera as a contactless fingerprint sensor. We created our own database of contactless fingerprints acquired with regular mobile phone camera. We used this database to test performance of fingerprint matching algorithm designed to compare regular fingerprint images. With image enhancement we managed to achieve a promising equal error rate of 13.81%. To showcase the usability of the proposed concept of contactless mobile authentication we also developed a mobile application. Authentication with mobile application achieves sensitivity of 80% with 100% of imposters being rejected.

Predstavitev: pdf
12:00 – 12:15 Aleš Horvat idr.
Optično branje podatkov iz računa
(več...)

V članku je predstavljen postopek, ki smo ga razvili v sklopu diplomske naloge na fakulteti za računalništvo in informatiko, kot rešitev za problem avtomatiziranega vnosa stroškov v mobilno aplikacijo za osebno finančno evidenco. Aplikacija zajema storitev, ki uporabniku omogoča zajem slike računa nad katero izvede optično prepoznavo znakov, ter prebran tekst posreduje algoritmom za iskanje podatkov na računu. Končne rezultate lahko uporabnik v primeru napake popravi in s tem tudi zmanjša možnost ponovitve enake napake pri naslednjih branjih. Podatki, ki jih aplikacija išče so: končni znesek, datum, izdajatelj računa, naslov na katerem je bil račun izdan in kategorija. Za optično prepoznavo znakov je bila uporabljena knjižnica Google Mobile Vision. Na koncu članka so predstavljeni rezultati testiranja učinkovitosti skeniranja računov.

Kosilo
Demonstracijska sekcija: "Globoko učenje: Praktični nasveti strokovnjakov"
14:30 – 14:50 Danijel Skočaj idr.
Aplikativna uporaba segmentacije osnovane na globokem učenju
(več...)

V zadnjih letih smo priča zelo velikemu napredku na področju računalniškega vida, ki predvsem na krilih globokega učenja dosega odlične rezultate in v obliki raznih aplikacij in robotskih sistemov vstopa na najrazličnejša področja našega življenja. V tem članku bomo osvetlili te zadnje trende in predstavili zmogljivosti globokega učenja na primerih praktičnih aplikacij. Predvsem se bomo osredotočili na probleme, ki so rešljivi z uporabo semantične segmentacije oz. njenih nadgradenj. Predstavili bomo primere detekcije anomalij na industrijskih (pol)izdelkih, detekcije ovir na vodni površini pred avtonomnim plovilom ter štetja predmetov oz. polipov, ki svojo funkcionalnost gradijo na segmentacijskih konvolucijskih globokih nevronskih mrežah. Metodologija, osnovana na globokem učenju, omogoča zamenjavo paradigme razvoja aplikacij računalniškega vida; namesto klasičnega inženirskega pristopa s snovanjem namenskih značilnic in algoritmov se vse bolj uveljavlja pristop, ki temelji na podatkih in strojnem učenju. Tak pristop vse bolj prodira tudi na področje strojnega vida.

Predstavitev: pdf
14:50 – 15:10 Jure Skvarč idr.
Praktična uporaba metod umetne inteligence v industrijskem okolju
(več...)

Umetna inteligenca (UI) je področje informatike z interdisciplinarnim značajem. Cilj UI je razvoj naprav, ki se vedejo, kot da bi razpolagale z inteligenco. S postopki strojnega in globokega učenja računalnike naučimo, da so sposobni učinkovito opravljati naloge v ozki domeni. S tehnologijo vizualne inteligence lahko izjemno nadgradimo zmogljivosti sistemov strojnega vida v industriji. Lahko rešujemo do sedaj nerešene probleme in odpiramo nove priložnosti za uporabo. V prispevku bodo predstavljeni konkretni primeri iz prakse, ki bodo pokazali, da UI spreminja paradigmo reševanja izzivov na področju strojnega vida v industrijskem okolju.

Predstavitev: pdf
15:10 – 15:30 Gašper Sedej idr.
Globoko učenje: Od samovozečih avtomobilov do anotacije rentgenskih slik
(več...)

Članek opisuje postopek predelave nevronske mreže namenjene avtonomni vožnji v nevronsko mrežo, ki je sposobna anotirati karakteristične točke na biomedicinskih slikah. Kot osnovo smo uporabili arhitekturo za segmentacijo slik imenovano Segnet. Mrežo smo priredili za branje rentgenskih slik in detekcije karakterističnih točk ter jo poimenovali KeypointNet. Preizkus smo opravili na bazi 124 kefalometričnih rentgenskih slik. Na slikah smo označili 10 kefalometričnih točk. Mrežo smo učili na učni množici velikosti 100 slik in testirali na testni množici velikosti 24 slik. Rezultati meritev na testni množici so pokazali povprečno napako 2,7 piksla pri velikosti slike 480 × 360.

Predstavitev: pdf
15:30 – 15:50 Matthias Kerschhaggl
State of the art hyperspectral data analysis and prospects with respect to AI
(več...)

Multidimensional data such as stemming from hyperspectral imagery (HSI) with its high degree of collinearity need sophisticated multivariate methods to extract relevant features in various machine vision applications. Most of the current methods emphasize the spectroscopic nature of the data and focus less on other features such as object shape and texture also present in HSI-cubes. Corresponding features are often treated separately and sequentially rather than analysing the data following a more holistic approach. This limitation can be overcome by introducing e.g. deep learning methods (such as stacked autoencoders) to these combined spatio-spectral datasets. This talk will give a brief introduction into state of the art hyperspectral analysis algorithms as well as an outlook into the benefits of modern AI methods related to this high potential machine vision technology.

Predstavitev: pdf
Študentski prispevki (nadaljevanje)
15:50 – 16:05 David Romero idr.
Subdivided Ear Recognition
(več...)

The present paper addresses the performance of different ear feature extractors on partial ear images. The main goal is to find out which parts of the ear have major influence on successful recognition for each extractor. In this sense, a whole ear recognition pipeline has been simulated using Annotated Web Ears (AWE) Toolbox and dataset [1]. Ears have been divided in up, down, internal and external parts and results have been compared. It has been demonstrated the existence of performance gaps between different ear parts and extractors. Trying to exploit that, a score level distance fusion approach has been tested combining separately obtained distances by means of weighted averaging.

Predstavitev: pdf
16:05 – 16:20 Alen Ajanović idr.
Comparing performance of biometric models trained on different groups with Bayesian statistics
(več...)

When developing a decision model, data bias can have large unwanted consequences. In this paper we explore whether a trained ear detection model performs better on female or male images depending on what its training set constituted. We use three separately trained convolutional neural networks (CNN) based on the U-Net architecture as well as Haar cascades for comparison. The three distinct training sets consist of a balanced set of females and males, a set of all females, and a set of all males. After being trained on each, they attempted to produce a mask locating an ear of both groups. With Bayesian statistics, we modelled a normal distribution of their intersection over union scores on similarly sized testing sets. Results show that models tend to prefer one group over the other, but that this difference is too marginal to be practically relevant. The overall success achieved is related to the size of the training set and the larger it is, the better it seems to perform on both genders. In our case, a model that was trained on only males performed equally well classifying females as the one trained on both genders if their training sets were similarly large.

Predstavitev: pdf
Odmor za kavo