IBM bojuje proti rasismu rozpoznávání obličeje speciálními značkami a větší pestrostí vstupních dat

Rasismus algoritmů schopných přesně rozpoznat a identifikovat lidskou tvář je dlouhodobý problém. Z různých nezávislých testech vyšlo, že většina aplikací lépe nejlépe rozeznává tváře mužů s bílou kůží. Naopak u žen vykazuje vyšší chybovost stejně jak jako u lidí s jinými odstíny pleti nebo rysy obličeje.

Podle odborníků z IBM je hlavní důvod prostý – malá rozmanitost v datech, na nichž systém své schopnosti trénuje. Proto také oznámila zveřejnění dvou nových datových sad, které slouží k výuce strojového učení. Ty byly připravené tak, aby pomohly předcházet předpojatosti a naučili počítače vidět lidi stejně.

První sada obsahuje asi milion snímků tváří a obsahuje také značky, které stroji říkají jakou má člověk na obrázku délku vlasů, barvu očí a vlasů a další fyzické rysy. Díky tomu se může systém učit opakovaně a své odpovědi ihned kontrolovat. Ačkoliv se nejedná o největší veřejně dostupnou databázi, právě nový systém značek by podle IBM mohl pomoci posunout celý obor rozpoznávání tváří dopředu.

Druhá sada, je znatelně menší, obsahuje 36 000 snímků tváří. Její tvůrci však kladli hlavní důraz na rozmanitost, proto obsahuje lidi různých etnik, věku a pohlaví. I zde jsou použité speciální tagy, které mají strojům při učení napovědět, tak aby na příště byli schopny určit tvář bezpečně samy.

IBM čerpalo z fotografií lidí, které uživatelé daly s volnou licencí na Flickr. Svou činností se IBM snaží napravit svou reputaci. Jeho systémy totiž vykazovali vysokou míru předsudků a podle některých výzkumů byla jejich nepřesnost u žen s jinou než bílou barvou kůže až 35 procent. Svou snahu IBM deklaruje i sérii besed a workshopů na nichž chce debatovat s vysokoškolskými odborníky na možnostech zavádění nových proměnných a metod do rozpoznávání obličejů, které by mohly zvýšit přesnost a odstranit nežádoucí vlastnosti.

Zdroj: theverge.com