V poslednom období zaznamenalo vyhľadávanie obrázkov a detekcia objektov výrazný pokrok vďaka umelej inteligencii (AI). Tieto technológie umožňujú efektívnejšie rýchle spracovanie a analýzu obrovského počtu vizuálnych dát, čo je užitočné v mnohých oblastiach ako e-commerce, určovanie objektov a druhov, tvarov, produktov... Určite sa všetci už stretli s technológiou Google Lens. Ide o algoritmus rozpoznávania obrazových súborov od Google, ktorý je navrhnutá, aby zobrazoval relevantné informácie súvisiace s objektmi, ktoré sú identifikované pomocou vizuálnej analýzy založenej na neurónovej sieti (AI).
Vyhľadávanie obrázkov pomocou AI
Vyhľadávanie obrázkov založené na umelej inteligencii umožňuje používateľom vyhľadávať vizuálny obsah pomocou obrázkov namiesto textových kľúčových slov. Tento proces využíva techniky ako hlboké učenie a extrakciu vlastností, kde modely rozpoznávajú vzory, farby, tvary a textúry, prípadne samotné objekty a prvky v obrázkoch. Tieto systémy dokážu nielen vyhľadávať obrázky podľa podobnosti, ale aj kategorizovať a označovať objekty, čo výrazne zlepšuje presnosť vyhľadávania.
Ukážkový prípad použitia
Predstavme si, že disponujeme desiatkami tisíc fotografií vo zvolenej téme, v tomto ukážkovom prípade pôjde o škodcov lesných drevín. Každý škodca sa však prejavuje inak. Niektorý spôsobuje zmenu farby listov, iný poškodzuje kôru, prípadne majú ďalšie symptómy. Inak napísané, každá položka má svoje ďalšie atribúty, ktorých môžu byť desiatky...
Na prechádzke v lese nájdete na listoch poškodenie a chcete vedieť druh, ktorý to spôsobil. Tak jednoducho odfotografujete poškodený list, alebo kôru, nahráte fotografiu a umelá inteligencia prejde spomenuté desiatky tisíc fotografií v priebehu sekundy. Určí, či ide o list, kôru, drevo, identifikuje objekt na fotografii (poškodenie) a nájde v katalógu zhodné ďalšie fotografie. Algoritmom určí percento zhody a vygeneruje výsledok. K nemu je možné priradiť ďalšie vstupné informácie, napríklad druh dreviny, ktorý pri detailnej fotografii listu nemusí byť vôbec jasne určiteľný, prípadne lokalita výskytu. Takéto ďalšie vstupné parametre dokážu zmeniť výsledok v prospech kvalitnejšieho určenia. K celkovej analýze pripojí z existujúcej databázy text o danom škodcovi a vám, ako užívateľovi sa dostane kompletná informácia. AI dokáže efektívne triediť aj veľmi veľké datasety (stovky tisíc fotografií) veľmi efektívne.
Ukážkové video základnej funkčnosti
Spôsoby využitia
Existuje veľmi veľa možností využitia tejto technológie v praxi. Napíšem niekoľko z nich:
Prírodné vedy
Popísaný príklad aplikácie rieši analýzu a vyhľadávanie podobných obrázkov pre potreby určenia škodcu drevín. Tento istý spôsob je možné aplikovať pre vyhľadávanie rastlín, živočíchov, hornín a minerálov, oblakov a mnohých iných prírodných javov na základe vstupnej fotografie.
Vozidlá
Umožňuje vyhľadávanie podobných vozidiel pre účel kúpy, alebo predaja, prenájmu vozidiel ako autá, bicykle, motorky...
Produkty
V prípade vedenia skladu umožňuje hľadať vizuálne podobný sortiment. Tiež pri prevádzke e-shopu je možné návštevníkom ukázať ďalšie podobné produkty.
Analýza zdravotných snímok
Analýza a vyhodnotenie zdravotných snímok (napr. röntgenov, CT skenov), ktoré môžu uľahčiť a automatizovať isté procesy.
Fotobanka
Ak disponujete rozsiahlou fotobankou, niekedy môže byť náročné vyhľadať podobné fotografie tej vstupnej len na základe textového popisu, či podľa kľúčových slov. Aj tu je vhodné použitie umelej inteligencie pre rýchle vyhľadanie podobných obrázkov.
Integrácia AI vyhľadávania
Proces funguje približne nasledovne, ako je znázornené v diagrame nižšie. Zvolený súbor spracuje AI, ktorá následne prehľadá existujúcu databázu fotografií a informácií k nej priradených. Napríklad hľadá vizuálnu podobnosť a objekty na fotke a následne skóre zvyšuje, alebo znižuje podľa ďalších vstupných parametrov (drevina, miesto výskytu, rozmery, čokoľvek ďalšie, čo nie je možné z fotografie inak určiť...)
Integrácia AI vyhľadávania vizuálne podobných obrázkov spočíva vo viacerých krokoch.
1 – príprava datasetov
Všetky fotografie a informácie podľa uváženia je potrebné zosumarizovať, pričom môžu byť uložené v SQL tabuľke, ktorá umožňuje veľmi rýchle spracovanie, triedenie a správu. Taktiež je možný pravidelný import údajov prostredníctvom XML súboru.
2 – integrácia AI konektora
Na klasický webhosting s podporou PHP sa nainštaluje AI konektor pre analýzu obrazových údajov. Ide o systém napísaný v jazyku PHP, ktorý zabezpečuje riadenie celého procesu, teda analýzu vstupného obrázku, spracuje všetky relevantné informácie z databázy, vypočíta celkové skóre zhody s ohľadom na vizuálnu podobnosť a ďalšie parametre, ak sú zadané. Na záver vypracuje odpoveď pre užívateľa aj s použitím už evidovaných informácií. Nakoľko pri analýze vizuálnej podobnosti systém pracuje s ďalšími parametrami, ktoré sú k nájdeným podobným obrázkom priradené, môžeme ich aplikovať do zostavenia celkovej odpovede.
3 – postupné učenie sa modelu
Model sa postupným pribúdaním údajov dokáže učiť a výsledky teda môžu byť časom ešte presnejšie.
Aj napriek mnohým benefitom tejto technológie sa môžeme v niektorých prípadoch stretnúť s nesprávnou interpretáciou obrazových materiálov. V podstate to vidieť aj v ukážkovom videu, kde na základe vstupnej fotografie nám síce systém správne vyhodnotí hľadaného škodcu drevín na prvé miesto, ale rovnako nám aj ponúkne nesprávne možnosti na ďalších miestach s pomerne vysokým percentom zhody. Platí, čím väčšia je údajová báza, tým presnejšie výsledky nám AI dodá.
Pre viac informácií, prípadne záujem o integráciu podobného systému ma môžete kontaktovať.
Pridať komentár k článku