Metódy inžinierskej práce

ak. rok 2023/24

 
 

Rámcová téma

 
 

Vyhľadávanie, získavanie a extrakcia informácii

Vyhľadávanie, získavanie a extrakcia informácii (information retrieval) v prostredí otvoreného webu či v prostredí definovanom uzavretými resp. čiastočne uzaveretými digitálnymi systémami/knižnicami sa postupne rozvíja. Existujú konkrétne modely pre vyhľadávanie a získavanie informácií. Známe sú techniky indexovania a vyhľadávania ako aj spracovania textu pomocou textových operácií. Pretrvávajúcim problémom v oblasti je aj problém rozlíšenia relevantných informácií od zbytočných a pod. No s pokračujúcim narastaním objemu dostupných informácií, údajov, či všeobecne dát vyvstáva aj problém orientácie v nich. Známe sú preto prístupy triedenia dát do skupín na základe podobností a použitie sekvenčných klastrovacích algoritmov. Šandardnou je už podpora „full-text“ vyhľadávania, ale známe sú tiež sémantické vyhľadávanie a sémantické siete ako aj regulárne výrazy pri spracovaní textu. Množstvo svetových renovovaných vydavateľstiev vytvára a poskytuje najnovšie poznatky vo forme vedeckých publikácií, dát, ktoré sú prístupné pre dané skupiny angažovaných spracovateľov a vyhľadávačov takýchto informácií.

Vypracujte konkretizáciu rámcovej témy do podoby zámeru článku súvisac s témou vyhľadávania, získavania a extrakcie informácii (information retrieval) v prostredí otvoreného webu či v prostredí definovanom uzavretými resp. čiastočne uzaveretými digitálnymi systémami/knižnicami. Ako pomôcka môže poslúžiť súbor súvisiacich podtém: indexovanie, vyhľadávanie a usporiadanie, spracovanie veľkého množstva dát, distribuované systémy na ukladanie a spracovávanie dát, sémantické vyhľadávanie a sémantické siete, regulárne výrazy a ich použitie pri spracovaní textu.