System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy krymionalnej

RSS

W wyniku badań powstał system MPI, który składa się s trzech głównych komponentów:

 

1. Modułu Web crawlera zintegrowanego z ekstraktorem spójnych tekstów,

  2. Monitorów informacji, z których każdy ma indywidualną strategię crawlingu i własny ekstraktor informacji. W chwili obecnej MPI ma 4 monitory: monitor serwisu www o nieznanym adresie, monitor zdarzeń, monitor aktualizacji, monitor podobieństwa informacyjnego tekstów.

 3. Repozytorium tekstów, gdzie każdy tekst jest opisywany prze odsyłacze (links), adresy symboliczne,  addres IP adres serwera, etc…

 

W grudniu 2010 JM Rektor Agh podpisał zezwalającą Komendzie Głównej Policji na używanie

prototypu systemu MPI

Wszelkie prawa zastrzeżone © 2010 Katedra Informatyki   |   Akademia Górniczno-Hutnicza   |   Realizacja Creative Bastards