Web Crawler

Webový prehľadávač, známy tiež ako pavúk, je automatizovaný program alebo robot, ktorý systematicky prehľadáva internet a hľadá nový alebo aktualizovaný obsah. Účelom webového prehľadávača je zhromažďovať informácie, napríklad text, obrázky a odkazy, a potom tieto informácie indexovať v databáze pre neskoršie použitie vyhľadávacím nástrojom alebo inými aplikáciami.

Web Crawlers pracujú začatím na konkrétnej webovej stránke a potom sledujú odkazy na iné stránky na rovnakom webe a potom na iné stránky. Používajú algoritmy na určenie, ktoré stránky na prehľadávanie a ako často, a môžu byť nakonfigurované na rešpektovanie súborov robots.txt, ktoré používajú webové stránky na kontrolu, ktoré stránky sú prehľadávané a indexované.

Webové prehľadávače používajú vyhľadávacie nástroje ako Google a Bing na indexovanie obsahu webových stránok a na ich vyhľadávanie. Spoločnosti ich tiež používajú na zhromažďovanie informácií o svojich konkurentoch, na sledovaní správania zákazníkov a monitorovaní online zmienok o svojej značke.

Webové prehľadávače môžu byť výkonnými nástrojmi, ale môžu spôsobiť problémy, ak sa nepoužívajú zodpovedne. Môžu zaťažiť webové servery a môžu sa dokonca použiť na škodlivé účely, ako je škrabanie osobných údajov alebo pokus o preniknutie do systémov.

Celkovo sú webové prehľadávače dôležitou súčasťou moderného internetového ekosystému, ktoré pomáhajú udržiavať vyhľadávacie nástroje aktuálne a poskytovať cenné údaje pre podnikom aj výskumným pracovníkom. Je však dôležité ich používať zodpovedne a s ohľadom na práva vlastníkov webových stránok a obavy súkromia.

 

Späť do slovníka pojmov

 

Poznáte tiež...?

 

Shareware je označenie pre softvér, ktorý je chránený autorským právom, ktorý je možné voľne šíriť, avšak nie vždy voľne používať. Shareware programy obvykle po nejakej dobe užívania vyžadujú...

Čítať ďalej

QR kód (quick response kód, kód pre rýchlu odpoveď) je dvojrozmerný čiarový kód, ktorý funguje ako prostriedok na automatizovaný zber dát. Dokáže zakódovať veľké množstvo informácií (text,...

Čítať ďalej

Content delivery network (CDN - sieť na doručovanie obsahu) je skupina serverov rozprestieraných po celom svete a spolupracuje na tom, aby internet bol rýchlejší a efektívnejší. Predstavte si, že ste v závode a musíte získať informácie (napríklad web alebo video) z bodu A do bodu B...

Čítať ďalej