V digitálnom svete, kde je prístup k informáciám kľúčový, sa firmy a webové stránky často stretávajú s problémom automatizovaného zbierania dát, známeho ako scraping. Tieto aktivity, hoci niekedy legitímne, môžu viesť k preťaženiu serverov, zneužitiu zdrojov a narušeniu bežnej prevádzky. V reakcii na tieto výzvy vznikajú nové technológie na ochranu, ako je napríklad Anubis.
Anubis je riešenie, ktoré sa zameriava na identifikáciu a odradenie automatizovaných scraperov. Jeho základná myšlienka spočíva v tom, že aj keď dodatočná záťaž pre jednotlivca je zanedbateľná, pri masívnom scrapovaní sa tieto náklady výrazne zvyšujú, čím sa stáva menej ekonomicky výhodným.

Hlavný cieľ Anubisu nie je len blokovať scrapery, ale predovšetkým získať čas na vývoj pokročilejších metód. Tieto metódy zahŕňajú fingerprinting a identifikáciu bezhlavých prehliadačov (headless browsers). Fingerprinting sa zameriava na zbieranie jedinečných charakteristík prehliadača, ktoré ho odlišujú od ostatných. Bezhlavé prehliadače sú programy, ktoré automatizujú interakciu s webovými stránkami bez grafického rozhrania, čo ich robí ideálnymi pre scrapery.
Jednou z techník identifikácie bezhlavých prehliadačov je analýza spôsobu, akým vykresľujú písma (font rendering). Rozdiely v tomto procese môžu odhaliť automatizovaný softvér. Cieľom je, aby stránka s výzvou na overenie (challenge proof of work page) nebola prezentovaná používateľom, ktorí s najväčšou pravdepodobnosťou nie sú scrapermi, ale skutočnými návštevníkmi.
Je dôležité poznamenať, že Anubis vyžaduje používanie moderných JavaScriptových funkcií. Tieto funkcie môžu byť niektorými pluginmi, ako je JShelter, vypnuté. JShelter je nástroj, ktorý sa zameriava na ochranu súkromia používateľa tým, že obmedzuje sledovanie a zbieranie dát, často však na úkor funkčnosti moderných webových aplikácií.
Toto obmedzenie znamená, že používatelia, ktorí používajú pluginy na zvýšenie bezpečnosti a súkromia, môžu naraziť na problémy pri návšteve stránok chránených Anubisom. Systém Anubis teda predstavuje kompromis medzi robustnou ochranou proti automatizovanému zberu dát a dostupnosťou pre všetkých používateľov, vrátane tých, ktorí aktívne chránia svoje digitálne súkromie.
Čo je to bezhlavý prehliadač a ako ho používať?
V konečnom dôsledku, Anubis slúži ako dočasné riešenie, ktoré umožňuje vývojárom sústrediť sa na dlhodobé a efektívnejšie metódy ochrany webových stránok pred nežiaducim scrapingom.