Hlavní obsah

Katastr zatěžují i roboti z Číny. Minulý víkend poslali stovky tisíc dotazů

Foto: ČÚZK

Nahlížení do katastru. Ilustrační foto.

Od 12. června zavede katastr nemovitostí účinnější obranu proti těžbě dat ze strany robotů. Proti původním plánům ale zůstane anonymní nahlížení zachované. Šéf katastrálních úřadů Karel Večeře popisuje v rozhovoru proč.

Článek

Katastr nemovitostí je pod velkým tlakem robotů, kteří ve velkém stahují informace o domech a pozemcích. Za květen musela katastrální aplikace vyřídit 92 milionů dotazů. Stavěná přitom byla maximálně na 70 milionů. Výsledkem bylo, že se aplikace začala zpožďovat. Z katastru navíc pomocí robotů unikají osobní údaje. To využívali například spekulanti se zemědělskou půdou.

Český úřad zeměměřický a katastrální (ČÚZK) plánoval problém vyřešit vypnutím anonymního nahlížení do katastru. Záměr ale vyvolal bouřlivou reakci veřejnosti. Zformovala se iniciativa Otevřený katastr, kterou v krátkém čase podpořilo přes 15 tisíc občanů.

Úřad a jemu nadřízené Ministerstvo zemědělství pod nesouhlasným tlakem od plánu upustily. Automatům bude katastrální aplikace čelit pomocí takzvaného CAPTCHA testu. Ten se na internetu používá právě pro rozlišení člověka a robota, například tak, že člověk musí přečíst a zadat zdeformovaný text nebo označit, na kterých obrázcích se nachází například autobusy.

Katastr starší CAPTCHA test přitom využíval už v minulých letech. Tehdy se ho však roboti naučili obcházet.

Proč jste se rozhodli zachovat anonymní nahlížení do katastru?

Samozřejmě si stále vyhodnocujeme reakce. Byla to věc, kterou jsem musel probrat s Ministerstvem zemědělství jakožto nadřízeným orgánem. Proto jsem pana ministra požádal o schůzku. Pan ministr jasně potvrdil, že je potřeba bránit vytěžování katastru, ale na druhou stranu, pokud je tolik nesouhlasných reakcí, že máme zkusit postupy typu CAPTCHA testu.

Od příštího víkendu se aplikace upraví tak, že kdo nebude přihlášen a bude chtít vidět osobní údaje, bude muset překonat CAPTCHA test. Je to obvyklý postup. Tento test jsme ostatně používali už v letech 2013 až 2017. Tehdy na to také byly negativní reakce. Na druhou stranu, když někdo v katastru pracuje delší dobu a chce více údajů, vždycky existuje možnost se přihlásit a pak CAPTCHA test nebude muset vyplňovat.

Představuje automatické vytěžování katastru riziko pro příjmy vašeho úřadu z prodeje dat?

Určitě ne, nemáme žádný problém naše příjmy plnit díky aplikaci Dálkový přístup. My navíc tyto příjmy nijak nevyužíváme. Skončí ve státním rozpočtu. Jestli vybereme 200, nebo 250 milionů, na nás nemá vůbec žádný vliv.

Je robotické vysávání dat z katastru dlouhodobý problém?

První jednoduchá podoba elektronického nahlížení do katastru vznikla v roce 2004. První formy vytěžování aplikace se objevily v době po roce 2008. V první fázi jsme mu čelili pomocí testu CAPTCHA. Měli jsme jej celkem složitý, nějakou dobu to fungovalo. Časem se to ale začalo zase zhoršovat. Zjistili jsme, že se to masově děje přes zvukový záznam. Jeden čas jsme dokonce zjistili, že data jsou natolik atraktivní, že kód CAPTCHA přečetl například někdo ve Venezuele nebo v Indii.

Ve chvíli, kdy už CAPTCHA nebyla účinná, tak jsme ji odstranili a zavedli jsme blokování IP adres. To vychází z toho, že v obchodních podmínkách obchodního rejstříku stojí, že když uživatel vyšle více než 3000 dotazů za den nebo za jinou krátkou časovou jednotku, že ho zablokují. To by ovšem mohlo fungovat v prostředí pevných IP adres. Dnes už toto opatření příliš účinné není.

Zároveň se lidé, kteří katastr tímto způsobem vytěžovali, přesouvali do datacenter po celém světě. Měli jsme například víkend, kdy do aplikace směřovaly statisíce dotazů z čínských datových center.

Na webu jste ale před časem uvedli, že se problém podařilo technologicky vyřešit. Takže je to zase zpátky?

Systém byl stavěný na 60 až 70 milionů dotazů měsíčně. Jenže tyto hodnoty jsme začali překračovat. Důsledkem bylo, že se začaly prodlužovat odezvy. Systém jsme posílili, ale nárůst pokračuje. Za minulý měsíc jsme na 90 milionech dotazů. Už se zase začíná blížit doba, kdy výkonová rezerva nebude stačit.

Když se podíváte na noční provoz, tak je tam běžně sto tisíc dotazů za hodinu. Přeci si nikdo nemyslí, že v noci statisíce Čechů sedí u obrazovky a hledají si v katastru. Pokud máte trend, že během několika měsíců vyroste počet dotazů z 50 na 90 milionů měsíčně a pokračuje to, tak nemůžete čekat, až vám to zase brzy klekne. Když nebudeme nic dělat, dostaneme se velice rychle opět do situace, kdy se odezvy dramaticky prodlouží.

Luxování databáze

Není to ale celé jen technický problém? Nejde jen o to, mít dostatečně robustní systém?

To je jedna stránka věci. My jsme ale současně v postavení orgánu veřejné moci, který má nějaké povinnosti. Jedna z povinností je daná zákonem o zpracování osobních údajů. A my víme, že měsíčně je automatizovanými prostředky z naší databáze vysáto několik desítek milionů záznamů o parcelách a budovách. Součástí záznamu je jméno a adresa vlastníka. S tím musíme něco dělat. Nemůžeme připustit, aby vedle katastru kvůli jeho vytěžování vznikaly paralelní databáze, jejichž zdrojem jsme my. Máme povinnost chránit osobní údaje.

Máte poznatky o tom, že by někdo tyto osobní údaje z katastru zneužíval?

Realita je pak taková, že například vlastníkům zemědělské půdy chodí desítky dopisů s nabídkami na odkup. Někteří z těchto subjektů to navíc dělají tak, že si vybírají z databází podle věku a posílají nabídky jen starším občanům, kteří můžou být svolnější k prodeji. Někde tedy musí docházet ke zpracování osobních údajů, k němuž není žádný legální základ.

Obhajoba těchto postupů je bohužel postavena na tezi, že katastr jsou otevřená data. Kdyby to byla pravda, tak by to znamenalo, že osobní údaje nejsou nijak chráněné.

Nevyplývá ale otevřený přístup ke katastru ze zákona?

Nevyplývá. Katastr je veřejný a každý má právo do něj nahlížet. Ovšem často se vynechává, že jen pro svou potřebu. Poskytování údajů z katastru se neřídí právní úpravou svobodného přístupu k informacím.

To, že katastr je veřejný a každý má právo do něj nahlížet, neznamená, že to jsou otevřená data. Charakteristika otevřených dat je elektronická forma a strojově čitelný formát bez jakéhokoliv omezení pro další zpracování. Katastr otevřená data nejsou a my musíme jejich ochranu v maximální možné míře zajišťovat.

Doporučované