Re: Re[2]: FW: odkaz pres obrazek v barve pozadi

From: izero <izero (zavinac)>
Date: 10. 06. 2005, 17:46 CEST
----- Original Message ----- 
From: "Ing. Branislav Gerzo" <konfera@2ge.us>
To: "Dusan Janovský" <seo@nawebu.cz>


> Dnes, vo stvrtok, 9. juna 2005 v noci o 02:16, pisal Dusan Janovský
> [DJ]:
>
> DJ> 1. robot musi obsahovat HTML/CSS parser. Pokud mate pocit, ze to je
> DJ> dost tezke, tak si uvedomte, ze pri konstrukci parseru staci pocitat
> DJ> barvy pisma, barvy odkazu a barvy pozadi. Tato metoda je ovsem docela
> DJ> zranitelna, protoze staci:
>
> s tym css parserom to nie je az take jednoduche ako by sa mohlo na
> prvy pohlad zdat, osobne si nemyslim, ze roboti vedia spravne parsovat
> CSS a na zaklade toho robit nejake usudky (napriklad skryty text).
> display: none; sa pouziva coraz castejsie v CSS menu.

    Vôbec to také tazké nevidím. Nech je MS akokolvek zatracovaný, na
podobné veci sa dá krásne vyuzit MSHTML library, kde sprasujete celý DOM aj
s CSS vlastnostami. Pre dokonalost nie je problem nacítat obrázok,
spriemerovat pixely a porovnat, ci je dostatocný kontrast s podkladom.
Myslím si ale, ze nacítavat kvanta obrázkov len preto, aby som zistil podvod
je blbost a pre vyhladávace zbytocné mrhanie síl.

PS: Samozrejme, na linuxe by bolo asi najlepsie pouzit obdobu MSHTML parseru
z jadra Gecka/Mozilla. A v neposlednom rade, pekný parser je v HTML Tidy,
ale len pre HTML, na HTML je tých parserov viac, viz codeproject.com.

    Anton Piták
    http://www.softpae.com
Received on Fri, 10 Jun 2005 17:46:19 +0200

This archive was generated by hypermail 2.1.8 : 10. 06. 2005, 17:47 CEST