RE: Prubeh indexovani Google

From: Martin Kopta (martin.kopta@garcon.cz)
Date: 22. 12. 2002, 15:16 CET


---> Bonjour,

SE muze poznat, ze se stranka zmenila, na zaklade hlavicky HTTP, ale 
obvykle se na ni nespoleha a spocita si hash ze stranky (nektere SE 
pocitaji se zdrojovym kodem, jine s obsahem po odstraneni tagu). 
V tehle technice se obvykle museji nejakym chytrym zpusobem eliminovat 
zmeny datumu, reklamy distribuovane serverem a podobne.

Pokud SE zjisti, ze se od posledni navstevy web zmenil, interval 
zkrati, a naopak. Denni indexaci ovsem provadi jen uz zpravodajskych 
webu a webu s vysokym poctem odkazu na nej vedoucich.

Tohle se sice netyka primo SE, ale mozna by o rozpoznavani zmen 
na strance mohl neco rict Michal Krause -- pred pul rokem jsme se 
o tom bavili v souvislosti se sluzbou WOKO.

> - Bylo zde zmineno, ze pokud je obsah nejake stranky casto aktualizovan,
> Google se k nemu vraci v kratsich periodach, treba i jednou denne. Jakym
> zpusobem aktualizaci poznava? Porovnava obsah s predchozim 
> indexovanim nebo nejak jinak zjistuje modifikovaci souboru? Lze robota 
> k castejsimu indexovani nejak "premluvit" - treba u mapy webu?

--
=M=



This archive was generated by hypermail 2.1.2 : 22. 12. 2002, 15:20 CET