Rozpoznání hitparády vyhledavačem

From: Jan HejTi Šedo - konference <konference.hejti (zavinac)>
Date: 23. 05. 2005, 23:14 CEST
S kamarádem jsme narazili na jeden takový "problém":

Snažíme se udělat takový menší fulltextový vyhledávač na několika
doménách, mimo jiné na www.signaly.cz. (Prosím nesnažte se jakkoli
argumentovat jestli to má nebo nemá cenu to dělat - už to má kamarád
zapsané jako zápočet a navíc by to bylo OT.) Na tomto webu je ale na
každé stránce v pravo v menu hitparáda, která se téměř neustále mění a
je nezanedbatelnou částí stránky. Protože téměř pokaždé, když crawler
přijde na jakoukoli stránku zmiňovaného situ se na ní něco "změní",
vyhledávač tomu přiřadí prioritu co se týče přeindexování stránky a
snaží se je co nejčastěji aktualizovat, což ho ale zbytečně zatěžuje.

Protože ale řešení tohoto problému nespadá do tématu této konference,
formuluji otázku jinak:

Jak se asi vyhledávače mohou k tomuto problému stavět? Co když se totiž
na stejné ploše změní komentář k článku - to je pro uživatele výraznější
změna a přitom pro stroj to vypadá stejně. Jak často je potom taková
stránka přeindexovávaná? Co jsem se díval do logů signálů na googlebot,
tak ten na stránky článků nepřijde minimálně více jak tři dny (bohužel
na serveru mám k dispozici vždy statistiky za poslední tři dny :( ),
přičemž se tam neustále něco mění... Neřešil jste někdo podobný problém?

Nemůže to mít negativní vliv na hodnocení stránky? Když se na to podívám
z pohledu uživatele, tak si nejsem jistý - vadí mu to nebo ne? Hitparáda
nesouvisí s hlavním sdělením stránky, ale přesto je tam celkem vhodná...

Napadá mě jistá spojitost s "náhodně generovaným obsahem", kterého se
pár lidí zastává jako dobré metody jak zvýšit hodnotu stránky a docílit
častějšího indexování stránky - teoreticky by to měla být pravda, ale
nemáte někdo nějaká fakta? Pokusím se překecat správce serveru, aby
předělal ty logy na signálech a pokud se povede, napíšu sem. Bylo by ale
dobré asi porovnat několik webů...

Jan HejTi Šedo
hejti.tvorime.net
Received on Mon, 23 May 2005 23:14:29 +0200

This archive was generated by hypermail 2.1.8 : 23. 05. 2005, 23:14 CEST