Re: Seznam nejeví zájem očuchávat samotné články

From: Dušan Janovský <janovsky (zavinac)>
Date: 25. 04. 2006, 20:34 CEST
Dobrý den,

> Můj nový portál nějak "nevoní" seznamu.cz. Základní SEO je myslím vpořádku a
> seznam indexuje správně
> hlavní rubriky (se seznamy článků), ale nějak se mu nechce zaindexovávat
> samotné články (což je v podstatě
> nejdůležitější). Netušíte proč?

robot Seznamu si pro každou skupinu provázaných stránek (představte si
to jako doménu) interně počítá "ochotu", s jakou se mu chce sledovat
nové odkazy. Tato ochota se počítá z mnoha věcí.

> Jedná se o doménu www.moje-rodina.cz

Ve vašem případě hraje podstatnou negativní roli množství velmi
podobného obsahu, který robot Seznamu na stránkách www.moje-rodina.cz
nasbíral. Například je nyní v indexu toto:

http://www.moje-rodina.cz/forum/56?sort=asc&order=T%C3%A9ma
http://www.moje-rodina.cz/forum/56?sort=asc&order=Odpov%C4%9Bd%C3%AD
http://www.moje-rodina.cz/forum/54?sort=asc&order=Vytvo%C5%99eno
http://www.moje-rodina.cz/forum/56?sort=asc&order=Posledn%C3%AD
http://www.moje-rodina.cz/forum/56?sort=desc&order=Posledn%C3%AD
http://www.moje-rodina.cz/forum/56?sort=desc&order=T%C3%A9ma

Na první pohled jsou to téměř duplicity, ale vzhledem k tomu, že na
tyto stránky chodí robot v různých časech, najde dole v levém menu
rozdílné poslední komentáře, a tak si tyto stránky pouze označí jako
podobné, nechá si je nějaký čas v indexu a zahrne jejich existenci do
výpočtu ochoty sbírat další stránky. Konkrétně v tomto případě pak
ochota robota chodit pro nové stránky klesá.

Dá se to tedy říct i tak, že robot na vašich stránkách zabloudil ve
slepých uličkách, což ho odradilo od dalšího cestování. Momentálně
robota upravujeme, aby v takových případech fungoval lépe, nicméně
toto současné chování považuji za v zásadě logické.

Co s tím můžete udělat:

- na články, které považujete za důležité, odkazujte častěji a z
důležitějších stránek než na jiné, méně důležité věci. Dostanou se do
indexu s vyšší pravděpodobností.

- pomocí robots.txt můžete zakázat URL, které jsou pro vyhledávač k
ničemu. Zakázáním některých stránek můžete zvýšit ochotu našeho robota
chodit pro stránky jiné. K zákazům pro robota Seznamu můžete nyní nově
použít i hvězdičku, která v pravidle Disallow označuje více znaků.
Například můžete přidat řádek
Disallow: /forum*?sort=desc
(na jednom řádku nelze používat více než jednu hvězdičku)

- různé řazení diskusí nedělat odkazem, ale třeba submitováním
formuláře. Tím vznikne méně téměř duplicitních URL.

- smazat z levého menu box s posledními komentáři. Tím se z mnoha
podobných URL stanou URL duplicitní. Robot Seznamu si s duplicitními
URL umí poradit lépe (a hlavně rychleji) než s velmi blízkými
podobnostmi. Blízké podobnosti se z indexu vyřazují po řádově delší
době než čisté duplicity. Čisté duplicity se totiž jenom lehce
propočítají, orankují se a pokud nejsou důležité, tak se velmi brzo
zahodí. Tím pádem se do ochoty, s jakou se na skupině stránek chodí
pro nová URL, duplicity promítají jen velmi málo. Jinak řečeno -- ano,
čisté duplicity uvnitř jedné domény robotovi Seznamu nyní tolik
nevadí.

Upozornění: Výše popisované chování robota se v budoucnu může měnit.

--
Yuhů
Seznam.cz
Received on Tue, 25 Apr 2006 20:34:17 +0200

This archive was generated by hypermail 2.1.8 : 25. 04. 2006, 20:34 CEST