Re: Zákaz indexace určitých stránek

From: Michal Illich, adresa do konferenci <list (zavinac)>
Date: 06. 01. 2006, 09:10 CET
Ahoj,

>>1. znamenají obsahovou duplicitu
> Ano, znamenají. No a co? Stejnou duplicitu znamenají třeba dva
> různě sřazené seznamy.

	dva různě seřazené seznamy... počítaš jako takové i např. 
http://blog.cz/zebricky/ ? Tam jsou opravdu jedna jediná data nahlížená z 
3-4 pohledů (řazení). Ve výsledku jsou ty stránky úplně jiné - vzájemná 
podobnost jejich textů bude tak maximálně 10%. To za duplicitu stránek 
nepovažuju. A totéž platí pro většinu řazených seznamů, ten blog byl jen 
příklad.

>  Stejnou duplicitu znamená třeba
> www.csszengarden.com.

	jeden konkrétní, velmi specifický web není argumentem do obecné diskuze.
	Když se podíváš na jiné weby, které řeší stejný problém (více stylů pro 
jeden obsah), tak uvidíš, že to mají řešené výrazně lépe. Viz třeba 
http://pixy.cz/
	Tohle ale není kritika CSS Zen Gardenu - ten má trochu jiné potřeby (např. 
možnost odkazovat přímo konkrétní vzhled) než ostatní vícestylové weby, 
takže je tam více url ospravedlnitelné (i když nikoliv nejlepší) řešení. Ale 
to platí pouze pro Zen Garden, ne pro weby, o kterých mluvíme.

> IMHO se na to koukáš příliš z pohledu vyhledavače. Ve výsledcích
> vyhledávání samozřejmě obsahová duplicita být nesmí, ale nechápu,
> proč by nemohla být obecně na webu.

	zbytečné náklady na přenosovou kapacitu a na práci
	(tu přenosovou kapacitu můžeš počítat jako šestý, i když ne moc důležitý 
argument)

> Pokud kdy URL měla tuto filosofii, ztratila ji se zavedením
> link rel="alternate" a kotvy (#). V praxi, mimo filosofickou
> rovinu, to ovšem neplatilo nikdy, třeba právě kvůli tiskovým
> verzím (na které občas někdo chce adresně odkázat), kvůli RSS,
> kvůli personifikaci vzhledu atd.

	ano, URL měla filosofii - to, že ji v určitém období lidé rozmetali, je 
také pravda. Teď je vidět velmi podstatný posun zpět k té filosofii. A 
vyhledávače, seo konzultanti, webmasteři, bloggeři a další v něm hrají roli.

	Ke konkrétním výtkám:
	# - je v pohodě, to nikdo (tedy prohlížeč ani vyhledávač ani uživatelé) 
neberou jako samostatné stránky
	rss - to máš pravdu - v budoucnu by sice bylo hezké RSS a stránku sjednotit 
do jednoho datového toku (který má nějaké url) s několika styly prezentace 
(do webu, do mobilu, do tisku, do čtečky, atd.) a tendence k tomu trochu 
jsou, ale bude to trvat dlouho a pravděpodobně se to nepovede vůbec. To mi 
nevadí - rss je tak výborná věc, že tohle negativum bych akceptoval.
	alternate - to jsem většinou viděl použít buď na css nebo na rss - u css je 
to správně (tam nevznikají obsahové duplicity), o rss viz výš

>>3. jsou pracnější na vytvoření
> ... nedělá-li to hotový CMS sám od sebe.

	a hotový CMS nespadl ze stromu, ten musel někdo vytvořit, že...

>>5. mají často ten problém s roboty, kterým tohle vlákno začalo
> 
> Ano. Proto se o tom bavím a doufám, že jsem nesklouzl do OT. IMHO
> je tohle *jediný* skutečný problém tiskových verzí. A myslím, že

	on byl některý z těch předchozích bodů vyvrácen? :)	

> je škoda, že robots.txt neumožňuje zakázat URL podle určitého
> parametru za otazníkem. To by vyřešilo jak tiskové verze, tak ta
> různá řazení seznamů zmíněná výše, tak i plno dalších typických
> problémů (session id atd.).
> Ber to jako námět na další vývoj Jyxa :-)

	ani nevíš, jak rád bych to vyřešil. Robots.txt je v současnosti 
nedostatečný relikt z minula, kterých by pár zásahů potřeboval. Ale 
pochybuji, že bych dokázal jeho správce donutit ke změně, když je k tomu 
nepřiměly ani celosvětové vyhledavače.

	Hezké ráno...

MI, Jyxo
Received on Fri, 06 Jan 2006 09:10:56 +0100

This archive was generated by hypermail 2.1.8 : 06. 01. 2006, 09:10 CET