Re: Zákaz indexace určitých stránek

From: Marek Prokop <mprokop (zavinac)>
Date: 05. 01. 2006, 23:27 CET
Michal Illich, adresa do konferenci napsal(a):

> protože dvě url

> 1. znamenají obsahovou duplicitu

Ano, znamenají. No a co? Stejnou duplicitu znamenají třeba dva
různě sřazené seznamy. Stejnou duplicitu znamená třeba
www.csszengarden.com.

IMHO se na to koukáš příliš z pohledu vyhledavače. Ve výsledcích
vyhledávání samozřejmě obsahová duplicita být nesmí, ale nechápu,
proč by nemohla být obecně na webu.

> 2. jsou proti filosofii URL, které identifikují zdroj, a
> nikoliv prezentaci

Pokud kdy URL měla tuto filosofii, ztratila ji se zavedením
link rel="alternate" a kotvy (#). V praxi, mimo filosofickou
rovinu, to ovšem neplatilo nikdy, třeba právě kvůli tiskovým
verzím (na které občas někdo chce adresně odkázat), kvůli RSS,
kvůli personifikaci vzhledu atd.

> 3. jsou pracnější na vytvoření

... nedělá-li to hotový CMS sám od sebe.

> 5. mají často ten problém s roboty, kterým tohle vlákno začalo

Ano. Proto se o tom bavím a doufám, že jsem nesklouzl do OT. IMHO
je tohle *jediný* skutečný problém tiskových verzí. A myslím, že
je škoda, že robots.txt neumožňuje zakázat URL podle určitého
parametru za otazníkem. To by vyřešilo jak tiskové verze, tak ta
různá řazení seznamů zmíněná výše, tak i plno dalších typických
problémů (session id atd.).

Ber to jako námět na další vývoj Jyxa :-)

-- 

Zdraví,

Marek Prokop
Received on Thu, 5 Jan 2006 23:27:10 +0100

This archive was generated by hypermail 2.1.8 : 05. 01. 2006, 23:22 CET