Stejny obsah pod ruznymi URI [RE: (ne)zobrazovani GPR v Toolbaru]

From: Martin Kopta (martin.kopta@garcon.cz)
Date: 22. 12. 2002, 15:06 CET


---> Bonjour,

a jsme zase u mod_rewrite. Pokud si nektere servery domenu treti urovne (www) 
pridavaji samy, jsou tak proste nastavene. SE muze rozpoznat tyz zdroj na ruznych 
URI porovnanim hodnoty hlavicky HTTP ETag, ve Vasem pripade Apache vraci pro 
obe zminene destinace (spravne) tutez:

  25f2f8-3315-3df3e581

  # [www.zvony-tomaskova.cz]
  http://delorie.com/web/headers.cgi?url=http%3A%2F%2Fwww.zvony-tomaskova.cz%2F
  # [zvony-tomaskova.cz]
  http://delorie.com/web/headers.cgi?url=http%3A%2F%2Fzvony-tomaskova.cz%2F
  # [zvony-tomaskova/index.html]
  http://delorie.com/web/headers.cgi?url=http%3A%2F%2Fzvony-tomaskova.cz%2Findex.html
  # [www.zvony-tomaskova/index.html]
  http://delorie.com/web/headers.cgi?url=http%3A%2F%2Fwww.zvony-tomaskova.cz%2Findex.html
  # [hele.zvony-tomaskova.cz]
  http://delorie.com/web/headers.cgi?url=http%3A%2F%2Fhele.zvony-tomaskova.cz%2F  

Druhou moznosti, jak SE rozezna duplicitu, je spocteni hashe zdrojoveho 
textu (treba MD5).

Pokud SE narazi na duplicitni obsah, obvykle dal pracuje jen s jednou URI 
a ostatni ignoruje nebo penalizuje.

Domena www sice prodluzuje kod, ale uzivatele jsou zvykli ji pouzivat, takze 
si ji doplnuji zcela automaticky i tam, kam nepatri -- to se projevi i v odkazech 
na Vas web. Je tedy rozumne na tuhle variantu server pripravit tak, aby se 
pozdeji nerozmelnoval pocet odkazu. Totez je treba udelat i s odkazy 
na / a /index.html.

---> Vsiml jsem si, ze vyuzivate dynamickytvorene domeny treti urovne ... pokud 
se chcete vyhnout prekvapeni od vtipalku, ;-) doporucuji osetrit i dalsi modifikace 
URI. Abyste se nedockal bombardovani ve stylu: 

  http://at-zije-zbraslav.zvony-tomaskova.cz/

Predstavte si, co by asi klient rekl, kdyby zjistil, ze jeho web se objevuje 
ve vysledcich vyhledavani na prvnim miste po zadani nejakych obscenich 
vyrazu. ;-)

  http://jyxo.cz/search.php?s=hasal%EDk+je+v%F9l&d=cz

(Zjistite, ze treti klicove slovo z vyrazu se v textu na prvni vracene 
strance vubec nevyskytuje, ovsem vyskytuje se v odkazu. ;-)

---> Jelikoz o mod_rewrite ve firme P.E.S. Consulting nejspis vedi, 
dovolim si odkazat jen na clanek o bombardovani odkazy (jak vidite, 
neni to jen slabina Google).

  # Prokop Marek. Jak se bombarduje Googlem. Lupa [online]. 
  2002-05-16 [cit. 2002-12-22]. Praha, CZ. Dostupne na Internetu 
  <http://www.lupa.cz/clanek.php3?show=2286> ISSN 1213-0702

BTW: Dostanu se jen na stranku http://zvony-tomaskova.cz/html_cz/ramy.html,
pak mi IE rekne, ze spousteni pozadovanych ActiveX prvku neni bezpecne 
a stranka nebude zobrazena. To jsem si predtim musel povolit spousteni JS -- 
pokud Vam mohu radit, zakladnim pravidlem SEO je predpoklad, ze kterakoli 
stranka funguje bez nadstaveb HTML.

> Aha, to mi nejak nedoslo.
> Prosel jsem si nekolik webu a skutecne maji vetsinou stranky ve formatu
> http://www.domena.koncovka zpravidla o neco vyssi PR nez
> http://domena.koncovka - byt se jedna vzdy o totozny dokument (na UNIX
> serverech). Z toho mi logicky plyne, ze by melo byt ku prospechu vkladat
> nove odkazy do vyhledavacu a katalogu dusledne s predponou www a stejne
> dusledne www psat u kazdeho linku kdekoli. Delal jsem to doposud prave
> opacne - kvuli zkraceni adresy, ale jak je videt, nektere servery 
> si tam to www proste sami pridaji ...

--
=M=



This archive was generated by hypermail 2.1.2 : 22. 12. 2002, 15:10 CET