Re: Duplicita x SEO

From: Michal Kec (MiK) (Michal.Kec@centrum.cz)
Date: 23. 04. 2003, 20:40 CEST

  • Next message: Adam Hauner: "Re: Duplicita x SEO"
    Dobrý den,
    > AFAIK Google rozlišuje dva druhy duplicitního obsahu:
    
    > 1) Plně duplictní dokumenty. Tento případ nastává např. použitím 
    ...
    > 2) Obsahový překryv. Jedná se o případ, kdy dokument B 
    > neobsahuje oproti dokumentu A žádný indexovatelný obsah navíc. 
    > Typický příklad jsou verze stránek pro tisk. Pokud má zároveň 
    > dokument B nižší PR než A a nachází se ve stejné doméně, nebude 
    > pravděpodobně vůbec zahrnut do výsledků výhledávání.
    
     Co myslíte tím "indexovatelný obsah"? IMHO se Google alespoň trochu
    snaží rozpoznat, jakého typu je daný dokument (fórum, zpravodajství,
    galerie) a co který prvek v něm znamená. Jinak si nedovedu představit,
    že by našel dvě stejně "dynamické" stránky. Nějak prostě zjistí a jako
    rozdíl neuvažuje doplňky typu: datum aktualizace, dnešní datum, počet
    návštěvníků, náhodný vtip ap. Zřejmě věci, které se pokaždé změní (ale
    zůstanou na místě), zatímco zbytek stránky zůstává beze změn.
    
     Pokud vypočítává nějaký hash, nemusí to být nutně jeden z celé stránky,
    ale třeba několik z určité části, ne? Může jít po DIVech, buňkách
    tabulky, bajtech...
    
    
    > Ani jeden z těchto typů neznamená penalizaci pro všechny verze 
    > stránek. Google si vždy jednu vybere, tu indexuje normálě, 
    > kdežto ostatní buď zcela ignoruje, nebo alespoň nezobrazuje ve 
    > výsledcích hledání.
     Tak a jak do toho zapadají různá kódování Češtiny? (Bez ohledu na to,
    že to dnes již není tak potřeba.) Server mi provádí automatickou změnu
    kódování a mám tak v několika "adresářích" (tj. na jiném URL) takřka
    shodné verze.
     Google pochopí i tohle (pozná kódovou stránku a převádí do ASCII nebo
    do UTF) a všechny duplicitní penalizuje. Pikantní je, že asi nepozná
    všechno a ve výsledcích hledání se mi tak krom latiny objevují tuším
    Kameníci, nebo Mac (nejsem si jistý). :-)
     Navíc to ve výsledcích nevypadá zrovna nejlépe -- ty znaky jsou tam
    prostě pomršené. Měl by to pro mě být impuls zrušit kódové verze?
    
    -- 
    S pozdravem, Michal Kec (MiK) (Michal.Kec@centrum.cz)
    
    Vše o VŠE. http://mik.euweb.cz | http://mik.3web.cz
    Studijní materiály, bakule a jiné zajímavé informace o VŠE(m).
    -- 
    bash# man girlfriend
    No manual entry for girlfriend
    

  • Next message: Adam Hauner: "Re: Duplicita x SEO"

    This archive was generated by hypermail 2.1.6 : 23. 04. 2003, 23:09 CEST