ruzna kodovani (bylo: Duplicita x SEO)

From: Marek Prokop (mprokop@prokopsw.cz)
Date: 24. 04. 2003, 09:59 CEST

  • Next message: Miro Vesely: "Re: google adwords"
    Michal Kec (MiK) [SMTP:Michal.Kec@centrum.cz] napsal:
    
    >  jak do toho zapadají různá kódování Češtiny?
    
    AFAIK Google interně ukládá data v Unicode a teprve pak 
    porovnává duplicity. Pokud se tedy stránka liší jen kódování, 
    které je v ní správně označeno, nebo ho lze autodetekovat, jedná 
    se o duplicitní obsah.
    
    Připojil bych se k těm, kteří už přede mnou radili všechny 
    kódové verze s výjimkou jediné zakázat v robotos.txt. Ovšem 
    pozor -- varianta us-ascii není pro češtinu *jiné kódování*. 
    Čeština bez diakritiky je prostě *jiný text*. Pokud tu možnost 
    máte, verzi bez diakritiky nabízejte a nechejte ji indexovat ze 
    dvou důvodů:
    
    1) Zahraniční vyhledavače (vč. Googlu) zpravidla diakritiku 
    nefiltrují, takže tím zvýšíte šanci na nalezení, pokud někdo 
    hledá bez ní.
    
    2) IMHO jsou stále relativně časté případy, kdy si uživatel 
    diakritiku nemůže zobrazit, protože nemá nainstalované příslušné 
    fonty. Týká se to zejména krajanů v zahraničí.
    
    Zdraví,
    
    Marek Prokop
    * Novinky pro webove autory: http://www.sovavsiti.cz/weblog/ *
    

  • Next message: Miro Vesely: "Re: google adwords"

    This archive was generated by hypermail 2.1.6 : 24. 04. 2003, 10:07 CEST