Re: seznam a site:

From: <Stepan (zavinac) firma.seznam.cz>
Date: Wed, 19 Mar 2008 08:35:44 +0100
> Nemusíte zadávat vůbec žádné slovo. Funguje i třeba
> http://search.seznam.cz/?q=site%3Alevneelektro.com&mod=f
> Když to porovnáte třeba s
> http://search.seznam.cz/?q=site%3Awww.levneelektro.com+elektro&mod=f tak
> zjistíte značnou disproporci. Je to dáno (alespoň tedy imho) právě tím, 
že
> ne všude je dané slovo považováno za nějak důležité. Když to navíc 
porovnáte

zdar,
zajímavý postřeh.
různá čísla jsou způsobená rozdílným vyřazováním duplicit
když se zadá "levneelektro site:levneelektro.com" tak jsou stránky 
seřazené
s důrazem na slovo levneelektro, kdežto když je čistě jenom 
"site:levneelektro"
tak jsou řazené jinak a i jinak se na nich uplatní vyřazení duplicit.


> 
http://www.google.cz/search?aq=f&hl=cs&q=site%3Alevneelektro.com&btnG=Hledat&lr=tak
> zjistíte další ohromný rozdíl, který je dán různou ochotou indexovat
> velký počet stránek a také jiné chování se k duplicitám. Někdy je pak 
také

vypadá to, že konkrétně web levneelektro.com má z nějakého důvodu velký 
počet
duplicit.
když zkusíte na googlu "site:levneelektro.com", tak hlásí 55900 výsledků,
pro "levneelektro site:levneelektro.com" už hlásí 20000 výsledků,
a když se pak trochu proklikáte tak skončíte na 497 výsledkách. Takže 
duplicit hodně :-(


 
> 2008/3/18 Tomáš Krejčí <krejci.tom (zavinac) centrum.cz>:
> 
> >  rikalo se, ze aby seznam zobrazil skutecny pocet zaindexovanych 
stranek,
> > ma se jako hledane klicove slovo uvest nejake, ktere je obsazeno v 
domene.
> > to jsem prave udelal a tvrdi mi to pouze asi 11 stranek.
> >

jak již bylo řečeno, klíčové slovo již netřeba uvádět. jaktak nad tím 
přemýšlým,
tak skutečný počet stránek teď asi zjistit nejde, protože duplicity se 
vyřazují vždy.
co bychom pro to mohli udělat je úprava, aby se při čistém 
"site:domena.tld"
duplicity nevyřazovali, pak by to zjistit šlo dobře.


mějte se
-- stepan
Received on 19. 03. 2008, 08:35 CET

This archive was generated by hypermail 2.2.0 : 19. 03. 2008, 08:35 CET