Re: Statistiky Seznam fulltextu

From: <Stepan (zavinac) firma.seznam.cz>
Date: Sat, 2 Feb 2008 08:10:42 +0100
zdar,

"přesná shoda" zde znamená jakýkoli dotaz, který obsahuje pouze
uvedená slova v libovolném pořadí. Např. uvedený dotaz "ke programy
stazeni vypalovaci zdarma" původně zněl zřejmě "vypalovací programy
ke stazeni zdarma". Je ale možné, že ho někdo mohl zadat i "vypalovaci
programy zdarma ke stazeni", v praxi je ale typicky je nejčastější pouze
pár kombinací (odhadl bych 1-2).

Přeházené pořadí (seřazeno podle abecedy) je důsledek normalizace
při agregaci dotazů. Co se týče počtu zadání, tak si myslím, že je to
možné - tipnul bych si, že jeden člověk může dát průměrně třeba 3 stránky
(jak reloady stejné, tak další stránky), takže to pak dá asi 60 lidí
denně (je to ale moje doměnka, porovnejte se situací, kolikrát vám jeden
člověk na webu při jedné session zobrazí stejnou stránku).


-- stepan


> hledání (ať už to znamená cokoli). Zatím bych tomu moc nevěřil. Nebo
> myslíte, že třeba fráze [ke programy stazeni vypalovaci zdarma] v
> přesné shodě se opravdu hledá v průměru 1389krát týdně?
> 
> 
http://search.seznam.cz/stats?collocation=ke%20programy%20stazeni%20vypalovaci%20zdarma
> 
> Problém se zdá být v tom, že ty fráze uvedené na konci jako
> "Nejhledanější dotazy obsahující xyz" nejsou opravdové dotazy, ale jen
> jakési podivně vygenerované skupinky slov setříděné podle abacedy.
> Jenže jelikož to pak stejně nesmyslné číslo ukáže i pro každou z
> těchto náhodných a reálně nikdy nehledaných frází, evidentně je to
> ještě nefunkční -- alespoň pro víceslovné přesné shody.
Received on 02. 02. 2008, 08:10 CET

This archive was generated by hypermail 2.2.0 : 02. 02. 2008, 08:10 CET