Re: Statistiky Seznam fulltextu

From: Jaroslav Mallat <jaroslav (zavinac)>
Date: Sat, 02 Feb 2008 09:57:57 +0100
Dobry den,
agregaci dotazu rozumim, ale "dalsi stranka" je zapocitavano do poctu 
zadani?

J. Mallat

Stepan (zavinac) firma.seznam.cz napsal(a):
> zdar,
>
> "přesná shoda" zde znamená jakýkoli dotaz, který obsahuje pouze
> uvedená slova v libovolném pořadí. Např. uvedený dotaz "ke programy
> stazeni vypalovaci zdarma" původně zněl zřejmě "vypalovací programy
> ke stazeni zdarma". Je ale možné, že ho někdo mohl zadat i "vypalovaci
> programy zdarma ke stazeni", v praxi je ale typicky je nejčastější pouze
> pár kombinací (odhadl bych 1-2).
>
> Přeházené pořadí (seřazeno podle abecedy) je důsledek normalizace
> při agregaci dotazů. Co se týče počtu zadání, tak si myslím, že je to
> možné - tipnul bych si, že jeden člověk může dát průměrně třeba 3 stránky
> (jak reloady stejné, tak další stránky), takže to pak dá asi 60 lidí
> denně (je to ale moje doměnka, porovnejte se situací, kolikrát vám jeden
> člověk na webu při jedné session zobrazí stejnou stránku).
>
>
> -- stepan
>
>
>   
>> hledání (ať už to znamená cokoli). Zatím bych tomu moc nevěřil. Nebo
>> myslíte, že třeba fráze [ke programy stazeni vypalovaci zdarma] v
>> přesné shodě se opravdu hledá v průměru 1389krát týdně?
>>
>>
>>     
> http://search.seznam.cz/stats?collocation=ke%20programy%20stazeni%20vypalovaci%20zdarma
>   
>> Problém se zdá být v tom, že ty fráze uvedené na konci jako
>> "Nejhledanější dotazy obsahující xyz" nejsou opravdové dotazy, ale jen
>> jakési podivně vygenerované skupinky slov setříděné podle abacedy.
>> Jenže jelikož to pak stejně nesmyslné číslo ukáže i pro každou z
>> těchto náhodných a reálně nikdy nehledaných frází, evidentně je to
>> ještě nefunkční -- alespoň pro víceslovné přesné shody.
>>     
>
>   
Received on 02. 02. 2008, 09:57 CET

This archive was generated by hypermail 2.2.0 : 02. 02. 2008, 09:58 CET