Re: Hledani bez hacku a carek

From: Dušan Janovský <janovsky (zavinac)>
Date: 06. 10. 2004, 02:42 CEST
Z různých zdrojů jsem si sestavil takové pravidlo, že průměrně 20%
hledání je bez diakritiky a 80% s diakritikou (kde 100% jsou výrazy, u
kterých to má smysl rozlišovat). Opravdu tolik nezáleží na konkrétním
vyhledávači, na druhou stranu opravdu záleží na slovu. Některá slova
jsou zadávána častěji bez diakritiky.

Dříve udávaná vysvětlení vašeho jevu podle mě nesedí. 

V Seznamu se prohledávání fulltextu od prohledávání katalogu ohledně
diakritiky zase tolik neliší. Obě hledání diakritiku směšují. Spíše je
to tím, že na ta slova, na která k vám přicházejí, jste na Seznamu
náhodou výše bez diakritiky než na stejné slovo s diakritikou. Nebo
ne?

Ale je fakt, když o tom tak přemýšlím, že seznamovské Jyxo asi
"zrovnoprávňuje" obě varianty více než prohledávání katalogu. Ale
přesné algoritmy Jyxa neznám, takže těžko říct.

> Podíl na tom může také mít:
> http://www.seznam.cz/summary.html

Seznam ve statistikách a výročních stránkách diakritiku odstraňuje,
takže z toho si příklad neberte.
Received on Wed, 6 Oct 2004 02:42:38 +0200

This archive was generated by hypermail 2.1.8 : 06. 10. 2004, 02:42 CEST