Re: Yuhů/Seznam - problém přídavných jmen nebo diakritiky?

From: Dušan Janovský <janovsky (zavinac)>
Date: 09. 10. 2006, 12:13 CEST
> Zdravím konferenci, speciálně Yuhůa,

ehm, mám i jiné adresy než seo@nawebu :-)

>
> při hledání fráze <nové byty> seznam tučně zvýrazňuje pouze slovo <byty>,
> slovo <nové> ignoruje, narozdíl od google, kde jsou zvýrazňována obě slova.
>

tohle se zde probíralo už asi třikrát, na jiných příkladech. To, že se
slovo nezvýrazňuje, neznamená, že se slovo vůbec nehledá. Samozřejmě
je z toho ale něco vidět.

> Je to záměrné ignorování slova <nové> ???

je to částečné ignorování slova "nové"
a není "záměrné", nýbrž vyplývající z algoritmu. Já osobně to hodnotím
jako věc, kterou je potřeba řešit. Nebudu rozkrývat plány, ale je to
jedna ze dvou věcí fulltextu, na jejíž řešení myslím dnes a denně a
pracuje se na ní po 75 procent vývojového času.

> (jiná přídavná jména, např.
> <repasované počítače> fungují ok)

ono ani tak nejde o slovní druh, ale o častost výskytu slova na
stránkách a mohutnost lemmatu. (Závidím v tomhle ohledu Googlu, který
slova moc neohýbá.) S rostoucím indexem je pak třeba řešit výkonové
otázky. Osobně nenávidím sliby do budoucna, takže nebudu nic slibovat,
ale je to řešitelné a řešení je celkem zábavné.

Yuhů
Received on Mon, 9 Oct 2006 12:13:28 +0200

This archive was generated by hypermail 2.1.8 : 09. 10. 2006, 12:14 CEST