Re: našeptávač seznam.cz

From: Dušan Janovský <janovsky (zavinac)>
Date: Tue, 4 Mar 2008 17:55:11 +0100
>  No právě si nejsem jist tím, jestli je to hrůza. Není ani tak důležité
>  jestli hledá něco jiného než chtěli, ale jestli nakonec použije stejný
>  a nebo přesnější dotaz než takový který chtěli.

Všechny moje zkušenosti s našeptávačem vedou k tomu, že lidé nakonec
používají buďto méně přesný dotaz, než jaký původně chtěli, nebo úplně
jiný dotaz.

>  Právě třeba příklad
>  "dveře" kdy s našeptavačem použije (třeba) "dveře interiérové" je sice
>  něco "jiného než co hledat chtěli" ale přitom "lepší", nebo alespoň
>  tak jak slovo "lepší" v tomto kontextu chápu já, tj. přesnější.

Naštěstí na světě není taková autorita, která by rozhodovala, co mají
lidé chtít. V tomto příkladu mohli ti lidé stejně dobře chtít dveře ze
dřeva nebo dveře do pokoje. Nabídka našeptávače je zmátla a oni v
domnění, že nabídka je úplná, zvolili dveře interiérové, protože se to
nejvíc blížilo tomu, co chtěli.

Párkrát jsem byl svědkem toho, jak student pustil internet, naťukal
čtyři písmenka a pak bezradně studoval nabídku, než zvolil tu nejméně
špatnou možnost.

>  Nicméně jak už jsem psal, chtěl by vylepšit a myslím, že by to nebyl
>  až takový problém.

"Až takový problém" znamená vzít programátory a přesunout je z
nějakého projektu na jiný, případně jim přeházet priority. Opravdu si
myslíte, že nyní je třeba dělat úpravy našeptávače?

> Jak by to podle mého možná fungovalo lépe než nyní
>  1. fráze by se cvičně vypínaly na nějakou dobu (např. den) a sledovalo ...
>  2. používala by se nějaká pseudointeligence (kterou myslím seznam má a ...
>  3. po zadání mezery by se hledání rozšířilo i na levostranné. Takže ...

Nic z těchto nápadů není malé zadání. Všechno vyžaduje programování a
údržbu. To, co může vypadat jako malá úprava, je hodně práce, pokud to
musí pracovat s mnoha daty a pod velkou zátěží což v Seznamu musí).
Například pokud se mi doslechlo, tak ten bod 3. už se jednou
programoval, dělalo se to dost dlouho. Nakonec to pod zátěží prý
lehalo, takže se levostranné rozšíření nikdy raději nepustilo.

Náklady na programátory jsou značné. Nejde tak ani o náklady
explicitní (platy, daně, židle, pití), ale o náklady implicitní (co
užitečnějšího by se dalo naprogramovat) a budoucí (Jak často se to
bude muset debugovat, nasazovat, restartovat, upravovat? Kolik
budoucích komponent bude dražších, protože na to budou muset brát
ohled?). Správné rozhodnutí, jak upravit našeptávač, není v tom, co by
se na něm mělo dělat, ale zda bude případná úprava přínosnější než
úprava jiné komponenty. Opravdu si myslíte, že nyní je potřeba
obětovat programátory na úpravy našeptávače? Já ne.

Moje doporučení vypnout našeptávač se vždy opíralo také o to, že tato
změna nemá žádné přímé náklady a HLAVNĚ nemá žádné náklady budoucí.
Jestli je pravda, že včera našeptávač lehnul (a zdá se, že ano), tak
je jisté, že se tomu opět N lidí muselo X hodin věnovat místo toho,
aby dělali něco jiného užitečnějšího.

Kdyby byl programátorský čas volný statek a neměli by do čeho
píchnout, pak prosím, rozhodně by mělo smysl věnovat se výzkumu toho,
jak upravit našeptávač, aby vracel inteligentnější věci. Ale vezměte
si, že třeba Google, který má programátorů výrazně více a méně
zaměstnaných než Seznam, k nasazení našeptávače do ostrého vyhledávání
nikdy nepřikročil, i když ho měl vyvinutý dříve.

Já jsem ve svém minulém příspěvku schválně nepsal argumenty proti
našeptávači, protože jsem se domníval, že jsou zdejšímu publiku
zřejmé. Kromě zmenšení long tailu, zmenšení počtu unikátních dotazů a
posílení hledanosti nejčastěji hledaných dotazů (není pravda, jak tady
někdo zmínil, že se ta špička zplošťuje) vede zavedení našeptávače k
menšímu celkovému množství dotazů. <názor>Podle mého názoru to vede i
k menšímu množství prokliků z vyhledávače a nepřímo i k dlouhodobě
menšímu výdělku vyhledávače přes PPC (protože inzerenti nejsou moc
motivováni k cílení na long tail). </názor>

Yuhů
Received on 04. 03. 2008, 17:55 CET

This archive was generated by hypermail 2.2.0 : 04. 03. 2008, 17:55 CET