Re: novy search engine - CUIL.COM

From: Jaromir Klimek <info (zavinac)>
Date: Fri, 29 Aug 2008 20:50:04 +0200
>>> Google controval následující den, kdy uveřenil, že má přes triliardu
>>> URL (http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html),

Ono asi opravdu moc nezáleží na tom, kolik přesně má velký Google stránek ve 
svém velkém indexu.

Nicméně:

Když se z angličtiny do češtiny  přeloží správně to číslo, které Google v 
anglickém článku uvedl (trilion), tak je to bilion.

Triliarda je definována jako miliarda bilionů.

Takže autor výše uvedeného tvrzení zvětšil Googlí index o pouhých devět řádů 
(neboli miliardkrát).
Asi se shodneme, že je to "trochu" nepřesné.

Před spaním (a ještě lépe před psaním) doporučuji třeba toto: 
http://encyklopedie.seznam.cz/heslo/182455-zetta .


>>> ale že to vlastně nic neznamená, protože počet url je neomezený

Tady citujete skoro správně - Google v článku opravdu píše, že striktně 
vzato je počet URL nekonečný. A jako důkaz uvádí poměrně přihlouplý příklad 
s kalendářem.

Ale nekonečný počet URL je nesmysl.

RFC stanovuje konečnou (a poměrně malou) množinu povolených znaků, které se 
mohou v URL vyskytovat.
IE se nebaví s URL, jejichž maximální délka přesahuje 2 083 znaků ( 
http://support.microsoft.com/kb/208427 ), takže předpokládám, že ani Google 
nebude delší URL indexovat.

Tzn. máme konečnou množinu znaků, které se mohou objevit na konečném počtu 
pozic, přičemž záleží na pořadí.

Počet příslušných permutací spočítá i student gymnázia před maturitou a je 
jisté, že tento počet je konečný. A to i v případě, že mezi povolené znaky 
zahrneme znaky všech existujících národních abeced.


Takže prosím nebaštěme povídačky.


Pěkný víkend přeje
Jaromír Klimek









----- Original Message ----- 
From: "Tomáš Kapler" <tomas (zavinac) kapler.cz>
To: <seo (zavinac) nawebu.cz>
Sent: Friday, August 29, 2008 7:37 PM
Subject: Re: novy search engine - CUIL.COM


>> novy vyhledávač CUIL: www.cuil.com tvrdi ze ma vecsi index ako Google :-)
>
> je to už tedy téměř dva měsíce stará "novinka", každopádně ten větší
> index než google netvrdili oni, ten vydedukovali novináři z toho, když
> cuil řekl, že má v indexu 121 617 892 992 stránek a oni to porovnali s
> 8,2 miliardami, které Google před sděloval před 3 lety, kdy naposledy
> uveřenil velikost svého indexu a odvodili z toho, že cuil je větší.
> Google controval následující den, kdy uveřenil, že má přes triliardu
> URL (http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html),
> ale že to vlastně nic neznamená, protože počet url je neomezený (ono
> stačí různý počet kombinací různých url s parametry
> kategorie/výrobce/id produktů na mnohých shopech atd.)
>
>
>> Dalsia velmi zaujimava vec je, ze na hodnotenie stranok pouziva kontext - 
>> obsah daneho webu a nie spetne odakzy . . .
> no to není tak úplně pravda a kdyby byla, tak by to nebyla vůbec
> zajímavá věc, čistě kontextovou analýzu měly všechny vyhledávače před
> příchodem google, můžete si je stáhnout i jako open source, a právě
> analýza nejen kontextu klíčového slova v textu stránky, ale též
> analýza kontextu stránky na celé doméně a analýza kontextu stránky a
> domény na celém internetu je právě to co dělá výsledky Google tak
> přesné/důvěryhodné ...(no flame, samozřejmě local flaws existují, na
> širším vzorku to ale google vyhrával v každém oficiálním testu) a
> která Google dostala tam kde je.
>
> Jediné co na cuilu je zajímavé je to, jak se jim podařilo zblbnout
> novináře, kteří o nich psali jako (po milionté opět) o google
> killerovi, a psalo se o nich všude, přitom různé podobné pokusy udělat
> jiný vyhledávač vznikají prakticky dennodenně. Výsledky stojí za
> starou bačkoru a tak ne dost možná nejlepší z celého týmu jejich PR
> pracovník. Ale samozřejmě dostatečnou pílí, s dostatečnou trpělivostí,
> štěstím, penězi, kvalitními lidmi ... se mohou vyšvihnout, ale by
> mohlo třeba i Jyxo či Morfeo u nás, když bych měl dát vhodnou
> paralelu.
>
> -- 
> Tomáš Kapler
> technický a marketingový ředitel
>
> DEVELOPSTUDIO, s.r.o.
> http://www.developstudio.com
> Zelená linka: 800 SEO SEO (800 736 736)
> 
Received on 29. 08. 2008, 20:50 CEST

This archive was generated by hypermail 2.2.0 : 29. 08. 2008, 20:51 CEST