Re: Bad words

From: TomᚠKapler <tomas (zavinac)>
Date: Wed, 27 Aug 2008 12:04:05 +0200
No to co vy zmiňujete se spíš než fulltextu Seznamu týká Skliku, který
zakazuje používání superlativů atd. (viz
http://www.sklik.cz/napoveda/pravidla-pro-inzeraty#celytext). Hledání
těchto slov fulltextově žádný postih nemá
(http://search.seznam.cz/?q=nejlevn%C4%9Bj%C5%A1%C3%AD%20elektro&mod=f
http://www.google.cz/search?hl=cs&q=nejlevn%C4%9Bj%C5%A1%C3%AD%20elektro&lr=)

U fulltextových vyhledávačů existují tzv. stop words - slova která
nemají význam a která se běžně vypouštější bez ztráty smyslu dotazu,
seznam slov u Google viz níže, u Seznamu bude asi velmi podobný

Existují pravděpodobně také nějaké "problematic words", něco jako
"sex", "fu.k" ... při kterých při splnění nějakých dalších podmínek
(problematické backlinky, hustota problematických slov, jazyk ...)
vyhledávač stránku slušně řečeno "vyfuckuje" ;) z běžných hledání aby
je běžně neviděly třeba dětské oči. Samozřejmě to není také
stoprocentní (zrovna minulý týden třeba chtěla moje dcera vidět nějaká
zvířátka a já našel
http://images.google.com/images?hl=cs&q=bobr&gbv=2). Ale to asi není
předmětem otázky, protože taková slova se běžně nevyskytují.

Stop words google:
dnes
cz
timto
budes
budem
byli
jses
muj
svym
ta
tomto
tohle
tuto
tyto
jej
zda
proc
mate
tato
kam
tohoto
kdo
kteri
mi
nam
tom
tomuto
mit
nic
proto
kterou
byla
toho
protoze
asi
ho
nasi
napiste
re
coz
tim
takze
svych
jeji
svymi
jste
aj
tu
tedy
teto 	bylo
kde
ke
prave
ji
nad
nejsou
ci
pod
tema
mezi
pres
ty
pak
vam
ani
kdyz
vsak
ne
jsem
tento
clanku
clanky
aby
jsme
pred
pta
jejich
byl
jeste
az
bez
take
pouze
prvni
vase
ktera
nas
novy
tipy
pokud
muze
design
strana
jeho
sve
jine
zpravy
nove
neni 	vas
jen
podle
zde
clanek
uz
email
byt
vice
bude
jiz
nez
ktery
by
ktere
co
nebo
ten
tak
ma
pri
od
po
jsou
jak
dalsi
ale
si
ve
to
jako
za
zpet
ze
do
pro
je
na

-- 
Tomáš Kapler
technický a marketingový ředitel

DEVELOPSTUDIO, s.r.o.
http://www.developstudio.com
Zelená linka: 800 SEO SEO (800 736 736)
Received on 27. 08. 2008, 12:04 CEST

This archive was generated by hypermail 2.2.0 : 27. 08. 2008, 12:04 CEST