Re: Zabanovane stranky na seznamu??? Dlouhodoba ztrata vsech stranek z fulltextu

From: Dušan Janovský <janovsky (zavinac)>
Date: 20. 01. 2006, 14:51 CET
> neznate nekoho ze seznamu, nebo neni zde primo nekdo ze seznamu od fulltextu?

Já. Od února se naplno ujímám fulltextového projektu na Seznamu.

> Potrebuju zjistit jestli neni na seznamu
> zabanovana jedna domena, uz jsem psal pred mesicem a pul na helpdesk a nikdo se mi neozval , pak po telefonatech
> na helpdesk mi dali email na fulltext admina, tak jsem psal dvakrat tam a nic se nezmenilo a taky se mi nikdo neozval

Budu Vás muset zklamat. Tento přístup není chybou, nýbrž standardním
postupem Seznamu. Doufám, že čtenáře této konference nebudu nudit, ale
zkusím to rozvinout. Jde o tři věci:
1. o časové možnosti
2. o citlivost informací
3. o princip

Vážíme si všech ohlasů, které dostáváme. Bez výjimky jsou všechny
ohlasy, které tým analytiků fulltextu dostává, alespoň čteny, a v
naprosté většině případů i kontrolovány v databázi. Nemáme ale čas
všem odpovídat, a tak máme pravidlo, že pokud to neodporuje základní
slušnosti, neodpovídáme vůbec. Hlavní komunikační kanály, kterými
sbíráme podněty, totiž spamový a kontrolní formulář (k doklikání z
menu na http://fulltext.seznam.cz ), kvůli tomu dokonce ani neobsahují
pole pro zadání kontaktu na odesilatele.

Každou fulltextovou technologii, Google a Seznam nevyjímaje, lze
ošálit, ať má jakkoli chytré algoritmy. Tým fulltextu Seznamu si v
této fázi vývoje netroufá poskytovat veřejnosti žádné citlivější
informace. Citlivou informací může být i konkrétní stav zaindexování
nějaké stránky nebo jiný jev, ze kterého by bylo možno (i třeba jen
náznakem) vyvodit, jak některé ochranné prvky fulltextové technologie
Seznamu fungují. To je další důvod, proč informace nechceme
poskytovat.

Jestliže tedy nemůžeme na dotazy odpovídat každému, rozhodl jsem, že v
rámci spravedlnosti nebudeme na dotaz tohoto typu odpovídat nikomu.
Není to žádné uzavírání se nebo neochota přijímat zpětnou vazbu.
Zpětnou vazbu přijímáme rádi, ale máme právo své informace
neposkytovat. Seznam.cz a.s. je soukromá firma, která z kapacitních
důvodů nemůže poskytovat poradenství v oblasti informační architektury
nebo optimalizace pro vyhledávače.  Informace o tom, jak je který web
ve fulltextu Seznamu zaindexovaný, je interní informací Seznamu, který
není povinnen nikomu ji předávat. Pokud vám vadí, že má Seznam v
databázi informace o Vašem webu, můžete pomocí souboru robots.txt
určit, že Seznam nemá Vaše stránky indexovat buď vůbec, nebo jen
omezeně. Seznam oproti tomu z kapacitních důvodů, které jistě chápete,
nedokáže zaručit, že stránky budou v indexu všechny.

> tak uz nevim jak
> mam zjistit proc me prestal jednu domenu seznam robot uplne indexovat a vytratili se XXX tisic odkazu ze seznamu z fulltextu
> z teto domeny teda resp. skoro vsechny.
> Nebyla pouzita zadna link farma, zadne skryte texty atd., tak nevim.

Pravidla banování na Seznamu jsou velmi striktní, rozumná, dodržují se
a neobcházejí se (mimochodem také nejsou a nebudou veřejná, protože se
jedná o citlivé informace). Weby, které snad vypadají postiženě, ovšem
v naprosté většině případů nijak ručně penalizovány nejsou. Problém
může být na mnoha místech příslušného webu a (proč to neříct) ani
navržené algoritmy nejsou vždy domyšlené do všech důsledků.

Standardní cestou řešení takových případů je zadání všech relevantních
informací do kontrolního formuláře na adrese
http://fulltext.seznam.cz/url.py/contactScreen
Vstupy se zpracovávají poloautomaticky, ovšem analytici fulltextu
každý jednotlivý podnět čtou. To zejména pomáhá odhalování chyb
algoritmů. Jestliže lze zmíněným stránkám nějak pomoci, analytici to
ihned udělají (například tak, že doménu pošlou na přeindexaci). Ve
většině případů je ale situace buďto v pořádku, nebo je problém na
straně webu. Ačkoli bychom rádi měli v databázi všechny hodnotné české
stránky, nemůžeme si z kapacitních důvodů dovolit poskytovat
provozovatelům jednotlivých webů konzultace a rady, co by měli
opravit. Rádi v této oblasti dáme prostor nezávislým informačním
architektům a dalším specialistům v oblasti webu.

>
> Jde mi o to zjistit proc to tak je at to muzu dat do poradku jestli to je opravdu kvuli necemu,

Rád bych zhruba v horizontu jednoho měsíce rozšířil informace na
stránce http://fulltext.seznam.cz/url.py/infoScreen , protože si
uvědomuji, že existují situace, kdy provozovatel webu neví, co dělá
špatně. Můžete mi také emailem posílat své otázky, na něž byste rádi
viděli odpovědi v tamním FAQ (Rád sestavuji FAQ ze skutečných AQ).
Nežádejte mě ale prosím o radu ohledně svého konkrétního webu - rád se
na to sice podívám, ale jak jsem nastínil výše, z principu vám s tím
nemohu radit.

Yuhů
Received on Fri, 20 Jan 2006 14:51:39 +0100

This archive was generated by hypermail 2.1.8 : 20. 01. 2006, 14:51 CET