Re: Propad v dusledku vypadku webu

From: Jan Stejskal <stejskal (zavinac)>
Date: Thu, 09 Jul 2009 23:28:59 +0200
jeste k tomu male doplneni, ale s docela podstatnou informaci, viz: 
http://www.osklivy-sup.cz/seznam.php



Jan Stejskal napsal(a):
> nenasel jsem presne ten prispevek zde v konferenci, ale nasel jsem ho 
> v zapiscich z prednasky, i kdyz ponekud starsiho data:
>
>    * Pokud najde url, tak se ho pokusí stáhnout a když se mu to
>      napoprvé nepovede, jde do banlistu, ze kterého automaticky vypadne
>      za 3měsíce.
>    * Stránka se při reindexaci má 3x3 pokusy (pokud se nezdaří, je
>      vyřazena z vyhledávání (pokud server nevyhodil 50X chybu), při
>      úspěšném pokusu opět vložena).
>    * Při vyřazení z hledací databáze se ztratí zpětné odkazy (které se
>      obnovují cca měsíc).
>
>
>
> viz. http://internet.blog.cz/0612/zapisky-z-prednasky-seznam-fujjtext
>
> Jan Stejskal
>
>
> Ondilla Miloslav napsal(a):
>> Nemáte někde odkaz na příspěvek od Dušana Janovského, nemohu ho 
>> najít. Nepřipadá mi příliš logické vyřadit Web z indexu, když je 
>> jednou nedostupný.
>>
>> Jan Stejskal napsal:
>>
>> takto funguje google
>>
>>
>> Tomáš Kapler napsal(a):
>>  
>>> Nikoliv, je to trochu složitější. Jestli si to pamatuji dobře, když 
>>> narazí na 404, tak si to "poznamená" a naplánuje urychlenou novou 
>>> návštěvu stránek v nějakém nejbližším termínu. Teprve myslím když se 
>>> 404 vrací i při druhé či třetí návštěvě, tak ji robot vyhodí z 
>>> veřejné databáze, ale interně si ji dál uchovává a průběžně ji znovu 
>>> zkouší.
>>>
>>> Ale nekamenujte mě, jestli je to trochu jinak, slyšel jsem to 
>>> naposledy na nějaké jejich vývojářské přednášce asi před rokem a 
>>> nebyla to nějaká věc, která by mě příliš zajímala abych si ji uložil 
>>> do dlouhodobé paměti.
>>>
>>> P.S.: BTW update k předchozímu příspěvku o spinkajícím Seznamu - 
>>> spinká stále, stále stejně špatné výsledky
>>>
>>> Tomáš Kapler
>>> Váš http://SEO-konzultant.cz
>>>
>>>       
>>
>>
>>
>>   
>
>
Received on 09. 07. 2009, 23:28 CEST

Chcete se naučit víc? Navątivte naąe odborná ąkolení pro webdesignéry

This archive was generated by PROGNAME VERSION on DATE and TIME