Re: Google Page Rank obecne

From: Du¹an Janovskı (dusan@pc-slany.cz)
Date: 13. 11. 2003, 21:23 CET


Robert Nemec napsal:
> GPR na TB je v posledni dobe na nic. Delali jsme v zari velke srovnani a
> zjistili jsme, ze podle GPR na TB Google odkazy rozhodne neradi. :-)
> 
> V testu bylo pres 200 stranek.

Google vysledky podle GPR rozhodne neradi. Google radi odkazy podle "kombinace" IR a GPR. Domnivam se tak na zaklade kousku textu v originalni dokumentaci ke Google: 

http://www-db.stanford.edu/~backrub/google.html


v oddile 4.5.1 se pise:

... We take the dot product of the vector of count-weights with the vector of type-weights to compute an IR score for the document. Finally, the IR score is combined with PageRank to give a final rank to the document. 

IR je relevance slova v dokumentu (vypocitana skalarnim soucinem vah umisteni slova a vahy poctu vyskytu slova/slov) a PR je PageRank. Kombinaci se pravdepodobne mysli soucin (nebo nejaka monotonni relace). 

Pokud tedy budete sledovat razeni vysledku hledani na nektere slovo, je jasne, ze vysledky nebudou razeny podle (na TB porovnatelneho) GPR, protoze tam vstupuje jeste nezjistitelne IR skore. Vase pozorovani (samo o sobe jiste uctyhodne) tedy rozhodne neznamena, ze GPR je na nic.


Yuhù



This archive was generated by hypermail 2.1.3 : 13. 11. 2003, 21:31 CET