Блог на Васил Тошков

Всичко за Google PageRank

Има много статии в българското Интернет пространство, разясняващи какво е това Google PageRank, но нито една от тях не ми се видя пълна. Затова в тази статия ще се опитам да изкажа и моите виждания по въпроса и се надявам да научите нещо ново. Не твърдя, че всичко е напълно вярно, защото нещата се променят с времето.

Google Pagerank е алгоритъм на Google за оценка на страниците в Интернет по десетобалната система. Всяка страница може да има PageRank цяло число в затворения интервал [1,10] или да няма такъв. Самият алгоритъм е патент на Станфордския университет, а думата "PageRank" е запазена търговска марка на Google.

Алгоритъмът е изграден върху теорията на графите, като всеки възел получава стойност в зависимост от броя и тежестта на връзките към себе си. Тоест, всеки възел е страница в Интернет, която има ранг в посочения интервал и дава от този ранг на другите възли (страници), към които има връзки.

Това е системата за гласуване върху която се базира технологията на търсене на Google. Тя е иновативна за търсачките и затова Google е единствената за времето си търсачка, която въвежда този метод на оценяване на страниците. Примерно връзка от страница A към B е гласуване на възел A за възел B.

При създаването си всяка страница в Интернет получава известно количество PageRank по подразбиране. Това се случва само ако страницата не е в допълнителните резултати на Google, тоест има достатъчно съдържание уникален текст. Точната стойност на получавания ранг не е известна и най-вероятно се мени с времето.

Всяка страница дава ранг на страниците, към които сочи. Примерно страница A няма връзки към себе си и има Google PageRank по подразбиране на стойност 0,1 и сочи към страница B. Ако страница A няма други изходящи връзки, освен към B, то тя ще предаде ранг 0,1 на страница B.

Ако от страница A има n изходящи връзки, то всяка сочена страница получава 1/n от ранга на страницата A. От всяка страница имат значение само първите 100 изходящи връзки, така че няма как да се предаде повече от 1/100 от ранга на страницата A на сочените от нея страници.

Рангът на всяка страница е реално число, но в Google Toolbar се закръгля до цяло такова и няма начин да се разбере точната реална стойност на ранга на която и да е страница. Също така не може да се разбере и моментната стойност на ранга, защото тя се съхранява на външни информационни центрове, които се обновяват рядко.

При наблюдения е установено, че обновяването на информационните центрове е веднъж на 3 до 6 месеца. Това се прави с цел да се пести изчислителна мощ и в същото време е пречка да се изследват формули и системи, които биха повлияли на ранга. В Интернет има много формули за изчисление на Google PageRank, но не се заемам да Ви занимавам с тях.

Длъжен съм да подчертая, че Google PageRank отдавна не е основният фактор за оценка на страниците и Интернет, поради многото опити за манипулирането му. Той все пак е фактор, но сами при правилното му използване. Ако примерно една страница е с тематика "SEO" и към нея има само силни връзки с думата "оптимизация", то тези връзки по никакъв начин няма да повлияят на класирането на страницата по думата "SEO". (Допълнение: Гугъл вече разбира от "синоними" и двете търсения може да се повлияят)

Също така, ако два сайта имат реципрочни връзки един към друг, но не са от еднаква тематика, тогава те ще си обменят ранг, но този ранг ще е напълно безсмислен и за двата сайта. Същото се отнася и за сайтове, които имат еднакъв C block на IP адресите си (Допълнение: С появата на CDN услугите, IP-тата вече не са от такова значение). Така че, висок PageRank вече не означава непременно добро класиране на страницата.

Трябва да спомена и за това как се определя точната оценка на Google PageRank. Разпределението на тежестта по стойности не е равномерно. Примерно, ако за да имаме PageRank 4 са ни необходими 100 връзки с ранг 1, то за да имаме PageRank 5 са ни необходими 200 връзки с ранг 1. За всяко следващо ниво трябва да направим още толкова, колкото сме направили до момента за съответната страница.

Google PageRank зависи само и единствено от броя и качеството на връзките към дадена страница. По принцип стойността му се визуализира само от Google Toolbar, но съществуват и сайтове, които се представят за него и също могат за Ви го покажат. Пример за български сайт за визуализация на Google PageRank е Axeny. Това човече прави и невъзможното, за да извлече точния ранг от информационните центрове на Google.

Поради злоупотреби със SPAM с цел натрупване на PageRank, от Google въведоха нова стойност на rel атрибута на връзките, или по-точно rel="nofollow". Връзки с този атрибут не придават PageRank, но за сметка на това отново влияят до известна степен на класирането на сайта. Това е поради факта, че Google разпознава и URL адреси, споменати в текста, като връзки, без да са връзки.

И накрая искам да Ви посъветвам да не обръщате внимание на стойността на Google PageRank на Вашия сайт, а да се съсредоточите върху позициите му. Публикуването на ранга публично донесе само главоболия и на потребителите, и на самите Google (търгуване с връзки и т.н), но идеята им беше да си популяризират Toolbar-a. Да се надяваме, че са получили това, което искат през него :)