A keresőoptimalizációs szakemberek folyamatosan ezt találgatják persze, hiszen a Google féltve őrzött titka, hogy pontosan mi alapján dönti el egyes oldalakról, hogy értékesek vagy éppen azt, hogy webszemétnek minősülnek.
De a kereső azért némi betekintést enged a munkájába. A legújabb
Google Inside Search-projekt egy látványos prezentáció arról, hogyan is működik az indexelése és rangosorolása több mint harmincbillió weboldalnak.
Megtudjuk, hogy a Google indexe 100 millió gigabájtnál is nagyobb. Ebben az óriási adathalomban bizony nem könnyű jó helyen szerepelni. A prezentációban látjuk, hogy egy egyszerű kifejezésre keresve is mennyi mindent figyelembe vesz az algoritmus a találati lista összeállításánál (például természetesen a szinonimákat is, nem csupán a begépelt szavakat).
Fontos tényező a rangsorolásnál az oldal minősége (itt külön említik a PageRanket is, amely a Google büszkesége, de valódi jelentősége ma már elhalványult), a frissessége (hiszen mindig fontos, hogy a hírek, információk naprakészek legyenek, úgyhogy a rendszeres tartalomfejlesztés elengedhetetlen), de szempont az is, hogy pontosan ki keres éppen.
A SafeSearch bekapcsolásával a felnőtteknek szóló oldalakat lehet kiszűrni, de ennél is részletesebb karaktert vizsgál a Google: ellenőrzi, hogy az adott személy korábban mely oldalakat látogatta meg, mikre keresett, így ez által igyekszik az ő számára legrelevánsabb oldalt megmutatni. Fontos figyelemmel kísérni ennek a technikának az erősödését: hiába látjuk mi a weblapunkat első helyezettnek a fontos kulcsszavára, könnyen lehet, hogy csak nekünk ilyen a találati lista, mindenki másnál rosszabb helyezésben jelenünk meg.
A rangsorolási tényezők teljes listáját természetesen nem ismerhetjük meg – de a leírás szerint kétszáz ilyen van, úgyhogy alapos munkát végez a keresőmotor.
Ami nagyon fontos és egyféle fenyegetésként is vehetik néhányan: külön figyelmet szentelnek a bemutatóban a webspam elleni harcnak. Fontos, hogy szakemberekkel végeztessük az optimalizációs munkákat, ugyanis a tiltott, szabályellenes technikák komoly kárt okozhatnak egy-egy weboldal megítélésében.
A spameket algoritmikusan is szűrik, de a weblapok eltávolítása manuálisan történik. Spamtevékenységként van feltüntetve a linkvásárlás, feltört oldal, hamis átirányítás (cloacking), rejtett szöveg és kulcsszóhalmozás, a kevés vagy semmilyen hozzáadott értékkel sem bíró tartalom (jellemzően a duplikáció, tehát más oldalak szövegének másolása ilyen).
Fontos, hogy az ingyenes hostingszolgáltatóknál lévő oldalakat sem szereti a kereső! A bemutató ideális ahhoz, hogy bemutassuk olyanoknak is a Google működését, akik kevéssé értenek hozzá. Látványos, rövid, mégis nagyon velős, így a megtekintését mindenkinek ajánljuk.