Gyakran hivatkozok itt a blogban és egyéb fórumokon arra a google szabadalomra, amely a weboldalak rangsorolásáról szól és tekinthetnénk akár a google keresÅ‘optimalizálási bibliájának is, érdekes módon mégsem hivatkoznak rá SEO fórumokon olyan gyakran, sejtésem szerint a többség nem is ismeri, csak a belÅ‘le levont tömör következtetéseket és kérdéseket, hogy pl. tényleg számÃt-e a domain lejárati dátuma és az hogy milyen hosszú idÅ‘re regisztráltuk?
Ezért gondoltam úgy, jó lesz egy magyar nyelvű összefoglalót készÃteni a szabadalomról. Itt szögezném le, hogy ne tessék hivatalos fordÃtásnak tekinteni, mert ha holnap Peresztegi Zoltán megjelenne az ajtómban egy ügyvéddel a jobbján, nem tudnám hirtelen hova ültetni Å‘ket, a feleségem Cirmike délután vasalt és nem pakolta még el a fotelekrÅ‘l a ruhákat.
Használati utasÃtásként még annyit, hogy próbáltam némileg hű maradni az eredeti szöveg száraz hivatalos precÃz struktúrájához is, de próbálkoztam kicsit olvashatóbbá tenni, remélem sikerült. A publikációban gyakran elÅ‘forduló weboldal és dokumentum szavak többnyire egymás szinonÃmáiként értendÅ‘ek.
A szabadalom irányelvet takar és természetesen nem tekinthetÅ‘ működési leÃrásnak, továbbá a google rangsorolási algoritmusának nyilván rengeteg egyéb nem publikált tényezÅ‘je is van.
Következzen a leÃrás, idÅ‘vel tervezek egy áttekintést is Ãrni amely magyarázatokkal kiegészÃtve próbálja majd még könnyebben értelmezhetÅ‘vé tenni a leÃrt irányelveket valamint leÃrja, mi az ami nem szerepel vagy nem hangsúlyozott (esetleg hiányzik) a publikációban, de fontos kihagyhatatlan tényezÅ‘ keresÅ‘optimalizálásban.
Előzmények - dokumentum megjelenésének, életbe lépésének ideje
Megjelenés dátuma meghatározható több dolog alapján: úgy mint a dátum amikor a kereső első alkalommal indexelte a weboldalt, weboldal regisztrációja indexelésre (google addurl formra gondolnak nyilván), esetleg az a dátum amikor a kereső első alkalommal talál a weboldalra mutató linket egy külső weboldalról.
Egy további implementáció alapján a weboldal megjelenési dátuma meghatározható a domain regisztrációjának dátuma alapján is, ezen túl egy küszöbérték meghatározásával a minimum oldalak számát is lehet feltételhez szabni a dátumot, valamint a webserver által hozzárendelt dátum alapján. Fent emlÃtett valamint a meg nem emlÃtett egyéb technikák együttes alkalmazása használható fel egy kezdeti dátum meghatározásához.
A dokumentum megjelenési dátuma olyan helyzetekben játszhat fontos szerepet a weboldal rangsorolásnál mint pl. a backlinkek (weboldalra mutató linkek) száma által meghatározott értékelés.
Fenti szempont figyelembevételére adhat magyarázatot olyan példa amikor egy pár nappal korábban indexelt weboldal 10 backlinkje kerül összevetésre egy tÃz éves web dokumentum 100 backlinkjével szemben. Ebben az esetben a 10 backlink értékesebb mint 100 backlink. Másik oldalról egy rövid idÅ‘n belül nem általános, gyors tendenciával növekvÅ‘ linkek száma esetén mérlegelnie kell a keresÅ‘ algoritmusának az esetleges spam gyanúját is és helyén kezelni az ilyen szándékú mesterséges link népszerűsÃtést.
Megjelenési dátum egyéb felhasználási pontja a linkek növekedésének idÅ‘beni átlagolása alapján való osztályozás amely értékelés mentén egy idÅ‘sÃkon belül gyakrabban linkelt dokumentum nagyobb osztályzatot kap.
Tartalmi frissÃtés gyakorisága
Rangsorolási szempont egy weboldal frissÃtési gyakorisága.
EltérÅ‘ osztályozással bÃrhat egy dinamikusan változó tartalmú portál egy statikus tartalommal szemben.
Differenciálni kell a változtatások mértékét méretek általi arányok által is, megkülönböztetetve terjedelmesebb dokumentumokat kisebb dokumentumokkal szemben.
Egy képlettel szemléltetve frissÃtési változó számolására egy példa: U=f(UF, UA):
f az összegzése a két változónak UF-nek ami frissÃtési gyakorÃságot takar valamint UA-nak amely frissÃtési mennyiséget jelent, egy relatÃv értéket, a teljes tartalom mennyiségéhez viszonyÃtva, azon belül mennyi tartalom frissült. UF értéke többféle módon számÃtható, a frissÃtések között eltelt idÅ‘t figyelembe véve, valamint egységnyi idÅ‘n belül törtnt változtatások száma, stb.
�llandó keresések változó alanyokkal
KövetkezÅ‘ figyelmen kÃvűl nem hagyható dolog az olyan lekérdezésekre vonatkozik amelyek állandóak a jellegüket és lekérdezések számát illetÅ‘en viszont a lekérdezés alanya változó bizonyos idÅ‘intervallum szerint, ilyenek lehetnek például világbajnokságok és egyéb kontinentális sport-események.
Dokumentumok aktualitása
Figyelemmel követendÅ‘ szempont egy weboldal/dokumentum mennyire aktuális még illetve mennyire elévült információkkal szolgál, következÅ‘ jellemzÅ‘k felhasználásával: dokumentum készÃtésének (megjelenésének) dátuma, hivatkozó linkek számának idÅ‘beni növekedése , tartalom változása. Néhány dokumentum esetén a frissesség kiemelten fontos, mint pl. népszerű termékek és alkalmazások esetén a FAQ, azaz Gyakran Ismételt Kérdések, a keresÅ‘ alkalmas kell legyen eldöntse, hogy melyik oldalon található dokumentum lehet a legaktuálisabb legautentikusabb és egyben legfrissebb.
A keresÅ‘ elemzi adott weboldalak, különbözÅ‘ keresési kifejezésekre való elÅ‘fordulási fokát és amennyiben az adott weboldal kifejezetten sok kulcsszóra elÅ‘fordul a lekérdezésekben ez lehet spam jellegű tartalom jele és viszonylagosan kisebb minÅ‘sÃtést kaphat egyéb szűkebb kulcsszó készletre fókuszáló dokumentumokkal szemben.
Link jellemzők
Néhány faktor amely a weboldalra hivatkozó linkek alapján befolyásolhatja a weboldal rangsorolását:
- a linkek alapján történő értékelés viszonyitási pontjai azon dátumok amikor adott weboldalra hivatkozó link megjelent illetve amikor egy link hivatkozás megszünt.
- fenti idő változók felhasználásával követhető a weboldalra mutató linkek esetlegesen növekvő illetve csökkenő tendenciája,
utóbbi esetében jelezheti adott dokumentum elévülését, ellenkező esetben pedig a növekvő tendencia jelenthet egy kiemelt aktualitást az adott weboldalnak minden egyéb értékelési szempont párhuzamos figyelembevételével.
- Egy külön implementáció szolgálhat a weboldal linkjeinek idÅ‘beni gyarapodásának követésére. A robot követi az utóbbi n napban szerzett új linkek számát a dokumentum megjelenésének dátumához viszonyÃtva y% értékben.
Illusztrációképpen:
legyen y=10, A és B két weboldal az illusztráció tárgya, amelyek mindektten 100 nappal ezelÅ‘tt lettek indexelve. A oldal esetében a linkek 10%-a kevesebb mint 10 nappal korábban lett jegyezve mÃg B oldal esetében az összes link több mint 10 napnál régebbi, ebben az esetben a metrikus (idÅ‘mértékes) eredmény 0.1 A oldal javára B 0.0 ellenében. Ez a metrikus jellemzÅ‘ többféleképpen alkalmazható a továbbiakban.
Linkek jelentÅ‘sége egyéb módon is értékelhetÅ‘. Például a linkek közül melyek - bizonyos osztályozási szempontok alapján - megbÃzható forrásból származó linkek (például állami/kormányzati üzemeltetésű portálokról mutató linkek nagyobb értéket képviselhetnek (.gov)). Milyen jelentÅ‘ségű dokumentumok hivatkoznak az oldalra, valamint egyéb szempont, hogy milyen aktualitással bÃró és mennyire naprakész dokumentumok hivatkoznak rá (milyen gyakran frissÃtett, stb.)
Dokumentum aktualitásához felhasználható tulajdonság lehet a weboldalra mutató linkek “életkora”, a korábbi és újabb linkek arányának összehasonlÃtása.
Anchor Text
A weboldalra mutató linkekhez tartozó szövegek - anchor textek - változásai indikátorai lehetnek adott weboldal tematikus változásainak teljes mértékű változás esetén feltételezhető egy tulajdonos csere vagy teljes változtatás is.
Előző bekezdéseben vázolt jelenség esetén, a weboldal tartalmi és/vagy tulajdonos változása következtethető a weboldal lapjainak szignifikáns változásához és ezek után az ennél korábbi dátumu linkek értéke leértékelhető a továbbiakban.
Weboldal forgalma
Weboldal forgalmi statisztikái alapján való rangsorolási szempontok egyike a látogatottsági statisztikák feldolgozása időmértékes változókat felhasználva.
Radikális forgalom visszaesés jelentheti egy dokumentim aktualitásának elmúltát esetleg másik hasonlódokumentum által okozott népszerűség vesztést.
IdÅ‘szakos illetve szezonális népszerűséget élvezÅ‘ weboldalak esetén a ciklikusan ismétlÅ‘dÅ‘ népszerüségi periódusok felismerésére használhatóak egyéb algoritmusok úgy mint napi látogatottsági statisztikákat összehasonlÃtása utóbbi x nap átlagos látogatottsági statisztikáiva, ahol x értéke lehet 30 nap tehát egy hónapos statisztika, de esetleg x=365 egy hosszabb idÅ‘tartamot, éves periódusokat mérve.
Külön implementációt kap a “reklám-forgalom” mérése weboldalak kapcsán, úgy mint reklámozott oldalak “minÅ‘sége” (amazon.com és népszerűbb oldalak nagyobb értéket képviselnek ilyen tekintetben), egyes hirdetések átkattintási arányai (látogatók száma/kattintások reklámokra az oldalon)
Látogatói statisztikák
Szempont az osztályozásban, hogy az adott weboldal hány alkalommal lett kiválasztva adott kulcsszó találati eredményei közül a többi weboldallal szemben a felhasználók által. (magyarán hányszor klikkeltek többi találat ellenében az oldalunkra)
Látogatók által az oldalon eltöltött idő indikátora lehet, hogy adott topikokban, adott kulcsszavak és keresések kapcsán mennyire releváns, mennyire aktuális és figyelemre érdemes.
Domainhez kapcsolódó információk
Domainhez kapcsolódó jellemzők mint lejárat dátuma mutathatnak jeleket a tulajdonos szándékát illetően a domain-el.
MÃg spammerek rövidtávú célokra inkább regisztrálnak rövidebb idÅ‘tartamra domaineket mÃg komolyabb szándékra felhasznált neveket akár lefoglalhatnak 10 év távlatában is elÅ‘re a domain regisztrációs szabványok alapján a tulajdonosaik.
Figyelemre méltó szempont lehet még a domain tulajdonos információk állandósága vagy gyakori cserélÅ‘dése, a szerver melyre a domain nameserver beállÃtásai mutatnak mennyire jó “előéletű” vagy mennyire spam oldalak kiszolgálására szolgál és szolgált a korábbiakban.

July 2nd, 2007 at 4:39 pm
Köszi a fordÃtást.
July 2nd, 2007 at 5:33 pm
Kérlek.
Lesz majd tanulmány a blogok és politikai élet viszonyáról majd gondolok Rád.
Addig is mozgósÃthatod blogod táborát, hogy szavazzon rám GoldenBlokkon.
July 4th, 2007 at 10:25 am
Jó amit művelsz
Járok erre máskor is.
Egyébként a weboldal forgalmának adatai hogy jutnak el a Google-höz? Hacsak nem teszek fel Goggle féle statot, akkor honnan tudja?
July 4th, 2007 at 10:30 am
Köszi Krisztián, visszavárlak!
Ha nincs Analitycs akkor lehet hogy sehogy, ilyen beépÃtett alkalmazások mint Google Toolbar nem tudom, hogy tudnak-e ilyen tekintetben kémkedni, de nem hiszem.
Utánajárok majd ennek a kérdésnek, mert bennem is már felmerült.
July 4th, 2007 at 6:20 pm
Megtettem.
July 5th, 2007 at 12:26 pm
Ha csak az Analitycs, akkor egy kisebb forgalmú, de jól optimalizált sitenak kimondottan hátrányos lehet az Analitycs.
Ezzel szemben egy nem optimalizált, de magas forgalmú site esetén viszont javÃthat a helyezésen.
KÃváncsi leszek mit derÃtesz ki
July 10th, 2007 at 10:16 pm
Elolvasgattam pár dokumentumot azóta ezzel kapcsolatban, nem találtam sehol utalást egyéb méréshez felhasznált eszközre a Google Analitycs-en kÃvűl.
Talán nem véletlenül tette ingyenessé a Google a felvásárlása után
July 11th, 2007 at 12:43 am
[...] weboldalak linkjeivel szemben, szintén szempont, ahogy ez már az “általános” rangsorolási szabadalomból ismert [...]