Szó volt már korábban párszor itt a blogon a Google által alkalmazott “humán erőforrásról” a spam elleni munkában, most egy részletes angol nyelvű tájékoztató került nyilvánosság elé, hogy milyen irányelvek mentén javasolja a Google a spam jellegű oldalak vizsgálatát a minőség osztályozó alkalmazottainak.
Bővebben a Blogoscoped ír a téma kapcsán.
Az útmutató dokumentum a quality rater rendszer felületét és működését is részletesen bemutatja, amelyen belül az alkalmazottak a weboldalakat osztályozzák.
Könnyed éjjeli böngészés közben tűnt fel tegnap a status bar-t megpillantva, hogy az Index főoldala nullás Google Pagerank értékkel bír.
Vajon mi lehet? Csak nem büntetés fizetett linkeknek nyilvánított hirdetések miatt?
Futtattam gyorsan egy lekérdezést Digpagerank-en, narancssárga színű, non-confirmed status (valid és fake státusz között, google info: operátorával lekérdezve nincsenek infok az oldalról, nincs cachelt változat sem pl.).
(update: közben kiderült, hogy a http://index.hu/index.html oldallal duplikáció van és ez a másodlagos url kapott Pageranket míg a főoldal nem. Amikor főoldalas nyitóreklámok vannak akkor irányítják át azokat a felhasználókat egy napig az index.html címre, akik már megtekintették egy alkalommal a reklámot)
A kérdés azért érdekes, mert én nem tapasztaltam idáig, hogy igazán patinás oldalak elmarasztalásban részesültek volna Matt Cutts
rögtönítélő bírósága előtt. Átnéztem futólagosan még a fontosabb kategóriaoldalakat, a Tudomány rovat szintén nem kapott a Google spenótfőzelékéből a legutóbbi update során, többi kategória oldal “rendben” van, ezért is tűnik úgy mintha nemcsak átmeneti jelenségről lenne szó.
Miért nullás épp’ a főoldal és az említett kategória aloldal?
Lehetséges megfejtéseket várok a kommentekben. (amennyiben a PR hiány mégiscsak átmeneti és időközben megoldódik, akkor a feladvány visszavonva)
Részletes tanulmányban számol be a Google kutató csoportja, a keresőben felbukkanó káros weboldalak arányáról, amelynek eredménye: 1.3%. A felmérés 2007 január-október közötti mérés alapján készült 66.534.330 URL statisztikája alapján.
Országok szintjén Kína nyert 67%-al, USA (15%) és Oroszország (4%) előtt.
38.1%-os arányban futottak Apache szerveren a malware-el fertőző lapok és 39.9%-os volt olyan szerverek aránya, ahol régi PHP volt telepítve a jól ismert biztonsági sebezhetőségekkel.
Több mint kétszer annyi Microsoft IIS szerveren (113.905) volt kártékony oldal mint Apache-on (55.088).
(a tanulmány bővebben: All Your iFRAMEs Point to Us)
Immár magyar nyelvű szekció is van a Google Webmasters-en, - illetve Webmesteren bocsánat -.
Megmondom őszintén, eddig nem igazán voltam elkötelezett olvasója az angol nyelvű webmaster helpnek, de kiváncsian fogom követni, hogy hogyan fog működni ez a magyar nyelvű group.
Kicsit titokzatos stílusban mutatkozik be Google Tibor és Google János az új magyar felületen, akik magyar származásuk nyomatékosítása céljából leírják hol nőttek fel, hol nyaraltak, hol tanultak és mit dolgoztak kb. ezidáig, mielőtt a Google dublini központjába kerültek, hogy szolgálatot teljesítsenek, a web magyar ajkú webmestereinek.
Hajrá Tibor és János és hajrá Google, megyünk majd kérdezni és Chit-Chatelni hozzátok!
(Írek tényleg olyan sokat vedelnek, hogy még a magyarokat is simán leisszák az asztal alá?)
update: Rá is kérdeztem akkor már egy dologra, ami régóta foglalkoztat: Rangsorolás -”minőségellenőrök”
Egy Technology Review cikknek köszönhetően, amelyben Peter Norvig, a Google egyik vezető fejlesztője beszél a keresőről, újra téma lett a Google által alkalmazott “minőségellenőrök” munkája, akik egyénileg tekintenek át találati listákat és osztályoznak weboldalakat.
cikk megnyitása
A duplikált tartalmak megjelenítésének elkerülése érdekében a Google többé nem tárol az indexben RSS feedeket (Podcastek maradnak).
Jó döntés.
Azt gondoltam csak nálam jellemző az utóbbi napokban, hogy nem a bevételek nagysága szerint rendezi az oldalakat az Adsense Report, hanem össze-vissza, de olvasom, hogy általános a jelenség.
Azért a Googlenél sem kóderzsenik agyából van a kerítés.
A napokban zárult PubCon konferencián Matt Cutts egy nemrégiben történt változtatásról beszélt a Google találati oldalai tekintetében.
A változtatás lényege: idáig aldomainek (pl. aldomain.domain.com) révén egy domainen található weboldalak közül kettőnél több is megjelenhetett egy Google találati oldalon.
Mostantól ugyanúgy ahogy alkönyvtárak esetén, egy találati oldalon előforduló azonos domainen található weblapok száma maximum 2 lehet.
(Ducard kérdezte nemrégiben, hogy mi van akkor, ha egy weboldal 3 oldala találkozik egy Google találati oldalon. Mostmár azt is tudjuk, hogy ilyen nincs, maximálva volt/van a megjelentetett lapok száma)
Kivételek persze vannak, elég a Google vagy az IBM szóra rákeresni. Ezt Matt a mai blog bejegyzésében tette csak hozzá utólagosan a hírhez, miután több webmasternek feltűnt az ellentmondás és fórumokon, blog bejegyzésekben osztották meg észrevételüket …
Toni barátomék megint segítettek rajtam. Hétvégén a Googleplexben jártunk a fiúkkal. Tárgyalni voltunk a “két orosszal”.
A beszélgetés eredményesen zárult, Sergeyék visszaadták az előzőleg bevont zöld kártyámat…
És akkor komolyra fordítva, mégegyszer utoljára (egy darabig legalábbis) beszéljünk a pagerank kérdéséről, büntetésekről, esetleges okairól és következményeiről.
cikk megnyitása
Örömmel látom, hogy Misa közben elkészítette Peresztegi Zoltánnal (Google Magyarország) a korábban beígért interjút.

Keresőoptimalizálás cikkek