Content scraper site-oknak hívják azokat a weboldalakat amelyek más oldalak tartalmait összegyűjtve építenek új portált, új struktúrában esetleg, de hozzáadott plusz tartalom nélkül.
Kicsi az olyan oldalak százalékos aránya a weben, amelyek teljesen egyedi tartalmat közölnek folyamatosan, ezen kevesek közé tartoznak a saját cikkeket publikáló hírportáljaink mint az Index.hu, ahol nagyon sok új tartalom készül napi szinten.
Most úgy látszik ők is elkezdtek contentet duplikálni jól, “erősebb kutya baszik” elv alapján hátha hozzájuk hozza a Gugle majd az usert egynéhány keresésre.
Nem tudom mióta léteznek adatlap címszó alatt tartalmak az Index kultúr rovatában, én csak most vettem észre egy cikkben lévő hivatkozás nyomán, de azt látni, hogy közel 800.000 ilyen oldal szerepel a Google indexben.
Az oldalak többnyire színészek, filmek, tv műsorok bemutató adatlapjai, az a közös bennük, hogy szinte mind a Port.hu oldal leírásaival 100%-osan megegyező szövegek.
Jogi hátteret nem ismerem, valószínűleg a Port.hu szerkesztői sem maguk írják a rövid bemutatókat a filmek esetén, tehát nem saját tartalmuk, hanem gyártók által kiadott sajtóanyagok ezek minden valószínűséggel, amelyek újrapublikálhatóak bárki által, tehát nem követ el vétséget azzal senki, ha a közzéteszi.
(voltak olyan tartalmak is, amit csak a port.hu és az index.hu oldalán találtam meg
pl. DunaTV kívánságkosár: http://index.hu/kultur/musor/adatlap/70168 - http://www.port.hu/pls/fi/films.film_page?i_perf_id=7547142&i_where=1)
Viszont negatív jelenség számomra, hogy nagyobb portálok is, ahelyett, hogy olyan hasznos forrásokra mutatnának (jelen esetben a port.hu) amelyek jól teljesítik a szerepüket, elkezdik ilyen megoldásokkal inkább “haza hordani” a látogatókat saját oldalaikra.
Adott színész, film, műsor említése során, port.hu hivatkozás helyett, az onnan átvett tartalom jelenik meg saját oldalon.
Kapcsolódó cikkek:
- Jelenségek: Hírportál design körkép
- Jelenségek: Egyedi design
- SEO cikkek: Indexelés követése
- SEO cikkek: Duplikált tartalom
- Google: Index.hu főoldal - Pagerank: 0
- SEO cikkek: Gyengélkedik a Google.hu
- SEO cikkek: Keresési oldalak találatai keresőkben
- SEO cikkek: Közösségi Portál terv…

August 12th, 2008 at 11:15 pm
“Viszont negatív jelenség számomra, hogy nagyobb portálok is, ahelyett, hogy olyan hasznos forrásokra mutatnának (jelen esetben a port.hu) amelyek jól teljesítik a szerepüket,”
Ez akkor történne így, ha a port.hu fizetne azoknak az erős oldalaknak, akik meglinkelik, és sok látogatót hoznak.
Valószínűleg a port nem fizet ilyesmiért, akkor pedig az index és a többiek miért tennének jót velük ingyen, ha ugyanazt az anyagot maguk is megjelentethetik, és kereshetnek rajta?
A kapitalizmus nem a szívjóságról szól.
August 12th, 2008 at 11:41 pm
Nem jószívűség kérdése.
Ne linkelje, ha úgy ítéli, hogy nem érdemes. Nem kötelező.
(Egészségesebb egyébként az a gyakorlat, hogy relevánsabb forrásokat megjelelölünk esetenként. Jó a felhasználó számára, jó a keresők számára, erre is gondolni kell.)
Szerintem az Indexnek a jellegéből fakadóan nem lenne szüksége ilyen tartalmak behúzására, sokkal értékesebb maradhatna a saját szerkesztői és az olvasók által (ahogy egyre jobban integrálódik a blog.hu is) előállított tartalmakból készült értékek létrehozásával.
August 13th, 2008 at 8:29 am
Legszörnyűbb a “content scrape” olyankor, amikor ténylegesen segítségre van szükségem és külföldön nagyon sok “tech oldal” simán csak átveszi a fórumokból a (sokszor nem éppen hozzáértő kommentelőktől jövő) hozzászólást, mint ha az a saját megoldása lenne egy adott problémára. Nem egyszer előfordult, hogy az első 2-3 találati oldalon minden egyes találatra dettó ugyanaz a szöveg jön be más köntösben (és persze más reklámmal vagy “popunderrel”). A találat ugyan tényleg a keresésre illő, de sok esetben már nem tudom jobban szűkíteni a keresést ha a segítségért gugli barátomhoz fordulok.
August 13th, 2008 at 1:07 pm
Origo?
Ha valaki elárulja miért sikeresebb a rosszabb strukturával rendelkező origo mint az index, az kap egy sőrt!
(szvsz: aki már tud netelni indexet olvas, aki alap az meg origot, persze vannak átcsurgások, de javába inkább ezvan)
August 13th, 2008 at 3:17 pm
Index.hu szinten tényleg nem kellene, ez inkább a megélhetési webmesterek műfaja (akik lehet, hogy gyakran nem is kicsit jól élnek meg ebből
)
August 13th, 2008 at 7:17 pm
Sajnos sok esetben mindkét oldalon elég gyenge minőségű írások születnek meg, mivel az előzményekre nem figyelnek, illetve nem járják körül a témát. Ami még feltűnt már elég régóta, hogy eléggé el ment a bulvár felé, azért ez az őskorban nem volt (2000 elött)
August 14th, 2008 at 2:24 am
Az idex mostanában folyamatosan degradálja magát. Ezzel még jobban eligénytelenedik. Sok panaszt hallok mostanában, több ismerősőm levette az RSS-ről mert azt mondták, lassan az lesz a neve, hogy “Blikk”….
August 14th, 2008 at 6:00 am
Amig nem lesz “igazi” verseny ezen a szegmensen, addig ez a kettő mamut marad.
August 14th, 2008 at 12:18 pm
Ráadásul szinte minden cikkben van egy-egy elgépelés… de nekem összességében tetszik.
August 15th, 2008 at 12:56 am
muhaha, jó ez a post, a gonosz index behúzza szegény port.hu adatait. lol. valójában az index fizet ezekért az adatokért a portnak, ilyen egyszerű.
August 15th, 2008 at 1:01 am
no, egy bennfentes válaszolt netán?
Jólvan apafej, akárhogy is van, baszott rossz tartalom építési stratégia IMHO, az Indextől.
Ha még fizet is érte, akkor meg pláne.
(btw. nemcsak port.hu tartalmaival azonos duplikált tartalmak találhatóak Index “adatlapokon”, ezért falsnak tűnik kicsit ez az “info”)
August 16th, 2008 at 4:05 pm
Egyébként olyan édes, hogy mennyien aggódnak azon, hogy mit csinál az index.hu…
Gondolom van náluk felelőse a témának és valószínűleg átgondolják, hogy mit miért csinálnak, ha meg tévednek… az ő gondjuk
August 16th, 2008 at 4:09 pm
Én nem aggódom rajta különösképpen, csak tényleg meglepetésként ért amikor a napokban rábukkantam ezekre az adatlapokra és tartottam annyira rossz lépésnek, hogy írjak róla egy külön bejegyzést.
August 17th, 2008 at 11:17 am
Szerintem az érték és a minőség fontos lenne, ha az ilyen nagy portálok egyáltalában fontosnak tartják, ha ezek nem képesek közvetíteni akkor, a régi látogatói rétegből veszít és veszíteni fog és egy másfajta látogatói réteg lesz. Az írásokat igen sokan “értékelik” az origon, talán az index még nem meri bevállalni, hogy hozzászólhassanak a tartalomhoz.
August 22nd, 2008 at 1:23 pm
Kissé pofátlanság az efféle automatizált tartalommásolás. Nem, mint ha a kézzel történő másolás nem lenne az. Sokan most azt mondják: “Ehh, így kell okosan lopni, automatikusan”. Én másképp látom. Ha már lopsz, “dolgozz” meg érte. Grrrrrrrr . Index.hu, grrrrrrr.
August 25th, 2008 at 5:55 pm
Talán ezzel összefügg, és nem véletlen, hogy egy negyedéven át az Index pagerank-je nulla volt.
August 25th, 2008 at 7:03 pm
Az egy technikai jellegű probléma volt mint utólag kiderült. Az index.hu/index.html léte okozta a zavart, mert néha az Index erre a címre szokta átirányítani a felhasználókat amikor belépési oldal előtti reklám van.
September 8th, 2008 at 11:08 pm
A Port.hu meg a Moziplussz.hu-tól lop időnként tartalmakat, úgyhogy ez inkább ilyen belterjes, spóroljunk a munkával kör.
September 10th, 2008 at 6:01 pm
amatőr kérdés:
egy olyan portálnak mint az index mennyire számít a pr ?
azt gondolná az ember hogy valaki vagy ismeri (internettó óta) vagy nem, vagy ez nem így van ?
September 11th, 2008 at 1:03 am
nehéz a kérdésedre jó és jól fogalmazott választ adni kerecsen malac