Duplicate content: de problemen én oplossingen! | Deel 1

Karel
28/4/2014
Karel
28/4/2014
Zoekmachine optimalisatie
X
min leestijd

Duplicate content en SEO: het is nooit een gelukkige combinatie geweest. Sinds Googles Panda-update in 2011 en de Pinguïn-updates in 2012 en 2013 zijn de gevolgen van duplicate content echter groter geworden.Waren het voorheen vooral de rankings van de pagina's met duplicate content die aangetast konden worden, na Panda/Pinguïn kunnen de rankings van je gehele site in gevaar komen.Een goed moment om duplicate content nog eens uitgebreid onder de loep te nemen.Want wat is duplicate content eigenlijk? Wat zijn precies de gevolgen en hoe kan je duplicate content voorkomen?

Wat is duplicate content?

Er is sprake van duplicate content wanneer twee of meer pagina's dezelfde of nagenoeg dezelfde inhoud hebben.Zoekmachines laten helaas geen exacte percentages los, maar de schatting is dat pagina's die voor meer dan 70% gelijk zijn, beschouwd worden als duplicate content.Hierbij telt overigens alleen de tekst van de pagina: codering is niet van belang.Als je dus twee websites hebt met een identieke vormgeving (hetzelfde template, menustructuur enz.) maar met verschillende tekst, hoef je je nergens druk om te maken.Als het gaat om duplicate content, moet je verder in gedachten houden dat een “pagina" niet simpelweg een bestand of document is dat op de webserver staat.Een zoekmachine beschouwt elke unieke URL namelijk als een afzonderlijke pagina.Verwijzen twee verschillende URL's naar exact dezelfde content (iets wat op een website al snel kan gebeuren), dan ziet Googlebot ze dus als twee aparte pagina's met duplicate content.

Voorbeelden van duplicate content

Duplicate content kan voorkomen op één en hetzelfde domein of op twee (of meer) domeinen.

Hetzelfde domein

Duplicate content is een veelvoorkomend probleem op websites. Ten eerste is een domein "“ als je hier geen actie tegen onderneemt "“ altijd toegankelijk via twee verschillende URL's: de http- en de www-versie.Voor sites met een beveiligde omgeving komt daar nog een derde bij: https. Googlebot ziet al die URL's die naar dezelfde content verwijzen als afzonderlijke pagina's, waardoor sprake is van duplicate content.Andere veelvoorkomende problemen (vooral bij dynamische websites op basis van een CMS, zoals WordPress of Joomla) zijn meerdere URL's voor de homepage en pdf- of printversies van een pagina met een afzonderlijke URL.Op een site kan duplicate content er dus bijvoorbeeld in de praktijk zo uit zien:

  • http://mijnsite.nl
  • www.mijnsite.nl
  • http://mijnsite.nl/index.html
  • www.mijnsite.nl/artikel
  • www.mijnsite.nl/artikel.pdf
  • www.mijnsite.nl/print/artikel

Verschillende domeinen

Duplicate content op verschillende domeinen kan bijvoorbeeld ontstaan wanneer de auteur zijn artikel aan meerdere sites aanbiedt.Soms worden artikelen ook zonder toestemming van de auteur op andere sites geplaatst, wat een schending van auteursrecht oplevert.Een ander geval van duplicate content op verschillende domeinen dat vaak voorkomt, is wanneer affiliate sites alle productomschrijvingen automatisch één op één overnemen van de leverancier.

Gevolgen van duplicate content

Voordat we toekomen aan hoe je duplicate content opspoort en wat je ertegen kunt doen, kijken we eerst maar eens naar de meest prangende vraag: wat zijn de gevolgen en hoe erg is duplicate content nu eigenlijk?

Google negeert duplicate content

Google wil gebruikers altijd de meest relevante zoekresultaten voorschotelen. Een gebruiker zit er uiteraard niet op te wachten dat dezelfde content meerdere keren in de zoekresultaten voorkomt.Dus als Google duplicate content tegenkomt, wordt slechts één pagina in de zoekresultaten opgenomen. In de zoekresultaten zie je dan de volgende mededeling:

Zoekresultaten-duplicate-content

Voor wat betreft duplicate content die op je eigen domein staat, is dit op zichzelf beschouwd niet zo erg. Zolang Google maar jouw voorkeurs-URL kiest om weer te geven natuurlijk.Iets wat helaas niet altijd het geval is.Duplicate content op twee verschillende domeinen kan ook wel eens problemen opleveren. Soms slaagt Google er namelijk niet in om vast te stellen wat nu het originele artikel is, zodat de site van de oorspronkelijke auteur achter het net vist en alleen de site die het artikel heeft overgenomen wordt weergegeven in de zoekresultaten.Als Google het bij het juiste eind heeft en het origineel laat zien, plukt de site die het artikel overneemt daar geen SEO-vruchten van. Als de overnemende site gewoon waardevolle content aan haar gebruikers aan wil bieden, is dit geen probleem. Als de overnemende site echter niets anders doet dan content plaatsen die ook al op andere websites staat, zijn de gevolgen (zoals we hieronder zullen zien) wel vervelend.

Verlies van linkjuice en rankings

Via links stroomt waarde door naar een pagina waarnaar wordt gelinkt. Deze waarde wordt linkjuice genoemd en hoe meer waarde een pagina krijgt hoe hoger hij rankt in Google.Stel nu dat je duplicate content op je site hebt staan in de vorm van een artikel, dat toegankelijk is via twee URL's: www.mijnsite.nl/artikel en www.mijnsite.nl/artikel.pdf.Er linken 5 websites naar de eerste URL en 5 websites naar de tweede URL. Het gevolg hiervan is dat de linkjuice verdeeld wordt over twee verschillende URL's in plaats van dat alle waarde naar één URL/pagina vloeit.De rankings van je artikel in Google zijn nu lager dan wanneer alle 10 de links naar dezelfde URL hadden verwezen.

Minder crawltijd voor je site

Als Googlebot op je site aanlandt, gaat hij aan de gang met het crawlen van al je pagina's. Als hij heel veel URL's/pagina's met dezelfde inhoud tegenkomt, houdt Googlebot het al snel voor gezien.Een site met veel duplicate content is nu eenmaal niet interessant. Als Googlebot minder tijd besteedt aan het crawlen van je site, loop je het risico dat belangrijke pagina's op je site niet meer worden gecrawld en dus ook niet zichtbaar zijn in de zoekresultaten.

Minder pagina's worden geïndexeerd

Aan de hand van de PageRank/autoriteit van je site, stelt Google een limiet vast van hoeveel pagina's maximaal geïndexeerd worden.Als er inmiddels al honderden pagina's met duplicate content van je site in de index van Google staan, loop je het risico dat de limiet is bereikt en dat andere belangrijke pagina's van je site niet in de index worden opgenomen.

Een penalty voor de hele site

In sommige gevallen kan duplicate content leiden tot een penalty voor de gehele site. Google zegt hier het volgende over op zijn support pagina's:“In de zeldzame gevallen waarin Google merkt dat dubbele inhoud wordt weergegeven met de bedoeling onze rangschikking te manipuleren en onze gebruikers te misleiden, zullen we ook de juiste aanpassingen aanbrengen in de indexering en rangschikking van de betreffende sites. Dit kan een nadelig effect hebben op de positie van de site of de site kan worden verwijderd uit de index van Google en daardoor niet meer in zoekresultaten worden weergegeven."Een behoorlijke zware straf.Gelukkig deelt Google een dergelijke “site-wide penalty" niet zomaar uit: daarvoor moet een site het wel behoorlijk bont maken met duplicate content.De grootste verliezers van de Panda- en Pinguïn-updates waren sites die grotendeels uit matige en duplicate content bestonden. Dergelijke sites hebben weinig tot geen toegevoegde waarde voor gebruikers en worden dan ook uit de zoekresultaten geweerd.

Is duplicate content altijd slecht?

Als rankings in zoekmachines je lief zijn, is duplicate content een belangrijk aandachtspunt.Op eigen domein is duplicate content eigenlijk nooit goed en moet je het zoveel mogelijk zien te vermijden.Google kan ervoor kiezen een andere dan jouw voorkeurs-URL te tonen in de zoekresultaten, je verspreidt in veel gevallen onnodig linkjuice en het kan gebeuren dat minder pagina's op je site worden gecrawld en geïndexeerd.Duplicate content op twee of meer verschillende domeinen kun je in de meeste gevallen ook maar het best vermijden.In één geval is het echter niet erg en kan het je zelfs voordeel opleveren. Als je een artikel schrijft, dit op je eigen site plaatst en vervolgens aanbiedt aan een andere site, is er niet zoveel aan de hand als Google het artikel op jouw site als origineel aanmerkt en laat zien in de zoekresultaten.Met het artikel op de andere site vergroot je dan niet alleen je lezersgroep, maar verdien je ook meteen een mooie link naar je site. Duplicate content kan soms dus ook wel eens positief uitpakken!In dit artikel hebben we gezien wat duplicate content precies is en wat de gevolgen ervan zijn. In deel 2 van deze reeks bekijken we hoe je duplicate content kunt opsporen en oplossen.>>> Lees hier deel twee van deze reeks! <<<

Schrijf je in voor onze nieuwsbrief

Je bent succesvol ingeschreven voor onze nieuwsbrief!
Er is iets fout gegaan bij het verzenden van het formulier

Wil je meer gratis tips over online marketing?

Bekijk onze gratis downloads

Categorieën

Ontdek hoe wij jouw bedrijf verder kunnen helpen

We hebben je aanvraag succesvol ontvangen, we nemen zo snel mogelijk contact met je op
Er is iets fout gegaan bij het verzenden van het formulier