Duplicate Content: Wat is het en Hoe Los je het Op?
Duplicate content herkennen en oplossen. Canonical tags, redirects en andere methoden.
Wat is duplicate content en waarom is het een probleem
Duplicate content betekent dat dezelfde of nagenoeg dezelfde inhoud bereikbaar is via meerdere URLs op het internet. Dit kan binnen je eigen website voorkomen, bijvoorbeeld wanneer dezelfde pagina bereikbaar is met en zonder www, of met en zonder trailing slash. Het kan ook voorkomen tussen verschillende websites, bijvoorbeeld wanneer productbeschrijvingen van een fabrikant op meerdere webshops verschijnen.
Het probleem met duplicate content is dat zoekmachines niet weten welke versie ze moeten indexeren en tonen in de zoekresultaten. In plaats van al hun autoriteit te bundelen op een pagina, wordt die verspreid over meerdere duplicaten. Het resultaat is dat geen enkele versie optimaal presteert. Google bestraft duplicate content niet met een penalty, maar het verdunt wel je rankingpotentieel.
Veelvoorkomende oorzaken van duplicate content
De meest voorkomende oorzaak is technisch van aard: je website is bereikbaar via meerdere URL-varianten. Denk aan http en https, www en niet-www, met en zonder trailing slash, en met en zonder hoofdletters. Elk van deze varianten wordt door Google als een aparte URL beschouwd, zelfs als ze dezelfde content tonen.
URL-parameters zijn een andere veelvoorkomende bron van duplicaten. Sessie-IDs, trackingparameters, sorteerparameters en filteropties genereren allemaal nieuwe URLs met dezelfde content. Een productpagina kan zo tientallen URL-varianten krijgen door combinaties van filters en sortering.
Paginereing leidt ook vaak tot duplicaten, vooral als de eerste pagina van een reeks bereikbaar is via zowel de basis-URL als pagina-1. Content syndication, waarbij je dezelfde artikelen op meerdere platforms publiceert, en printer-vriendelijke versies van pagina's zijn nog twee klassieke bronnen van duplicate content.
Canonical tags: de primaire oplossing
De canonical tag, oftewel rel=canonical, is het belangrijkste wapen tegen duplicate content. Met deze tag vertel je Google welke URL de voorkeurs- of originele versie van een pagina is. Google bundelt dan alle rankingsignalen van de duplicaten bij de canonical URL.
Plaats een canonical tag in de head-sectie van elke pagina op je website, zelfs op pagina's die geen duplicaten hebben. Een zelf-refererende canonical, waarbij de canonical tag naar de eigen URL wijst, is een best practice die voorkomt dat Google zelf een verkeerde keuze maakt bij onverwachte URL-varianten.
Wees consistent met je canonical tags. Als je ervoor kiest dat de versie zonder trailing slash je voorkeur heeft, dan moeten alle canonical tags consequent verwijzen naar URLs zonder trailing slash. Zorg ook dat je canonical URLs overeenkomen met de URLs in je sitemap en je interne links. Tegenstrijdige signalen verwarren Google en verminderen de effectiviteit van je canonical tags.
301-redirects voor permanente oplossingen
Waar canonical tags een hint zijn die Google kan negeren, is een 301-redirect een harde doorverwijzing. Gebruik 301-redirects wanneer je zeker weet dat een URL permanent niet meer gebruikt wordt en alle bezoekers en zoekmachines naar de nieuwe URL gestuurd moeten worden.
De klassieke toepassing is het redirecten van HTTP naar HTTPS en van www naar niet-www, of andersom. Stel deze redirects in op serverniveau via je htaccess-bestand op Apache of je nginx-configuratie. Dit zorgt ervoor dat elke bezoeker en crawler automatisch bij de juiste versie terechtkomt.
Gebruik 301-redirects ook wanneer je pagina's samenvoegt, URL-structuren wijzigt of oude pagina's vervangt door nieuwe. Redirect altijd naar de meest relevante bestaande pagina, niet naar de homepage. Een redirect naar de homepage is een gemiste kans om de opgebouwde autoriteit van de oude pagina over te dragen naar gerelateerde content.
Noindex en andere geavanceerde oplossingen
Voor pagina's die je wel toegankelijk wilt houden voor bezoekers maar niet in de zoekresultaten wilt tonen, gebruik je een noindex meta-tag. Dit is ideaal voor interne zoekresultatenpagina's, filterpagina's met weinig unieke content, printer-vriendelijke versies en bedankpagina's na formulierinzendingen.
De noindex-tag verschilt fundamenteel van de canonical tag. Een canonical zegt: indexeer die andere versie in mijn plaats. Een noindex zegt: indexeer deze pagina helemaal niet. Gebruik noindex alleen als je zeker weet dat de pagina geen SEO-waarde moet opleveren.
Voor URL-parameters kan je in Google Search Console aangeven hoe Google met specifieke parameters moet omgaan. Geef aan of een parameter de content verandert of slechts het uiterlijk beinvloedt. Parameters die enkel voor tracking of sessies dienen, kan je laten negeren. Dit helpt Google om je crawlbudget efficienter te besteden.
Hreflang voor meertalige websites
Meertalige en meerregionale websites lopen extra risico op duplicate content problemen. Als je dezelfde content aanbiedt in Belgisch Nederlands en Nederlands Nederlands, of in het Frans voor Belgie en Frankrijk, kan Google deze als duplicaten beschouwen. De hreflang-tag lost dit op door aan te geven welke taal- en regioversie voor welk publiek bedoeld is.
Implementeer hreflang-tags op elke pagina die een equivalent in een andere taal of regio heeft. Elke taalversie moet naar alle andere versies verwijzen, inclusief zichzelf. Gebruik de juiste taal- en regiocodes: nl-BE voor Belgisch Nederlands, nl-NL voor Nederlands Nederlands, fr-BE voor Belgisch Frans.
Hreflang kan geimplementeerd worden via HTML link-tags in de head, via HTTP-headers of via je XML sitemap. Voor de meeste websites is de HTML-methode het eenvoudigst. Vergeet niet om een x-default versie aan te geven voor bezoekers die niet overeenkomen met een van je specifieke taal-regio combinaties.
Paginering en duplicate content
Pagina's die deel uitmaken van een gepagineerde reeks, zoals categoriepagina's in een webshop of archiefpagina's van een blog, vereisen speciale aandacht. Google heeft de rel=prev en rel=next hints officieel beeindigd, wat betekent dat je andere methoden moet gebruiken om paginering correct af te handelen.
De beste aanpak voor paginering is om een view-all pagina aan te bieden als dat haalbaar is qua laadsnelheid. Stel de canonical tag van alle gepagineerde pagina's in naar deze view-all pagina. Als een view-all pagina niet haalbaar is, geef dan elke gepagineerde pagina een zelf-refererende canonical.
Zorg ervoor dat pagina 1 van een reeks slechts via een URL bereikbaar is. Als je categoriepagina bereikbaar is via zowel /schoenen/ als /schoenen/pagina/1/, redirect dan de laatste naar de eerste. Voorkom ook dat filterparameters onnodig veel URL-varianten creeren door minder populaire filtercombinaties een noindex-tag te geven.
Een systematische aanpak voor het opsporen van duplicaten
Begin met het crawlen van je website met een tool zoals Screaming Frog. Filter op pagina's met identieke of bijna identieke title tags, meta descriptions of H1-headings. Dit zijn sterke indicatoren voor mogelijke duplicate content. Controleer ook de indexeringsstatus in Google Search Console voor pagina's die gemarkeerd zijn als duplicaat.
Gebruik de site-operator in Google om te checken hoeveel pagina's er geindexeerd zijn. Als Google aanzienlijk meer pagina's indexeert dan je verwacht, is dat een teken dat er URL-varianten of onbedoelde duplicaten in de index zitten. Zoek op site:jouwdomein.be en vergelijk het aantal resultaten met het werkelijke aantal pagina's op je website.
Maak een actieplan op basis van je bevindingen. Prioriteer problemen op basis van de betrokken pagina's: duplicaten van je belangrijkste commerciele pagina's hebben de hoogste prioriteit. Los de meest voorkomende oorzaken structureel op met serverredirects en canonical tags, in plaats van elke pagina individueel te behandelen. Een structurele aanpak voorkomt dat dezelfde problemen zich in de toekomst opnieuw voordoen.
Hulp nodig met Technische SEO?
Onze experts helpen je graag. Vraag een gratis strategiegesprek aan.