canonical-url
9 Mar `15 SEO

Canonical URL – Antwoord op Rel=Canonical vragen

Sinds 2009 ondersteunen zowel Google als Yahoo de rel=canonical tag in de head sectie. Nog steeds zorgt deze lijn HTML-code voor veel verwarring bij zowel developers, SEOs als webmasters. Een canonical (of canonieke url) is een typisch voorbeeld van één simpele lijn code die je hele SEO-strategie en vindbaarheid kan ruïneren. Recentelijk heeft Google daarom een blog gepost met de [[vijf meest voorkomende fouten bij canonicals] http://googlewebmastercentral.blogspot.nl/2013/04/5-common-mistakes-with-relcanonical.html]. Hoewel het prettig is dat Google hier openheid geeft en de vijf meest voorkomende (grove) fouten probeert te tackelen, geeft het nog geen antwoord op veel andere vragen over canonicals. Omdat een canonical essentieel is en het ontzettend belangrijk is dat dit goed helemaal goed staat in de HTML header, is het dus hoog tijd voor een blog over canonicals. Ik ga hier in op wat een canonical is en de meest voorkomende vragen hierover.

Rel=canonical, wat is het?

Simpel gezegd is de canonical tag een manier om Google (en andere zoekmachines) te vertellen dat een bepaalde URL gelijk is aan een andere URL. Bij webwinkels en blogs is dezelfde content vaak toegankelijk via meerdere URL’s. Wanneer bijvoorbeeld URL B een kopie is van de URL A kun je dat via een canonical tag in de header aan Google aangeven (zie onderstaand voorbeeld). Zo voorkom je dat je verschillende pagina’s hebt met verschillende URL’s maar met dezelfde inhoud, oftewel duplicate content. Duplicate content heeft een negatief effect op de ranking van je website en dient daarom altijd voorkomen te worden.

Voorbeeld van een canonical in de sectie wanneer URL B duplicaat is van URL A. In de head sectie van URL B gebruik je een canonical die verwijst naar URL A om te laten zien dat Google URL A dient te indexeren en URL B hier een duplicaat van is. De canonical tag in de head sectie van URL B ziet er dan als volgt uit.

Wanneer je deze tag toevoegt, zal alleen de canonical URL (in dit voorbeeld http://www.voorbeeld.com/url-a/) worden getoond in de zoekresultaten van Google en voorkom je dus het probleem van duplicate content. Google waardeert pagina’s die allemaal dezelfde inhoud lijken te hebben namelijk lager. Door een canonical toe te voegen, laat je Google zien dat dit een bewuste kopie is van een pagina. Met deze kopie URL kun je de bezoeker beter bedienen, zonder dat dit een negatief effect heeft op de ranking van de desbetreffende pagina’s.

Wanneer gebruik je canonieke URL’s

Canonieke URL’s is een lastig onderwerp en Google heeft daarom zelf een uitgebreid [support document https://support.google.com/webmasters/answer/139066?rd=1] hierover geschreven. Mocht je dit nog niet hebben gelezen, dan raad ik je aan dit zeker te doen. Tenslotte willen wij uitsluitend in overeenstemming met de richtlijnen en instructies van Google handelen om onze canonicals zo goed mogelijk in te richten. En wie kan dit beter vertellen dan Google zelf! Hieronder noem ik kort een aantal voorbeelden wanneer je een rel=canonical kunt gebruiken.

Webshops: productpagina’s met categoriepad

Wanneer productpagina’s een URL hebben waarin het categorie pad deel uitmaakt van de URL, dien je via een canonical op de gelijkwaardige pagina te verwijzen naar de “hoofd URL”, bijvoorbeeld:

Originele product: http://www.voorbeeld.com/zwarte-koffie/
URL wanneer je via categorie 1 “Peruaanse koffie” bij het product komt: http://www.voorbeeld.com/peruaanse-koffie/zwarte-koffie/
URL wanneer je via categorie 2 “Geurende koffie” bij het product komt: http://www.voorbeeld.com/geurende-koffie/zwarte-koffie/
Al deze URL’s verwijzen naar hetzelfde product. Om te voorkomen dat je duplicate content krijgt, wijs je in de header een canonieke URL aan. URL 2 en 3 krijgen daarom een canonical die verwijst naar http://www.voorbeeld.com/zwarte-koffie/.

Webshops: pagina’s met dynamische URL

Een dynamische URL is een URL die verandert wanneer de parameters veranderen en die gebruikt wordt om scripts aan te sturen die bijvoorbeeld informatie uit een database halen. Je herkent een dynamische URL aan tekens zoals “?”, “&” en “=”. Een voorbeeld hiervan is het ordenen van een pagina op bijvoorbeeld prijs, alfabet of volgnummer. Wanneer je bijvoorbeeld op prijs ordent, heb je nog steeds dezelfde pagina voor je alleen met een andere volgorde. Om te voorkomen dat Google dit aanmerkt als duplicate content, dien je deze dynamische urls een canonical mee te geven naar de oorspronkelijke of hoofd URL.

Blogs: eenzelfde artikel, verschillende urls

Sommige blogsystemen slaan automatisch meerdere URL’s op wanneer je een bericht in meerdere secties of onderwerpen plaatst. Dit is eigenlijk de blog variant van productpagina’s bij webshops die in meerdere categorieën worden geplaatst (zie voorbeeld hierboven).

www en non-www / http en https-protocol

Wanneer een server zo is geconfigureerd dat met www voor de URL of zonder www voor de URL en https en http eenzelfde pagina wordt weergegeven, dien je een canonical tag te gebruiken om Google te laten weten welke variant je geïndexeerd wilt hebben.

Veelgestelde vragen over canonicals

Ondanks de uitgebreide documentatie van Google is het helaas nog niet altijd duidelijk wanneer wel en wanneer niet een canonical te gebruiken. Vooral specifieke situaties roepen nogal eens vragen op. Ik behandel daarom hieronder een aantal vragen die regelmatig aan ons wordt gesteld over canonicals en ga in op een aantal specifieke situaties.

Dient een canonical gebruikt te worden bij paging of pagination?

Wanneer je bijvoorbeeld resultaten in een categorie verdeeld over meerdere pagina’s weergeeft, krijgen de pagina’s een nummering p=1, p=2, p=n, etc. Een veelgestelde vraag hierover is of de p=n pagina’s een canonical dienen te krijgen naar de p=1 pagina? Het officiële antwoord van Google is nee. Google adviseert om alleen een rel=canonical te gebruiken voor de “view all” pagina, of het gebruik van rel=prev/next in de HTML header. Je kunt een canonieke URL gebruiken in combinatie met “rel=prev en next” maar dat wordt al snel gecompliceerd. Pagination en SEO kan zonder canonicals al tricky zijn dus lees jezelf goed in voordat je drastische aanpassingen maakt. (zie ook: SEO en pagination [[http://searchengineland.com/the-latest-greatest-on-seo-pagination-114284]]).

Kan een canonical worden gebruikt op de canonical pagina zelf?

In andere woorden, kun je een canonical tag in de HTML-header gebruiken op de canonical versie (hoofdversie) van de pagina die naar zichzelf wijst? Het antwoord is ja, maar het is niet nodig.

Kan ik rel=canonical ook gebruiken voor pagina’s die zeer op elkaar lijken maar niet gelijk zijn?

Dat is een lastige vraag. In principe geldt de vuistregel dat pagina’s een zeer sterke overeenkomst dienen te hebben (>95%). Wanneer een pagina anders geordend is, zoals het voorbeeld met de dynamische URL’s hierboven, is dit het geval. Ook bij een productpagina waarvan vijf verschillende kleur varianten bestaan, kan een canonical worden gebruikt om de “parent” aan te wijzen en duplicate content tegen te gaan. Echter, filters vallen hierdoor buiten het bereik van een canonical. De getoonde pagina’s zijn in veel gevallen niet gelijk of vrijwel gelijk aan de hoofdpagina. Gebruik de rel=canonical daarom alleen bij identieke en vrijwel identieke pagina’s.

Geeft rel=canonical Pagerank door?

Dat is moeilijk te meten, maar waarschijnlijk wel. Google onderkent de tag en het lijkt eenzelfde effect voor de zoekmachines te hebben als een 301-direct. Een canonical zou dan net als een 301 PageRank met een klein beetje verlies van kracht doorgeven.

Conclusie

Een canonical tag in de HTML header is een effectieve manier om duplicate content door zelfde pagina’s met verschillende URL’s tegen te gaan. Door de rel=canonical aan een (vrijwel) identieke pagina mee te geven, laat je Google zien dat dit een “kopie” is van de oorspronkelijke pagina, al dan niet om de gebruiker een betere ervaring te geven. Een voorbeeld hiervan is de sorteeroptie in een webshop categorie. Zorgvuldigheid en deskundigheid is bij de implementatie absoluut geboden! Een canonical is een typisch voorbeeld van een regel code die je SEO kan ruïneren en ongewenst pagina’s buiten de index kan houden. Lees je daarom goed in en wees zorgvuldig bij de implementatie. En houd je aan de vuistregel, alleen identieke of vrijwel identieke pagina’s (95%) dienen een canonical tag te krijgen met een verwijzing naar de oorspronkelijke pagina.

Category: SEO advies, Web development