Waarom noindex op een webpagina en hoe doe je dat?
Je hebt vast wel eens gehoord over ‘noindex’. Of misschien ook niet. In het laatste geval is het tijd dat je wel weet wat het is, en waarom je het zou gebruiken. En hoe. Want die noindex-tag is nuttig en soms zelfs noodzakelijk. Ontdek wanneer, waarom en hoe je noindex gebruikt, wat het verschil is met blokkeren van crawlers en welke volgorde je eventueel aanhoudt.
– Dit artikel werd oorspronkelijk gepubliceerd op 13 juni 2021 en is geüpdatet op 22 mei 2024 –
Waar staat noindex voor?
Noindex is een stukje code in je webpagina dat je toevoegt om aan de zoekmachines aan te geven dat een webpagina niet geïndexeerd hoeft te worden. Je wilt dus dat deze pagina niet gevonden kan worden in de zoekmachines en dat zoekmachines deze niet in de index hoeven opnemen. Daar kunnen meerdere redenen voor zijn.
Een aantal voorbeelden van pagina’s die je mogelijk niet wilt laten indexeren:
Inschrijfformulieren of andere formulieren
Een inschrijfformulier of een ander formulier dat je bezoeker pas hoort in te vullen na het bezoeken van een specifieke webpagina, wil je niet in de index van de zoekmachines hebben. Wat heeft de argeloze bezoeker er te zoeken? Of beter nog: wat heeft die bezoeker er überhaupt aan?
Inlogpagina’s
Je biedt een online training aan. Of je hebt een ander soort portaal waar leden of klanten kunnen inloggen. En daarvoor is een speciale inlogpagina waar alleen die leden of klanten hoeven te zijn. Daar hebben anderen niks te zoeken, dus die kan op noindex.
E-boeken of andere weggevers voor je mailinglijst
Misschien geef je een e-boek, videocursus of ander leuk dingetje weg op je website. Maar daarvoor moet je websitebezoeker wel eerst een e-mailadres achterlaten, dus je e-boek of de pagina’s met de video’s -of wat er ook onderdeel is van je gratis weggever- hoeven niet in Google terug te vinden te zijn. Want dan krijg je die e-mailadressen niet.
Zo vond ik zelf via Google e-boeken van enkele van mijn vakgenoten. En je snapt vast dat ik daar dan wel even om moet gniffelen ;-)
Oh en zo’n e-boek, zou je dat wel doen tegen inlevering van een e-mailadres? Lees hier waarom je mijn gratis weggever gewoon zonder e-mailadres mag downloaden.
Je hebt nu wel een idee, toch?
Als het goed is heb je nu wel een beeld van pagina’s die je op noindex zet. Je hebt een aantal voorbeelden gelezen. Waarschijnlijk heb je zelf nu ook wel een aantal (soorten) pagina’s bedacht die niet in de index van een zoekmachine hoeven te staan. Dus kun je nu aan de slag met de pagina’s op jouw website.
Hoe plaats je die noindex-tag?
De noindex-tag komt in de code van je website te staan, en wel in de head-sectie, of als metatag. Een complete technische uitleg vind je bij Google Search Console help. Als je een WordPress website hebt, kan je heel gemakkelijk zelf de noindex instellen met de Yoast SEO plugin of een andere SEO-plugin.
Noindex in Yoast SEO
Bij Yoast SEO ga je naar het onderste deel van de Yoast meta box, waar je ‘Advanced’ of ‘Geavanceerd’ vindt, net hoe je taalinstellingen zijn. Daar staat dan “Allow search engines to show this Pagina [sic] in search results?” of “Zoekmachines toestaan deze pagina te tonen in de zoekresultaten?”. Als het goed is staat dat standaard op ‘Yes’, en als je de pagina (of het bericht) niet wilt laten indexeren, zet je het op ‘No’. Zo simpel is het.
Noindex in SEOPress
In SEOPress is het net iets anders dan in Yoast SEO, maar het komt grotendeels op hetzelfde neer. Ook in SEOPress ga je naar de metabox, en kies je in dit geval bovenaan het tabblad ‘Geavanceerd’. Daar kan je onder ‘Meta robots instellingen’ het eerste blokje aanvinken. Daar zie je ‘Toon deze pagina niet in de zoekresultaten / XML – HTML sitemaps (noindex)’.
Bij andere SEO-plugins zal het zo ongeveer hetzelfde werken.
Noindex haalt pagina uit sitemap
Het is een goed gebruik om een XML-sitemap voor je website te hebben. Dat helpt de zoekmachines je pagina’s te ontdekken. Zet je een pagina op noindex, dan wordt deze -in ieder geval bij de SEO plugins- niet opgenomen in de sitemap van je website. Want ook via de sitemap kan ik je e-boek gewoon vinden hoor ????
Bedenk dus goed welke pagina’s van jouw website niet via de zoekmachines vindbaar hoeven te zijn. Het handigst is natuurlijk om dat te doen wanneer je een pagina aanmaakt. Gelukkig kun je het altijd nog achteraf aanpassen. Je pagina staat dan al wel in de index, maar verdwijnt meestal uit die index zodra de zoekmachine je noindex-tag gevonden heeft.
Je pagina wordt altijd gecrawld
Er zijn mensen die denken dat een pagina niet wordt gecrawld als deze op noindex staat. Dat is helaas niet het geval. De zoekmachinebot moet de noindex-tag eerst “zien” om daar iets mee te doen. Zodra een pagina wordt ontdekt, wordt deze gecrawld. Staat daar een noindex-tag op, zal de zoekmachine deze meestal respecteren.
Meestal? Ja, een noindex-tag wordt niet altijd gerespecteerd. Als er bijvoorbeeld veel gelinkt wordt naar een pagina, kan een zoekmachine besluiten dat die webpagina dan wel relevant zal zijn en de pagina mogelijk toch indexeren. Zorg dus dat er zowel intern als extern niet of in ieder geval weinig wordt gelinkt naar een pagina die je niet in de index wilt zien.
Crawlen voorkomen door uitsluiten in robots.txt
Wil je voorkomen dat een URL überhaupt gecrawld wordt, dan kan je die uitsluiten in je robots.txt-bestand. Doe dat wel vóórdat je een pagina publiceert, omdat je het anders achteraf een stuk lastiger krijgt. Stel dat je een pagina uit de index wilt krijgen, dan zal je eerst de pagina op noindex moeten zetten. Pas als je zeker weet dat de pagina niet meer in de index staat, kan je de pagina uitsluiten in robots.txt.
Doe je dat andersom, dan krijgt de zoekmachinebot de noindex-tag niet te zien, en blijft je pagina in de index staan. De instructies in je robots.txt worden namelijk altijd gerespecteerd.
Aan de slag dus, als je pagina’s hebt die mensen niet hoeven te ontdekken via de zoekmachines. Je weet nu ook hoe je dat kunt doen. In WordPress althans. Schakel in andere gevallen een specialist in of zoek even uit hoe dat in jouw CMS kan. Vragen, opmerkingen en aanvullingen mag je hieronder natuurlijk altijd achterlaten.
Of je SEO nu interessant vindt of er helemaal geen interesse in hebt, als je een website hebt, heb je er nu eenmaal mee te maken. Juist omdat ik het leuk vind, schijf ik er graag en vaak over en uit reacties blijkt dat het zelfs mensen met een aversie tegen zoekmachine-optimalisatie helpt.
Begonnen in 2012 met het idee webteksten te schrijven, ben ik me steeds verder gaan verdiepen in SEO en het daarmee verbonden CRO (conversie-optimalisatie). In al mijn artikelen help ik je jouw website te verbeteren om er zo meer omzet uit te halen. Wedden dat je het nog leuk gaat vinden ook?
Ik ben ook wel eens gratis weggevers (en zelfs betaalde PDFs!) tegengekomen in Google. Op zich geen ramp, want ik neem aan dat 99% van de mensen niet de moeite neemt om eerst te gaan Googelen of ze de gratis weggever misschien zo kunnen vinden. Persoonlijk schrijf ik me ook liever in: je krijgt vaak nuttige tips via de nieuwsbrief en je kunt je altijd weer uitschrijven natuurlijk!
Maar over het algemeen wel zo safe om je gratis weggevers op noindex te zetten. Een andere handige methode om dat te doen (bijvoorbeeld als je geen WordPress hebt), is om je PDFs naar een aparte map op je server te uploaden. Vervolgens zet je die hele map op noindex met behulp van robots.txt. Als je helemaal fancy wil doen, kan je dan nog een blanco index.html-file in die map zetten om te voorkomen dat bestanden in die map via de browser kunnen worden opgevraagd in een directory listing :).
Eens hoor, het is geen ramp als je gratis weggever te vinden is. Maar dan vooral omdat -zoals je aangeeft- vrijwel niemand daarop zal zoeken. Wel grappig dat jij je wel liever inschrijft, ik ben nogal klaar met het standard funneltje met je gratis weggever. Ik pak meestal zo’n e-boek om te kijken of ik er nog wat uit kan halen en meld me dan vaak snel weer af. Leuk dat we daarin verschillen, toch? :-)
Dank voor het artikel. Ik heb een vraag over de no-index. Als ik media of een pagina op no index wil zetten en er staat: Standaard voor de hele site: geen – betekent dat dan alleen die pagina, of staat dan mijn hele website op no-index? Ik heb op mijn website zowel salespagina’s die wel gevonden moeten worden als beveiligde pagina’s en media die ik niet openbaar wil hebben.
‘Standaard voor de hele site: geen’ gaat over de meta-robotsinstellingen. Daar zou ik niet aan tornen. Je kiest dus enkel in het eerste deel onder ‘Sta zoekmachines toe om deze Bericht te tonen in zoekresultaten?’ voor ‘Nee’.
De meta-robotsinstellingen op ‘Nee’ laten staan is verder prima.
Dankjewel voor je reactie en advies.