Site-architectuur en interne linkstructuur
Hoe je de logische opbouw van je website zo inricht dat zoekmachines alle pagina’s kunnen bereiken en begrijpen.
Lees artikelZorg ervoor dat zoekmachines jouw website volledig kunnen verkennen. Leer hoe je robots.txt correct inricht en je crawlability maximaliseert.
Je hebt de beste website ter wereld, maar als Google’s bots die niet kunnen bereiken, dan zal niemand jouw pagina’s vinden. Crawlability — de mogelijkheid van zoekmachines om jouw site te verkennen — is fundamenteel voor SEO.
Het gaat niet alleen over robots.txt. Het gaat erom dat je Google vertelt welke pagina’s belangrijk zijn, welke je wilt indexeren, en welke je liever niet in de zoekresultaten wilt zien. We’ve gezien websites die honderden pagina’s hebben, maar slechts een fractie wordt geïndexeerd. Dat kost je traffic.
Een Googlebot begint op je homepage. Van daaruit volgt het alle links naar andere pagina’s. Die links vormen een netwerk — je sitemap zeggen we. Als pagina’s goed aan elkaar gelinkt zijn, vindt de bot alles. Als je pagina’s geïsoleerd zijn, worden ze gemist.
Google heeft een “crawl budget” voor elke site — een limiet aan hoeveel pagina’s ze per dag willen crawlen. Voor kleine sites is dit meestal geen probleem. Maar voor sites met duizenden pagina’s? Daar moet je slim zijn. Je wilt dat Google zijn tijd besteedt aan jouw belangrijkste pagina’s.
Pro tip: De meeste crawl-problemen komen niet van robots.txt — ze komen van slechte interne links, niet-werkende links, of pagina’s die geen duidelijke pad hebben.
robots.txt is een klein tekstbestand in de root van je website. Het vertelt bots welke delen ze wel en niet mogen crawlen. Het is niet verplicht, maar het is verstandig.
User-agent: * Allow: / Disallow: /admin/ Disallow: /temp/ Disallow: /*.pdf$ Sitemap: https://jouwsite.nl/sitemap.xml
Dit zegt: “Alle bots mogen overal heen, behalve in /admin/ en /temp/. Geen PDF’s indexeren. En hier’s onze sitemap.”
We’ve gezien het allemaal. Sites die hun gehele /blog/ directory blokkeren zonder het te beseffen. Websites die vergeten robots.txt helemaal bij te werken na een redesign. Hier zijn de vijf ergste fouten:
Dit blokkeert Google volledig. Je site zal niet geïndexeerd worden. We’ve dit zien gebeuren na migraties. Check je robots.txt na grote veranderingen.
Typo’s zoals “Disalow” in plaats van “Disallow” — Google ignoreert ze. Zorg dat je spelling exact is. Een spatie op de verkeerde plek en je rule werkt niet.
robots.txt is een perfecte plek om je sitemap URL in te voegen. Dat helpt Google alles sneller te vinden. Voeg “Sitemap: https://jouwsite.nl/sitemap.xml” toe.
Als je een specifieke bot wilt blokkeren (bijv. “Disallow: / for: badbot”), vergeet dan niet een fallback rule in te stellen. Anders kunnen andere bots verwarren.
Beyond robots.txt zijn er veel andere dingen die je crawlability verbeteren. Dit zijn onze favoriete quick wins:
Elke pagina moet via minstens één link bereikbaar zijn. Geen verwaalde pagina’s. Als je een pagina niet van je homepage kunt bereiken via links, dan kan Google het waarschijnlijk ook niet.
Als je per ongeluk “noindex” hebt ingesteld op belangrijke pagina’s, verwijder het. Check je template-bestanden — soms staat het standaard in staging-omgevingen.
404-fouten? Redirects die niet kloppen? Die kosten je crawl-budget. Controleer je .htaccess-file of server-configuratie. Broken links zijn je vijand.
Een sitemap.xml helpt Google alle pagina’s te vinden. Zeker handig als je site veel JavaScript gebruikt. Voeg de URL toe in robots.txt.
Je hoeft niet te gokken. Er zijn gratis tools waarmee je exact kunt zien wat Google ziet. We’ve deze tools gebruikt met honderden sites.
Je website kan prachtig zijn, maar als Google die niet kan vinden en indexeren, helpt dat niks. Crawlability is niet sexy, maar het is fundamental. Een goed ingestelde robots.txt, schone interne links, en een XML-sitemap — dit zijn de basisprincipes.
Start vandaag: controleer je robots.txt in Search Console, zorg dat je sitemap daar is ingevuld, en verwijder broken links. Dit zijn dingen die je kan doen zonder developers. Je zult merken dat je indexering verbetert, en dat leidt uiteindelijk tot meer traffic.
Wil je de andere fundamentele SEO-onderwerpen verkennen? Lees onze gidsen over site-architectuur, semantische HTML, en gestructureerde data.
Bekijk alle SEO-resourcesDit artikel is bedoeld als educatief materiaal over SEO-praktijken en website-crawlability. De informatie is gebaseerd op algemeen aanvaarde SEO-principes en richtlijnen van zoekmachines. Elke website is uniek, en resultaten kunnen variëren op basis van veel factoren. We adviseren je altijd de officiële documentatie van Google Search Console te raadplegen voor de meest actuele richtlijnen. Het implementeren van deze aanbevelingen is op jouw eigen risico.