maandag, november 21, 2005

Andere meta tags

Er zijn natuurlijk ook nog andere meta tags. Deze meta tags zijn over het algemeen minder belangrijk voor de zoekmachines, maar kunnen toch nog zeer relevant zijn. We zullen er een aantal overlopen.

robots tag

algemeen

<meta name="robots" content="all">
<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">

Deze tag geeft de zoekmachines aanwijzingen over wat ze met de pagina moeten doen. De default value is "index, follow", wat hetzelfde is als "all".

Wanneer je wil dat de zoekrobot de pagina indexeert, geef je "index" mee en wanneer je wil dat de links gevolgd worden geef je de optie "follow" mee. In de andere gevallen geeft je "noindex" en "nofollow" mee. Uiteraard kan je geen strijdige attributen meegeven als "index, noindex".

Wanneer je wil dat de pagina geindexeerd wordt en dat de links gevolg worden, kan je deze tag eigenlijk weglaten. Deze tag is dus voornamelijk interessant wanneer je afwijkend gedrag wil (wanneer je bijvoorbeeld wil dat de pagina niet wordt geindexeerd of je wil niet dat de links gevolgd worden). Dit komt wel vaker voor bij pagina's die nogal persoonlijk zijn of bij link-pagina's.

Wanneer je deze tag gebruikt, gebruik je best ook de robots.txt file. Over dit bestand zullen we het later nog hebben. Dit is een krachtiger mechanisme om zoekmachines te blokkeren uit bepaalde mappen etc. Maar de meta tag biedt een oplossing voor mensen die niet aan het robots.txt bestand van hun website kunnen.

De formele syntax is:

content = all | none | directives
all = "ALL"
none = "NONE"
directives = directive ["," directives]
directive = index | follow
index = "INDEX" | "NOINDEX"
follow = "FOLLOW" | "NOFOLLOW"

specifiek

Er zijn ook speciale tags per zoekrobot. Wanneer je de msnbot wil mijden gebruik je:

<meta name="msnbot" content="noindex, nofollow">

De msnbot luistert naar noindex en nofollow. Ook Google doet mee natuurlijk, als je Google wilt mijden gebruik je:

<meta name="googlebot" content="noarchive, nofollow">

Google luistert dus naar een extra directief, namelijk noarchive. Hiermee kan je ervoor kiezen dat Google de site niet (wel) archiveert.

Revisit-after

<meta name="revisit-after" content="15 days">

Deze tag is bedoeld om de zoekmachines erop te wijzen om de hoeveel tijd ze de pagina moeten bezoeken. Er zou echter geen enkele zoekmachine zijn die deze tag gebruikt, buiten de regionale Columbiaanse zoekmachine SearchBC (een irrelevante zoekmachine). Het opnemen van deze tag is dus een beetje overbodig.

Language tag

<meta http-equiv="content-language" content="nl">

Deze tag geeft de taal weer die gebruikt wordt op de pagina. Dit is wel belangrijk. Op de meeste zoekmachines kan je de resultaten filteren op een bepaalde taal. Wanneer de website zelf aangeeft welke taal er gebruikt wordt, kan ze veel gemakkelijker opgenomen worden in die resultaten. Ook wanneer iemand zoekt op google.be zullen bijvoorbeeld nederlandse .org websites beter scoren dan engelse.

Expires tag

<META name="Expires" content="Tue, 01 Jun 1999 19:58:02 GMT">

Geeft de zoekmachines aan wanneer de website verloopt. Meestal "never".


Distribution

<META name="Distribution" content="Global">

Geeft aan of de pagina bestemd is voor globale publicatie of dat ze voor intern gebruik is. Meestal global en kan dan weggelaten worden.

Auteur, copyright

<META name="Copyright" content="Copyright Statement">
<META name="Author" content="Author Information">

Ter volledigheid. Geven copyright en auteursinformatie. In principe niet belangrijk bij zoekmachine-optimalisatie. Hoewel ik eens de indruk heb gehad dat mijn site gevonden werd omdat de url in de auteur sectie vermeld stond. Mijn site werd nergens anders vermeld en toch vond ik in mijn statistieken een bezoeker die als referrer die site aangaf.

Geen opmerkingen: