zaterdag, december 10, 2005

Te vermijden voor zoekmachine optimalisatie

Er zijn nog een aantal zaken die vanuit het standpunt van zoekmachine-optimalisatie ten strengste te vermijden zijn. We zullen hier deze zaken overlopen. Een aantal andere dingen die moeten vermeden worden, worden beschouwd als spam en zullen daar behandeld worden.

Flash is evil

Macromedia Flash is zeer populair onder grafisch designers. Met Flash kan je dan ook dingen doen die anders onmogelijk waren. Vanuit zoekmachine-optimalisatie-standpunt echter is Flash een door in het oog. Er zijn nog een aantal andere zaken die door tegenstanders van Flash worden opgenoemnd, maar die zijn hier niet ter zake.

Eerst en vooral is het zo dat de teksten die in Flash applicaties verwerkt zitten niet door de zoekmachines gelezen kunnen worden. Er kunnen dus ook geen credits worden opgebouwd voor de keywords die hier terug te vinden zijn.

Wanneer de hele site in Flash is opgebouwd geeft dit natuurlijk serieuse problemen, want hoe moet je dan verwachten dat je site nog te vinden is in de zoekmachineS?

Verder moet Flash meestal eerst een tijdje laden omdat het nogal groot is. In ieder geval veel groter dan de normale tekst en beelden die op een website terug te vinden zijn. Dit is ook nadelig voor de zoekresultaten. Hoe langer het duurt om de site te laden, hoe minder vaak spiders de site gaan crawlen om te zien of er nieuwe dingen op staan en hoe kleiner de kans dat alle pagina's geindexeerd worden.

Gebruik Flash dus best alleen waarvoor het best dienst: het opvrolijken van het geheel of het illustreren van bepaalde zaken die anders onmogelijk te illustreren zijn. Zo houdt je de tekst leesbaar voor de zoekmachines en heb je nuttige content die wordt geindexeerd. Verder hou je de Flash applicaties best klein, zodat het niet te lang duurt vooraleer de site geladen is. Zo bevorder je het crawlen en indexeren van de site.

Hoewel de zoekmachines bekijken hoe ze ook Flash animaties kunnen indexeren, is het gebruik van Flash zeker af te raden vanuit zoekmachine optimalisatie standpunt.

Java

Een zelfde redenering gaat op voor Java Applets. Vaak worden Java Applets gebruikt om de site op te vrolijken. Java laadt gewoonlijk nog trager dan Flash en vaak zijn er problemen met het laden van de class bestanden om wille van incompatibele virtuele machines. Java applets zijn uitermate geschikt voor serieuse applicaties, maar niet voor zoekmachine optimalisatie. Dezelfde twee redenen als hierboven gelden hier ook: kan niet geindexeerd worden en laadt traag.

Frames

Ook de veelgebruikte techniek met frames moet vermeden worden als je de site wil optimaliseren voor zoekmachine optimalisatie. Er zijn een groot aantal nadelen verbonden met frames (ivm toegankelijkheid, opslaan in favoriete, etc.), waaronder dus ook een zoekmachine-optimalisatie probleem.

Het probleem is dat niet alle zoekmachines frames-pagina's kunnen indexeren, en alle zoekmachines hebben er problemen mee. Het is dan ook niet duidelijk hoe de verschillende pagina's moeten geindexeerd worden. Vaak krijg je dan een pagina in de SERP's die eigenlijk ergens in een frame had moeten terechtkomen. Gebruikers die dan op de site terecht komen zien enkel die pagina en vragen zich af waar bijvoorbeeld het menu staat. Dat kunnen ze enkel bereiken door handmatig in de adresbalk naar het hoofddomein te gaan (er zal iets staan van www.mijnpagina.be/subcategorie/producti.html).

Stel nu dat de zoekmachine dit wou voorkomen door alleen het hoofd-domein te indexeren (www.mijnpagina.be). Dan zou de persoon die op de link in de SERP's klikt doorverwezen worden naar de homepagine, en dus niet op de juiste pagina terecht komen. Een beetje hetzelfde probleem als bij het proberen toevoegen van een subpagina aan de favorieten.

En toch worden frames nog bijzonder veel gebruikt. Heel veel pagina's zondigen dus nog en zijn heel slecht vindbaar in de zoekmachines.

En er is nog een zaak ivm frames waar veel sites op zondigen. Veel van die websites worden ontwikkeld dmv een ontwikkeltool (vaak bvb Frontpage). En er worden voor de verschillende subpagina's dan geen beduidende namen gekozen. Vaak kom je zo tot pagina's met titels als "nieuwe pagina 3" en dergelijke. Het hoeft geen betoog dat dergelijke pagina's niet scoren in de SERP's.

dinsdag, december 06, 2005

Zoekmachine vriendelijke redirect

De zoekmachine vriendelijke Redirect


Een van de best bekende zoekmachine optimalisatie technieken is het gebruiken van zoekmachine vriendelijke redirects. Het is alom bekend dat zoekmachines problemen hebben met een 302 redirect in de header. Vooral Google en 302 redirects zijn geen al te beste vrienden, hoewel Google een aantal aanpassingen in het algoritme heeft gedaan zodat ook 302 redirects nu worden opgenomen in de index. Het probleem is eigenlijk een logisch gevolg van de semantiek van de redirects. Een 301 redirect is een Permanente redirect en een 302 redirect is een temporele redict. Dat staat zelfs mee in de return van de redirect: "301 Permanently Moved". Toch komt de 302 redirect soms nog voor bij mensen die een permanente redirect willen doorvoeren. Ook andere zoekmachine onvriendelijke redirects komen voor. Een van de meest voorkomende is de meta-refresh redirect. In tegenstelling tot een verkeerd soort redirect (zoals bij 301/302) is dit een verkeerde techniek. Ook de url-forwarding die sommige domeinnaam hosting bedrijven aanbieden is onveilig.


Het probleem met 302 redirect zit hem in het feit dat de nieuwe pagina wordt bekeken als inhoud van de eerste pagina. De oude pagina wordt meestal ook niet uit de index gehaald. Zoekmachines interpreteren de 302 redirect elks op een andere manier en er duiken zo problemen op ivm hijacks en duplicate content filters. Dit valt echter buiten het bestek van deze tekst.


De HTTP-redirect


Een eerste manier is de meta-refresh redirect. Dit is een zeer veel voorkomende vorm van redirect en het is dus belangrijk dat je ervoor op je hoede bent. Deze redirect geef je mee in een meta tag in de header van het html document. Het ziet er allemaal zo uit:


<META HTTP-EQUIV=Refresh CONTENT="0; URL=http://www.nieuwdomain.com">


Je kan dus een aantal seconden meegeven (hier 0) gedurende dewelke de pagina moet weergegeven worden vooraleer de nieuwe pagina wordt geladen. Dit soort redirect wordt vaak gebruikt bij het wijzigen van domein of pagina met de vermelding "Onze website is verhuist naar www.nieuwesite.be, u wordt automatisch doorverwezen. Indien de nieuwe pagina niet automatisch wordt weergegeven, klik dan hier". De meeste zoekmachines indexeren deze pagina gewoon met de tekst "onze website is ..". Een aantal zoekmachines (de belangrijkste) is intelligent genoeg om de redirect te herkennen. Zij zien dan hoe lang de time-out is. Indien de time-out zeer kort is en korter dan de gemiddelde tijd om een pagina te laden, wordt de nieuwe pagina bekeken. Indien de tijd te lang is wordt de pagina zelf gewoon geindexeerd.


Maar indien de tijd zeer kort is zou de redirect aanzien worden als een 302 redirect, en niet als een 301 redirect. En een 302 redirect is nu eenmaal niet zoekmachine vriendelijk. Dus proberen we dit soort redirect beter te vermijden.


Yahoo heeft bekendgemaakt hoe het dit soort redirect behandeld. Een meta refresh van 0 seconden wordt aanzien als een 301 redirect. Vanaf meer dan 1 seconde wordt de redirect aanzien als een 302 redirect. Msn zegt dat ze een meta-refresh redirect zien als een 302 redirect en Ask Jeeves ziet een meta-refresh van 0 seconden aan als een 302 redirect, maar wacht tot er meer duidelijkheid is over de redirect vooraleer de index te updaten.


Elke zoekmachine heeft dus een andere manier om de redirectie te interpreteren en het is vanuit zoekmachine-optimalisatie standpunt dus beter om deze redirect te vermijden. Als je hem toch nodig hebt omdat de andere methodes bijvoorbeeld niet binnen de mogelijkheden liggen, gebruik je best een redirect van 0 seconden. Die wordt dan in de meeste gevallen geïnterpreteerd als een 302 redirect, behalve bij Yahoo.


De Script-redirect


Een andere manier om te redirecten van de client-side is door middel van een client script zoals JavaScript. Zoekmachines zullen een dergelijke JavaScript redirect niet herkennen en dus ook niet volgen. Sommige mensen zagen zo de kans van hun leven om de zoekmachines te misleiden. Ze maakten een pagina vol keywords en lieten een JavaScript de pagina doorverwijzen naar de echte pagina. De zoekmachines zien alleen de originele pagina en ranken die dus hoog in de SERPS. Vorig jaar echter werd het algoritme Google slim genoeg om dergelijke redirects te herkennen en werden er een hele hoop pagina's uit de lijsten gebanned of omlaag gehaald.


Het komt er dus op neer dat de redirect niet herkend wordt door de zoekmachines en dat het gebruik ervan ertoe kan leiden dat de site gebanned wordt. Het is dus absoluut belangrijk deze methode te vermijden! Om volledig te zijn neem ik hier toch 2 voorbeeld code snippets op waarmee dergelijke redirect mogelijk is:


JavaScript Redirect - Niet gebruiken!


<script type="text/javascript">

<!--

window.location = "http://www.nieuwesite.be/"

//-->

</script>


<body onLoad="setTimeout(location.href='http://www.nieuwesite.be', '0')" >


De 301 redirect


Het is dus belangrijk te kiezen voor een goede redirect, dwz de 301 redirect. Omdat hij zo belangrijk is geef ik hier alle manieren om hem te bewerkstelligen in client-side script en programmeertalen. Daarna geef ik de mogelijkheden om het in de apache server in te stellen in de .htaccess en een alternatieve mogelijkheid met de CNAME.


PHP 301 Redirect voorbeeld


header("HTTP/1.1 301 Moved Permanently");

header("Location: http://www.nieuwdomein.be/nieuwedir/nieuwe-pagina.htm");

exit();


ASP 301 Redirect voorbeeld (VBScript)


<%@ Language=VBScript %>

<%

Response.Status="301 Moved Permanently"

Response.AddHeader "Location", "http://www.nieuwdomein.be/nieuwedir/nieuwe-pagina.asp"

response.end

%>


ASP 301 Redirect voorbeeld (JScripit)


<%@ Language=VBScript %>

<%

Response.Status="301 Moved Permanently"

Response.AddHeader "Location", "http://www.nieuwdomein.be/nieuwedir/nieuwe-pagina.asp"

response.end

%>


ASP .NET 301 Redirect voorbeeld (c#)


<script runat="server">

private void Page_Load(object sender, System.EventArgs e) {

Response.Status = "301 Moved Permanently";

Response.AddHeader("Location","http://www.newdomein.be/");

}

</script>


Cold Fusion 301 Redirect voorbeeld (CFM)


<.cfheader statuscode="301" statustext="Moved permanently">

<.cfheader name="Location" value="http://www.nieuwdomein.be/">


JSP / Java Servlets / Java 301 Redirect voorbeeld (Java)


<%

repsonse.setStatus(301);

response.setHeader( "Location", "http://www.nieuwdomein.be/" );

response.setHeader( "Connection", "close" );

%>


CGI / Perl 301 Redirect voorbeeld


#! /usr/bin/perl

use cgi;

my $q = cgi->new();

print $q->redirect(

-location => 'http://www.newsite.com/nieuwe-pagina.cgi',

-status => 301,

);


Als je te maken hebt met html-pagina's bestaat er toch de mogelijkheid om de soort redirects te implementeren. Je kan immers in de .htacces de html pagina's ook laten interpreteren als scripting pagina's zodat ze geparsed worden. Hiervoor gebruik je dan volgende regels in de .htaccess:


AddType application/x-httpd-php .html

AddType application/x-httpd-php .htm


301 Redirect in de htaccess


Een mooie en krachtige manier om een redirect te doen is in de .htaccess. We hebben de .htaccess reeds eerder gezien in het stuk over domeinnamen en subomeinen en het herschrijven van url's met mod rewrite.


Als je beschikt over Apache en mod_rewrite is geinstalleerd, dan kan je de redirect inderdaad mooi daar zetten ipv in de broncode van de pagina's. De syntax van de redirect in de htaccess (heb je geen mod rewrite voor nodig) is als volgt:


Redirect /uwdirectory http://www.nieuwdomein.told/nieuwedirectory


Maar de default waarde geeft een 302, en zoals we reeds eerder gezien hebben willen we zeker geen 302 redirect. Je kiest dus best een van de volgende varianten:


Redirect permanent /one http://www.nieuwdomein.be/two

Redirect 301 /two http://www.nieuwdomein.be/other


Zo ben je er zeker van dat Apache een 301 zoekmachine vriendelijke redirect teruggeeft. Je kan zoals we gezien hebben met die mod rewrite ook de url's herschrijven en bijvoorbeeld .php bestanden hernoemen naar .html bestanden. Je kan met mod rewrite nog veel meer dan met de gewone redirect in de htaccess. Maar als je geen bevoegdheden hebt om de mod rewrite te installeren kan je zo al verder. Wanneer je een domein wilt forwarden naar een nieuw domein kan je deze code gebruiken met mod rewrite:


Options +FollowSymLinks

RewriteEngine on

RewriteCond %{HTTP_HOST} ^newdomain\.com

RewriteRule ^(.*)$ http://www.nieuwdomein.be/$1 [R=permanent,L]


301 Redirect mbv de CNAME


Een laatste manier om een redirect te bewerkstelligen is dmv het CNAME veld op de server. Deze CNAME wordt meestal gebruikt als alias voor een subdomein dat ergens anders gehost is. Een voorbeeld is wanneer www.domeinnaam.be wordt doorverwezen naar domeinnaam.be. In Apache is de server respons voor een dergelijke redirect 301, dus kan je de CNAME in principe gebruiken als zoekmachine-vriendelijke redirect. Mijn ervaring is dat dit inderdaad goed werkt.


Je kan natuurlijk alleen subdomeinen doorverwijzen met de CNAME. Verder is dit geen echte methode voor beginnende webontwikkelaars. Bij een slechte configuratie van de CNAME kan je zelfs in een oneindige lus raken of kan er voor zorgen dat je mails niet meer aankomen. Daarom is het gebruik van een CNAME eigenlijk niet zo aangewezen. Het wordt dan ook meestal enkel gebruikt wanneer een subdomein verwijst naar een nieuw domein.

Wat kan en niet kan

Tot zover hebben we enkel zaken besproken die belangrijk zijn bij de zoekmachine optimalisatie om te implementeren.

Natuurlijk zijn er ook zaken die je absoluut moet vermijden. Er bestaan technieken en werkwijzen die soms heel handig zijn of mooie resultaten opleveren, maar die absoluut te vermijden zijn bij het ontwerpen of ontwikkelen van een website.

Sommige van deze technieken worden ook aanzien als spam en zullen in die sectie nog terugkomen.

In eerste instantie zullen we de redirect in al zijn vormen bekijken. Het gebruik van een verkeerde redirect is een van de meest voorkomende fouten die beginnende webmasters maken.

vrijdag, december 02, 2005

domeinnaam en url (rewrite)

de domeinnaam

Een ander belangrijke eigenschap van de website ivm zoekmachine optimalisatie of pagina is de domeinnaam waaronder ze te vinden is. Het belangrijkste keyword komt best in de domeinnaam voor. Vaak is dit bijvoorbeeld een bedrijfsnaam. Als je bijvoorbeeld hoog wilt scoren voor Quick, dan kies je best voor Quik.tld.

Wat als je bedrijfsnaam nu uit meerdere woorden bestaat? Je schoonheidssalon heet bijvoorbeeld Perfect Body. Dan kan je best kiezen voor het streepje tussen de twee delen. perfect-body.be is dus beter dan perfectbody.be. Dat komt omdat de zoekmachines woorden die verboden zijn met een streepje lezen als een samenhangende woordgroep. Ze zien perfect-body dus als "perfect body" en perfectbody als ... perfectbody.

de subdomeinen

Subdomeinen worden door de zoekmachines aanzien als aparte domeinen. Wanneer je dus met verschillende subdomeinen zit, worden die aanzien als aparte websites. Je kan die sites dan interlinken, zodat ze elkaar voeden met links. Uiteraard moet je ook opletten dat je geen dubbele informatie beschikbaar stelt. Dan treedt de dupblicate content filter in werking en zal slechts een van de sites krediet krijgen voor de content. De kans is er dan dat de andere site een beetje naar achteren geschoven wordt.

oppassen met de www!

Er is heel weinig dat andere mensen kunnen doen om jouw site naar beneden te halen in de zoekmachine resultaten. Maar er is een ding dat werkt en waar je jezelf voor moet behoeden. De situatie komt voor wanneer www.website.com dezelfde resultaten geven als website.com, zonder dat er wordt doorverwezen, of toch zeker zonder dat er wordt doorverwezen met een zoekmachine-vriendelijke 301 Redirect.

Naar deze situatie wordt verwezen als "Search Engine Sabbotage". Een volledige uitleg vind je op http://www.threadwatch.org/node/2817 . Het komt er op neer dat wanneer zowel de www. als de versie zonder www. (bvb www.vanderhovenss.be en vanderhovenss.be) dezelfde pagina weergeven (door technische instellingen op de server), dit door Google als twee aparte domeinen en dus sites wordt behandeld. Google zal dan de duplicate content filter activeren en de sites zullen elks apart in de zoekresultaten terecht komen, elks met een lagere ranking dan wanneer slechts ��n van beiden in de resultaten terecht zou komen.

Om dit te vermijden moet je een van de twee versies (bvb. diegene zonder de www) laten doorverwijzen naar de andere versie (bvb die met de www). Dit moet natuurlijk op een zoekmachine vriendelijke manier, met een 301 Permanente redirect. Dit kan bijvoorbeeld met php code of in de htaccess.

Met php code kan een redirect er als volgt uitzien:


< ?php if ($_SERVER['HTTP_HOST'] != "www.example.com") {

header("HTTP/1.1 301 Moved Permanently");

header("Location: http://www.example.com".$_SERVER['REQUEST_URI']);

exit; }

else {

// your usual HTTP headers go here

};

? >



Voor de redirect in de htaccess stond er op SEOMoz een interessante link naar threadwatch.org (zie boven) waarin volgende code werd vermeld (wordt onder ander gebruikt op vanderhovenss.be :



#------------------------------------------

# First optional line, include only in case of errors:

RewriteEngine On

# Second optional line, include only in case of errors:

Options +FollowSymLinks

# Optional start tag, requires use of corresponding end tag as well

< IfModule mod_rewrite.c >

# ----------------- the real stuff starts here

# IF there's a host field at all, AND

RewriteCond %{HTTP_HOST} .

# IF domain does not start with www, AND

RewriteCond %{HTTP_HOST} !^www\.threadwatch

# IF subdomain is not another one of those you like

RewriteCond %{HTTP_HOST} !^sub1\.threadwatch [NC]

RewriteCond %{HTTP_HOST} !^sub2\.threadwatch [NC]

RewriteCond %{HTTP_HOST} !^sub3\.threadwatch [NC]

RewriteCond %{HTTP_HOST} !^sub4\.threadwatch [NC]

RewriteCond %{HTTP_HOST} !^sub5\.threadwatch [NC]

# THEN redirect everything to an appropriate location

RewriteRule (.*) http //www.threadwatch.org/$1 [R=301,L]

# ----------------- the real stuff ends here

# Optional end tag, only if you have used the optional start tag

< /IfModule >

#------------------------------------------



De andere pagina's met mod rewrite

Ook de andere pagina's kan je best niet zo laten indien ze dynamisch gegenereerd worden. Meestal zal je pagina's krijgen in de vorm:

index.php?page=hoofdpagina&sub=subpagina&id=23

Dit is niet aan te raden voor opname in de zoekmachines. Veel zoekmachines hebben het niet zo met dynamische url's en zullen de url's niet opnemen in hun index. Google formuleert het in zijn tips voor webmasters als volgt:

If you decide to use dynamic pages (i.e., the URL contains a "?" character), be aware that not every search engine spider crawls dynamic pages as well as static pages. It helps to keep the parameters short and the number of them few.

Vooral wanneer er een SESSIONID in de url wordt bijgehouden zullen de url's niet opgenomen worden. Er wordt ook gezegd dat url's met id= niet worden opgenomen, maar dat is verkeerde informatie. De nieuwsartikels op vanderhovenss.be worden voorlopig nog op deze oude manier benaderd. Een voorbeeld van een nieuwsbericht is dat van "Google straft msn.com?", met als url: http://www.vanderhovenss.be/index.php?page=nieuws&id=69. Dit artikel werd bijvoorbeeld opgenomen in de index van google. Net als alle andere nieuwsartikels.

Beter is het dus om met mod rewrite de verschillende url's te herschrijven naar beter leesbare url's. Dit is bijvoorbeeld toegepast bij De Hongerkiller. In plaats van iets als index.php?pagina=frietkraam is de url nu http://www.dehongerkiller.be/frietkraam. Omdat frietkraam nu mee in de url voorkomt krijgt deze url meer krediet voor het keyword frietkraam. Bovendien is de url zoekmachinevriendelijk en kan hij door alle zoekmachines zonder meer geindexeerd worden. Sommige seo-consultants kiezen ervoor om met mod rewrite de url te herschrijven naar www.domein.tld/pagina.htm . Ze gaan er van uit dat .htm bestanden beter geindexeerd worden omdat ze statisch zijn. Op fora wordt toch steeds tegengesproken dat dit waar zou zijn en ikzelf heb ook niet die indruk.

Een voorbeeld van zo'n rewrite (anders dan in het vorige voorbeeld) is bijvoorbeeld:

RewriteRule ^sitemap* index.php?page=sitemap

Je kan dan met /sitemap verwijzen naar de sitemap!

Herschrijven die url's dus!!

woensdag, november 30, 2005

De sitemap

Als er ooit een pagina bijgemaakt moet worden voor zoekmachine optimalisatie, dan is het wel de sitemap. De sitemap geeft een snelle index naar alle verschillende pagina's op de website, zodat de pagina's goed gevonden kunnen worden.

Hoe stel ik een sitemap op?

Je maakt je sitemap best op een aparte pagina. Via die pagina zijn alle andere pagina's (of toch de belangrijkste) dan direct bereikbaar. Je geeft er uiteraard best een goede structuur aan.

Voor zoekmachine optimalisatie zijn er twee technieken die in het oog springen voor het maken van een sitemap.

Een eerste manier is het werken met headers. De buitenste en belangrijkste pagina's geef je mee in een h1-header, de minder belangrijke in een h2, de nog minder belangrijke etc. Zo geef je als het ware de belangrijkheid van de pagina's door aan de zoekmachines.

Maar dit oogt meestal niet zo prettig en meestal hebben de h1 en h2 al een aparte opmaak gekregen, zodat je eigenlijk nog een aparte class of id moet gaan aanmaken in de CSS. Een leukere manier om mee te werken vind ik persoonlijk het gebruik van lijsten.

Ook met lijsten kan je de onderlinge structuur van de website duidelijk maken. Je begint met de belangrijkste pagina's in een lijst (bvb UL) en wanneer er onderverdelingen komen begin je gewoon in en nieuwe sublijst. Dat ziet er dan bijvoorbeeld zo uit.


  • Belangrijk item 1

  • Belangrijk item 2

  • Belangrijk item 3


    • Belangrijk subitem 3.1

    • Belangrijk subitem 3.2


  • Belangrijk item 4



Zo kan je dus de interne structuur duidelijk maken. Maar soms is er een van de subitems waar je zeer veel belang aan hecht. In zo'n gevallen zie je dat seo-consultants in hun sitemap de letters groter maken. Dat doen ze bijvoorbeeld met een font-tag (omdat die door meer spiders gelezen wordt dan de CSS) of door tekst in het vetjes te zetten.

Zoals we reeds eerder gezien hebben werkt de font-tag minder goed als de h-tags. Het zou dus goed zijn om in de ul-li items de hoofdingen te gebruiken. Maar daar is het natuurlijk al afvragen of dit nog een normale werkwijze is. Het is nog een vraag of zoekmachines hiervoor de rode vlag ophalen.

Wat is het voordeel van een sitemap?

Het voordeel is drieledig. Ten eerste is het gemakkelijk voor je gebruikers. En goede content schrijven blijft de belangrijkste vereiste van een website.

Ten tweede geef je een goed overzicht van de verhoudingen van alle pagina's. Sommige pagina's zijn ondergeschikt aan anderen. Je wilt voor je bedrijfsnaam bijvoorbeeld liefst de hoodfdpagina in de rankings hebben, en niet een of andere geschiedenis pagina waar de bedrijfsnaam meer in voorkomt.

Ten derde, en dit is een zeer belangrijk voordeel. Je geeft een goede pagina aan de zoekmachines om snel heel de site te kunnen spideren. Veel zoekmachines herkennen een sitemap en gaan aan de hand van de sitemap de pagina crawlen.

Je linkt dus best naar je sitemap vanop de voorpagina, dat is gemakkelijk voor de gebruiker en voor de zoekmachines. En als je linkt is het belangrijk dat je goed linkt (zie de teksten over links en link-tekst). Zet in de tekst van de link zeker "site map" of "sitemap" en zet in de link-tekst ook zeker "site map" of "sitemap". Dit helpt de zoekmachines om de sitemap te herkennen als sitemap. Gebruik uiteraard ook in de title van de sitemap pagina sitemap, etc.

Zijn er nog andere mogelijkheden voor een sitemap?

Er zijn nog mogelijkheden voor sitemaps. Zo ondersteunen bepaalde zoekmachines een aantal technieken om je site aan te melden. Bekend zijn vooral de Google Sitemaps. Ook bij Yahoo kan je een lijst van url's aanmelden. Zo kan je bijvoorbeeld een lijst maken in plain text van al je url's en aanmelden bij zowel Google als Yahoo. Die mogelijkheden bespreken we later nog.

Een andere recentelijk opgedoken manier is het maken van een sitemap in OPML en het maken van een sitemap in ROR formaat. Ook deze meer technische manieren zullen later nog in een aparte post aan bod komen.

maandag, november 28, 2005

Tekst en keyword density

Zoekmachine optimalisatie gaat niet alleen om het gebruik van de juiste tags en snufjes natuurlijk. Buiten de vorige meer technische aangelegenheden is ook de tekst natuurlijk van groot belang. Meer bepaald de keywords in de tekst zijn van groot belang. Wat betreft die keywords zijn er een aantal parameters die belangrijk zijn bij het opstellen van de tekst.

Een eerste belangrijke parameter is de keyword density, de keyword dichtheid dus. Die geeft weer hoe vaak een keyword in de tekst terugkomt, in verhouding met de lengte van de tekst. Een kleine tekst moet dus minder keer het keyword bevatten dan een lange tekst om dezelfde keyword density te behalen. Bij de berekening van de densiteit worden "stopwoorden" (=veel voorkomende woorden) als 'de' en 'het' er eerst uitgefilterd. Er wordt wel mee rekening gehouden wanneer zo'n woordjes met andere woorden voorkomen. Een moeilijk geval is bijvoorbeeld "De Hongerkiller".

Elke zoekmachine heeft natuurlijk andere algoritmes, en elk algoritme zal anders reageren om de keyword density. Zo zal bijvoorbeeld Google zeer strikt zijn en slechts een kleine maximale keyword density toelaten. Wanneer de densiteit hoger wordt gaat de rode vlag op.

Er zijn natuurlijk veel mogelijke definities voor deze dichtheid. Zo kan je bijvoorbeeld alleen de zichtbare woorden inrekenen in de berekening van de dichtheid, maar zou je bijvoorbeeld ook alle mogelijke woorden in de bron van het document kunnen opnemen (zoals de alt-tekst, de title-tekst, etc.). Afhankelijk van de definitie van de dichtheid zal deze parameter dus varieren.

Ook wegen woorden in belangrijke tags zwaarder door, zoals we reeds eerder gezien hebben. Een woord in een h1-tag is zeer belangrijk en weegt zwaar door. Het is niet duidelijk of dit mee in de densiteit moet verrekend worden. Voorlopig houden de meeste algoritmes voor het berekenen van de densiteit hier geen rekening mee.

Uiteraard is niet alleen de dichtheid van belang, maar ook de plaatsing van de keywords. Woorden die aan het begin van een tekst of paragraaf voorkomen krijgen meer gewicht dan woorden die in de tekst zelf voorkomen. Ook woorden die voorkomen aan het einde van de tekst of een paragraaf krijgen doorgaans meer gewicht.

Een ander belangrijk iets om mee rekening te houden is dat elke pagina best enkel voor ��n zoekwoord geoptimaliseerd is. Wanneer de densiteit van een woord uitsteekt boven die van andere woorden, wordt die pagina als belangrijk beschouwd voor dat zoekwoord. Dit is zeer duidelijk bij de frituurwagen en frietkraampagina van De Hongerkiller. Deze pagina is geoptimaliseerd voor zowel frituurwagen als frietkraam, waardoor het keyword frietkraam iets minder hoog scoorde als voordien (stond vroeger op de eerste plaats).

Wat betekent die dichtheid nu in het echte leven?

De seo-specialisten zijn het er over eens dat Google de stritkste regels hanteert wat betreft keyword dichtheid. Er mogen maximaal 2% van de woorden op de pagina keywords zijn, meer wordt als spam bekeken. Het is natuurlijk niet zo duidelijk om welke dichtheid het gaat. Meestal spreekt men over de dichtheid zonder de tekst in de title tags, maar wel met de alt-tags en de title-tags inbegrepen. Voor MSN en Yahoo spreekt men over een maximale dichtheid van 5%. Optimaliseren voor Google lijkt dus de beste optie.

Link titles

Het broertje van de alt-tekst is de link-tekst. Dit is een beschrijvende tekst die aan een link kan toegevoegd worden. De syntax is als volgt:

<a href='titletag.htm' title='De title tag in zoekmachine optimalisatie'>

Zoekmachines lezen ook deze tekst, net zoals de alt-tekst bij afbeeldingen. De voordelen zijn weer hetzelfde. Je krijgt extra credits voor het keyword en de pagina waar je naar verwijst krijgt ook extra credits voor de woorden in de title-tag.

Het is dus van belang geen links te maken als "klik hier". Dan mis je de bal twee keer. In plaats daarvan maak je een link met de juiste keywords:

<a href='titletag.htm' title='de title tag'>title tag<a>

Dan heb je twee keer winst!

Over het algemeen is er geen consensus over de tekst rondom te links. Men gaat er van uit dat de belangrijkste zoekmachines rekening houden met de omliggende tekst en context. Je zorgt er dus best ook voor dat de omliggende tekst aansluit bij de link!

Afbeeldingen en alt-tekst

Veel webmasters maken gebruik van afbeeldingen voor allerlei hoofdingen en menu's. Ze willen zo bijvoorbeeld lettertypes gebruiken die anders onmogelijk te gebruiken zijn. Dit is grafisch zeer mooi, maar zoekmachines kunnen zo natuurlijk de tekst niet meer lezen. En die tekst is belangrijk.

2 redenen waarom de tekst belangrijk is

De eerste reden is dat de tekst gewoon mee telt als tekst op de pagina. Als je dus bijvoorbeeld je bedrijfsnaam in een beeld verwerkt, krijg je daar geen credits voor. Beter gebruik je dan een h1-tag, dan krijg je in plaats van geen credits juist heel veel credits. Dit wordt bijvoorbeeld toegepast op Seo Chat (seochat.com) en op de belle epoque site (belle-epoque.org).

De tweede reden is dat de tekst in een link belangrijk is voor de pagina waarnaar die link verwijst. Als ik bijvoorbeeld verwijs naar de title tag, dan houden de crawlers er rekening mee dat de woordjes "title tag" in de link staan. De pagina krijgt dan een boost voor deze keywords. Wanneer je linkt met een afbeelding krijgt die pagina natuurlijk geen credits, simpelweg omdat de zoekmachines niet kunnen lezen wat er in de pagina staat.

De oplossing: de alt-tekst

Er is een eenvoudige oplossing: de alt-tekst. De alt-tekst is de tekst die wordt opgenomen om een afbeelding te beschrijven. In feite is de alt-tekst bedoeld voor blinden of mindervaliden die moeite hebben met afbeeldingen. Ook wanneer een afbeelding niet kan gevonden worden op de server bijvoorbeeld, wordt de alt-tekstweergegeven. Sommige browsers tonen ook de alt-text van een afbeelding wanneer de muis boven de afbeelding blijft stilstaan. De alt-tekst wordt alsvolgt gebruikt

<img src='title-tag.jpg' alt='title tag'>

De zoekmachines lezen deze tekst en zullen hem mee opnemen als tekst. De consensus is dat de alt-tekst over het algemeen minder belang heeft dan gewone tekst. In ieder geval krijg je nu wel credits voor het keyword. Het belangrijkste is dat de pagina waar je naar verwijst credits krijgt voor deze link, en dit maakt wel veel uit. Een tekst-link werkt over het algemeen ong ietsje beter, maar als je menu bijvoorbeeld afbeeldingen gebruikt en op elke pagina terugkomt is het ten zeerste aangeraden om de alt-tekst op te nemen bij alle afbeeldingen.

Opgepast met alt!

Het is natuurlijk niet de bedoeling dat je allerlei nieuwe keywords en lange zinnen in de alt-tekst opneemt. Dit is "onhandig" voor blinden (zij krijgen de tekst vaak voorgelezen) maar wordt ook aanzien als zoekmachine-spam. Deze vorm van spam bleek tegenwoordig meer en meer voor te komen en met de laatste update van Google (Jabber) zou de relevantie van de alt-tekst zijn afgenomen. Natuurlijk blijft het belangrijk om de alt-tekst overal op te nemen. Al is het enkel voor mindervaliden.

Pas ook op met afbeeldingen die enkel voor de layout gebruikt worden. Witte ruimte bijvoorbeeld wordt vaak afgedowngen met een "spacer.gif". Laat de alt-tekst van deze afbeeldingen gewoon "". Als je hier keywords in opneemt zullen de zoekmachines dit zeker aanzien als zoekmachine-spam en zal de site dalen in de rankings!

vrijdag, november 25, 2005

De hoofdingen

Hoofdingen

De optimalisatie speelt zich natuurlijk niet alleen af in het meta-gedeelte van de website. Ook in het "gewone" gedeelte valt er heel wat te optimaliseren. Zo is er de tekst zelf bijvoorbeeld. Maar in lijn met de vorige posts zullen we nu de belangrijkste html-tag zien, die een gewoon document naar de toppen doet stijgen!

de h1 tag

De belangrijkste tag na de title-tag is de h1 tag. De h1 tag wordt gebruikt voor de belangrijkste titels/hoofdingen. Standaard wordt de h1 tag groter weergegeven als de h2 tag, enzovoort. Dat gaat als volgt:

<h1>Zoekmachine Optimalisatie</h1>

<h2>Insite optimalisatie</h2>

<h3>title tag</h3>

<h3>andere meta tags</h3>

<h3>hoofdingen en andere html tags</h3>

ziet er zo uit op deze pagina (de tags zijn aangepast door de CSS):

Zoekmachine Optimalisatie


Insite optimalisatie


title tag


andere meta tags


hoofdingen en andere html tags



Zoekmachines besluiten terecht dat de tekst in de h1 tag zeer belangrijk is. Die weegt dus ook zwaar door. Het is dus zeker aan te raden om op elke pagina het keyword waarvoor die pagina moet geoptimaliseerd worden in de h1-tag van de pagina te gebruiken. Op een pagina die goed moet scoren voor de term "smoutebollenkraam" gebruik je dus "smoutebollenkraam" in de h1-tag van dat document, zoals in de pagina over het smoutebollenkraam van de Hongerkiller.

Waar je op moet letten

Je kan natuurlijk niet op *alles* de nadruk leggen door heel de paginatekst in h1-tekst te gaan plaatsen. Dat is technisch wel mogelijk, omdat met CSS elke gewone html tag volledig kan omgebouwd worden. De tekst in een h1-tag kan je er perfect laten uitzien als de andere tekst in je document.

Te veel tekst in een h1 tekst zal de rode vlag doen zwaaien bij de meeste zoekmachines. Het is dan ook aan te raden niet te veel tekst op te nemen in de tags. Het beste is eigenlijk alleen de zoekwoorden op te nemen.

Je moet ook opletten met het gebruik van CSS. Sommige zoekmachines zullen het detecteren wanneer een h1 tag als gewone tekst wordt weergegeven. Dit zal uiteraard beschouwd worden als een poging om de zoekmachines te misbruiken en zal automatisch leiden tot een afstraffing.

Bewijs dat het werkt

Dat het werkt is wel duidelijk. Vanderhovenss.be scoorde redelijk goed voor het keyword Vanderhoven op google.com. Maar de site kwam niet als eerste resultaat. Na aanpassing van de titel (die gebruikte font size +2 en opmaak in de css) naar h1-tags kwam de site plots op nummer een te staan voor het keyword Vanderhoven. Hoewel de tekst er identiek hetzelfde uitzag (met CSS was hier voor gezorgd), bleek de font tag met size+2 dus veel minder door te wegen dan de h1-tag. In dit geval maakte het een vijftal plaatsen verschil goed en stond de site plots op de eerste plaats.

Andere toepassingen

Deze tags kunnen ook gebruikt worden in de sitemap. Ze geven een mooie hierarchie weer en leggen nadruk op de juiste zoekwoorden voor de verschillende url's. De sitemap zullen we later bespreken.

maandag, november 21, 2005

Andere meta tags

Er zijn natuurlijk ook nog andere meta tags. Deze meta tags zijn over het algemeen minder belangrijk voor de zoekmachines, maar kunnen toch nog zeer relevant zijn. We zullen er een aantal overlopen.

robots tag

algemeen

<meta name="robots" content="all">
<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">

Deze tag geeft de zoekmachines aanwijzingen over wat ze met de pagina moeten doen. De default value is "index, follow", wat hetzelfde is als "all".

Wanneer je wil dat de zoekrobot de pagina indexeert, geef je "index" mee en wanneer je wil dat de links gevolgd worden geef je de optie "follow" mee. In de andere gevallen geeft je "noindex" en "nofollow" mee. Uiteraard kan je geen strijdige attributen meegeven als "index, noindex".

Wanneer je wil dat de pagina geindexeerd wordt en dat de links gevolg worden, kan je deze tag eigenlijk weglaten. Deze tag is dus voornamelijk interessant wanneer je afwijkend gedrag wil (wanneer je bijvoorbeeld wil dat de pagina niet wordt geindexeerd of je wil niet dat de links gevolgd worden). Dit komt wel vaker voor bij pagina's die nogal persoonlijk zijn of bij link-pagina's.

Wanneer je deze tag gebruikt, gebruik je best ook de robots.txt file. Over dit bestand zullen we het later nog hebben. Dit is een krachtiger mechanisme om zoekmachines te blokkeren uit bepaalde mappen etc. Maar de meta tag biedt een oplossing voor mensen die niet aan het robots.txt bestand van hun website kunnen.

De formele syntax is:

content = all | none | directives
all = "ALL"
none = "NONE"
directives = directive ["," directives]
directive = index | follow
index = "INDEX" | "NOINDEX"
follow = "FOLLOW" | "NOFOLLOW"

specifiek

Er zijn ook speciale tags per zoekrobot. Wanneer je de msnbot wil mijden gebruik je:

<meta name="msnbot" content="noindex, nofollow">

De msnbot luistert naar noindex en nofollow. Ook Google doet mee natuurlijk, als je Google wilt mijden gebruik je:

<meta name="googlebot" content="noarchive, nofollow">

Google luistert dus naar een extra directief, namelijk noarchive. Hiermee kan je ervoor kiezen dat Google de site niet (wel) archiveert.

Revisit-after

<meta name="revisit-after" content="15 days">

Deze tag is bedoeld om de zoekmachines erop te wijzen om de hoeveel tijd ze de pagina moeten bezoeken. Er zou echter geen enkele zoekmachine zijn die deze tag gebruikt, buiten de regionale Columbiaanse zoekmachine SearchBC (een irrelevante zoekmachine). Het opnemen van deze tag is dus een beetje overbodig.

Language tag

<meta http-equiv="content-language" content="nl">

Deze tag geeft de taal weer die gebruikt wordt op de pagina. Dit is wel belangrijk. Op de meeste zoekmachines kan je de resultaten filteren op een bepaalde taal. Wanneer de website zelf aangeeft welke taal er gebruikt wordt, kan ze veel gemakkelijker opgenomen worden in die resultaten. Ook wanneer iemand zoekt op google.be zullen bijvoorbeeld nederlandse .org websites beter scoren dan engelse.

Expires tag

<META name="Expires" content="Tue, 01 Jun 1999 19:58:02 GMT">

Geeft de zoekmachines aan wanneer de website verloopt. Meestal "never".


Distribution

<META name="Distribution" content="Global">

Geeft aan of de pagina bestemd is voor globale publicatie of dat ze voor intern gebruik is. Meestal global en kan dan weggelaten worden.

Auteur, copyright

<META name="Copyright" content="Copyright Statement">
<META name="Author" content="Author Information">

Ter volledigheid. Geven copyright en auteursinformatie. In principe niet belangrijk bij zoekmachine-optimalisatie. Hoewel ik eens de indruk heb gehad dat mijn site gevonden werd omdat de url in de auteur sectie vermeld stond. Mijn site werd nergens anders vermeld en toch vond ik in mijn statistieken een bezoeker die als referrer die site aangaf.

meta description tag

De andere meest gebruikte meta tag is de description tag. Die geeft zoals de naam het zelf zegt een beschrijving van wat er op de pagina te vinden is. Hoewel deze tag geen grote invloed heeft op de resultaten in de zoekpagina's is hij toch zeer belangrijk.

De description tag ziet er als volgt uit:

<meta name="Description" content="Deze pagina handelt over...">

en bevindt zich weer tussen de <head> en </head> tags.

Om wille van misbruik weegt de beschrijving nog bijzonder weinig door bij de zoekmachines. Bij Google zou het geen invloed hebben en bij Yahoo nog een zeer zeer kleine invloed (volgens Jill Whalen).

Het belang van de beschrijving zit hem vooral in het feit dat deze beschrijving wordt weergegeven op de SERP's (Search Engine Result Pages). Wanneer je bijvoorbeeld zoekt in google naar Sociale Familiezorg, dan krijg je onder de link de beschrijving:

Sociale Familiezorg is een Dienst voor Gezinszorg en Bejaardenhulp die huishoudelijke,
hygi�nische, sociale en morele thuishulp, nachthulp biedt aan ...


Dit is dus een duidelijke omschrijving en die is zeker zeer belangrijk om mensen te overtuigen om om de link te klikken. Dit hebben we reeds uitvoerig besproken bij het artikel van de title tag.

Dit gedrag verschilt wel van zoekmachine tot zoekmachine. Zoals we gezien hebben komt er bij Google mooi de beschrijving. Ook bij MSN krijgen we de beschrijving te zien:

Sociale Familiezorg is een Dienst voor Gezinszorg en Bejaardenhulp die huishoudelijke, hygi�nische, sociale en morele thuishulp, nachthulp biedt aan personen en gezinnen die door ziekte, leeftijd ...

Bij MSN krijgen we wel meer informatie te zien, namelijk de woorden "aan personen en gezinnen die door ziekte, leeftijd". Zeer vriendelijk van MSN. Minder vriendelijk is Yahoo. Zij laten een snippet zien:


... op de website van Sociale Familiezorg! Sociale Familiezorg is een Dienst voor Gezinszorg en ... Sociale Familiezorg wil op een kwalitatieve wijze diensten leveren aan die mensen ...


Die snippet komt uit de <h1> tag en het begin van de tekst. Yahoo zoekt dus de plaats in het document waar deze tekst prominent voorkomt. Dit is duidelijk in de <h1> tag gevolgd door het begin van de tekst want de tekst komt hier twee maal voor en wordt benadrukt door de <h1> en de beginpositie in de tekst.

Het gedrag verschilt dus wat bij Google, MSN en Yahoo. Bij Yahoo zal je bijvoorbeeld voor een nonsense woord in de beschrijving de pagina terugvinden in de zoekresultaten voor dat nonsense woord. Bij Google is dit niet het geval. Dat zijn natuurlijk details en geen dingen om nachten van wakker te liggen.

Wat wel belangrijk is, is dat de beschrijvingen verschillen per pagina. Wanneer er op elke pagina een nieuwe beschrijving aanwezig is, kan die geoptimaliseerd worden voor die pagina. Ook hier overlapt de redenering grotendeels met die van de title tag. Het opstellen van dynamische meta-tags is dus ten zeerste aangeraden!

meta keywords tag

De meest besproken tag is waarschijnlijk de meta keywords tag. Die is oorspronkelijk ontstaan met als doel een aantal keywords aan een document te koppelen. Door het vele misbruik echter is deze tag volledig irrelevant geworden voor de zoekresultaten van de meeste zoekmachines. In feite is de tag niet �cht irrelevant geworden, want bij verkeerd gebruik kan hij wel nog zorgen voor een penaltie.

De tag wordt (zoals reeds gezien in de vorige post) als volgt opgesteld:

<meta name="Keywords" content="keyword1, keyword2, ...">

Spammers begonnen deze tag te misbruiken en stopten hem overvol. Zo kwamen er sites met honderden keywords in deze tags. Bovendien werden er ook tags gebruikt die totaal irrelevant waren voor de zoekresultaten. Dit heeft geleid tot een aantal aanpassingen in de zoekmachines.

De keyword tag geeft geen aanleiding meer tot "credits" voor deze keywords, maar wanneer je op misbruik wordt betrapt krijgt je pagina wel een soort boete. Dit kan bijvoorbeeld wanneer een keyword meerdere keren voorkomt. Zeker wanneer het twee maal na elkaar voorkomt. Veel mensen gebruiken bijvoorbeeld de variatie: "keyword1, Keyword1". De keywords verschillen dan zogezegd een hoofdletter van elkaar. Ook raden sommigen "keyword1, keyword2, KeyWord1, KeyWord2" aan. Het is niet helemaal duidelijk wat bij welke zoekmachine relevant is, maar het lijkt me toch beter dergelijke zaken te vermijden.

Ook wanneer je woorden gebruikt die irrelevant zijn (om zo meerdere bezoekers te trekken) voor de tekst kan dit bij bijvoorbeeld Google een rode vlag doen heisen. De naam van de concurrent gebruiken is op het randje omdat dit misschien nog relevant is (Juridisch is dit natuurlijk een andere zaak). Aangezien 'sex' het meest gezochte zoekwoord is, waren er vroeger nog al eens wat sites...

Ook bepaalde zoektermen worden aangeduidt als verboden keywords. Het gaat hier om vulgaire taal. De site wordt niet uit de ranking gehaald (je vindt duizenden sites voor dergelijke woorden), maar het zou toch schade aanbrengen. Waarschijnlijk wordt de site als minder professioneel geklasseerd. Wanneer de termen natuurlijk ook nog eens irrelevant voor de pagina blijken te zijn kan je het helemaal schudden :-)

Ook wordt het aangeraden om het aantal keywords te beperken (tot maximum 20-30 ofzo). Teveel termen zou immers de rode vlag doen heisen.

Je neemt dus best een beperkte set van keywords die zeer relevant zijn voor de site. Ikzelf heb goede resultaten ondervonden bij het aanpassen van de keywords per pagina.
Er wordt nog al eens aangeraden om de verkeerde spelling van een woord op te nemen in de keywords. Daar heb ik weinig goede ervaring mee. Zo zijn er op belle-epoque.org nooit bezoekers gekomen die bijvoorbeeld bele epoque opzochten, hoewel al die dingen wel in de tag stonden vermeld. Vroeger zou deze techniek in altavista wel goede resultaten hebben opgeleverd. Waarschijnlijk levert hij nu alleen nog resultaat op als je het fout gespelde woord ook effectief in de tekst van de pagina verwerkt. Maar dat haalt dan weer de professionaliteit van de site naar beneden...

In elk geval kan bij juiste toepassing (het idee van de keyword tag is immers dat het de meest relevante keywords aanduidt) de pagina nooit schade ondervinden van deze tag. Je gebruikt hem dus gewoon het beste waarvoor hij dient en voor de rest lig je er beter niet van wakker, want hij zal geen wonderen verrichten.

Meta tags: een inleiding

Nu het duidelijk is dat de title tag zo belangrijk is, lijkt het evident dat al de meta tags van het html document een belangrijke rol gaan spelen. De meta tags zijn de tags in de <head></head> sectie in het html document. Dit kan er bijvoorbeeld zo uit zien:

<head>
...
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Keywords" content="keyword1, keyword2, ...">
<meta name="Description" content="Deze pagina handelt over...">
<meta name="author" content="Vanderhoven Nick">
<meta name="robots" content="ALL">
<meta name="revisit-after" content="1 days">
...
</head>

Er zijn twee soorten tags, de "http-equiv-tags" en de tags met een name attribuut. De "http-equiv-tags" zijn equivalent aan de http-headers. Wat dus in deze tags staat kan ook in de http response header voorkomen en omgekeerd. Een bekend voorbeeld van het gebruik van dit soort tag is de redirect. Maar zoals we later nog zullen zien valt er daar nog wel wat over te vertellen over dit soort redirect.

Wat betreft zoekmachine-optimalisatie zijn de keywords-tag en description tags het meest besproken. We zullen ze daarom eerst apart behandelen.

zondag, november 13, 2005

De title tag

Wat is de title tag?

Het allerbelangrijkste bij zoekmachine-optimalisatie is de title-tag. De title tag bevindt zich in de header van de pagina, tussen de <HEAD></HEAD> tags, bijvoorbeeld:

<HEAD>
<TITLE>Acme.com</TITLE>
</HEAD>

Het resultaat is de mooie titel in de balk van de browser:

Zoekmachine optimalisatie - title tag

Binnen deze sectie komen ook nog een groot aantal meta-tags. Het speelt voor de techniek geen rol of deze voor of na de title tag komen. Maar gevoelsmatig zet je de title tag misschien best bovenaan. Of dit uitmaakt of niet is onderwerp van discussie, maar je doet er niets fout mee om hem bovenaan te zetten. Spiders hechten belang aan zoekwoorden die in het begin van de pagina komen. Bij minder slimme spiders is het dan heel misschien een beetje voordelig om de title-tag bovenaan te zetten :-)

Waarom is de title tag zo belangrijk

De title tag is op zich al zeer belangrijk om hoog te scoren in de SERPS (search engine result pages). Bovendien is hij ook belangrijk omdat hij getoond wordt als de linktekst bij de resultaten. Een goede title tag is dus zeer belangrijk, want mensen klikken vaak op de resultaten die er "goed uitzien". Als er in de title "nieuwe pagina" staat, is dit dus totaal verkeerd. Ten eerste scoort de pagina niet, en ten tweede zal zo goed als niemand geneigd zijn om op het resultaat te klikken.

Nu denk je misschien dat niemand zo dom is om "Nieuwe pagina" in zijn title tag te zetten. Maar het is nu eenmaal zo dat html-editors zelf vaak automatisch een nieuwe naam kiezen bij het aanmaken van nieuwe pagina. Als je dit niet gelooft moet je maar eens kijken
hoeveel zoekresultaten er zijn bij Google voor "Nieuwe pagina".

Al vanaf een paar resultaten komt er bijna niets anders dan "Nieuwe pagina 1", "Nieuwe pagina 2", etc.

Wat moet er juist in de title tag?

Het is belangrijk dat elke pagina van de site zijn eigen title tag heeft, en dat daarin de keywords die belangrijk zijn voor die pagina voorkomen. Een pagina die geoptimaliseerd is voor mosselfeesten, moet dus mosselfeesten in de title tag krijgen.

De zoekmachines kijken naar de titel van de pagina en als die titel het keyword bevat zijn ze er terecht van overtuigd dat het keyword een zeer belangrijke rol speelt in het document. Het keyword moet dus ook voorkomen in het document. Wanneer dat in orde is, zullen de zoekmachines het document/de pagina hoog plaatsen wanneer iemand zoekt naar dat bepaald keyword.

Als je dan zoekt op google naar mosselfeesten dan merk je dat De Hongerkiller deze techniek goed heeft toegepast. Inderdaad, het keyword staal als eerste woord in de title tag, en wordt dus als zeer belangrijk aanzien door de zoekmachines. Bij de daarop volgende sites komt het keyword Mosselfeesten altijd op een positie meer achteraan in de title-tekst. Bovendien zijn de andere titles ook langer en is het woord "mosselfeesten" dus ook minder belangrijk tov de rest van de woorden in de title tag.

Merk ook op dat de juiste pagina wordt gevonden (www.dehongerkiller.be/mosselfeesten) en niet de hoofdpagina (www.dehongerkiller.be). Dit is zeer voordelig. Ten eerste vindt de persoon die zoekt meteen de juiste pagina en ten tweede kan je elke pagina optimaliseren en dus met elke pagina hoog scoren. Je moet dus niet "de hele website" optimaliseren om zo de hoofdpagina ergens bovenaan te krijgen voor bepaalde keywords. Hoe meer pagina's, hoe meer hoge rankings je kan krijgen! Bij het voorbeeld van De Hongerkiller staat zo bijna elke subpagina (smoutebollenkraam, frietkraam, etc.) als eerste bij de zoekresultaten!

Wat met de bedrijfsnaam?

Aangezien het dus belangrijk is om zo weinig mogelijk tekst in de title tag te hebben naast de keywords, zijn er veel SEO-aanhangers die afraden om de bedrijfsnaam in de title-tag te zetten. De meer gevorderde SEO-specialisten raden echter altijd aan om de bedrijfsnaam in de title-tag te plaatsen.

Dat is ook logisch. Niet vanuit een technisch standpunt, maar vanuit een menselijk standpunt. Mensen die op zoek zijn naar gezinszorg zijn eerder geneigd om op een zoekresultaat met de tekst "Gezinszorg - Sociale Familiezorg" te klikken dan om te klikken op een zoekresultaat met de teskt "gezinszorg". In het eerste geval weten of veronderstellen ze immers dat het gaat om een onderneming die voor hen gezinszorg kan aanbieden. In het tweede geval hebben vele gewone internetgebruikers zo goed als geen idee welke site er achter de titel verborgen zit.

Uiteraard verminder je dan wel de prominentie van het zoekwoord in de title-tag, zodat je iets minder goed scoort. Dat is ook te zien, wanneer je zoekt in google voor gezinszorg. De pagina van Sociale Familiezorg over gezinszorg komt onder een aantal resultaten met alleen "gezinszorg" in de titel. Toch zullen veel mensen die op zoek zijn naar gezinszorg of bejaardenhulp meer aangesproken zijn door deze tekst dan de andere resultaten.

Bovendien is het ook zeer belangrijk om de bedrijfsnaam in de title-tekst te hebben wanneer het bedrijf enige bekendheid geniet. Coca-Cola heeft er enorm veel belang bij om de naam in de title tag te zetten, of het nu de hoofdpagina is of een verre subpagina. Maar ook minder bekende bedrijven die toch naambekendheid hebben bij een beperkt publiek zetten best hun bedrijfsnaam in de titel. Zo vallen ze gewoonweg beter op in de zoekresultaten. Een goede manier is bijvoorbeeld : "Keyword-tekst - Bedrijfsnaam". Omdat het streepje toch niet meetelt voor de zoekmachines. Een heel belangrijke bedrijfsnaam kan je ook op de eerste plaats zetten, gevolgd door de keyword tags.

Mag een keyword twee keer voorkomen in de title tag?

Een keyword mag twee maal voorkomen. Maar er wordt aangeraden om de keywords niet na elkaar te laten voorkomen. Dat zou immers de rode vlag kunnen doen opgaan bij de zoekmachines. En dat wil je ten allentijde vermijden. Bovendien is het bij korte titels beter om de tekst kort te houden en een extra keyword te vermijden dan om het keyword twee keer te hebben. Maar als een automatisch script zorgt voor de samenstelling van de title-tags heb je soms weinig keuzes :-)

Keywords gevonden, nu de pagina's opstellen

Eens je de keywords gevonden hebt is het belangrijk om voor elk keyword een aparte pagina te hebben. Zo kan je dan elke pagina optimaliseren voor ��n bepaald keyword. Dit werkt het beste, wanneer je probeert een pagina te optimaliseren voor meerdere keywords krijg je slechtere resultaten. Later daarover meer.

Voor elk keyword een eigen pagina maken zal ook belangrijk zijn bij het linken van de pagina's later. Dit zal uitgelegd worden in het gedeelte over pagerank/linken.

Nu dus de pagina's opstellen voor al die keywords. Ik zal de relevante zaken in de volgende posts ��n na ��n behandelen. We zullen beginnen bij het allerbelangrijkste... de titel!

woensdag, november 02, 2005

Zoekwoorden vinden voor gevorderden

Natuurlijk kan het zijn dat de concurrentie al hoog scoort voor bepaalde zoekwoorden. Voor je de site begint te optimaliseren is het dus belangrijk de zoekwoorden eens in te geven in bijvoorbeeld Google. Zo kan je zien welke concurrentie er is en of die te overwinnen is.

Indien dit niet is kan je de pagina beter optimaliseren voor een ander zoekwoord. Indien de concurrentie daar staat met een site die helemaal niet geoptimaliseerd is kan je er natuurlijk nog voor gaan.

Maar kijk niet alleen naar de zoekwoorden die je zelf gevonden hebt. Kijk ook naar de zoekwoorden waarvoor de concurrentie hoog scoort. Kijk in de meta-tags naar de keywords waar ze op doelen en kijk naar de links die ze krijgen. De tekst die in de title-tags van de links is zeer belangrijk. Indien dit Chinees in de oren klinkt, geen zorg, dan wordt dit later nog wel duidelijk.

Maar een zeer, zeer, zeer belangrijke methode om zoekwoorden te vinden heb ik nog niet vermeld. Er bestaan online systemen die weten welke zoekwoorden het meest ingetypt worden. Het is natuurlijk belangrijk om te mikken op zoekwoorden die ook veel ingegeven worden.

Zo kan je via http://www.wordtracker.com zoekwoorden opzoeken. Je geeft een zoekwoord in en wordtracker geeft de relevante zoekwoorden die in dezelfde context ingegeven worden. Je kan zo brainstormen en nieuwe woorden zoeken, maar tegelijkertijd ook zien hoe vaak een bepaald zoekwoord ingegeven wordt en hoeveel concurrentie er is.

Een andere manier van keyword suggestion is die van overture. Je kan er een aantal van vinden op het internet. Leuke zijn die van digitalpoint en eentje van 123promotion. Je vindt ze hier:

http://www.digitalpoint.com/tools/suggestion/

en hier:

http://www.123promotion.co.uk/ppc/

Ze geven een leuke lijst van zoekwoorden, hoeveel keer per dag/maand/jaar ze voorkomen. Deze getallen zijn enkel aanwijzingen van de veel voorkomende termen want ze durven nog al eens uit elkaar te lopen.

De resultaten zijn toch interessant. Zo valt bijvoorbeeld te zien dat frituur gemiddeld 31,7 keer per dag wordt ingetypt :-) In elk geval kan je zo een duidelijk beeld krijgen van welke zoekwoorden er vaak met het door u gekozen zoekwoord samengaan en krijg je een indruk van het aantal keer dat het zoekwoord wordt ingegeven.

Zoekwoorden vinden

Voor je zoekwoorden gaat opstellen moet je eerst nagaan voor welke zoekwoorden jouw site een bijdrage levert aan het internet. Het is belangrijk om zeer specifiek te zijn.

Wanneer je amateurfotograaf bent en een website hebt en je bent gespecialiseerd in portretten, dan is het belangrijk om dit te vermelden. Vermeld je dat niet en iemand is op zoek naar een fotograaf voor portretten en ziet twee aanbiedingen, die van jou en die van een andere fotograaf die "portretfotografie" als uithangbord heeft, dan stuur je die klant naar je concurrent.

Niet alleen voor dit marketingconcept natuurlijk. Hoe specifieker je zoekwoorden, hoe hoger je in de SERPS (Search Engine Result Pages) komt voor die specifieke zoekwoorden. Net zoals bij "Japans" en "Japans restaurant Wilrijk".

Wees dus specifiek bij het opstellen van zoekwoorden. Dit kan vaak zijn door te mikken op meerdere zoekwoorden die samen voorkomen. Mikken op Belle Epoque is te ruim. Mikken op Belle Epoque feesten of op Belle Epoque Neerland is veel effectiever. Bekijken we dit voorbeeld, waar we zoeken naar www.belle-epoque.org :

Resultaten 1 - 10 van circa 3.310.000 voor belle epoque
Resultaten 1 - 10 van circa 12.700 voor belle epoque feesten
Resultaten 1 - 10 van circa 197 voor belle epoque neerland

In de twee laatste gevallen staat de site op 1 bij Google.be. Dit was nooit gelukt voor het eerste geval.

Er zijn natuurlijk grenzen. Niemand zoekt op "sportschoenen om toertjes te gaan lopen in leuven". Het is dus niet alleen mikken op specifieke zoekwoorden.

Je moet ook meedenken met je klanten. Een klant zal eerder "schoenwinkel leuven" intypen wanneer hij wil gaan winkelen in Leuven. Momenteel zijn er daar nog geen sites voor geoptimaliseerd, dus de eerste schoenwinkel in leuven heeft nog "vrij spel".

Zo kan je al aardig wat zoekwoorden vinden waar je hoog voor kan scoren. Maar wat als de grote concurrentie al eerst staat voor die zoekwoorden? En hoe weet je of die zoekwoorden wel effectief worden ingetypt?

Insite Optimalisatie : keywords zijn belangrijk

Voor je kan gaan beginnen met je site te optimaliseren moet je eerst kijken voor welke zoekwoorden je de site wil optimaliseren. Dit is een zeer cruciale keuze.

Stel dat je de website van een Japans restaurant wil optimaliseren en je probeert de site te optimaliseren voor het woord Japan (omdat je alle mensen die Japan opzoeken naar je restaurant wil lokken). Dat is een redelijk onmogelijke opdracht. Wanneer we in Google zoeken naar Japan:

Results 1 - 10 of about 671,000,000 for japan

Het is dus zo goed als onmogelijk om hoog te scoren voor een dergelijk keyword. Voor "japans restaurant" zijn de zoekresultaten al behoorlijk minder en voor "Japans restaurant Wilrijk" zijn er nog maar 86 resultaten wanneer je de zoekopdracht beperkt tot Belgie.

Het is dus belangrijk de site te optimaliseren voor de juiste keywords. Het is natuurlijk niet zo eenvoudig om goede keywords te vinden. Gelukkig zijn er methodes voor.

dinsdag, november 01, 2005

Korte omschrijving items op de planning

Resultaten van de verschillende onderdelen zullen een diepte-analyse van de onderwerpen zijn, verduidelijkt met voorbeeldcode en eventueel aangevuld met proof-of-concept code. Mogelijk zal er ook analytische software ontworpen worden.

Insite Optimalisatie

De broncode van de website is zeer belangrijk. Die moet helder zijn en goed opgesteld. Er moet een duidelijke scheiding zijn tussen layout en informatie. Zoekmachines hechten belang aan de tags (title tags, h1, h2 etc, meta tags) en ook de content en de hoeveelheid informatie is zeer belangrijk. We zullen ook parameters zoals keyword density bekijken en het uitkiezen van goede zoekwoorden bestuderen. Ook de domeinnaam is belangrijk en het gebruiken van goede bestandsnamen (mod rewrite) en alt-tags bij images. Andere dingen zijn bijvoorbeeld een duidelijke sitemap, die eventueel aangevuld wordt door een van de meta-data-sitemap-mogelijkheden.

Pagerank / Linking

De linkstructuur van een website en de interlinking op het net zijn zeer belangrijke factoren. Heel belangrijk bij zoekmachine-optimalisatie zijn de inbound links. Die links samen met de outbound en de interne links bepalen de PageRank. Over PageRank zijn vele interessante artikels geschreven en ook Google gebruikt een PageRank algoritme (zij het een aangepast tov het oorspronkelijke).

Er zijn vele manieren om links te bekomen. Niet alle links zijn even goed. Links van sites met hoge PageRank zijn belangrijker dan van sites met lage pageranking. Ook belangrijk zijn de links van sites met gerelateerde content en dan nog liefst authority sites. Ook de linktekst en titletekst zijn belangrijk. Ook dangling links en links naar sites met een penaltie zijn belangrijk. Zo zijn FFA links (Free For All) te vermijden, maar zijn links van gerelateerde directories dan weer goed voor de PageRank. Interessant is ook de verschillende manieren te bekijken waarop links op een goede manier verzameld kunnen worden. Door hard werken of bijvoorbeeld door het aankopen van links. Hoe is het mogelijk zoveel mogelijk links naar je site te krijgen?

Zoekmachines in kaart brengen

Er zijn verschillende soorten zoekmachines. Google en Yahoo kennen elk hun eigen zoekalgoritmen. Elke zoekmachine legt andere accenten. Er moet ook rekening gehouden worden met de directories waarin gezocht kan worden (dmoz, yahoo, …). Zoekmachines maken ook gebruik van elkaar en van onderliggende services. Ze leggen elk hun eigen klemtonen. In deze sectie leggen we de onderlinge verhoudingen en methodes bloot en bekijken we de verschillende zoekmachines van dichterbij.

Nieuwe technologien

Pagina’s en websites komen niet alleen met tekst, maar er is ook de mogelijkheid tot het verschaffen van meta data. Er zijn enorm veel meta tags gedefinieerd. Maar de keywords en description tags die vroeger enorm belangrijk waren zijn nu veel minder relevant. Er zijn wel nieuwe manieren voor het verschaffen van meta data. Zo valt te denken aan sitemaps in OPML (bvb. http://www.vanderhovenss.be/sitemap.opml ) of ROR. Ook RSS-feeds bevatten veel meta data (bvb. http://www.vanderhovenss.be/rss.xml) . Ook bijvoorbeeld het pics-label kan interessante meta data verschaffen.

Zoekmachine Spam

Er zijn ook veel frauduleuse mogelijkheden om een site hoog in de rankings te krijgen. Zo kan bijvoorbeeld aan de zoekmachine een andere keyword-rijke pagina worden voorgeschoteld, terwijl aan een gewone gebruiker iets totaal anders wordt voorgeschoteld. Dergelijke methoden zijn niet volgens de ethische regels en zijn niet in overeenstemming met de voorwaarden die bvb. Google oplegt. Overtreders zoals het Nederlandse Tribal worden dan ook afgestraft en volledig uit de index verwijderd. Het is belangrijk niet aan dergelijke methoden toe te geven. Zwarte tekst op een zwarte achtergrond werkt al lang niet meer.

Zoekmachine marketing

Bij zoekmachine-optimalisatie hoort ook zoekmachine-marketing. Hier kan je betalen voor links, zodat deze zo hoog mogelijk of in speciale secties bij de zoekresultaten terecht komen. PPC systemen zijn zeer in omloop (bvb. Google Adwords en Adsense) en worden veelvuldig gebruikt. Marketing is ook belangrijk bij het kopen van links. Zo kunnen er belangrijke links gekocht worden die een grote boost geven aan de PageRank.

Andere

Belangrijke aangelegenheden zijn dingen die speciaal in het leven geroepen zijn voor de zoekmachines. Zo is er bijvoorbeeld de speciale robots.txt file en zijn er de Google sitemaps. Google sitemaps zijn redelijk recent en vragen om een priority en laatste aanpassingsdatum van de pagina’s. Ook de rel=nofollow is recentelijk ingevoerd. Een aantal van die dingen hebben te maken met de berekeningen van de PageRank.

Eerste project planning

Project Start Date: Wed 26/10/05
Project Finish Date: Fri 9/12/05

IDTaakTijdStartEind

1Insite Optimalisatie12 daysWed 26/10/05Thu 10/11/0530%
2Pagerank / Linking12 daysMon 31/10/05Tue 15/11/0510%
3Zoekmachines in kaart brengen7 daysMon 7/11/05Tue 15/11/050%
4Nieuwe technologien7 daysWed 16/11/05Thu 24/11/050%
5Zoekmachine Spam7 daysWed 16/11/05Thu 24/11/050%
6Zoekmachine marketing10 daysMon 28/11/05Fri 9/12/050%
7Andere18 daysWed 16/11/05Fri 9/12/050%

De problemen met de table zijn opgelost. Blogger zette de end of line markers om in
br-tags. Die kwamen tussen de table-tags terecht en werden door de browser apart gegroepeerd. Zo ontstond er dus de lelijke gap.


De verklaring vond ik op http://help.blogger.com/bin/answer.py?answer=275&topic=17 .

maandag, oktober 31, 2005

Zoekmachine Optimalisatie: een case study

Deze blog zal de vorderingen beschrijven in het capita selecta vak "Zoekmachine optimalisatie". Er zullen verschillende thema's aan bod komen zoals insite optimalisatie, pagerank, rss-feeds etc.

Enjoy!

Nick Vanderhoven