de robot.txt file.
is een vrij belangrijke file deze kunnen niet geautoriseerde robots/spiders tegen houden.
dit kan een voordeel hebben als je niet iedereen op en bepaalde pagina van je website wild hebben.of dat er geheime gegevens op staan.
we gaan beginnen bij het begin.
-
we gaan naar het start menu drukken op bureau accessoires en klikken op kladblok
-
we gebruiken eerst de User-agent statement
voorbeeld hier van is
User-agent: *
de * (ster) attribuut gebruiken voor alle robots/spiders.
verder op deze pagina zet ik een aantal robots voor je neer.
maar nu weet de User-agent nog niks maar daar gaan we nu iets aan toevoegen
-
we gebruiken hier voor de disallow statement
voorbeeld van disallow :op een test pagina is (deze pagina bestaat in dit web)
Disallow:test.htm
-
als we nu de twee samen voegen ziet dit er als volgt uit :
User-agent: *
Disallow:test.htm
op deze manier zeg ik tegen alle robots en spiders dat ze de file web.kustvissenineuropa.nl/test.htm
niet mogen bezoeken gebeurt dit wel probeer dan te achterhalen welke robot hier voor de dader is en geef hem dan een eigen User-agent statement
-
voorbeeld met het gebruik van de msnbot
User-agent: msnbot
Disallow:test.htm
nu je weet hoe je hem maakt gaan we naar de volgende stap .