|
Materiale stampato dal sito www.dablones.org |
|
|
|
Abbiamo
visto che, qualsiasi cosa facciamo, siamo noi a doverci
adattare agli spider dei search engine. E' possibile però far
adattare i robots alle nostre esigenze, indirizzandoli (Cloaking)
all'interno del sito, a nostro piacimento. Se
foste in possesso di un
dominio, è possibile creare un file di nome robots.txt
che va inserito nella root principale (www.dominio.com/robots.txt).
In questo file, vanno inserite le istruzioni per
"governare" il ragno. Ad esempio:
User-agent:
* Disallow:
/
User-agent: * Disallow:
User-agent:
* Disallow:
/cgi_bin/ Disallow:
/secret/
User-agent:
ArchitextSpider Disallow:
/cgi_bin/ Disallow: /secret/
User-agent:
Scooter Disallow:
/
User-agent: Slurp Disallow: Disallow: /
<meta name="robots"
content="noindex, nofollow"> |