Quiz SEO bastardi a cui credete di saper rispondere (1)

Alla luce dell’inevitabile confusione che alberga nel mondo empirico del SEO, ove tutto sembra opinabile, mi è venuta l’idea di proporre qualche post “didattico” sfruttando quell’infido stratagemma che è il quiz.

Quiz SEOCon questo articolo inauguro dunque una serie di quesiti che vi verranno posti attraverso semplici sondaggi.

Come funziona: voi rispondete al quiz e poi tornate dopo qualche giorno per vedere se ci avete azzeccato o se sono riuscito a fregarvi in qualche modo. I commenti saranno a vostra disposizione per eventuali reclami e linciaggi.

Una nota alla quale tengo molto: i quiz saranno bastardi, perché metterò le dita nelle piaghe più doloranti della cultura SEO e perché potrei anche fuorviarvi tendendovi volutamente dei trabocchetti.

Adesso bando alle ciance e rispondete al seguente quiz!

Il quiz

A cosa serve l'istruzione Disallow nel file robots.txt?

  • A chiedere allo spider di non effettuare richieste di una o più risorse (52%, 37 Voti)
  • A non far indicizzare una o più risorse (24%, 17 Voti)
  • A chiedere al motore di non effettuare richieste HTTP GET di una o più risorse, consentendo però le richieste di tipo HEAD (20%, 14 Voti)
  • A chiedere al motore di rimuovere una o più risorse dall'indice (3%, 2 Voti)
  • A non far apparire nelle SERP una o più risorse (1%, 1 Voti)

Votanti totali: 71

Avete votato? Tra qualche giorno, quando saranno stati accumulati un po’ di voti, potrò rendere pubblici i risultati e la risposta esatta.

Nel frattempo fatemi sapere se l’iniziativa è di vostro gradimento. 🙂

La risposta al quiz

Dopo una settantina di risposte, ho deciso che il quiz poteva essere chiuso. Ecco di seguito i risultati.

La maggioranza ha risposto “A chiedere allo spider di non effettuare richieste di una o più risorse” e ha dato risposta esatta! 🙂

Detta in parole più spicce ma non proprio precise, il Disallow serve solo a chiedere agli spider di non scaricare una risorsa. E questo non produce affatto una “non indicizzazione”, come spiegherò tra poco.

La gogna pubblica e le spiegazioni

Passo adesso alla pubblica gogna, fortunatamente anonima nei confronti di tutti i votanti, e spiego perché nessuna delle altre risposte andava bene.

A chiedere al motore di non effettuare richieste HTTP GET di una o più risorse, consentendo però le richieste di tipo HEAD” è una risposta che mi sono inventato di sana pianta per introdurre un’opzione affascinante per i geek in vena di tecnicismi.

Ho fatto di più: ho volutamente votato questa risposta errata subito dopo la pubblicazione del sondaggio, nella speranza di creare qualche dubbio ai votanti successivi e incentivare indirettamente congetture e approfondimenti.

In realtà l’istruzione Disallow chiede allo spider di non accedere ad alcuna risorsa prescindendo dalla modalità HTTP: che sia GET, HEAD, POST o altro, il divieto vale sempre.

Se beccate uno spider ad accedere ad una risorsa in Disallow con un metodo HEAD, sappiate che lo sta facendo perché ha deciso di fregarsene del robots.txt e non perché l’accesso di tipo HEAD sia contemplato o accettabile o previsto dal Robots Exclusion Standard.

Nota utile per eventuali quiz futuri: il fatto che un Disallow non consenta nemmeno le richieste via HEAD significa che una risorsa bloccata non permette agli spider di sapere nemmeno che intestazioni HTTP essa restituisce (redirect 30X, 404, ecc.).

A non far indicizzare una o più risorse” si è beccata ben 17 voti e si è piazzata al secondo posto dopo la risposta esatta.

Quando scrivevo di “le piaghe più doloranti della cultura SEO” pensavo proprio all’ambiguità del termine “indicizzazione” e all’incredibile confusione che esiste nel settore attorno a questo termine. Un secondo posto non dovrebbe dunque sorprendere.

La spiega: ogni risorsa è identificata da un URL e quando un motore di ricerca viene a conoscenza di un nuovo URL, può già considerarlo una risorsa a propria disposizione. A questo punto inizia ad associare alla risorsa e ad inserire in un indice (questo significa indicizzare) quante più informazioni riesce a trovare.

Nel caso in cui lo spider abbia accesso alla risorsa, sarà possibile associare ad essa (indicizzare) anche i suoi contenuti, per esempio il testo nel corpo di una pagina HTML.

Nel caso in cui lo spider non possa accedere alla risorsa a causa del Disallow, sarà possibile associare ad essa (indicizzare) solo informazioni esterne alla risorsa, per esempio il testo dei link che puntano ad essa.

In entrambe i casi, la risorsa è presente nell’indice, solo che nel caso in cui essa sia in Disallow la quantità di informazioni nell’indice sarà inferiore, perché non saranno presenti i suoi contenuti.

Questa è la ragione per la quale una risorsa in Disallow può apparire in una SERP: di fatto è indicizzata, sebbene con meno dati rispetto ad una risorsa a cui lo spider può accedere.

La risposta “A chiedere al motore di rimuovere una o più risorse dall’indice” è errata per quanto appena spiegato: il Disallow non impedisce al motore di indicizzare la risorsa.

Risposta “A non far apparire nelle SERP una o più risorse“: vedi sopra.

Conclusioni

Arrivare alla risposta esatta è facile se si conoscono un po’ le basi del robots exclusion standard e come il motore indicizza le risorse. Inoltre la risposta era già presente nel flow chart sull’indicizzazione che vi avevo proposto in un post precedente.

Spero che questo primo quiz SEO bastardo vi sia piaciuto, perché ne ho in cantiere già un altro paio ed uno in particolare sarà davvero meschino.

Per approfondimenti e discussioni i commenti sono sempre a vostra disposizione. 🙂

7 Responses to Quiz SEO bastardi a cui credete di saper rispondere (1)

  1. Pingback: Panda sì o Panda no? Penalizzazioni per duplicazione interna e rimedi

Leave a Reply

Your email address will not be published. Required fields are marked *