Perché la sitemap del sito è importante

Per chi si occupa di ottimizzazione del sito, la sitemap è molto importante. Per almeno due motivi.

  1. La sitemap comunica ai motori di ricerca l’alberatura del sito e quindi quanto in profondità deve andare lo spider nel crawling (scansione) di un sito.
  2. Fornisce una gerarchia di argomenti importante per capire come definire la struttura del sito.

La sitemap per i motori di ricerca come Google è in formato XML. Si tratta di un protocollo rich-text che contiene questo tipo di informazioni:

  • indirizzo (URL) delle pagine
  • data di pubblicazione
  • indice di priorità della pagina (in pratica i livelli rispetto alla radice principale, la root o la index del dominio).

Una sitemap XML può contenere al massimo 50000 URL ed è molto utile in siti molto larghi e profondi come gli e-commerce.

Una sitemap di notevoli dimensioni andrebbe scorporata e divisa in più parti.

Essa può riguardare tutte le tipologie di URL statici e dinamici che il sistema o il webmaster genera:

  • pagine fisse
  • articoli
  • voci di categorie e tassonomie varie come i tag

All’interno di una sitemap classica puoi incorporare i video, attraverso i tag ma Google – per esempio – consiglia di fare una sitemap video separata, così da facilitare la rilevazione utile all’indicizzazione (e mostrare i video nelle anteprime all’interno delle pagine dei risultati).

Analogo discorso per i siti presenti su Google News, che necessitano di una sitemap apposita.

Se non usi un CMS come WordPress o Joomla o Prestashop, Shopify e via dicendo, puoi generare la Sitemap attraverso dei servizi online o software appositi.

Una volta creato, il file XML che hai scaricato va inserito nella root del dominio, cioè dove è situata la pagina principale index.

Una buona pratica può essere quella di indicare la sitemap nel footer. Ma il modo migliore per comunicarla a Google è tramite l’applicazione Google Search Console.

Una volta che hai verificato il sito puoi comunicare la sitemap nella sezione Indice:

La sitemap per WordPress

Se stai utilizzando un sistema di gestione dei contenuti come WordPress, attivare una sitemap XML è molto semplice.

Hai due strade:

  1. Inserire un plugin SEO che ha la funzione di sitemap incorporata.
  2. Inserire un plugin apposito.

Nel primo caso posso consigliare uno tra:

  • AIOSEO (All in One SEO)
  • Yoast SEO
  • Rank Math

Nel secondo caso installare un plugin come XML Sitemaps.

In ogni caso ti rimando alla seguente pagina per una panoramica: Sitemap XML. Una volta installati questi plugin rintraccia l’indirizzo della sitemap e poi comunicalo a Google via Search Console.

File e indirizzi da escludere dalla sitemap

Se vuoi escludere dei file o degli indirizzi dall’indicizzazione di Google esistono almeno due modi:

  1. Indicare il diniego all’indicizzazione via file robots.txt con il comando Disallow dedicato al file o alla cartella che intendi nascondere.
  2. Inserire le direttive noindex, nofollow nella sezione “head” delle pagine che non vuoi far indicizzare.

Ma queste indicazioni sarebbero molto più facilitate se le pagine che non vuoi indicizzare non fossero nemmeno nella sitemap.

Se Google le trova nella sitemap, gli stai chiaramente dando un’indicazione di indicizzarle. Poi cercherà di onorare le direttive date nei modi previsti.

Motivo per cui è bene NON inserire in sitemap gli indirizzi che non vuoi che siano presenti su Google.

In teoria questo non sarebbe mai un problema, ma lato SEO possono esserci ricadute negative in ordine ai contenuti duplicati, all’accesso ad aree protette e così via.

Se usi sistemi come WordPress, tramite i plugin di cui sopra, puoi decidere cosa far entrare in sitemap e cosa no, decidendo anche quali tipologie di contenuti indicizzare o non indicizzare.

Di norma in sitemap XML non dovrebbero finire:

  • Pagine duplicate;
  • Pagine non canoniche;
  • Pagine di navigazione (esempio: pagina 2, 3 del blog o delle categorie di prodotto, meglio usare un tag canonical per rinforzare la prima pagina o la pagina di categoria di prodotto, nell’e-commerce);
  • URL generate da opzioni di ricerca;
  • Pagine di archivi per data o per autore;
  • Pagine de-indicizzate via robots o via direttive in sezione head;
  • Pagine amministrative come login, account, carrello et cet.

La Sitemap HTML

La sitemap HTML non è un protocollo che i motori di ricerca usano per scansionare i siti in profondità. Si tratta più che altro di una normale pagina in HTML che riepiloga la struttura e l’alberatura del sito.

Può essere generata a mano, compilando l’alberatura in modo gerarchico a partire dalla home, o nei casi in cui si usi un CMS come WordPress tramite plugin o add-on.

L’editor di nuova generazione Gutenberg, di WordPress, ha un blocco per la sitemap HTML, ma esistono utili plugin che consentono di decidere quali contenuti mostrare.

È utile all’utente per muoversi all’interno del sito, inoltre – se viene seguita dai motori di ricerca – può aiutare l’indicizzazione complessiva.

È fondamentale, anche in questo caso, che non vi siano delle direttive in conflitto.

A differenza della sitemap XML, la sitemap HTML non è indispensabile e non va comunicata a Google.

Categorie Seo

Lascia un commento