Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Google alla prova dei fatti: sfatiamo alcuni mi...

Google alla prova dei fatti: sfatiamo alcuni miti #SEOMythbusting

In questo intervento mostriamo alcuni test condotti su prototipi di pagine web create a fini di prova. L'obiettivo è sfatare alcuni miti - a volte diffusi proprio da Google - su scansione, indicizzazione e posizionamento.

Gianluca Campo

November 18, 2022
Tweet

More Decks by Gianluca Campo

Other Decks in Marketing & SEO

Transcript

  1. Contenuto riservato e confidenziale. Google alla prova dei fatti: sfatiamo

    alcuni miti Gianluca Campo, Demetrio Orecchio #SEOMythbusting #SMConnect
  2. Indice 1. Introduzione e premesse 2. Cosa accade se inseriamo

    disallow e noindex? 3. Il nofollow è trattato come suggerimento? 4. Google preferisce HTTPS a HTTP? 5. Google scansiona i link in JavaScript? 6. Intermezzo (Analisi dei log con KNIME e SEO Log File Analyser) 7. Indexing API: aiutano l'indicizzazione? 8. Dopo quanti redirect hop Google non scansiona? 9. Inserire h1nell'head lo rompe? 10. Il noindex nel body viene considerato? 11. Cosa accade con noindex e canonical insieme? 12. I dati strutturati influenzano il ranking?
  3. Premesse 1. I test eseguiti sono soprattutto volti a riflettere

    sui fondamenti di scansione, indicizzazione e posizionamento a volte ignorati 2. Non c’è alcuna intenzione di screditare esponenti di Google o altri SEO, ma solo constatare il più possibile se qualcosa risulta vero o meno 3. Aggiornamenti di linee guida o documentazione possono essere avvenuti nelle ultime settimane, dunque i nostri test possono essere stati superati da novità recenti 4. In alcuni casi i test non hanno portato risultati significativi o a conclusioni diverse da quanto previsto
  4. Come abbiamo condotto i test 1. Abbiamo effettuato i nostri

    test in maniera più semplice ed efficace possibile cercando di rimuovere elementi che potessero comprometterne la validità 2. I metodi utilizzati per svolgere i test hanno puntato sulla rapidità, a discapito della rigorosità in alcuni casi 3. Abbiamo usato solo Google Search Console per favorire la scansione, nessun altro metodo (a parte alcuni link esterni per la prima indicizzazione della homepage) 4. Tutti gli screen delle SERP sono state fatte con browser in incognito, per limitare l'influenza delle preferenze dei nostri browser sui risultati di ricerca
  5. Passo 1. Avere un sito su cui effettuare i test

    Il primo passo è stato scegliere e registrare un dominio su cui effettuare i test. Abbiamo registrato il dominio https://nkseolab.com/ che abbiamo popolato con pagine HTML molto basilari, a volte un po' di JavaScript e qualche CSS.
  6. Passo 2: Configurazione Google Search Console e prima indicizzazione Appena

    creato il sito, abbiamo configurato Google Search Console e ispezionato la URL dell'homepage. Con nostra grande sorpresa Google non indicizzava la homepage perché il contenuto canonico selezionato era https://www.dapupetta.it (un ristorante qualunque di Vercelli ☺)
  7. Google: ‘’For the noindex to be effective, the page must

    not be blocked’’ Fonte: https://developers.google.com/search/docs/crawling-indexing/block-indexing
  8. Inseriamo un noindex su codice ma anche un Disallow nel

    robots.txt https://nkseolab.com/londra6.html
  9. Google: ‘’For the noindex to be effective, the page must

    not be blocked’’ Fonte: https://developers.google.com/search/docs/crawling-indexing/block-indexing
  10. Google: ‘’nofollow will become a hint as of March 1,

    2020’’ Fonte: https://developers.google.com/search/blog/2019/09/evolving-nofollow-new-ways-to-identify
  11. Creiamo due pagine diverse ma che puntano allo stesso target

    https://nkseolab.com/esperimento-nofollow-2.html https://nkseolab.com/esperimento-nofollow-1.html Target, presente anche nel title
  12. Sistemiamo i link in menu e footer, ma mettendo un

    nofollow nel menu Menu della homepage Footer della homepage
  13. Google: ‘’nofollow will become a hint as of March 1,

    2020’’ Fonte: https://developers.google.com/search/blog/2019/09/evolving-nofollow-new-ways-to-identify
  14. Creiamo una pagina orfana raggiungibile sotto HTTP e HTTPS Codice

    di risposta di https://nkseolab.com/milan.html Codice di risposta di http://nkseolab.com/milan.html
  15. Google: ‘’Can follow links only if they are an <a>

    tag with an href attribute’’ Fonte: https://developers.google.com/search/docs/crawling-indexing/links-crawlable
  16. Attenzione: entrambi i link sono inseriti dinamicamente Screaming Frog con

    JS abilitato trova solo il primo link Screaming Frog con JS disabilitato non trova alcuno dei due link
  17. Google: ‘’Can follow links only if they are an <a>

    tag with an href attribute’’ Fonte: https://developers.google.com/search/docs/crawling-indexing/links-crawlable
  18. KNIME Analytics Platform • KNIME Analytics Platform è una piattaforma

    gratuita no-code/low- code per la data science, che usa la programmazione visuale per costruire sequenze di attività. • La piattaforma è basata su un’interfaccia drag & drop in cui si costruiscono pipeline di blocchi e ognuno di questi corrisponde ad un’attività precisa. • KNIME nasce per la data science dunque è trasversale a diversi ambiti per propria natura. • KNIME è nato nel 2006 nei laboratori dell’Università di Costanza: a questo deve il suo nome KN (Konstanz) IM (Information Miner) E. https://en.wikipedia.org/wiki/KNIME
  19. KNIME // 1. Scarichiamo i file di log e li

    salviamo in una cartella sul desktop Spesso i file di log sono compressi
  20. KNIME // 3. Pre-processiamo un po’ i dati Convertiamo gli

    IP in paesi Modifichiamo le date e rimuoviamo il quarto ottetto dagli IP per semplificare la successiva ricerca
  21. KNIME // 4. Un metanodo per interpretare il JSON con

    indirizzi IP di Google Il metanodo è un gruppo di nodi, una sorta di mini-workflow Leggiamo il JSON scaricato da https://developers.google.com/static/ search/apis/ipranges/googlebot.json Processiamo fino ad ottenere una tabella utile ai nostri scopi
  22. …dal JSON alla tabella: il risultato del metanodo *ATTENZIONE, nota

    tecnica su IPv6: non è corretto modificarne la notazione!
  23. Cos’è SEO Log File Analyser? Uno strumento estremamente utile per

    l'analisi dei log è SEO Log File Analyser di Screaming Frog.
  24. Come impostare il file di log Lo strumento di Screaming

    Frog riesce, quasi sempre, a riconoscere i campi principali. Dove non riesce, è possibile settare manualmente i campi.
  25. I dettagli del tab Events Il tab event contiene i

    dati Row importati nella fase precedente e permette di ordinare o filtrare le richieste in base al Timestamp, useragent, path URL, etc.
  26. Google: ‘’the Indexing API can only be used to crawl

    pages with JobPosting…’’ Fonte: https://developers.google.com/search/apis/indexing-api/v3/quickstart
  27. Costruiamo una pagina senza i requisiti richiesti da Google La

    pagina non presenta alcun tipo di dato strutturato ed ha contenuto testuale generato casualmente e senza senso. https://nkseolab.com/c18/n2.html
  28. Inviamo la pagina mediante Indexing API La pagina è orfana

    e quindi non linkata mai internamente né tramite Sitemap né inviata mediante Google Search Console. È stata inviata solo tramite le API per verificare se venisse scansionata ed indicizzata da Google mediante Indexing API. Script usato per fare le chiamate alle Indexing API
  29. Google ha indicizzato la pagina anche se non è un

    JobPosting! La pagina a distanza di poche ore è stata indicizzata da Google.
  30. Google: ‘’the Indexing API can only be used to crawl

    pages with JobPosting…’’ Fonte: https://developers.google.com/search/apis/indexing-api/v3/quickstart
  31. John Mueller: ‘’up to 5 hops in the chain per

    crawl attempt’’ Fonte: https://www.searchenginejournal.com/googles-john-mueller-recommends-less-than-5-hops-per-redirect-chain/344664/
  32. Posizioniamo una pagina orfana alla fine di una catena oltre

    i 5 hop 3 salti 4 salti 5 salti 6 salti 301 https://nkseolab.co m/aaaa 301 https://nkseolab.co m/a 301 https://nkseolab.co m/aaa 301 https://nkseolab.co m/ab 301 https://nkseolab.co m/bbbb 301 https://nkseolab.co m/b 301 https://nkseolab.co m/bbb 301 https://nkseolab.co m/bc 301 https://nkseolab.co m/cccc 301 https://nkseolab.co m/c 301 https://nkseolab.co m/ccc 301 https://nkseolab.co m/cd 200 https://nkseolab.co m/c15/qq.html 301 https://nkseolab.co m/d 301 https://nkseolab.co m/ddd 301 https://nkseolab.co m/de 200 https://nkseolab.co m/c15/q.html 301 https://nkseolab.co m/eee 301 https://nkseolab.co m/ef 200 https://nkseolab.co m/c15/qqq.html 301 https://nkseolab.co m/ge 200 https://nkseolab.co m/c15/qqqq.html Scansionata? Sì Scansionata? Sì Scansionata? Sì Scansionata?
  33. Tuttavia, le linee guida di Google sono intanto cambiate Martino

    Mosna ci ha segnalato che sono state aggiornate le linee guida. Per questa ragione abbiamo fatto altri 2 tentativi. Fonte: https://developers.google.com/search/docs/crawling-indexing/http-network-errors
  34. Cosa accade dunque? 10 salti 11 salti 301 https://nkseolab.com/prova1 301

    https://nkseolab.com/pro1 301 https://nkseolab.com/prova2 301 https://nkseolab.com/pro2 301 https://nkseolab.com/prova3 301 https://nkseolab.com/pro3 301 https://nkseolab.com/prova4 301 https://nkseolab.com/pro4 301 https://nkseolab.com/prova5 301 https://nkseolab.com/pro5 301 https://nkseolab.com/prova6 301 https://nkseolab.com/pro6 301 https://nkseolab.com/prova7 301 https://nkseolab.com/pro7 301 https://nkseolab.com/prova8 301 https://nkseolab.com/pro8 301 https://nkseolab.com/prova9 301 https://nkseolab.com/pro9 301 https://nkseolab.com/prova10 301 https://nkseolab.com/pro10 200 https://nkseolab.com/c15/qa.html 301 https://nkseolab.com/pro11 200 https://nkseolab.com/c15/qqaa.html Scansionata? Scansionata?
  35. La pagina a 10 hop non sembra indicizzata, invece… Pagina

    di destinazione della catena Check indicizzazione pagina di origine della catena Check indicizzazione pagina di destinazione della catena
  36. L’indicizzazione è avvenuta come atteso Pagina di destinazione della catena

    Check indicizzazione pagina di destinazione della catena
  37. John Mueller: ‘’up to 5 hops in the chain per

    crawl attempt’’ Fonte: https://www.searchenginejournal.com/googles-john-mueller-recommends-less-than-5-hops-per-redirect-chain/344664/
  38. John Mueller: ‘’For us, this implicitly closes the head’’ Fonti:

    http://www.thesempost.com/avoid-non-head-html-tags-head-section-pages/ https://www.reddit.com/r/TechSEO/comments/87pxsu/comment/dwh3hd9/
  39. Costruiamo una pagina con l’h1 posizionato nell'head prima del canonical

    https://nkseolab.com/c1/aa.html Il canonical punta a https://nkseolab.com/c1/aaa.html
  40. John Mueller: ‘’For us, this implicitly closes the head’’ Fonti:

    http://www.thesempost.com/avoid-non-head-html-tags-head-section-pages/ https://www.reddit.com/r/TechSEO/comments/87pxsu/comment/dwh3hd9/
  41. Kristina Azarenko: ‘’Google respects the noindex tag found in the

    page <body>’’ Fonte: https://marketingsyrup.com/the-curious-case-of-noindexed-page/
  42. Kristina Azarenko: ‘’Google respects the noindex tag found in the

    page <body>’’ Fonte: https://marketingsyrup.com/the-curious-case-of-noindexed-page/
  43. John Mueller: ‘’we pick the rel=canonical and use that over

    the noindex’’ Fonti: https://www.contentkingapp.com/academy/canonical/faq/noindex/ https://www.reddit.com/r/TechSEO/comments/8yahdr/comment/e2dey9i/
  44. Abbiamo creato due pagine per il test 1. /dubai1.html (noindex

    + canonical verso la 2) 2. /dubai2.html (orfana ma riceve canonical) https://nkseolab.com/dubai1.html
  45. Creiamo una pagina con canonical verso una pagina con noindex

    La pagina https://nkseolab.com/newyork1.html possiede un noindex La pagina https://nkseolab.com/newyork.html punta a https://nkseolab.com/newyork1.html
  46. John Mueller: ‘’we pick the rel=canonical and use that over

    the noindex’’ Fonti: https://www.contentkingapp.com/academy/canonical/faq/noindex/ https://www.reddit.com/r/TechSEO/comments/8yahdr/comment/e2dey9i/
  47. Costruiamo due pagine con le stesse caratteristiche, ma non duplicate

    Le pagine sono: • orfane • testi diversi ma entrambi senza un senso logico • stesso h1 • stesso title • stessa meta description https://nkseolab.com/c20/sd2.html https://nkseolab.com/c20/sd1.html
  48. Costruiamo due pagine con le stesse caratteristiche Le pagine sono:

    • con contenuto testuale molto simile • stesso h1 • stesso title • stessa meta description • inseriti nella Sitemap • linkati nel menu laterale del sito https://nkseolab.com/madagascar2.html https://nkseolab.com/madagascar1.html