SEO, Webperf et choses bizarres…

10 Avr 2019

Bypass la Search Console avec des URLs externes

La nouvelle version de la Search Console et l’outil d’inspection d’URL est très utiles pour diagnostiquer des problèmes liĂ©s au rendu de GoogleBot :

Une autre point cool est qu’il inclut le rĂ©sultat après l’exĂ©cution du JS.

Malheureusement, si pas d’accès Ă  la Search Console… pas d’inspection d’URL possible :

Mais il existe une astuce…

Les redirections entre domaines !

Par exemple, amusons nous à analyser la homepage de la Corée du Nord, afin de les aider à quelques recommandations SEO :

Nous sommes sur le compte Search Console test.pierrick.dev , accédant volontairement au compte de la Search Console de : http://www.korea-dpr.com/

MĂ©thode

C’est simple :

  • Avoir un compte Search Console pour un site web que vous contrĂ´lez.
  • Configurez une redirection vers l’URL souhaitĂ©e sur une propriĂ©tĂ© que vous ne contrĂ´lez pas.
  • Inspectez l’URL redirigĂ©e dans la Search Console.
  • Tester l’URL en direct.

That’s it.

Ă€ savoir, l’inspecteur d’URL utilise l’agent qui indexe votre site web… dans la plupart des cas il s’agit aujourd’hui de Googlebot Mobile: Smartphone.

Comment voir plus qu’un aperçu

Le code source fournie peut ĂŞtre copiĂ©e et collĂ©e (contrairement Ă  certains autres outils de Google). Ainsi, mĂŞme si l’aperçu ne fournit qu’une image limitĂ©e au-dessus de la copie, vous pouvez toujours l’utiliser. Pour faire ça :

  • Copiez le code HTML de la page testĂ©e.
  • Inspectez l’Ă©lĂ©ment dans Chrome.
  • Modifiez en tant que HTML.
  • Écrasez en collant le rendu GoogleBot.
  • Appuyez sur EntrĂ©e pour afficher la page web rendue complète.

Pour aller plus loin, je suggère d’utiliser Chrome 41 afin d’avoir le rendu visuel le plus proche de ce qu’un robot est capable d’afficher actuellement.

Voici un lien pour télécharger gratuitement la version de chrome41 : https://commondatastorage.googleapis.com/chromium-browser-snapshots/index.html?prefix=Win/310958/

Limites

Si la destination est bloquĂ©e dans le fichier robots.txt, cela ne fonctionnera pas. Il y a potentiellement d’autres restrictions, mais je n’ai pas encore eu de cas concret.

Point positif, il n’y a actuellement aucune limite de frĂ©quence sur les interrogations d’URL… concrètement, cela peut donc ĂŞtre automatisĂ©.

Plus rigolo encore…. Nous pouvons l’utiliser pour soumettre du contenu d’autres personnes Ă  l’indexation.

La boite de Pandore

Autres idĂ©es d’utilisation…

Cette technique est potentiellement utile pour les devis avant audit, car elle peut vous donner des informations auxquelles vous ne devriez pas encore avoir accès (par exemple en regardant l’agent Google, on peut voir si le site est passĂ© ou pas encore en indexation Mobile First).

C’est un excellent moyen de voir rapidement si des problèmes de ressources sont bloquĂ©s et de commencer Ă  auditer en attendant d’avoir les accès complets Ă  la Search Console.

Et d’autres dĂ©tournements sont encore possibles grâce Ă  cette technique… Rappelez vous que vous utilisez par consĂ©quent l’adresse IP authentique Google, donc vous aurez accès au mĂŞme contenu que les robots Google, sans filtrage, quelques idĂ©es :

  • Contournement des paywalls
  • VĂ©rifier sur un concurrent fait du cloacking
  • VĂ©rifier si notre cloack fonctionne correctement

Et je suis persuadĂ© que vous trouverez d’autres idĂ©es sur la façon de l’utiliser… profitez tant que rien n’est bloquĂ© !

Stay Safe.

Pierrick

commentaires généré par Disqus