Ouvert : Lundi - Vendredi 10:00-18:00
Email: contact@web-sparkler.fr Tel : +33 (0)9 70 40 66 80

La révolution du Machine Learning : Quel impact sur le SEO ?

 

Machine Learning : De quoi s’agit-il ?

 

Le machine learning est en train de modifier durablement le SEO.

A l’heure où j’écris ces lignes un duel homme-machine vient de se terminer autour d’une table de Go.

Alpha GoLee Sedol, le génie Sud Coréen du jeu de Go vient de déclarer forfait face à AlphaGo, le logiciel d’intelligence artificiel conçu par Deep Mind ( une filiale de Google). Lee Sedol a cependant pu sauver son honneur, et celui de l’humanité, en parvenant à gagner une manche sur les cinq du tournoi.

Ce duel met la lumière sur les récentes avancées autour de l’intelligence artificielle.  Alpha Go est un programme de Machine Learning spécialement conçu et entrainé pour le jeu de Go. Derrière, cet usage anecdotique autour du jeu de Go se cache une révolution technologique qui va progressivement révolutionner l’informatique.

Quelle est la définition de Machine Learning ?

Selon wikipédia, le machine learning est :

machine_learning

L’apprentissage automatique ou apprentissage statistique (machine learning en anglais), est un champ d’étude de l’intelligence artificielle qui concerne la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine (au sens large) d’évoluer par un processus systématique, et ainsi de remplir des tâches difficiles ou impossibles à remplir par des moyens algorithmiques plus classiques.

En d’autre termes, il s’agit de « copier » le fonctionnement humain pour qu’une machine puisse « apprendre » par elle-même, sans qu’un humain optimise en permanence l’algorithme d’origine.

Comment cela fonctionne ?

Il  y a deux grandes catégories de Machine Learning : le supervisé, et le non-supervisé.

Le machine learning supervisé est celui utilisé dans les premières expériences.

Concrètement il est basé sur un algorithme, qui prend en compte un certain nombre de signaux, qui sont pondérés de manière à optimiser un résultat de calcul. En fonction des résultats, l’algorithme est optimisé.

Exemple : Comment faire la différence entre des spams et des vrais e-mails ? Un algorithme comprenant différents signaux est utilisé : présence de mots typiques du spam : viagra, héritage, prince africain, fautes d’orthographe… Des e-mails sont donnés pour analyse à la machine, et en fonction des résultats obtenus, l’homme ajuste la pondération des signaux l’algorithme pour le perfectionner, et mieux séparer les spams des vrais e-mails. Vivre sans gluten.

Le machine Learning non supervisé, est l’étape supérieure, rendue possible ces dernières années par l’augmentation de la puissance des ordinateurs.

Cette fois le mode de fonctionnement est différent. Il est basé sur différentes couches de neurones artificiels qui fonctionne de manière comparable à un cerveau humain : chaque couche de neurones traite l’information du niveau inférieur jusqu’à arriver à la catégoriser. Si la machine réalise des erreurs, elle corrige elle même l’algorithme afin d’améliorer son résultat.

On a ici un système auto-apprenant et autonome, que l’on nomme intelligence artificielle ou Deep Learning, et qui copie le fonctionnement du cerveau humain.

L’intervention humaine consiste alors à « fournir » à la machine des données pour l’entrainer et lui faire pratiquer des situations particulières. Plus la machine est confrontée à des situations différentes, plus elle sera capable de bien catégoriser les informations et de détecter des schémas de fonctionnement.

Pour les curieux Stanford a mis des cours en ligne sur le machine learning.

Machine Learning Stanford

 –

Et concrètement, le Machine Learning, ca sert à quoi ?

En fait le machine learning est déjà bien inscrit dans notre quotidien. Une des premières utilisations du machine learning a été la traduction automatique. A partir de 2011, Google a utilisé cette technologie a pu fortement améliorer la qualité des traductions.

Autre exemple quotidien de machine learning auquel nous sommes tous confrontés : l’algorithme facebook. En fonction de votre activité sur le réseau social, de vos clics, des profils que vous consultez, l’algorithme s’adapte et vous fournir plus de contenus qui correspondent à vos attentes et à votre comportement.

De nouvelles possibilités d’utilisation apparaissent régulièrement, comme par exemple pour améliorer la gestion de campagnes publicitaires sur Internet. Un système auto-apprenant est tout à fait capable de gérer et optimiser la diffusion des annonces, en prenant en compte les créations les plus efficaces pour chaque segment, à une enchère donnée. L’optimisation manuelle des campagnes n’est plus nécessaire.

Demain les voitures autonomes, comme la Google Car, seront également pilotées avec ces technologies d’intelligence Artificielle.

machine-learning-robots-dilbert

Et l’impact du Machine Learning sur le SEO ?

Et bien le machine Learning supervisé est déjà à l’œuvre depuis plusieurs années. C’est même la base de fonctionnement de l’algorithme originel de Google. Mais il a été complété récemment par des couches d’intelligence artificielle.

Prenons l’exemple de Pingouin : l’évolution de l’algorithme de Google pour lutter contre les mauvais liens. Les critères suivants ont été rajoutés dans l’algorihme : si le lien est mal positionné ( Footer ou blog-roll), situé à côté du mot « sponsorisé », a une ancre qui pointe vers un contenu non pertinent, ou se situe à proximité d’autres liens de faible qualité… Si ces critères se répètent trop souvent sur la page ou dans le site, alors la sanction tombe.

De la même manière Panda est une évolution pour détecter les contenus de faible qualité. Par exemple s »il y a peu de mots sur une page en comparaison des pages concurrentes, si il y a un manque de synonymes ou peu de richesse lexicale, si les mots clés sont trop présents, ou des contenus sont dupliqués, alors de manière identique Google sanctionnera la page.

Les filtres Panda et Pingouin ont donc été une des premières utilisations à grande échelle du machine Learning en SEO.

Récemment une nouvelle étape a été franchi, avec le lancement officiel du programme d’intelligence Artificielle Rank Brain, présenté comme le troisième critère de classement dans les pages de résultats.

google-rankbrain-thumbnailRank Brain est un programme d’intelligence artificiel qui permet de mieux comprendre le contexte d’une requête ou d’un contenu pour les utilisateurs du moteur de recherche. Ce programme n’est pour l’instant à l’œuvre que sur les requêtes longues traines ou à double sens ou qui n’ont jamais été tapées auparavant.

Dans le Search Engine Journal, nous trouvons l’exemple suivant du fonctionnement de Rank Brain pour la requête suivante :

« What is the title of the consumer at the highest level of a food chain ».

Sans Rank Brain, on pourrait comprendre « consumer » comme un consommateur qui achète quelque chose. Il y a aussi différents types de consommateurs dans la chaîne alimentaire. Ici la bonne réponse à cette requête, est « prédateur ».

Rentrer cette typologie de requête permet d’avoir un résultat qualitatif :

exemple rankbrain

Maintenant prenons l’exemple de la requête « Top Level of Food Chain » qui est plus simple à comprendre.

Le résultat de cette requête est très similaire :

exemple rank brain 2

=>Rank Brain permet d’associer la requête compliquer à la plus simple, en comprenant que l’utilisateur recherche la même typologie d’information.

Rank Brain permet donc à Google de mieux comprendre et valoriser les contenus des pages et d’optimiser les SERP.

Ce résultat est possible parce que la machine a « appris » quels étaient les résultats attendus pour cette typologie de requête.

Si on appelle cela du « machine learning » ce n’est pas parce que la machine a appris seule, mais par la corrélation qu’elle fait entre les attentes des humains, et l’observation de leur comportements face aux résultats fournis.

Et elle continue d’optimiser en permanence les résultats pour les utilisateurs.

II/ Quel sera l’impact de l’intelligence artificielle sur le SEO ?

L’impact du machine learning est une véritable révolution. Mais une révolution qui se passe en coulisses et dont les résultats se feront voir progressivement.

Pour y voir plus clair, gardons en tête l’objectif fondamental de Google. Il s’agit d’une société de services qui cherche à augmenter son offre de service, sa qualité de résultats fournis, afin que les gens reviennent souvent sur sa plateforme, et y passent le plus de temps possible. En contre-partie l’entreprise se rémunère avec de la publicité.

Concernant le Search, l’objectif de Google est d’optimiser les résultats proposés, pas seulement pour classer des informations, mais pour fournir une expérience globale satisfaisante qui répond à un besoin utilisateur. Et ce besoin est de plus en plus complexe : recherche d’information, de produits, de services… Toutes les évolutions de Google, passées ou à venir, ou pour but d’améliorer cette expérience globale, pour nous rendre toujours plus dépendants de ses services.

Et le SEO est une des priorités du moment.

Avec le machine learning non-supervisé, nous ouvrons une nouvelle ère. Click To Tweet

Avec le machine learning non-supervisé, nous ouvrons une nouvelle ère. Une ère ou l’algorithme de Google ne peux plus être connu, car en constante évolution. Les machines le font évoluer en permanence en fonction du comportement des internautes sur les SERPS, de votre historique de requêtes, de votre localisation…. Google parlait de 200 ou 300 critères dans son algorithme. Demain, plus personne ne pourra dire combien il y a de critères précis, et quelle sera la pondération entre eux pour une requête donnée, à un instant donné…

Alors, le SEO est-il mort ?

Ce qui est certain, c’est que les principales ficelles du métier ne seront plus suffisantes pour garantir un ranking de qualité. Une balise Title ou un pack de liens optimisés ne seront plus des garanties suffisantes.

L’algorithme évoluera en permanence au fur et à mesure que les machines apprendront en observant les comportements des internautes.

Alors, que faut-il faire ?

moz machine learningNous entrons dans une nouvelle ère dans laquelle il faudra « oublier » l’algorithme pour se concentrer sur l’expérience utilisateur. Si votre site intéresse les internautes : contenu de qualité, durée de visite élevée, tx de rebond faible… alors Google valorisera votre site car il améliore l’expérience utilisateur de ses services.

Inversement, si votre site est uniquement conçu pour être crawlé, mais n’offre pas une expérience satisfaisante, ou ne répond pas à un besoin utilisateur, il sera déclassé.

Il devient indispensable de prendre en compte l’expérience utilisateur, tant au niveau de la structure de l’information que de l’ergonomie.

Cette excellente présentation de Moz, explique les nouveaux principes SEO à appliquer dans cette ère ou optimisations du crawl, et optimisation utilisateurs doivent cohabiter.

 

Conclusion

Plus que jamais les sites doivent être optimisés pour les humains, et pas seulement pour les crawlers.

Le SEO sort de son aspect purement technique, et demain les sites qui arriveront à se positionner seront ceux qui conjuguent ergonomie de navigation, structure de l’information, qualité de contenus.

Les critères d’optimisation ON SITE deviendront donc de plus en plus importants afin d’améliorer l’expérience utilisateurs et les métriques de qualité de visite.

Ces articles vont aussi vous intéresser

About the author

Consultant en Marketing Digital et CEO de Web Sparkler. Depuis 2009, j’accompagne les entreprises pour réussir sur Internet.
2 Responses

Leave a Reply

L’Auteur

PA MESSNER

Pierre-Alexandre MESSNER

Consultant en Marketing Digital et CEO de Web Sparkler.
Depuis 2009, j’accompagne les entreprises sur Internet. Je suis aussi chroniqueur pour FrenchWeb.

Suivez-moi sur :

Découvrez aussi...