Comparaison de similarités syntaxiques avec Jaccard, Dice, TF-IDF et BM25 en Python

Dans cet article nous verrons comment effectuer des tests de similarités syntaxiques de documents en utilisant différentes méthodes : test de Jaccard, test de Dice, TF-IDF et BM25. Puis nous comparerons certains résultats « à la main ». Rappelons que la similarité syntaxique se base sur la comparaison de chaines de caractères dans des documents. Par exemple […]

Calcul d’un score BERT pour le référencement SEO

Dans cet article nous verrons comment calculer un « score BERT » pour déterminer si une page web est susceptible de répondre à une question posée dans Google. Pour ceux qui n’auraient pas fait attention, l’algorithme BERT a été déployé sur les résultats de Google pour l’anglais aux US depuis le 25 octobre 2019, et depuis le […]

Anakeyn TF-IDF Keywords Suggest

Anakeyn TF-IDF Keywords Suggest est un outil de suggestion de mots clés pour le SEO et le Web Marketing. Cet outil récupère les x premières pages Web répondant à une requête dans Google. Ensuite, le système va récupérer le contenu des pages afin de trouver des mots clés populaires ou originaux en rapport avec le […]

Scraping des pages Web pour enrichissement avant Machine Learning

Cet article fait suite aux 4 articles précédents : Classification de pages Web pour le SEO via le Machine Learning avec Python Récupérez des données de positionnement de vos pages via Google Search Console API Modèle Interne : test de classification de pages via le Machine Learning pour un seul site Classification de pages via […]

Comparatif Macron Wauquiez Mélenchon Le Pen avec TwitteR

Dans cet article nous verrons comment récupérer des tweets avec le logiciel R et la bibliothèque TwitteR. Nous verrons aussi comment extraire des données textuelles de ces tweets et essayer de les rendre intelligibles. Pour cet exercice nous avons choisi de traiter des tweets concernant des personnalités politiques. à savoir, ici : Emmanuel Macron, Laurent […]

En continuant à utiliser le site, vous acceptez l’utilisation des cookies. Plus d’informations

Les paramètres des cookies sur ce site sont définis sur « accepter les cookies » pour vous offrir la meilleure expérience de navigation possible. Si vous continuez à utiliser ce site sans changer vos paramètres de cookies ou si vous cliquez sur "Accepter" ci-dessous, vous consentez à cela.

Fermer