Comparaison de similarités syntaxiques avec Jaccard, Dice, TF-IDF et BM25 en Python

Dans cet article nous verrons comment effectuer des tests de similarités syntaxiques de documents en utilisant différentes méthodes : test de Jaccard, test de Dice, TF-IDF et BM25. Puis nous comparerons certains résultats « à la main ». Rappelons que la similarité syntaxique se base sur la comparaison de chaines de caractères dans des documents. Par exemple […]

Récupérer les mots-clés « Not Provided » de Google Analytics depuis Google Search Console avec Python

Dans cet article, nous verrons comment récupérer les mots-clés dans Google Search Console afin d’enrichir les données Google Analytics « Not Provided ». Nous procèderons pour cela avec un (petit) programme en Python. Qu’est-ce que le « Not Provided » dans Google Analytics ? Vous avez certainement remarqué que dans Google Analytics quand vous souhaitez connaître les mots clés […]

Installer Python en WSGI sur VPS OVHCloud + Plesk

Dans cet article nous verrons comment installer et paramétrer Plesk pour faire tourner du Python en mode WSGI sur un VPS OVHCloud. Notre objectif ici est de pouvoir tester un environnement de déploiement où nous pourrons faire cohabiter un Site Web développé en PHP avec des scripts d’Intelligence Artificielle développés en Python. Le choix d’OVHCloud […]

Covid 19 : Calcul du nombre de jours en réanimation par département

Dans cet article, nous verrons comment déterminer un nombre de jours en service de réanimation par département à partir des données de Santé Publique France, au moyen d’un programme Python. Normalement, si l’on voulait calculer ce nombre de jours de façon certaine, il faudrait avoir un fichier de toutes les observations (c’est à dire dans […]

Etude Données Hospitalières Covid-19 – I

Cette étude observationnelle porte sur les données hospitalières fournies par Santé Publique France relatives au Covid-19 du 18 mars au 20 mai 2020. Nous nous sommes intéressés au Taux de décès par rapport aux hospitalisations cumulées en France par département et par région. Ceci pourrait être intéressant pour évaluer une efficacité hospitalière. L’étude porte sur […]

Comment récupérer des données Google Search Console dans Dataiku DSS 6.0

Dans cet article nous verrons comment récupérer les données de « Performance Web » de votre site (notamment les mots clés) de Google Search Console dans Dataiku Data Science Studio 6.0. Nous ferons ensuite différents traitements sur ces données. Ceci vous permettra de voir une partie de l’étendue des possibilités de DSS dans la manipulation de données […]

Classification de pages Web via Deep Learning – Réseau de Neurones Convolutif

Cet article fait partie d’une série d’articles sur la classification de pages Web dans Google via le Deep Learning. Cette série a démarré par un article sur l’utilisation d’un réseau de neurones à propagation avant ou perceptron multicouches simple. Nous allons cette fois utiliser un Réseau de Neurones Convolutif pour résoudre notre problème. Traditionnellement les […]

Calcul d’un score BERT pour le référencement SEO

Dans cet article nous verrons comment calculer un « score BERT » pour déterminer si une page web est susceptible de répondre à une question posée dans Google. Pour ceux qui n’auraient pas fait attention, l’algorithme BERT a été déployé sur les résultats de Google pour l’anglais aux US depuis le 25 octobre 2019, et depuis le […]

Classification de pages Web via Deep Learning – Réseau de Neurones à propagation avant

Précédemment, nous avions vu, dans une série d’articles l’utilisation d’algorithmes de Machine Learning pour la classification de pages Web. Il s’agissait, dans notre cas, de déterminer la position d’une page dans Google sur un mot clé en fonction de caractéristiques liées à la page ou au site. Dans cette nouvelle série d’articles, nous allons nous […]

Anakeyn TF-IDF Keywords Suggest

Anakeyn TF-IDF Keywords Suggest est un outil de suggestion de mots clés pour le SEO et le Web Marketing. Cet outil récupère les x premières pages Web répondant à une requête dans Google. Ensuite, le système va récupérer le contenu des pages afin de trouver des mots clés populaires ou originaux en rapport avec le […]

En continuant à utiliser le site, vous acceptez l’utilisation des cookies. Plus d’informations

Les paramètres des cookies sur ce site sont définis sur « accepter les cookies » pour vous offrir la meilleure expérience de navigation possible. Si vous continuez à utiliser ce site sans changer vos paramètres de cookies ou si vous cliquez sur "Accepter" ci-dessous, vous consentez à cela.

Fermer