Comparaison de similarités syntaxiques avec Jaccard, Dice, TF-IDF et BM25 en Python
Dans cet article nous verrons comment effectuer des tests de similarités syntaxiques de documents en utilisant différentes méthodes : test de Jaccard, test de Dice, TF-IDF et BM25. Puis nous comparerons certains résultats « à la main ». Rappelons que la similarité syntaxique se base sur la comparaison de chaines de caractères dans des documents. Par exemple […]