Bonjour,

objectif : recherche d'une formule pour connaitre le pourçentage d'originalité dans un document


données pour l'exemple :

- texte de 100 mots

- extrait du texte:
"Selon que l’on considère que l’Homme est représenté par le seul genre Homo..."




Explications :

Afin de connaitre le pourçentage d'originalité dans un document l'outil va creer des groupes de 8 mots à partir du document.
Exemple : "Selon que l’on considère que l’Homme"
L'outil ira ensuite chercher sur Google.com : "Selon que l’on considère que l’Homme"
S'il y a un résultat (en l'occurence 'fr.wikipedia.org/wiki/Préhistoire') cela signifie que le groupe de mots a été copié.

Là se pose le problème, quelle est la formule permettant de connaitre le pourçentage d'originalité dans le document ?


!!! Les groupes de mots sont créés de la manière suivante :
"mot 1 ; mot 2 ; mot 3 ; mot 4 ; mot 5 ; mot 6"
"mot 2 ; mot 3 ; mot 4 ; mot 5 ; mot 6 : mot 7"
...

Il ne suffit pas de faire : 6 / (nb de mot dans le texte) * 100 ; car il s'agit de groupes de mots.

Merci à ceux qui auront le courage de me répondre,