Bonjour,
objectif : recherche d'une formule pour connaitre le pourçentage d'originalité dans un document
données pour l'exemple :
- texte de 100 mots
- extrait du texte:
"Selon que l’on considère que l’Homme est représenté par le seul genre Homo..."
Explications :
Afin de connaitre le pourçentage d'originalité dans un document l'outil va creer des groupes de 8 mots à partir du document.
Exemple : "Selon que l’on considère que l’Homme"
L'outil ira ensuite chercher sur Google.com : "Selon que l’on considère que l’Homme"
S'il y a un résultat (en l'occurence 'fr.wikipedia.org/wiki/Préhistoire') cela signifie que le groupe de mots a été copié.
Là se pose le problème, quelle est la formule permettant de connaitre le pourçentage d'originalité dans le document ?
!!! Les groupes de mots sont créés de la manière suivante :
"mot 1 ; mot 2 ; mot 3 ; mot 4 ; mot 5 ; mot 6"
"mot 2 ; mot 3 ; mot 4 ; mot 5 ; mot 6 : mot 7"
...
Il ne suffit pas de faire : 6 / (nb de mot dans le texte) * 100 ; car il s'agit de groupes de mots.
Merci à ceux qui auront le courage de me répondre,
-----