Statistique - Vérifier exactitude des données
Répondre à la discussion
Affichage des résultats 1 à 7 sur 7

Statistique - Vérifier exactitude des données



  1. #1
    erwan44119

    Statistique - Vérifier exactitude des données


    ------

    Bonjour à tous,

    Je cherche à vérifier l'exactitude des classifications données à mes fournisseurs.
    Dans mon entreprise, nous classons nos fournisseurs dans la taxonomie de l'entreprise (sorte d'arbre de classification sur plusieurs niveaux). Par exemple, le fournisseur XXX produisant des pommes va être classé de la manière suivante:
    - Niveau 1: Matière Première
    - Niveau 2: Fruit
    - Niveau 3: Pomme

    Nous avons ainsi plus de 50 000 différentes lignes d'achats classées dans la taxonomie de l'entreprise (un fournisseur peut-être classé plusieurs fois en fonction des différents produits/services fournis).

    Je souhaite donc demander aux personnes en charge des fournisseurs de vérifier si les fournisseurs sont correctement classés dans l'arbre de classification. Par exemple, est ce que mon fournisseur XXX qui produit des pommes est correctement classé dans les trois niveaux ou non ? La réponse attendue est "Oui" ou "Non", il n'y a pas d'autre possibilité de réponse.
    Néanmoins, nous n'avons pas le temps ni les moyens d'effectuer 50000 vérifications. Je souhaiterais donc déterminer l'échantillon de lignes à vérifier afin d'obtenir un pourcentage représentatif sur l'ensemble de mes 50 000 lignes d'achats.

    Etant novice en statistique, je sollicite donc votre aide afin de déterminer l'échantillon et la méthode de vérification à utiliser.

    Merci d'avance

    -----

  2. #2
    minushabens

    Re : Statistique - Vérifier exactitude des données

    Si je comprends bien, tu veux estimer la proportion de lignes bien classées, à partir d'un échantillon aléatoire. Si tu tires au hasard N lignes, et que tu en trouves k bien classées, tu vas estimer la proportion par x=k/N (évidemment) et la variance de cet estimateur sera donnée par x(1-x)/N. La précision de ton estimateur est proportionnelle à la racine carrée de cette variance, en général on donne comme précision + ou - 2 écarts-types (3 si on est pointilleux).

  3. #3
    erwan44119

    Re : Statistique - Vérifier exactitude des données

    Bonjour Minushabens,

    Merci pour ta réponse. Oui c'est effectivement ce que je recherche et ton commentaire m'est d'une grande aide!
    Maintenant si je cherche à savoir le nombre de lignes que je dois tirer aléatoirement afin d'avoir un échantillon représentatif de ces 50000 lignes, sais-tu comment je peux le calculer?

    Merci d'avance,

    Erwan

  4. #4
    minushabens

    Re : Statistique - Vérifier exactitude des données

    pour déterminer à l'avance la taille de l'échantillon, il te faut commencer par te donner une estimation à la louche de la proportion x. Supposons que ce soit 90%. Tu veux maintenant une estimation précise, disons à 1% près. Si N est la taille de l'échantillon, tu prends le plus petit N tel que 2*sqrt(0.9*0.1/N) <= 0.01 je trouve N=3600 dans ce cas (à toi de remplacer 90% et 1% par des valeurs convenables)
    Dernière modification par minushabens ; 29/06/2018 à 10h41.

  5. A voir en vidéo sur Futura
  6. #5
    erwan44119

    Re : Statistique - Vérifier exactitude des données

    Merci beaucoup!
    J'imagine qu'il n'y a donc pas de formule permettant d'obtenir l'échantillon optimal en fonction du nombre de lignes totales et de la précision de l'estimation souhaitée?
    Par exemple, N étant la nombre total de lignes et n l'échantillon optimal, si nous souhaitons une précision à 5% lors de la vérification, n devra être égal à XXX.

  7. #6
    minushabens

    Re : Statistique - Vérifier exactitude des données

    si tu supposes que le nombre total de lignes est très grand, la formule je te l'ai donnée. Toujours avec x=0.9, pour une précision de 5% (2 écart-types) je trouve N=144.

  8. #7
    erwan44119

    Re : Statistique - Vérifier exactitude des données

    Merci, c'est le résultat que je trouve également

Discussions similaires

  1. [Statistique] Elimination des données parasites.
    Par destroyedlolo dans le forum Mathématiques du supérieur
    Réponses: 10
    Dernier message: 11/12/2016, 19h12
  2. regroupement statistique (profilage de données)
    Par nicopat dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 25/01/2016, 16h14
  3. Peu de données pour un test statistique
    Par sitingbull dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 07/08/2015, 08h36
  4. Statistique : comment calculer mediane pour des données groupées et données groupées en classes
    Par hilal9207 dans le forum Mathématiques du collège et du lycée
    Réponses: 1
    Dernier message: 28/12/2012, 20h44
  5. Analyse statistique des données
    Par julien_4230 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 03/03/2011, 20h11