Distribution statistique et tendance
Répondre à la discussion
Affichage des résultats 1 à 6 sur 6

Distribution statistique et tendance



  1. #1
    CygneACrete

    Lightbulb Distribution statistique et tendance


    ------

    Bonjour,

    Je suis développeur informatique, et m'adresse à vous car certaines connaissances mathématiques me manquent pour achever un projet.

    Pour synthétiser: Dans le cadre du développement d'une application de statistique, je veux présenter une série de données à 4 variables, chacune exprimées en pourcentage et dont la somme est constante et égale à 200%. La présentation se fait dans un cercle et sur 4 axes en utilisant le centre comme point de référence, le zéro, chaque variable ayant un axe attribué.

    Représenter chaque variable sur son axe est très simple, là où se situe le problème est que je veux également présenter un point unique représentant la "tendance" de chaque ensemble de données (par groupe de 4 valeurs donc), afin d'obtenir un nuage de point avec l'ensemble des données.

    Exemple illustré:
    L'ensemble de donnée échantillon utilisé est (A, B, C, D, en %) {100, 0, 0, 100}, ce qui en représentation vectoriel donne deux vecteurs à leur maximum (OA et OD), les deux autres restant à zéro au centre. Le but est d'avoir une approche me permettant d'afficher un vecteur "tendance" des deux, qui se représenterai sur le graphique d'exemple en OE' (donc sur le cercle unitaire), or lorsque j'additionne les vecteurs OA et OD (Loi de Chasles sauf erreur) je me retrouve avec le vecteur OE, qui sort de mon cercle "unitaire".

    Nom : exemple.jpg
Affichages : 32
Taille : 33,5 Ko

    En faisant tourner l'algorithme sur l'ensemble de toutes les données j'obtiens une distribution statistique en losange au lieu de cercle (logique, Chasles), et en normalisant les vecteurs en les divisant par 200 (somme constante pour chaque ensemble), je me retrouve tout simplement avec un losange plus petit (à nouveau logique)

    J'ai essayé plusieurs approches (moyenne, baricentre, somme vectorielle, polaires...) mais je n'arrive pas à obtenir une distribution statistique restant en cercle.

    Je sent bien qu'il y a une notion mathématique derrière cette présentation qui m'échappe, d'où ma demande ; Sauriez vous m'orienter vers le théorème, fonction, approche ou loi que je devrais étudier afin d'aborder cette problématique de représentation de manière plus pertinente ?

    Bien évidement n'hésitez pas à me demander des informations ou précisions complémentaires au besoin.

    Merci du temps que vous avez pris à me lire et pour les éventuelles pistes que vous pourrez me fournir

    Cordialement

    -----

  2. #2
    Lyris

    Re : Distribution statistique et tendance

    En gros comme il y a 4 points tu vas avoir un losange. Si tu as besoin d'une distribution en cercle il te faut plus de point, genre 50 et là ça va déjà ressembler a un cercle.

  3. #3
    CygneACrete

    Re : Distribution statistique et tendance

    Bonjour,

    Merci de votre réponse, cependant j'ai probablement dû mal m'exprimer :

    * Je dispose de N ensembles, chacun de ces ensembles possèdent 4 variables.
    * Pour chacun de ces ensembles je ressors une sorte de "moyenne" (point unique à deux coordonnées X/Y dans l'espace).
    * Le nuage de point généré par toutes ces "moyennes" génère une forme de carré

    (je dispose en l'état d'une série d'environ 3000 ensembles)

    En espérant avoir été plus clair

    Cordialement
    Dernière modification par CygneACrete ; 24/03/2015 à 07h42.

  4. #4
    gg0
    Animateur Mathématiques

    Re : Distribution statistique et tendance

    Bonjour.

    Avec cette façon de faire, tu ne moyennes pas les 4 variables, mais tu les équilibres 2 à 2 (A avec C, B avec D), puis tu traces une résultante qui n'a à priori pas de signification (elle n'est pas portée par l'un des deux axes). Il est toujours possible de faire des calculs et des représentations de ces calculs, même si ça n'a aucun sens.
    Sans connaissances sur la signification des 4 variables, je ne peux que te conseiller d'éviter de faire n'importe quoi. Si tu veux faire un bilan sur ta population, tu peux le faire variable par variable puis représenter les moyennes.
    Si tu en dis plus sur les liaisons entre ces variables, sur le pourquoi 200% (c'est quand même plutôt inhabituel), sur pourquoi une représentation en cercle (un demi cercle donnerait tout autre chose), ... je pourrai peut-être te conseiller.

    Cordialement.

  5. A voir en vidéo sur Futura
  6. #5
    CygneACrete

    Re : Distribution statistique et tendance

    Bonjour,

    Merci de votre réponse, voici donc quelques informations complémentaires :

    La somme constante égale à 200% est un simple constat (j'ai parcourt toute la série de donnée en faisant la somme de chaque ensemble, et ai constaté ce résultat constant, il y a quelques ensemble qui ne le sont pas mais ce sont des bogues isolés, l'application générant les données étant réputée instable, c'est d'ailleurs pourquoi j'interviens)

    L'application est une application de profilage psychologique.
    * Chaque ensemble est (une petite partie) d'un profile psychologique. (Les autres parties sont achevées, ce point est le dernier me bloquant)
    * Chaque axe représente une caractéristique psychologique, qui semblent chacune distinctes les unes des autres, et que l'on peut imager "naïvement" pour travailler avec les quatre éléments eau, feu, terre, air (n'ayant pas accès au code générant les données je ne peux pas confirmer ou infirmer l'aspect distinct des variables)

    Pour la représentation en cercle, c'est simplement le contexte qui veut ça, c'est une nécessite de cette statistique.
    J'ai déjà une représentation sur les 4 axes de chaque variable et cherche à représenter avec un point unique issu des 4 variables la "tendance/dominance" d'un profile vis à vis des 4 axes, tout en restant dans le cercle.

    A quelle représentation en demi-cercle penses-tu exactement ? Peut-être pourrais je l'adapter en utilisant les couples de variables opposées sur les axes...

    En espérant que ces informations aient un peu éclaircit la problématique.

    Cordialement.

  7. #6
    gg0
    Animateur Mathématiques

    Re : Distribution statistique et tendance

    Je crois qu'il va falloir que tu voies les donneurs d'ordre pour savoir ce qu'ils veulent. Si tes 4 caractéristiques sont indépendantes, il te faut les représenter en 4 dimensions. Mais je ne sais pas trop ce qu'on en tirera (c'est une des difficultés qu'on a en ACP). En tout cas, ce que tu fais donne des résultats qui dépendent fortement de la façon de placer les caractéristiques les unes par rapport aux autres.

    Enfin le 200% est très douteux. Ne serait-ce pas simplement que tes caractéristiques vont par 2 (partage de 100% en deux pourcentages, l'un pour une caractéristique, l'autre pour l'autre), ce qui nécessite de savoir lesquelles et de les représenter en opposition.

    En tout cas, il te faut savoir exactement ce qui se passe et voir avec les donneurs d'ordre ce qu'ils vont lire.

    Cordialement.

Discussions similaires

  1. Statistique - donner la distribution
    Par invite8740d5f2 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 09/06/2011, 17h37
  2. Physique statistique: distribution de Boltzmann
    Par membreComplexe12 dans le forum Physique
    Réponses: 20
    Dernier message: 31/12/2010, 14h23
  3. Distribution statistique
    Par invite87ed8069 dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 12/04/2010, 18h47
  4. Distribution statistique jitter
    Par KHEOPS1982 dans le forum Électronique
    Réponses: 3
    Dernier message: 23/08/2009, 19h11