Bonjour à tous
Je ne sais pas si ma question est bien placée, voici mon problème : J'ai un procédé qui concentre légèrement un flux d'eau, la matière sèche passe typiquement de 4 à 10% en entrée et de 7 à 12% en sortie.
Je dispose d'environ 1000 points de mesures où l'on voit la correspondance de la concentration en entrée et celle en sortie.
En faisant un nuage de points on voit bien la corrélation, mais une droite de régression donne un coefficient de corrélation d'environ 0.5, ce qui est un peu logique car des phénomènes de temps de passage et de rétroaction viennent parasiter la corrélation, donc un point est en réalité à un autre plus anciens, mais avec un décalage temporel qui n'est pas constant, et pour compliquer le tout les 2 échantillons ne sont pas prélevés forcement au même moment.
J'ai donc utilisé l'approche suivante :
- J'ai classé les 2 séries de données par ordre croissant indépendamment.
- J'ai vérifié que ces séries obéissent à une loi normale en traçant une droite de Henry, ce qui est le cas
- Enfin j'ai établi une corrélation entre les 2 séries de données classées en ordre croissant, j'obtiens une tendance très propre, mais dont les points ne sont plus du tout liés temporellement
Ma question est la suivante : Est-ce que ce traitement des données reste pertinent ?
-----