Bonjour tout le monde,
je suis en stage et je bloque enfin jmembrouille.
Voila j'ai un jeu de donnée concernant 47819 contrats passés entre des centres de recherches et des entreprises. Une entreprise peu passer plusieurs contrats un ou plusieurs laboratoires
En tout 8 variables :
1) Numero de contrat (cle)
2) Date de signature du contrat
3) durée du contrat
4) Nom du laboratoire
5) Departement scientifique du laboratoire
6) Région du laboratoire
7) Nom de l'entreprise
Secteur d'activité de l'entreprise.
Je dois montrer si oui ou non les entreprises reste fidèle à un ou plusieurs laboratoire.
Je sais pas trop comment m'y prendre
pour l'instant j'ai calculer le nombre de contrats passés pour chaque entreprises ainsi que le nombre de laboratoire qu'elle a fréquentée. Je pensai qu'avec un calcul (nb_lab_diff / nb_contrat) ...
Ou alors faire le test du khi-2 entre la variable nom du labo et nom de l'entreprise : un lien montrerai une certaine fidélité ??
lol quelqu'un à une idée ?
-----