Bonjours,
Je reviens vers ce forum, comme je cherche à résoudre un problème de prédiction de la défaillance des PME en France.
Le problème c'est bien les données (je n’ai pas accès aux bases privées : /, j’utilise l’Insee). L’Insee donne des données annuelles (enfin trimestrielles) concernant un grand nombre d’entreprises pour un secteur donné… Il s’agit des totaux (par exemple: j’ai le totale des défaillances qui n’est pas binaire, mais je divise par le nombre d’entreprises –fourni heureusement-, ce qui me permet d’avoir au moins des probas en sortie). Voila ce que je veux faire en gros :
Régression logistique : F1 + F2 + F3 + … + F7 = Output
Où les Fi sont des facteurs permettant d’expliquer l’Output (ratios financiers qui sont les totaux des ratios pour toutes les entreprises appartenant à chaque secteur dont je connais bien le nombre).
Et l’Output = nombre de défaillances/nombre d’entreprises pour l’année j.
Le problème est que le nombre j d’année = 5 (ans), ce qui fait que le tableau de la régression n’a que peut de lignes et donc l’info dont on peut titrer de la régression n’a pas trop de sens.
La question est : si les Fi sont des totaux de ratios financiers (et dont je peux construire, en divisant par le nombre d’entreprises, les moyennes de ces ratios, supposant que c’est M). Serait-il licite de construire un échantillon aléatoire via Excel par exemple suivant la loi normale d’espérance = M et de variance au choix ?? Ne serait – il pas mieux d’utiliser d’autre loi (la loi uniforme par exemple) ?
Si vous avez des idées pour les commandes Excel, je suis preneur !!
Bonne vacances pour tous et Merci d’avance pour votre aide chers futuristes!
-----