Mesdames, Messieurs,
Je me permets de laisser un message ici car je souhaite vérifier ma compréhension du réseau de neurones à perceptrons avec rétro propagation des erreurs.
Ayant un travail statistique de scoring à faire sur plus de 300.000 données, j’ai trois variables sur lesquelles je souhaite me concentrer : marge économique, produit et volumétrie pour être complet. Il faut aussi savoir que la population est divisée automatiquement en deux groupes : les B et NB ; il y aura donc un score pour chaque classe.
Pour calibrer mon scoring, plutôt que de déterminer des niveaux arbitraires, je me propose de mettre en place une méthode itérative de RNA.
Ma compréhension du réseau est la suivante.
Les deux couches d’entrée comprennent les données des trois variables considérées, dont le modèle va piocher une donnée sur chaque variable de manière aléatoire. Par suite, il appliquera à chaque variable un poids aléatoire appelé synaptique dans le jargon approprié, c’est ici l’affectation ou la prédiction. Nous obtiendrons donc une valeur en couche de sortie étant le résultat de l’application linéaire des poids aux variables. Ce dernier chiffre sera comparé à un individu moyen déterminé préalablement de la classe (de quelle manière ?). Nous appliquons ici une fonction de transfert, si le résultat trouvé est supérieur à l’individu moyen la fonction de transfert pourra être égale à 1, 0 inversement ; pour une fonction Heaviside. Le modèle fait le total des erreurs de classification commise, si elle est trop importante nous mettrons à jour les poids selon la méthode choisie.
J’ai besoin d’éclaircissements, d’où provient l’individu moyen ?
Quelle fonction de transfert choisir ? Quelle est son utilité ?
Comment choisir le biais de la fonction de prédiction ?
Les poids synaptiques qui sont déterminés par le modèle serviront-ils finalement à affecter un individu bêta dans le futur à partir de ses caractéristiques pour les trois variables ?
Je vous remercie pour les réponses qui me sauveront la vie !
Mille mercis ;
REMI
-----