Bonjour,
j'ai un projet de licence...mon projet est de faire l'étiquetage morphosyntaxique des textes arabes en utilisant un réseau de neurone MLP pour faire l'apprentissage a partir d'un corpus étiqueté manuellement. pour faire sa, je peut faire la segmentation du texte puis l'extraction des caractéristiques (ou bien des paramètres) des mots. ces paramètres seront appliquées comme des entrées a mon réseau et à la sortie on trouve qu'il y a un code pour chaque mots a reconnaitre et on fait un apprentissage supervisé.
le problème est: comment je peut codifier les mots arabes par cette methodes?