Bonsoir,
je ne sais pas exactement ce que je cherche, le but de ce post est de trouver des conseils pour m'orienter dans mes travaux.
Je travaille actuellement sur le géocodage d'adresses.
Je dispose d'un référentiel d'adresses contenant toutes les adresses connues d'une ville, département ou région peu importe.
Le but du travail est de faire correspondre les adresses du référentielle avec des adresses que l'on peut rencontrer dans des fichiers du type administratif qui ne sont pas forcément "normées"
Par exemple dans le référentiel je vais avoir
"6 Rue du Général de Gaulle , 55 555 LE VILLAGE"
alors que dans mon fichier d'adresses à localiser je vais rencontrer plutôt
"6, Rue du Gal de Gaulle , Résidence "Le Fleurus", 4ème gauche , 55555 LE VILLAGE"
ou encore
"Le Fleurus , Appt 254 , 6 R du GENERAL DE GAULLE , 55 555-LE VILLAGE"
et encore bien d'autres choses...
Je suis à la recherche d'un cadre théorique pertinent de compréhension syntaxique des adresses (je ne sais pas si c'est exactement la façon de formuler les choses) me permettant par la suite d'élaborer des algorithme de "compréhension" des adresses dans le but de leur normalisation (et séparer l'inutile par exemple "4ème gauche", "Appt 254", le pertinent "6 R du général de Gaulle" et le peut-être pertinent "Résidence "Le Fleurus"")
Voilà si vous avez des idées, des connaissances, des conseils d'approche ou de lecture, je suis tout ouïe !
Merci
-----