Ca fait deux ans que je vois passer des dialogues avec des agents conversationnels, j'en ai plusieurs millions dans mes bases de données. Ma pratique me permet de vous dire que vous avez tous les deux raison ou tous les deux tort
MMY a raison dans la mesure où les sens exprimés sont effectivement très limités : statistiquement on retrouve toujours les mêmes idées, les mêmes thèmes, les mêmes enchainements de discussions.
Par contre Agyre a raison dans la mesure où l'on n'observe pas de stabilisation de la façon d'exprimer ces idées. Même si les phrases tapées ne font pas plus d'une dizaine de mots. La combinatoire des langues naturelles, leur polysémie, les erreurs de frappe et de formulation, font qu'il n'est pas réaliste (d'un point de vu pratique) d'espérer stocker toutes les formes dans une base.
-----