Tout a fait d'accord avec vous sur le fond, mais ca n'empeche pas d'apprendre les regularites statistiques d'utilisation du mot, ce qui n'est pas tout a fait rien. (pour le 'sens profond' du mot c'est une autre affaire evidemment)
Il est par exemple difficile de faire comprendre le sens du mot 'rouge' a un programme informatique qui n'a pas acces a un capteur visuel.
Perso je parlerai de relations sensorimotrices plutot que de 'réalité organique ressentie' comme l'a dit gillesh38, mais on parle probablement de la meme chose au fond?
euh, ben concretement, lis des milliers de pages web en chinois, sans autre information visuelle et auditive (pas de photos ni de videos) et tu me diras si tu as appris le chinois comme ça.... c'est pas parce que tu as repéré que tel idéogramme se retrouve souvent à coté de tel autre que ça va t'apprendre quoi que ce soit !
en revanche, si tu as des photos, tu as une petite chance de "comprendre" quelques idéogrammes (par exemple comment on écrit "Nicolas Sarkozy" en chinois ).
C'est juste. Je suis entouré de quelques jeunes enfants... et leur apprendre les couleurs n'est pas une mince affaire, même avec leurs capteurs visuels
Et assez curieusement, il est plus facile pour eux de répondre à "de quelle couleur est une tomate ?" plutôt qu'à "quelle couleur est-ce ? [en désignant une tomate]"
Or, WA est dans le premier cas, c'est à dire une base de connaissances
Est-on d'accord pour dire que ci on dote un ordinateur d'un corps, ces limitations disparaissent (ou au moins se réduisent) ?Perso je parlerai de relations sensorimotrices plutot que de 'réalité organique ressentie' comme l'a dit gillesh38, mais on parle probablement de la meme chose au fond?
intéressant de comparer le robot à un enfant , puisque le but De l' IA est de reproduire les capacités intellectuelles de l'humain , et celui la en particulier le langage , oui pourquoi ne pas le comparer à un enfant à qui l'on apprend à parler
L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances, compétences, d'attitudes ou de valeurs culturelles, par l'observation, l'imitation, l'essai, la répétition, la présentation.
( tiré de Wikipédia )
un enfant apprend donc à parler en observant en imitant en essayant en répétant
mais le robot , si je lui dit 50000 fois le même mot , sera il capable de le réutiliser convenablement dans une phrase ?
C'est mon avis oui. En tout cas lui donner des capacites sensori-motrices (donc un corps) proches des notres me semble en tout cas une condition necessaire pour que celui-ci puisse construire un sens lui aussi-proche du notre. Mais bon il restera aussi un travail enorme sur d'autres aspects plus 'logiciels'.
Si a chaque fois que vous l'avez utilise dans un exemple celui-ci etait utilise 'convenablement' alors un robot est potentiellement capable de le reutiliser aussi convenablement que vous dans les memes phrases et potentiellement de generaliser a des variantes (dans une certaine mesure evidemment et avec un risque d'erreur). Pour cela il lui suffit d'extraire les statistiques d'occurrence de ce mot en association avec d'autres.
De la a dire qu'il comprend le mot c'est un autre probleme.
Regardez l'argument de la chambre chinoise de Searle.
Je crois vous confondez les choses . Car pour extraire et restituer du sens , je pense pas qu'il soit nécessaire d'équiper les robots d'appareil sensitif comme les nôtres . C'est justement l'intérêt d' une approche purement mathématique, elle permet de rationaliser l'information, la hiérarchiser,l'optimiser . Ce qui est remarquable si WA tient ses promesses , c'est l'exploitation non des mots en eux même, mais les liens et la "mécanique" qui les unie , et c'est il me semble une approche tout à fait intéressante et prometteuse .Envoyé par Philder...lui donner des capacites sensori-motrices (donc un corps) proches des notres me semble en tout cas une condition necessaire pour que celui-ci puisse construire un sens lui aussi-proche du notre.
l'argument de searle me parait assez logique , désolé philder mais je me suis mal exprimé :
mais le robot , si je lui dit 50000 fois le même mot , sera il capable de le réutiliser convenablement dans une phrase ?
évidemment s'il redit ma phrase le mot sera juste ,
maintenant si je lui dit
- les grenouilles sont vertes
- les arbres sont verts
- mes chaussure sont vertes
comment saura il la signification de ce mot , est ce qu'il pourra dire que les pommes sont vertes si l'on ne lui a pas déjà transmises ces informations
sinon je joue à un mmorpg et je cottoie des informaticiens , certains d'entre eux ont créé une sort d' IA , soit un programme qui permette de jouer à la place des joueurs quand ils ne sont pas la , j'ai discuté avec certains d'entre eux et il y avait une difficulté , pour progresser dans le jeu on doit taper des codes , un code de 3 letres du genre CAA , BBB , XXX , on retrouve souvent ces codes notamment pour s'inscrire dans ce forum , qui sont en fait un dessin
il faut donc un programme capable de décrypter le dessin et de le convertir en lettre , ceux qui est très difficile , même pour un informaticien ,
si l'on créé un programme très puissant et qu'on puisse associer des mots à des images ( en couleur )
ça résoudrait peut être le problème de la pomme mais l'ordi ne saurait toujours pas qu'il parle
d'ailleurs ça me rappelle un article que j'ai lu récemment sur un chercheur qui associait les animaux à des machines , enfin certains animaux , ceux qui n'ont pas " conscience de soi"
en gros ne saurions pas nous même des machines évoluées capables de retransmettre des informations à notre progéniture
qu'est ce que j'entends par la : si on programme un robot dont la fonction première serait de survivre , il faudrait lui expliquer des milliers de chose pour qu'il survive
mais quand une personne ou un animal naît il connaît déjà ces choses
L'histoire était la suivante : un homme va au restaurant, commande un hamburger, on lui sert un hamburger carbonisé, l'homme s'en va sans payer. On demande à l'ordinateur : “A-t-il mangé le hamburger ?”. Il répond par la négative.
auteurs étaient très contents de ce résultat, qui était censé prouver que l'ordinateur possédait les mêmes capacités de compréhension que nous. C'est à ce moment-là que j'ai conçu l'argument de la chambre chinoise. »
désolé je vais paraître très présomptueux mais je vais dire que searle avait raison mais pas de la façon dont il entendait , l'ordinateur répond qu'il n'a pas mangé d' hamburger parce qu'on ne lui a pas dit qu'il avait mangé un hamburger tout simplement , si on lui avait demandait a t' il dansé il aurait aussi répondu non ,
et les programmeurs le savent très bien eux aussi puisque ce sont eux qui ont conçu le programme , ils ont seulement voulu faire croire aux gens que l'ordi était "plus intelligent que ce qu'il n'était "
Pas plus que n'importe quel enfant (ou adulte).
Si tu dis ceci à un programme capable de percevoir les couleurs (si tu lis passe des photos par exemple) alors oui, il est possible d'obtenir un programme capable de dire, si tu lui passes une photo d'un saladier vert, que celui ci est vert.maintenant si je lui dit
- les grenouilles sont vertes
- les arbres sont verts
- mes chaussure sont vertes
Je ne suis pas d'accord, en tout cas pas completement. Je suis bien d'accord que WA peut exploiter des liens entre les mots comme vous le mentionnez. C'est ce que je voulais dire quand je parlais d'extraire la structure statistique, et a partir de la d'en deduire d'autres aspects, par exemple des hierarchies de concepts etc... Neanmoins et c'est la ou on retombe sur la chambre chinoise, s'il traite des donnes de ce type et en ressort d'autres d'une maniere coherente et 'sensee' cela ne veut pas dire pour autant qu'il les comprenne vraiment. Le probleme c'est qu'il est difficile de trancher de maniere claire sur cette question. Certains diront que s'il traite ca de maniere coherente il comprend, et d'autres qu'il manque quelque chose.Je crois vous confondez les choses . Car pour extraire et restituer du sens , je pense pas qu'il soit nécessaire d'équiper les robots d'appareil sensitif comme les nôtres . C'est justement l'intérêt d' une approche purement mathématique, elle permet de rationaliser l'information, la hiérarchiser,l'optimiser . Ce qui est remarquable si WA tient ses promesses , c'est l'exploitation non des mots en eux même, mais les liens et la "mécanique" qui les unie , et c'est il me semble une approche tout à fait intéressante et prometteuse .
Quand vous dite que le potentiel de WA vient du fait qu'il exploite les liens et la mecanique qui unit les mots, par opposition aux mots eux-meme, alors je dis rien de neuf sous le soleil. C'est ce que font beaucoup de traducteurs automatiques, c'est ce que fait google quand il propose des completions de recherche, et c'est un des fondements de tout traitement semantique automatise. Apres peut-etre qu'il y aura un saut qualitatif par rapport aux programmes existants, lie a la sophistication des techniques d'extraction et de structuration de l'information, mais pour l'instant il est difficile d'en dire quoi que ce soit sans connaitre precisement les techniques utilisees.
Alors j'admet que l'on atteigne un certain niveau de 'restitution du sens' peut etre meme extremement eleve, mais on risque malgre tout de buter a un moment donne sur une frontiere (qui serait peut-etre celle separant ces systemes d'une IA forte), car il manquera au programme les aspects sensorimoteurs, ou comme l'a dit gillesh38 la 'réalité organique ressentie' , qui pour nous sont au coeur du sens que l'on donne au mot. C'est pour ca qu'il me semble que pour atteindre une IA forte dans le sens ou elle comprend le monde comme nous le faisons il faut qu'elle soit incarnee. Mais je me trompe peut-etre, et qui sait, peut-etre que les aspects qui me semblent absents peuvent finalement etre extraits de corpus textuels, mais ca me semble difficile.
Non evidemment il ne pourra pas dire cela. En termes de statistiques des mots il pourra tenter d'associer des noms avec vert. Et du coup si il a pomme dans sa liste des noms existants il pourra potentiellement 'essayer' la phrase 'les pommes sont vertes'.
Mais en meme temps rien ni personne ne peut inferer que les pommes sont vertes avec seulement le corpus de 3 exemples textuels donne ici.
Par contre, comme l'a dit Faith, et cela se fait deja, on peut prendre 3 photos, une grenouille, un arbre, une chaussure et y associer les 3 phrases que vous avez cite. Un systeme d'apprentissage constaterait alors un invariant dans ces photos, la couleur verte, qui est associe a un invariant dans le texte, 'vert'. A partir de cela il peut apprendre a associer une image contenant du vert au mot 'vert'.
Bonjour,
Comme tout le monde qui s'intéresse au problème de traitement du langage naturel et de la représentation des connaissances, j'attends avec impatience la release de Wolfram alpha.
Novak ne semble pas être la seule personne a avoir eu droit à une démo. Douglas Lenat a aussi pu le tester, et il relate son expérience sur son blog : http://semanticuniverse.com/blogs-i-...ram-alpha.html . Pour mémoire Lenat est le responsable du projet CYC qui a une visée similaire à celle de Wolfram alpha. Lenat ecrit entre autre dans son ticket " Alpha excels at not just retrieving the stored data but performing various appropriate numeric calculations on the data, and displaying the results in beautiful graphs and easily comprehended tables for the user.", il insiste d'autre part beaucoup sur le couplage avec Mathematica.
En lisant son ticket, il me semble comprendre que Wolfram alpha analyse la requête en langage naturel, extrait les concepts principaux et va chercher dans la base de mathematica si des données calculables peuvent être restituée autour de ces concepts.
"so if you type in something like "gdp France / Germany", it calculates and returns a graph of the relative fraction of France's annual GDP to Germany's GDP, over the last 30 years or so."
En ce sens, c'est effectivement très différent de google qui retournerait l'info si un utilisateur a un jour créé la page. Dans le cas de wolfram Alpha la donnée est restituée car le système posséde des données, la connaissance des équations dans lesquelles ces données sont mises en jeu, et la possibilité de fournir la solution à ces équations
GCS/S s: a C++ DI++>+++ UL++A++HIS++$ P++>+++$ E+>++$ W+>++$ N+ Y+ e++++ t+++ y+++
Je confirme
http://forums.futura-sciences.com/co...ml#post2240022
Je vais d'ailleurs proposer la fusion des deux fils si ça ne dérange personne.
Dernière modification par Philou67 ; 13/03/2009 à 10h06. Motif: Citation inutile
“I'm smart enough to know that I'm dumb.” Richard Feynman
Difficile de fusionner parce que les dates des messages se chevauchent et qu'il est souhaitable, par cohérence avec la page d'accueil de FS, de garder la référence au texte de l'actualité comme premier message dans le forum Commentez les actus... ce qui ne serait pas possible en cas de fusion.
Par contre je ferme cette discussion (on pourra toujours revenir sur cette mesure en cas de désaccord majeur) et je mets un lien vers elle dans le fil des actualités.
Rien ne sert de penser, il faut réfléchir avant - Pierre Dac
Finalement je reviens sur ce que je viens de dire : je laisse cette discussion ouverte, je ferme l'autre, nettement moins développée et je renvoie vers celle-ci
Rien ne sert de penser, il faut réfléchir avant - Pierre Dac
“I'm smart enough to know that I'm dumb.” Richard Feynman
Et bien voilà sa traduction en fr avec Live Search IE8 RC1 et c'est pas encore ça ce qui veut dire que l'ordi est loint de comprendre ce qu'il traduit alors de là à comprendre ce qu'il y a sur le WEB ça me semble encore plus compliquéla lecture du lien fourni par Mtheory me donne de l'espoir. Wolfram decrit tres bien une revolution majeure de l'histoire de l'humanite qui est sur le point de se produire. En tout cas, je le crois. Et je crois aussi Wolfram tout a fait capable d'etre un acteur majeur dans cette revolution.
Merci beaucoup pour ce lien !
Mathematica a été un grand succès dans le traitement très large de toutes sortes de systèmes techniques formelles et de connaissances.
Mais quid de tout autre ? Qu'en est-il tous les autres connaissances systématique ? Toutes les méthodes et modèles et les données, qui existe ?
Il y a cinquante ans, lorsque les ordinateurs étaient jeunes, personnes supposé qu'ils vous rapidement pouvoir gérer toutes ces sortes de choses.
Et, qu'il serait en mesure de poser un ordinateur toute question de fait et qu'il calculer la réponse.
Mais il n'a pas travailler hors de cette façon. Ordinateurs ont pu faire plusieurs choses remarquables et inattendues. Mais pas.
Cependant, j'avais toujours pensé que finalement il devrait être possible. Et il y a quelques années, j'ai réalisé que j'étais enfin dans une position pour essayer de le faire.
J'ai eu deux ingrédients essentiels : Mathematica et NKS. Avec Mathematica , j'ai eu un langage symbolique pour représenter quelque chose — ainsi que le pouvoir algorithmique de faire n'importe quel type de calcul. Et avec NKS, j'ai eu un paradigme pour comprendre comment toutes sortes de complexité pourraient découler de règles simples.
Mais quid de la connaissance réelle qu'en tant que les êtres humains, nous avons accumulé ?
Beaucoup d'il est maintenant sur le web — en milliards de pages de texte. Et avec les moteurs de recherche, nous peut très efficacement rechercher des termes précis et des expressions dans ce texte.
Mais nous ne peut pas calculer de qui. Et, en effet, nous peut uniquement répondre les questions qui ont été littéralement demandées avant. Nous pouvons chercher choses, mais nous ne peut rien de nouveau les figure.
Comment donc peut nous traiter que ? De plus, certaines personnes ont pensé à que la voie doit être de quelque sorte automatiquement comprendre la langue naturelle qui existe sur le web. Peut-être l'obtention de la web sémantiquement marqué pour faciliter la qui.
Mais armés de Mathematica et NKS j'ai réalisé il y a une autre façon : implémenter explicitement des méthodes et de modèles, comme les algorithmes et présenter explicitement toutes les données afin qu'il soit immédiatement calculable.
Il n'est pas facile pour ce faire. Chaque type de méthode et le modèle différent — et des données — possède ses propres caractéristiques spéciales et le caractère. Mais avec un mélange d'automatisation Mathematica et NKS et beaucoup d'experts humaines, je suis heureux de dire que nous avons obtenu un très long chemin.
Mais, OK. Let’s dire nous réussir à créer un système qui connaît beaucoup de choses et peut déterminer un lot. Comment pouvons nous interagir avec lui ?
La façon d'humains communiquent normalement est par le langage naturel. Et lorsqu'il un du traite de toute la gamme de connaissances, je pense que c'est l'option seulement réaliste pour communiquer avec les ordinateurs trop.
Bien entendu, obtenir des ordinateurs de traiter le langage naturel est devenu incroyablement difficile. Et, par exemple, nous sommes encore très loin d'avoir des ordinateurs comprendre systématiquement des volumes importants de langage naturel texte sur le web.
Mais si un est déjà fait connaissance calculable, un n'a pas besoin de faire ce genre de compréhension du langage naturel.
Tous les besoins un pouvoir faire est de prendre les questions que les gens demandent en langage naturel et de les représenter dans un formulaire précis qui s'intègre dans les calculs, on peut faire.
Bien entendu, même qui a jamais été fait en toute généralité. Et il est rendu plus difficile par le fait qu'un ne souhaitez simplement gérer une langue comme anglais : un veut également être capables de gérer tous les notations de sténographie personnes dans l'utilisation de chaque champ possible.
Je n'étais pas à tous les assurer, qu'il allait travailler. Mais je suis heureux de dire qu'avec un mélange de nombreux algorithmes astucieux et heuristiques, beaucoup de découverte linguistique et curation linguistique, et ce probablement équivaut à certains graves percées théoriques, nous sommes réellement gestion faire fonctionner.
Tirant tous ensemble pour créer un moteur de connaissances informatiques vrai est une tâche très difficile.
C'est certainement le projet plus complexe que j'ai jamais entrepris. Impliquant beaucoup plus de types d'expertise — et des pièces plus déplacement — que j'ai jamais eu à assembler avant.
Et — comme Mathematica , ou NKS — le projet sera jamais être terminé.
Mais je suis heureux de dire que nous avons presque atteint le point où nous nous sentons que nous peut exposer la première partie de celle-ci.
Ça va être un site Web : www.wolframalpha.com . Avec un champ d'entrée simple, qui donne accès à un système énorme, avec trillions de morceaux de données organisées et des millions de lignes d'algorithmes.
Nous tous travaillons très dur dès maintenant pour obtenir Wolfram|Alpha prêt à aller en direct.
Je pense que ça va être très excitant. Un nouveau paradigme pour utiliser des ordinateurs et le web.
Qui nous renvoie presque à ce que les gens pensaient ordinateurs pourront faire il y a 50 ans !
C'est vrai qu'il pense ne pas avoir besoin d'une compréention du langage pour répondre à une question
Et les développeur de traduction automatique le pense aussi visiblement mais on voit que le résultat n'est pas à la hauteur
Mais si un est déjà fait connaissance calculable, un n'a pas besoin de faire ce genre de compréhension du langage naturel.
Tu compares le résultat d'un truc connu (la traduction) qui ne marche pas bien à un projet novateur et qui intervient sur un sujet différent (le recoupement d'information).
Comment veux-tu avoir la moindre chance de tirer une conclusion valable en comparant deux domaines qui n'ont rien à voir ?
Effectivement l'un fonctionne et l'autre est un projet mais rien ne m'interdit de les comparer.Tu compares le résultat d'un truc connu (la traduction) qui ne marche pas bien à un projet novateur et qui intervient sur un sujet différent (le recoupement d'information).
Comment veux-tu avoir la moindre chance de tirer une conclusion valable en comparant deux domaines qui n'ont rien à voir ?
J'ai travaillé durant mes études avec Prolog, un langage de déclaration de données basé sur la logique des prédicats et il pouvait trouver des connaissances que nous ne lui avions pas fournis.
Mais il avait une compréention des données que nous lui avions rentré grace à sa base de connaissances.
Nous verrons le résultat au mois de mai.
Neanmoins et c'est la ou on retombe sur la chambre chinoise, s'il traite des donnes de ce type et en ressort d'autres d'une maniere coherente et 'sensee' cela ne veut pas dire pour autant qu'il les comprenne vraiment. Le probleme c'est qu'il est difficile de trancher de maniere claire sur cette question. Certains diront que s'il traite ca de maniere coherente il comprend, et d'autres qu'il manque quelque chose.
Oui oui je suis d'accord et d'ailleurs je te remercie de parler de l'argument de la chambre chinoise de Searle, ça me parait tout à fait censé.
Moi cela me parait au contraire assez neuf, pas qu'on s'y intéresse mais qu'une application puisse être opérationnelle .Quand vous dite que le potentiel de WA vient du fait qu'il exploite les liens et la mecanique qui unit les mots, par opposition aux mots eux-meme, alors je dis rien de neuf sous le soleil. C'est ce que font beaucoup de traducteurs automatiques, c'est ce que fait google quand il propose des completions de recherche, et c'est un des fondements de tout traitement semantique automatise.
Google ne fait pas du tout cela, puisqu'il se contente de remonter l'info sous forme de citations ; et qu'il utilise des statistiques assez basiques, sur l'existence des occurrences dans des secteurs clés des pages, plus d'autre paramètres logiques par rapport à la pertinence d'une url .
WA semble procéder de façon très différente. D'une part il pourrait analyser le sens de la question, ce qui est différent d'une requête passée sur Google , et d'autre part il restituerait la réponse non par simple citation mais par synthèse sur la base de sa connaissances des mots , et aussi des concepts plus vague de temps , d'espace, d'opposition, d'ensemble, etc ..etc ..je connais pas le fonctionnement de WA , mais cela me parait un système bien plus complexe et ambitieux que Google en terme de développement informatique pur.
Et aussi une philosophie différente des nouveaux projets que j'ai pu voir sur le web sémantique qui se base essentiellement il me semble sur l'apparition de nouvelles balises méta (une opération de trie par l'humain) .
C'est juste que la comparaison n'a pas de sens: d'un coté on a un traducteur et de l'autre un système de recherche.
Les deux n'ont pas les mêmes fonctionnalités, pas les mêmes complexités.
En particulier, la principale difficulté d'un traducteur est de reconstruire un texte. Chose qui est absente (à ma connaissance) du projet WA.
Moi je trouve que l'exemple des traducteurs justement nous fait comprendre la difficulté pour des algorythmes de recomposer des phrases correctes: de maitriser la syntaxe d'une langue . Si c'est réalisé cela ouvre bien des perspectives à l'IA et au web sémantique .Envoyé par FaithEn particulier, la principale difficulté d'un traducteur est de reconstruire un texte. Chose qui est absente (à ma connaissance) du projet WA.
à une minuscule condition : c'est que pour qu'il manipule le langage humain comme un humain, il faut qu'il associe aux signifiants les mêmes sensations, c'est à dire qu'il doit avoir un corps HUMAIN. Et interfacer quelque chose avec un corps humain, ça peut etre quoi d'autre qu'un vrai cerveau ?
c'est super, et c'est typiquement le genre de choses que je cherche quand je me pose des question sur l'économie."so if you type in something like "gdp France / Germany", it calculates and returns a graph of the relative fraction of France's annual GDP to Germany's GDP, over the last 30 years or so."
En ce sens, c'est effectivement très différent de google qui retournerait l'info si un utilisateur a un jour créé la page. Dans le cas de wolfram Alpha la donnée est restituée car le système posséde des données, la connaissance des équations dans lesquelles ces données sont mises en jeu, et la possibilité de fournir la solution à ces équations
Sauf que voilà : si je cherche des renseignements sur le PIB de la France et de l'Allemagne, je ne vaux pas forcément faire ce que le programme de M. Wolfram pense que je veux faire. Donc, je vais plutot chercher un site me permettant d'avoir des données fiables, que je vais récupérer dans un tableur, et je vais faire le graphe que je veux avec.
C'est à dire qu'au lieu de me connecter sur le site de M. Wolfram pour qu'il "transcrive" à sa façon ma requête sur google, je vais préférer de loin chercher directement sur google et faire ce que je veux avec . Je n'ai pas besoin de quelqu'un qui cherche a paraitre aussi intelligent que moi surtout quand j'ai aucune manière de lui expliquer ce que je veux vraiment !
par exemple j'ai essayé le bot encarta de msn, qui a exactement les qualités et les défauts attendus : il peut donner des réponses factuelles correctes, mais on peut bien sur les trouver aussi bien soi meme (la capitale de la Lituanie) , ou alors il ne comprend rien à des questions complexes. A part s'amuser à le pieger comme ici par exemple :
http://forum.rue-montgallet.com/ruem...et_25772_1.htm
à quoi sert ce genre de gadget ?