Tu es vraiment la cible idéale pour ce genre d'info...
Bon puisqu'on reparle ici aussi de ce sujet, je vais reposer la même question ; comment se fait-il qu'il y ait une telle différence de performances entre les systèmes de traduction automatique, Google étant de loin le plus mauvais de tous ceux que j'ai essayés jusqu'à maintenant?
"Музыки хватает на всю жизнь, но целой жизни не хватает для музыки"
Rachmaninoff
@mh34:
j'ai l'impression qu'il y a une différence d'approche architecturale entre Google Translate et Skype Translator.
( je ne sais si tu penses à celui ci )
le premier s'appuyant d'avantage sur un approfondissement ( recherche actuelle ) du contexte de la phrase.
qui était au départ un peu du "mot à mot" aligné bêtement.
le second bien plus sur l'apprentissage ( formules usuelles, etc... ) et donc avec des progrès liés aux nombres d'utilisations.
ceci sous toutes réserves, et sans bien connaître le sous-jacent informatique.
Cdt
En fait je pensais à ce logiciel : https://translate.yandex.ru/
Pour les traductions français/russe, il est nettement au-dessus de Google.
Même Reverso fait mieux.
"Музыки хватает на всю жизнь, но целой жизни не хватает для музыки"
Rachmaninoff
Ma compréhension est similaire à celle d'ansset: Google translate est un système low cost lost performance, très proche du mot à mot, qui est battu en qualité par d'autres approches "phrase based" mais au prix d'un coût élevé sur la quantité de calcul (ce qui peut expliquer, en dehors des questions de brevet, pourquoi ils n'étaient pas intéressé à implémenter cette approche).
Au contraire leur nouveau système basé sur des réseaux profonds de type LSTM bat très nettement les approches "phrases based", avec une vitesse qui devrait se comparer à la version "cheap". Ce n'est pas évident pour moi qu'ils vont tout-de-suite le mettre en ligne, versus le garder en tant qu'avantage compétitif pour, par exemple, faire vendre des androids.
... des pixel.
Question pour un champion: qu'est-ce qui rapporte le plus, vendre un logiciel de traduction ou avoir le monopole du portable avec le meilleur traducteur?
Si vous avez répondu vendre le processeur qui a permis la mise au point du logiciel, google n'est pas d'accord.
Bonjour,
Question de néophyte : existe-t-il (ou existera-t-il bientôt) un traducteur qui soit capable de traduire "An apple a day keeps the doctor away" par quelque chose du genre "Manger une pomme par jour, maintient en bonne santé", sauf si, dans le même document (même 500 pages plus loin) il est rappelé que Churchill ajoutait "especially if you aim carefully".
Où encore, capable de traduire en anglais "Chat est un mot de 4 lettres" par
"Chat is a four letter word" ou par "Cat is a three letter word", voire par "Chat est un mot de 4 lettres" suivant le contexte ?
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
... des pixel.
Question pour un champion: qu'est-ce qui rapporte le plus, vendre un logiciel de traduction ou avoir le monopole du portable avec le meilleur traducteur?
Si vous avez répondu vendre le processeur qui a permis la mise au point du logiciel, google n'est pas d'accord.
Bon ok j'ai compris, c'est pas demain que je vais pouvoir me fier à google trad pour mes quelques demandes.
Tu pourrais expliquer?
"Музыки хватает на всю жизнь, но целой жизни не хватает для музыки"
Rachmaninoff
Bonjour Marie-Hélène,
Demande à un traducteur automatique de traduire mon post en anglais .
Si ce n'est pas clair, je peux développer ...
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
le Google translate de base donne :
"cat is a 4-letter world".
! quel est le souci que je ne vois pas?
Cordialement.
oups, pardon, j'ai saisi !!!
Il suffit de penser à un livre, en français, traitant de la comparaison des constructions entre le français et le japonais, que je prenne comme exemple "Chat est un mot de quatre lettres" et son équivalent en japonais (que je ne connais pas), alors la traduction en anglais (ou toute autre langue) doit porter sur toutes les explications mais surtout pas sur les exemples.
[EDIT]Trop tard
Ou même entre français et anglais (lettres prend un s, letter n'en prend pas)
Dernière modification par Médiat ; 05/10/2016 à 09h17.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
ce point doit pouvoir s'étendre à tout ce qui est contextuel à la langue initiale.
Absolument, les deux exemples que j'ai donnés font appel, pour le premier, à la culture (c'est parce que je sais que Churchill a eu ce trait d'esprit que si je devais traduire le dicton sur les pommes, je me poserais la question de savoir s'il faut faire une traduction purement sémantique (bien meilleure dans certains contextes) ou si je dois conserver la possibilité du jeu de mot (obligatoire dans d'autres contextes)), et à une forme d'auto référence pour le deuxième.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Remarque que le deuxième exemple que tu as choisi est en fait intraduisible. Le jeu de mots dans titre de la chanson de Dylan "love is a four-letter word" ne peut pas être traduit: si on écrit "amour est un mot de quatre lettres" il n'y a pas de jeu de mots et si on écrit "l'amour est un mot de quatre lettres" ça n'a pas de sens.
Bonjour,
Oui, il y a des choses intraduisibles par un être humain, donc inutile de demander à un traducteur automatique (je me fais régulièrement la remarque que je suis bien content de ne pas être à la place des traducteurs, en regardant des séries américaines ou anglaises), l'exemple de cette chanson (que je ne connais pas) faisant allusion a un autre mot anglais de 4 lettres (fuck, pour ceux qui chercheraient), illustre aussi mon premier exemple, avec une difficulté supplémentaire.
Mais ce n'est pas le cas de mon exemple, simplement, cela dépend du contexte, par exemple dans un livre pour enfant, il y a de forte chance que "Cat is a three letter word", soit la bonne traduction, dans un livre traitant de la langue française "Chat is a four letter word" peut être la bonne solution, et j'ai donné un autre exemple plus haut.
J'ai pris un exemple "basique" mettant en jeu l'autoréférence, on pourrait en trouver des plus subtils
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Non, à ma connaissance aucun traducteur actuel ne prend en compte le contexte entourant la phrase.
En même temps, je ne serais pas surpris que Facebook ou Amazon soient proches de sortir un traducteur similaire. (pensée magique: la dernière fois ça a marché )
Cela fait partie de mes grosses interrogations : ces réseaux profonds ont-ils des boucles de rétroactions ? si oui, quel est l'ordre de grandeur du nombre d'itération ? Et quel est le nombre de couche de ces réseaux.
Ah, et puisque j'y suis dans les questions basiques. Dans les algos d'analyse d'image (par exemple les chats), en entrés du réseau on balance directement les pixels ?
Oui (par définition puisque ce sont des LSTM); très compliqué à compter dans les deux cas -disons entre une 1 et 20 itérations par mot et entre 8 et 20 couches au total (si on définit les couches comme étant les couches "structurellement définies", indépendamment des réentrées) ou entre 8 et 400 couches par mot (si on défini le nombre de couches comme étant le nombre maximal de neurone "rencontrés" par une information avant de se retrouver en sortie). Les détails sont sur arxiv (certes, pas toujours très clair...).
Donc là on est dans un autre type, i.e. les réseaux à convolution. Dans ce cas la taille de l'image en entrée est fixe, imposée par l'architecture. Dépendant des cas, cela veut dire qu'on doit sous-échantillonner, sur-échantillonner, ou balancer directement les pixels. Habituellement il est usuel d'ajouter aussi un peu de préprocessing (et, dans la phase d'apprentissage, d'ajouter des copies d'image avec rotation et translation pour augmenter la base de donnée & réduire l'overfit), mais ce n'est pas obligatoire ni même toujours utile.
Bonjour
Pour minushabens.
Pour "love is a four letter word", "l'amour est un mot de cinq lettres" ne marche pas si mal*
Je préfère le sous texte de la version anglaise (quoique dans un pays puritain comme les USA , cela doit leur faire à peu près pareil)
*Et je me rends compte d'un coup de g..gle que d'autres ont déjà eu la même idée (excellente traduction d'une chanson assez glauque de metallica)
Why, sometimes I've believed as many as six impossible things before breakfast
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
"Four letter word", en anglais, est immediatement compris comme "F-word", ne serait-ce que parce que c'est presque systematiquement ce mot qu'ils sentent le besoin de reprimer. En francais "mot de cinq lettre" ne sera pas aussi facilement associe a "baise", parceque nous avons d'avantage l'habitude de reprimer les "M-words". De la meme facon, tu as tout-de-suite compris cette derniere expression, et ce malgre qu'elle ne soit pas habituelle.
Peut-etre... mais si tu devais parier la-dessus, mon conseil serait de parier une tres petite somme.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Quel message?
ben ... #139
Je sais que ce n'est pas vous qui avez utilisé l'expression "quantum leap", mais si la prise en compte du contexte dans la traduction n'est pas un "quantum leap", alors je ne sais pas ce qui peut en être un dans ce domaine.
Dernière modification par Médiat ; 06/10/2016 à 08h01.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
salut:
heuu , ça dépend peut être du "contexte" de ce fil dans lequel il l'a écrit ?!
bon
C'est du blabla tout ça, vu par une lorgnette technique étriquée et limitée comme dans tous domaines ou la logique et les outils mathématiques n'ont pas cours, donc voué forcément à l'échec si l'outil recherché ne s'appuie pas sur des notions supérieures, la culture et l'érudition .Oui (par définition puisque ce sont des LSTM); très compliqué à compter dans les deux cas -disons entre une 1 et 20 itérations par mot et entre 8 et 20 couches au total (si on définit les couches comme étant les couches "structurellement définies", indépendamment des réentrées) ou entre 8 et 400 couches par mot (si on défini le nombre de couches comme étant le nombre maximal de neurone "rencontrés" par une information avant de se retrouver en sortie).
Une traduction réclame bien plus que de l'identification au niveau du mot ou même de plusieurs mots, la sémantique est bien plus complexe que ça, ce ne sont pas des itérations qui changeront quelque chose.
Un exemple parmi d'autres auquel aucun traducteur artificiel ne saura apporter une réponse viable: la poésie.
L'intelligence artificielle est selon moi un mythe de peudo-intellos dont l'appellation même est un non sens, une "vision" prépubère de ceux qui ont été bercés trop loin des références intelligentes...
Ca permet au moins de comprendre qu'une certaine forme d'asservissement est en train de naître, l'homme perdu étant en train de chercher à créer, à travers une quête technologique, une entité "supérieure" pour le rassurer sur son misérabilisme et le guider dans son quotidien.
Je vois de l'intelligence chez un Pascal par exemple qui nous éclaire sur le monde et les hommes, je n'en vois pas une once chez Google ou Apple.
La finalité est différente, où trouverez-vous de l'humanisme dans une foutue machine ou dans un traducteur ??
Quand les bases de départ d'un concept sont erronées, le résultat est forcément foireux.
Merci Jiav pour ta réponse.
Donc si on reprend vite fait tes chiffres à la louche : 400 couches, quelques millions de connexions à gérer, on se retrouve avec la réconnaissance d'un mot autour d'un 1 GFlops. Un PC de base peut "lire" à la vitesse d'un humain. Et une architecture spécialisé doit assez facilement gagner un facteur 1000. C'est impressionnant !