C'est quand même pas difficile de trouver les bonnes infos, plutôt que d'embrouiller le monde ! ! !
Jusqu'ici tout va bien...
22/05/2020, 08h53
#3
Antoane
Responsable technique
Date d'inscription
août 2007
Localisation
Kiel
Âge
33
Messages
19 024
Re : Définition - Unicode
Bonjour polo974,
Merci pour ton retour.
Pour qu'on puisse transmettre aux rédacteurs, pourrais-tu détailler un peu ce qui est faux dans l'article ?
Deux pattes c'est une diode, trois pattes c'est un transistor, quatre pattes c'est une vache.
23/05/2020, 14h30
#4
polo974
Date d'inscription
février 2007
Messages
9 040
Re : Définition - Unicode
Envoyé par Antoane
Pour qu'on puisse transmettre aux rédacteurs, pourrais-tu détailler un peu ce qui est faux dans l'article ?
l'article:
Unicode traduit chaque caractère en 16 bits et peut donc analyser plus de 65 000 caractères uniques
ARCHIFAUX
il ne faut pas confondre unicode et utf-8 ou utf-16 (en plus, il y a 2 utf-16 (big endian et little endian), bref...). https://fr.wikipedia.org/wiki/UTF-16 :
L'UTF-16 est en particulier utilisé dans les environnements Windows. Dans ce système, les API dites Unicode utilisent ce standard. Il en va de même du système NTFS.
C'est bien expliqué dans le lien wikipédia. ce que je pourrai dire risque d'être inexact, mais bon, je fais un bref résumé:
Le standard Unicode est constitué d'un répertoire de 137 929 caractères, couvrant une centaine d’écritures
(à l'heure actuelle), donc plus que 2 fois plus que les 65536 combinaisons possibles avec 16 bits.
bon, on a les unicodes, maintenant, il faut les trimbaler...
à minima, il faudrait 18 bits, soit arrondi 3 octets, mais en général, on bosse par paquets de taille fixe 1, 2 ou 4, donc 4 octets, à chaque fois, ça pique...
alors il a été décidé de coder en taille variable (utf-8) (mode ASCII compatible) sur 1, 2, 3 ou 4 octets avec des sortes de codes d'escape et une "continuation" bien foutus pour s'y retrouver... https://fr.wikipedia.org/wiki/UTF-8
ou en utf-16 (mode ASCII incompatible) qui n'est qu'un pis allé à une tentative ratée de limiter le codage sur 16 bits, vu que ça a débordé...
au fait, il existe aussi un utf-32 (enfin 2...).
Dernière modification par polo974 ; 23/05/2020 à 14h32.
Jusqu'ici tout va bien...
Aujourd'hui
A voir en vidéo sur Futura
24/05/2020, 16h53
#5
Antoane
Responsable technique
Date d'inscription
août 2007
Localisation
Kiel
Âge
33
Messages
19 024
Re : Définition - Unicode
Bonjour,
Merci pour ton retour, je le fait remonter à la rédaction.
Deux pattes c'est une diode, trois pattes c'est un transistor, quatre pattes c'est une vache.