Symboles étranges, Wikipédia, Phonétique et Unicode…
Tout a commencé lorsqu’en utilisant l’excellente suite bureautique OpenOffice j’ai tenté d’insérer un caractère spécial dans un document que je préparais… découvrant alors avec suprise que la police “Times New Roman” était scindée en plusieurs sous-groupes, comprenant des étrangetées telles que le U accent aigu-circonflêxe (ễ), le O accent circonflêxe-tilde (ỗ), le Y tilde (ỹ) , le O tilde-apostrophe (Ỡ), et même un symbole monétaire absolument inconnu pour ma part. Avant d’aller plus loin, ne vous inquiétez pas si vous avez sous vos yeux des valeurs étranges qui représentent ces caractères, j’y reviendrai plus bas…
Le mystère des lettres accentuées n’en était pas un car je me suis vite douté qu’il s’agissait de lettres destinées aux langues slaves (enfin je me demande quand même quelle langue utilise un U accent aigu ET circonflêxe superposés”). En revanche, je butais sur ce mystérieux symbole monétaire, ce qui m’a fait ouvrir la Wikipedia. Une recherche sur “symboles monétaires” m’a bien renvoyé vers une page intéressante, mais sans succès.
En revanche, comme à chaque fois que j’ouvre la Wikipédia je papillonne de lien en lien comme je l’ai toujours fait dans toute encyclopédie virtuelle ou non, j’y ai trouvé en revanche nombre de bizarreries liées aux symboles inconnus, d’une part de ponctuation, et d’autre part liées à la phonétique.
Ainsi, le point exclarrogatif (cherchez sur Google, vous n’aurez pas grand chose à vous mettre sous la dent) superpose les points d’interrogation et d’exclamation. Le point d’ironie est une sorte de point d’exclamation permettant de préciser le second degré de la locution. Et il y en a encore beaucoup d’autres de ce style. Mais toujours pas de trace de mon symbole monétaire bizarroïde…
De lien en lien, je suis arrivé aux symboles phonétiques, y ai découvert moult symboles tous plus étranges les uns que les autres, et cerise sur le gâteau ces symboles sont définis par des termes bien obscurs : le “clic alvéolaire latéral uvulaire voisé“, la “Consonne fricative éjective rétroflexe“, la “Consonne spirante alvéolaire voisée” ou bien encore la “Consonne occlusive épiglottale sourde“.
Finalement il n’y a pas qu’en informatique qu’on arrive à inventer des termes étranges !
Mais sur la Wikipédia, rien à faire, pas de trace de mon symbole monétaire… Google sauvera la mise en me renvoyant vers l’un des très nombreux documents de description de la norme Unicode, et j’ai pu enfin découvrir qu’il s’agissait du symbole du Nouveau shékel, une monnaie israélienne. D’ailleurs sur ce document il y a une bonne vingtaine de symboles monétaires dont personne n’a probablement jamais entendu parler !
Et j’en reviens à mes polices de caractères… la norme Unicode est connue pour les failles de sécurité qu’elle engendre dans un certain nombre d’applications mais quoi qu’on en dise je trouve cette invention extraordinaire. Depuis quelques années, les penseurs de “l’informatique du futur” se sont dit qu’il faudrait absolument intégrer la totalité des symboles utilisés sur notre planète dans les polices de caractères.
Bien leur en a pris, car désormais il est possible d’afficher (presque) tout document de langue connue ou inconnue sans surprise. Mais l’élaboration de la norme et sa concrétisation sous forme de polices de caractères m’a toujours fasciné, car cela a engendré des complications monstres. En effet, il existe plusieurs dizaines - centaines ? - de milliers de caractères et symboles différents, il a fallu les retrouver, les inventorier, les classer, les nommer/définir et enfin les incorporer dans les polices. Les documents de description de la norme Unicode représente plusieurs milliers de pages, c’est un travail de colosse qui ne laisse pas indifférent. Le plus impressionnant étant qu’ils n’ont pas oublié ni les caractères en provenance des langues anciennes et oubliées, ni les bizarreries tels que les points exclarrogatifs dont j’ai évoqué l’existence et qui doivent pourtant ne pas être très répandus en littérature !
Désormais, je passe un peu plus de temps sous OpenOffice à découvrir les symboles cachés dans mes polices de caractères… Un test est disponible pour déterminer si votre ordinateur possède ces polices étranges…
Ah, pour finir je ne peux que vous recommander de découvrir la Wikipédia, cette extraordinaire encyclopédie collaborative, vous aurez sans-doute remarqué que la plupart des liens de ce billets y faisaient référence ! Et si vous vous sentez à même de collaborer sur un sujet, n’hésitez pas !
ABSTRACT : My small narration of a journey in Unicode and weird characters and symbols… And an apology of Wikipedia, of course !
Bruno Kerouanton on juillet 19th 2006 in Culture