×L'Editorialjustice régions Dossiers Compétences & RH Société Brèves International Brèves internationales Courrier des Lecteurs Les Grandes Signatures Documents Lois à polémiques Docs de L'Economiste prix-de-la-recherche Prix de L'Economiste Perspective 7,7 Milliards by SparkNews Earth Beats Solutions & Co Impact Journalism Day cop22Spécial Cop22 Communication Financière
eleconomiste

Entreprises

Au-delà de la standardisation des caractères : L'arabisation de l'informatique bute sur le retard technologique du monde arabe

Par L'Economiste | Edition N°:24 Le 09/04/1992 | Partager

Les problèmes que pose l'arabisation commencent déjà à se sentir au niveau de l'enseignement.
L'année universitaire 1991-1992 est marquée par l'arrivée du premier groupe d'étudiants ayant reçu leur enseignement primaire et secondaire en arabe.
Un premier bilan de la politique d'arabisation de l'enseignement permet de dégager les constatations suivantes.
Tout d'abord, les étudiants rencontrent d'énormes difficultés dans les disciplines scientifiques, et ce, à cause du manque de manuels techniques bilingues.

Secteurs productifs

Si l'économie nationale n'est pas encore prête à cette opération d'envergure, du fait de sa nature même, la politique d'arabisation dans le domaine juridique ou dans l'administration publique a connu plus de succès, du fait que ces secteurs ne touchent pas directement l'appareil productif.
L'informatique qui est devenu une composante essentielle pour toute économie moderne et compétitive doit faire face à cette politique d'arabisation.
La nécessité d'arabisation des systèmes informatiques est une entreprise nécessaire pour pouvoir répondre aux besoins, de plus en plus pressants, des administrations publiques (collectivités locales, ministères, communes, etc...), du secteur juridique (banque de données, suivi des affaires pénales, etc...), et de l'enseignement.

Absence de standards

Les divers groupes internationaux de normalisation: ANSI (American National Standard Institute), ISO (International Standard Organization), ECMA (European Computer Manufac-turing Association), ont abouti à une codification unique de l'alphabet latin représentant un caractère avec 7 bits en langage binaire.
Cependant, la normalisation de la représentation machine du caractère arabe n'est pas arrivée à son terme. Chaque constructeur de matériel propose une solution propre, ce qui rend la communication entre ordinateurs quasi-impossible, ainsi que la transmission de données bilingues arabe-latin.
Plusieurs obstacles empêchent cette standardisation.
D'une part, la langue arabe a des particularités importantes par rapport à la langue latine:
- le caractère arabe est voyellé,
- il prend trois formes différentes selon sa position dans le mot (le début, le milieu et la fin).
D'autre part, les organismes techniques du monde arabe (l'Institut de Recherches et d'Arabisation, la Commission d'Etudes de Traitement de l'Information de Rabat, le Centre National Informatique de Tunis, etc...) ne se sont pas encore penchés sérieusement sur le problème de standardisation du caractère arabe.
Enfin, les divers organismes internationaux de normalisation se sont peu intéressés à ce problème.
Une première étude effectuée en 1977, a abouti à établir un code arabe unifié connu sous le nom de CODAR-U (Code Arabe Unifié).
Deux codes arabes ont émergé de ce code: ASMO (Arab Standardization and Metrology Organization) 449, puis ASMO 662 et enfin ASMO 708.

Le code à 7 bits: ASMO 449

Cette norme représente le caractère arabe sur 7 bits. L'équivalent pour l'alphabet latin est le code ISO 646, dit aussi code ASCII (American Standard Code Information Interchange).
L'ASCII permet de codifier 128 caractères (lettres, chiffres et caractères latins) en les représentant en langage binaire avec 7 bits (Le caractère A est codifié par la suite de bits 1000001=65 "en décimal").
Cette norme est inadaptée aux ordinateurs commercialisés en Europe, ceci est dû à l'absence des caractères accentués (tels le é, ou le à, etc...). Néanmoins, le Code ASCII étendu à 256 caractères permet de résoudre ce problème.
La norme ASMO 449 ne permet pas de représenter l'ensemble des jeux de caractères latins et arabes, ce qui rend difficile le travail en bilinguisme(*).

Le code à 8 bits: ASMO 708

Le code utilisé sur la plupart des ordinateurs modernes est EBCDIC (Extended Binary Coded Decimal Interchange Code), permettant une représentation des caractères sur 8 bits.
L'équivalent arabe est ASMO 708, qui inclut les caractères latins de l'ISO 646.
Chaque caractère dans cette représentation est codifié avec une indication sur la langue (arabe ou latine) à laquelle il appartient, contrairement au code à 7 bits.
Les précédentes codifications sont limitées au bilinguisme. Une solution plus souple est en train de faire son chemin, grâce aux recherches effectuées par la Japanese Industrial Standards (JIS).
La JIS propose une extension du standard ISO à 16 bits, contenant 6.768 caractères (37 caractères arabes, 24 grecques, 26 latins, 169 japonais, etc...), ce qui va permettre le multilinguisme.
Deux solutions sont proposées.
La première, qui consiste à arabiser les logiciels existants, comporte trois étapes:
- la compréhension des fonctionnalités du logiciel;
- la traduction en arabe;
- et puis, son implantation.
Cette solution s'avère très lente et coûteuse.
La deuxième solution préconise le développement d'interfaces arabisées permettant l'utilisation de logiciels existants sur le marché sans modification aucune.
Ce concept d'interface est utilisé par exemple pour le système d'exploitation MS-DOS arabisé.
Nous pensons que cette dernière solution est la meilleure dans le contexte actuel, caractérisée par le décalage technologique entre le monde latin qui essaye de perfectionner son informatique, et le monde arabe encore spectateur du bouleversement technologique mondial.
L'arabisation informatique ne doit pas être limitée à représenter le jeu de caractères arabes à l'écran ou à l'imprimante, mais elle doit être une arabisation intégrée(*).
L'arabisation intégrée de l'informatique consiste à saisir "l'information là où elle est produite, puis véhiculée par réseau, sans discontinuité, afin d'être disponible partout où on peut en avoir besoin".
Ceci suppose la gestion de tout le système informatique:
les commandes systèmes, les interrogations de base de données, et la communication réseau.
Ainsi deux étapes sont nécessaires pour l'arabisation:
- l'arabisation de l'ensemble des programmes de base permettant la gestion du dialogue Homme/Machine (le système d'exploitation),
- l'arabisation des logiciels d'applications tels les traitements de texte, les gestionnaires de base de données, etc...
Abdelmounaïme SAMI
& Ouadie BENKIRANE
(Ingénieur IN7)

(*) Pour plus de détails voir "L'ordinateur Africain" n° 5/6.
(*) Nous avons emprunté cette nomination à l'article "Arabisation: comment procéder" par M. VANTROYS dans le n° 5/6 de l'Ordinateur Africain.

Quelques applications:

- Hamim(1) ou Tribu arabisé: c'est un système transactionnel de gestion de base de données bilingue. Cet outil permet à l'utilisateur arabe de développer ses propres applications où l'arabe et les langues latines auront les mêmes priorités.
- Mistral(1): logiciel de recherche documentaire arabisé avec la collaboration de la société Bull. Il permet d'implanter, de gérer, de consulter et d'éditer des textes ou bibliographies.
L'application KINZ utilise Mistral pour mettre à la disposition des juristes toute la documentation dont ils peuvent avoir besoin.
- Le Minitel arabisé de Tunisie: c'est le résultat d'une collaboration entre Alcatel et l'IRSIT (Institut de Recherche des Sciences de l'Information de Tunisie), qui a abouti à une adaptation du minitel français à la langue arabe.
(1) Développé par le Centre National Informatique de Tunis (C.N.I.).

Un dictionnaire arabe-anglais sur votre ordinateur

Le Centre de Programmation en Langue Arabe (C.P.L.A) de l'Université Harvard, dirigé par le professeur américain, d'origine égyptienne, Wilson Beshay a conçu un dictionnaire sous forme d'un logiciel simple d'emploi à l'usage des utilisateurs de la langue arabe.
Ce logiciel est baptisé, le New Arab dictionary, compte plus de 30.000 mots, dont 10.000 verbes et 4.000 radicaux.
Ce dictionnaire, qui est le fruit de l'équipe dirigée par le professeur Beshay, permet de trouver le sens anglais des mots arabes, même s'ils sont délestés -pour des raisons grammaticales- de certains suffixes, préfixes ou voyelles. Si la recherche de la racine d'un mot se révèle difficile, il suffit de faire entrer n'importe quelle forme du mot en arabe pour que l'ordinateur cherche son équivalent anglais. La même opération peut être effectuée à partir de l'anglais.
Pour la recherche de la racine des mots, le logiciel peut proposer tous les mots de la langue arabe comportant une même racine. Il permet, par une fonction analytique, au chercheur d'introduire n'importe quel verbe, avec ou sans voyelles, pour trouver son équivalent anglais.
Le logiciel permet également d'affronter les formes les plus difficiles des conjugaisons et déclinaisons arabes.
Pour davantage de précision, il choisira une analyse approfondie de chaque verbe.
La dernière nouveauté de ce logiciel consiste en une série de tests pour apprécier son niveau de connaissance de la langue.
L'équipe de Harvard, qui a mis au point ce logiciel, a également conçu un "computerized arabic verb", à partir duquel il est possible de trouver toutes les formes que prend une racine en arabe.
Ce logiciel sera commercialisé dans le monde arabe par la Société Internationale de Développement de l'Electronique (S.I.D.E) dont le siège est à Amman en Jordanie.

  • SUIVEZ-NOUS:

  1. CONTACT

    +212 522 95 36 00
    [email protected]
    [email protected]
    [email protected]
    [email protected]
    [email protected]

    70, Bd Al Massira Khadra
    Casablanca, Maroc

  • Assabah
  • Atlantic Radio
  • Eco-Medias
  • Ecoprint
  • Esjc