Quand les algorithmes apprennent à parler marocain
Qu’on soit d’accord ou pas avec Fouad Laroui n’est pas là l’enjeu, mais plutôt la recherche de solutions langagières pour le Maroc. L’approche intelligente de Fouad Laroui n’est pas d’imposer, mais plutôt de proposer. Il nous livre des pistes de réflexion, pas plus. À ma connaissance, c’est l’analyse la plus complète et la plus réussie du champ langagier marocain, avec toutes ses langues et ses « différentes palettes de couleurs » : l’arabe classique, l’arabe marocain, l’amazigh, la hassanya et la langue française.
Il n’y a pas une langue qui n’ait pas été considérée comme un « parler » ou un « dialecte » à ses débuts. La Chine a connu le même problème au XVIIIe siècle, jusqu’à ce qu’un certain Cao Xue Qin, écrivain de vocation, propose son chef-d’œuvre « Le Rêve dans le pavillon rouge ». Cette œuvre monumentale de la littérature chinoise et mondiale de plus de 3 000 pages fut écrite en « darija » chinoise en l’espace de dix ans, étant donné que peu de gens maîtrisaient le chinois classique. En Allemagne, c’est la même chose : il y a cinq cents ans de cela, personne ne comprenait le latin ou le grec, qui étaient les langues du clergé et de l’élite. Lorsque Luther a traduit la Bible en « darija » allemande en 1534, cela a été le début de l’essor scientifique, économique et culturel de l’Allemagne. C’est le cas aussi du français, qui était au début une panoplie de dialectes locaux : le gaulois, le normand, le picard, le languedocien, l’aquitain, mêlés au latin et au grec.
Quant à la langue arabe, c’est pareil; car elle représente au fond un ensemble de dialectes orientaux, et même sa grande expressivité est due exclusivement à la langue sumérienne, jusqu’à 60% des mots arabes sont d’origine sumérienne, sans parler de la langue syriaque, nabatéenne, le babylonien et d’autres dialectes du Moyen-Orient. L’alphabet arabe qu’on appelle arabe est en réalité d’origine araméenne, et l’araméen est la langue de Sidna Issa, Jésus-Christ. Max Weinreich a dit un jour : « La langue, c’est un dialecte avec une armée et une flotte ».
Les langues ont toujours su créer de la richesse, de l’essor économique et booster l’innovation, dès lors que l’on érige l’humain en premier capital, socle de toute croissance et de tout développement durable. À titre d’exemple, la Suisse compte quatre langues officielles : l’allemand, le français, l’italien et le romanche; et c’est la quinzième année consécutive qu’elle occupe la première place de l’Indice mondial de l’innovation (GII), avec un PIB élevé dépassant les mille milliards de dollars et un PIB par habitant de l’ordre d’environ 120.000 dollars.
Après ce petit tour d’horizon nécessaire, nous allons passer à notre thème principal : les algorithmes parlent-ils vraiment l’arabe marocain ? Un aspect fondamental souvent négligé est que la darija est devenue, au cours des deux dernières décennies, une langue pleinement présente dans l’espace numérique. Les réseaux sociaux, les applications de messagerie, les plateformes de vidéo et les forums en ligne regorgent de textes en « langue marocaine » – une thèse de travail, pas plus, sans exclure aucune autre langue du Maroc, car même la langue française fait partie aujourd’hui du paysage langagier marocain. Cette présence numérique massive constitue précisément le type de données dont les systèmes d’IA ont besoin pour apprendre et s’améliorer.
Il existe aujourd’hui une collection organisée de ressources et de dépôts pour les tâches de NLP spécifiques à la darija qui vise à fournir aux étudiants et aux chercheurs une collection complète d’outils, de jeux de données, de modèles et d’exemples de code. Cette infrastructure croissante témoigne de la vitalité d’un écosystème académique et technique qui se structure rapidement autour de la darija.
L’un des indicateurs les plus significatifs de la compatibilité entre l’IA et la darija est la mobilisation croissante d’une communauté de recherche internationale et interdisciplinaire. Des universités marocaines aux institutions de renommée mondiale, des chercheurs de tout horizon ont choisi la darija comme objet central de leurs travaux en NLP. La recherche sur Atlas-Chat a été conduite par des chercheurs de l’Université Mohamed bin Zayed d’Intelligence Artificielle (Émirats Arabes Unis), de l’École des Mines de Rabat (Maroc), de l’Université Mohammed VI Polytechnique (Maroc), du KTH Royal Institute of Technology (Suède), et de l’École Polytechnique (France). Cette mobilisation internationale témoigne du fait que la darija est désormais reconnue comme un objet de recherche légitime et prioritaire dans la communauté NLP mondiale.
La première démonstration convaincante de la compatibilité entre l’IA et la darija est sans doute celle de DarijaBERT. Cette étude présente les premiers modèles BERT pour l’arabe marocain, également connu sous le nom de darija, appelés DarijaBERT, DarijaBERT-arabizi et DarijaBERT-mix. Ces modèles sont entraînés sur le plus grand corpus des langues vernaculaires arabes, supportant à la fois les représentations en caractères arabes et latins de l’arabe marocain. Leurs performances sont minutieusement évaluées et comparées aux modèles multilingues existants.
Le résultat est capital puisqu’on a pu démontrer que les architectures utilisées – qui constituent la base des LLM les plus avancés – sont parfaitement adaptables à la darija. DarijaBERT, entraîné sur des données des médias sociaux et des textes marocains, capture les caractéristiques syntaxiques et sémantiques de la darija, fournissant ainsi une base solide pour la classification des sentiments. Publié dans l’International Journal of Data Science and Analytics, ce travail a ouvert la voie à une nouvelle génération de modèles spécifiquement dédiés à la darija.
La maturité d’un écosystème NLP se mesure notamment à la qualité de ses dispositifs d’évaluation. Dans ce domaine, l’initiative AtlasIA s’est révélée particulièrement pionnière. La Darija Chatbot Arena est une plateforme innovante conçue pour faciliter la comparaison des réponses de différents LLMs sur un ensemble varié de prompts de l’arabe marocain. Elle vise à fournir une évaluation complète des capacités des LLMs à comprendre et à générer des réponses en darija.
La capacité des systèmes d’IA à comprendre et à générer de la langue marocaine dans des contextes conversationnels est particulièrement précieuse pour le service client, le commerce électronique, les services bancaires et les administrations publiques, qui interagissent quotidiennement avec des millions de locuteurs de darija. L’avenir de la darija à l’ère de l’IA est celui d’une langue qui n’a plus besoin de choisir entre authenticité et modernité. Dans un monde dominé par l’abstraction mathématique, l’arabe marocain apporte une texture humaine et contextuelle indispensable. L’IA ne remplace pas le locuteur marocain ou la locutrice marocaine; elle lui donne une voix plus forte, plus claire et plus globale.
La compatibilité entre l’IA et la darija n’est plus un sujet technique, mais un véritable projet de société. Ses caractéristiques – vitalité, hybridité et « chaos langagier » – sont précisément les forces qui lui permettent de s’épanouir dans le paradigme des réseaux neuronaux modernes. Sur le plan technique, elle témoigne d’une maturité exemplaire, capable d’épouser toutes les nuances de la modernité.
Si la darija est une langue vivante et agile, sa codification graphique accuse encore un certain retard. Ici, le Deep Learning s’impose comme un puissant outil de régulation, permettant au modèle de ne plus s’égarer dans le foisonnement scriptural des usages actuels. Le Deep Learning, cette sous-catégorie de l’intelligence artificielle qui s’inspire du fonctionnement du cerveau humain pour traiter des données, consiste à libérer le potentiel de la darija en s’affranchissant des règles rigides. En traitant l’usage réel et la diversité des scripts, le Deep Learning transforme la darija en données exploitables. Cette approche garantit une souveraineté numérique, protégeant l’identité culturelle marocaine tout en propulsant la langue dans l’économie mondiale de l’IA.
L’avenir numérique de la darija exige de passer de l’enthousiasme des pionniers à la rigueur d’une industrie de la langue. Le succès dépendra de trois ressources clés :
- La rigueur académique pour structurer.
- La codification pour modéliser.
- La vision stratégique pour valoriser et pérenniser.
Cette ambition exige un pacte entre institutions, informaticiens/informaticiennes et auteurs/autrices, créateurs/créatrices de contenu pour modéliser la darija dans toute sa splendeur organique. Il s’agit de doter l’IA de logiques fondatrices capables de déchiffrer l’alchimie des métaphores et la finesse des expressions imagées. En codifiant ce qui rend cette langue plus belle – ses nuances, son humour et ses non-dits – on protégera une souveraineté linguistique et culturelle essentielle. Cette démarche garantit l’épanouissement des locuteurs, des locutrices, des auteurs et autrices qui, par leur voix et leur plume, insufflent une vie nouvelle à ce patrimoine au cœur des enjeux du XXIᵉ siècle.
Une réalité amère après les sommets environnementaux Alors que les sommets internationaux consacrés à la protection des océans et du climat se succèdent, les corridors maritimes vitaux continuent de payer le prix des décisions des grandes puissances, tandis que les écosystèmes marins deviennent des victimes silencieuses. Pollution marine © DR En passant avec inquiétude d’un média à l’autre, je ressens lassitude et désespoir face à une scène internationale qui s’est transformée, dans nombre de ses détails, en un foyer dangereux…
Par Mohammed Tafraouti, Activiste environnemental, spécialiste des questions oasiennes et du développement durableCar l’attente, ici, n’est pas neutre. Elle ne suspend pas seulement une décision juridique. Elle fragilise la confiance, alimente les rumeurs, laisse prospérer les intox et entretient un brouillard politique sur une question pourtant centrale dans la vie des Marocaines et des Marocains. Dans les maisons, dans les médias, dans les débats publics, l’espoir d’une réforme réelle a bel et bien existé. Mais il se heurte désormais à un silence pesant, fait d’hésitations, de prudence excessive et de langage politique…
Par Dr Meryem Belhoussine, Politologue, spécialiste de la gouvernance démocratiqueCes dernières années, les appels à adapter l’éducation et la formation aux métiers de demain se sont multipliés dans les discours officiels. Ils orientent les réformes, dictent les priorités d’investissement, et façonnent les politiques publiques. Pourtant face à l’avancée fulgurante de l’intelligence artificielle, cette vision repose sur un paradoxe rarement remis en question. Comment peut-on former à des métiers dont la nature même reste incertaine ? L’intelligence artificielle n’a pas seulement pour effet de modifier les métiers existants, elle transforme…
Par Ouissale El Gharbaoui, Docteur en sciences économiques et gestion -Professeur Permanente HEC RabatDepuis plusieurs décennies, le débat oppose deux visions. D’un côté, les défenseurs de la répartition alertent sur les risques sociaux d’un basculement vers des systèmes individualisés. De l’autre, les partisans de la capitalisation promettent une solution plus performante, fondée sur l’épargne et les marchés financiers. Pourtant, cette opposition est souvent simplifiée à l’extrême. La réalité est plus nuancée Le système par répartition, largement dominant au Maroc, repose sur un principe de solidarité intergénérationnelle : les actifs financent les retraités. Ce…
Par Hanane El Amraoui, Enseignante chercheuse à HEC Rabat Business SchoolHub ou corridor : une distinction structurante La distinction entre hub logistique et corridor ne relève pas du simple vocabulaire technocratique. Un hub est un point nodal où les flux ne font pas que transiter : ils sont transformés, redistribués, enrichis. Il implique une capacité à capter de la valeur ajoutée, à intégrer des fonctions industrielles, commerciales et financières. À l’inverse, un corridor désigne un axe de passage, parfois performant, mais dont la contribution économique reste limitée à la facilitation…
Par Dr Anas Yachoulti, Docteur en Sciences Économiques et GestionCette posture de « wait-and-see » soulève une question brutale : notre banque centrale est-elle encore le pilote de la stabilité ou n’est-elle plus que le témoin passif d’un basculement inflationniste déjà acté par les agents économiques ? Car l’histoire récente de notre politique monétaire est marquée par une constante : la difficulté à anticiper les crises inflationnistes. Non pas à les gérer – Bank Al-Maghrib a montré sa capacité à réagir – mais à les devancer. Or, en matière d’inflation, la…
Par Professeur Nabil Adel, Chercheur en géopolitique et géoéconomieResponsables du CCME, quel est votre bilan ? Réponse à Abdellah Boussouf, SG du Conseil Article 1 Article 2 Article 3 Article 4 29 – Pour un CCME élu A ce propos, on voit mal pourquoi dans le nouveau site du CCME, les discours royaux du 6 novembre 2005, 6 novembre 2006 et 6 novembre 2007, ne sont plus reproduits dans la rubrique «Textes fondateurs » (du Conseil).Ces discours sont de la plus haute importance pour la conception des politiques publiques…
Par Professeur Abdelkrim Belguendouz, Chercheur en migrationResponsables du CCME, quel est votre bilan ? Réponse à Abdellah Boussouf, SG du Conseil 3/5 20 – Élargir le débat Dans cet esprit , dans le cadre de la discussion sereine et apaisée à mener avec tout le respect et la dignité que mérite le dossier stratégique d’intérêt national des citoyens MRE, auxquels le Souverain accorde une très haute sollicitude, à travers notamment toute une série de discours royaux (les derniers en date étant ceux du 20 août 2022…
Par Professeur Abdelkrim Belguendouz, Chercheur en migrationCependant, cette pratique pose une question délicate : où s’arrête l’inspiration et où commence l’appropriation illégitime d’une histoire personnelle ? L’affaire entourant Kamel Daoud et son roman Houris illustre les tensions qui surgissent lorsque fiction et réalité s’entrelacent. Lauréat du prix Goncourt 2024, Daoud se voit reproché d’avoir utilisé, sans consentement, le récit d’une survivante de la guerre civile algérienne, ancienne patiente de son épouse psychiatre. Si l’écrivain réfute ces accusations en invoquant la fiction comme territoire libre, cette controverse…
Par Intissar Haddiya, Médecin et auteure marocaineDans les grandes agglomérations, les tendances sont tout aussi disparates. À Casablanca, l’IPAI a reculé de 1%, avec des baisses de 0,5% pour les biens résidentiels, de 2,7% pour les terrains, et de 2,2% pour les actifs professionnels. La ville a également enregistré une contraction significative de 30,1% des transactions, notamment pour les terrains (-41,7%) et les locaux professionnels (-33,3%). À Rabat, les prix ont diminué de 0,6% globalement, avec une baisse notable de 7,5% des actifs professionnels, mais les…
Par Karim Mabrour, Fondateur et CEO de MKM ImmobilierLe rôle du Maroc s’étend bien au-delà de la simple défense de son intégrité territoriale face aux revendications désuètes du Polisario, il incarne une riposte systématique aux menaces qui gangrènent la stabilité de l’Europe, du Sahel et du Maghreb. La position géostratégique du Maroc, à la croisée de l’Atlantique, de la Méditerranée et du Sahel, confère au pays une fonction essentielle dans l’architecture sécuritaire mondiale. Les services de renseignement marocains, notamment la Direction Générale de la Surveillance du Territoire (DGST)…
Par Faiçal Marjani, Acteur associatifLa célébration de l’année hégirienne incarne le socle islamique fondamental de l’identité marocaine, tandis que la commémoration de l’année grégorienne illustre l’ouverture du Royaume au monde moderne et son interaction avec la culture occidentale. La célébration de l’année amazighe, quant à elle, honore des racines ancestrales profondes liées à l’identité amazighe, un pilier fondamental du tissu social marocain. Bien que ces festivités témoignent d’une reconnaissance certaine de la diversité culturelle marocaine, elles révèlent néanmoins des lacunes criantes si elles n’incluent…
Par Faiçal Marjani, Acteur associatifUne ambition qui dépasse les frontières Au-delà de l’exposition et des conférences, le Green Impact Expo & Summit porte une vision : celle de créer une communauté marocaine de la mobilité durable, où chaque acteur, qu’il soit industriel, institutionnel, académique ou citoyen peut contribuer à construire les solutions de demain. Cet événement incarne une dynamique unique, où la collaboration transcende les simples enjeux commerciaux pour embrasser une responsabilité collective envers l’avenir de notre planète. Dans un contexte où les politiques…
Par Omar Amarouch, Chargé des partenariats et de la commercialisation du Green Impact Expo & Summit,Dans ces environnements urbains, les rythmes de vie, les infrastructures et les dynamiques sociales ne sont plus en phase, créant une fragmentation de l’expérience urbaine. L’urbanisation rapide, souvent motivée par des impératifs économiques plutôt que par une vision cohérente de la ville, conduit à un désaccord entre les différents éléments qui composent la cité. Les transports fonctionnent à une cadence différente de celle des besoins résidentiels, les espaces de travail ne s’intègrent pas harmonieusement aux zones de loisirs, et les…
Par Mohammed Hakim Belkadi, Consultant architecte des écosystèmes urbains prédictifs et des milieux interconnectés expert judiciaireCe régime, dont les pratiques empiètent systématiquement sur la souveraineté des nations voisines, s’appuie en interne sur une propagande mensongère visant à alimenter la haine, à détourner ses citoyens de leurs véritables aspirations, et à les priver de leur droit légitime au développement, à la justice sociale, et à la prospérité. Son objectif est évident : manipuler l’opinion publique pour la maintenir captive de projets idéologiques en décalage complet avec les besoins et les droits réels de ses citoyens. Après…
Par Faiçal Marjani, Acteur associatifUne réflexion scientifique pour une mobilité durable La programmation scientifique du Green Impact Expo & Summit repose sur une approche transversale qui intègre les dimensions économiques, sociales et environnementales de la mobilité. L’objectif est clair : élaborer des solutions innovantes adaptées aux territoires et aux besoins des populations, tout en répondant aux impératifs de réduction des émissions de gaz à effet de serre. Le Maroc, acteur clé de cette dynamique, s’est fixé un objectif ambitieux de réduction de 45% de…
Par Mehdi Amarouch, Directeur du programme Green Impact Expo & Summit