Eric Wamugu : « Une grande partie de la désinformation en Afrique fonctionne comme un réseau de crime organisé financé par des acteurs du Nord »

Pour Eric Wamugu (Nairobi, Kenya), directeur principal du laboratoire de données de Code for Africa, le plus grand réseau de laboratoires de technologies civiques et de démocratie sur le continent africain, investir dans les données est capital pour « accélérer les progrès » vers les objectifs de développement durable d'ici 2030. « Pour chaque dollar investi dans les écosystèmes de données dans les pays à revenu faible et intermédiaire, il y a un retour économique moyen de 32 dollars », explique-t-il lors d'un entretien avec EL. PAÍS à Vitoria, où il participe à l'événement organisé par Political Watch et My Society lors du Sommet de l'Open Government Alliance. La séance s'est déroulée dans le cadre de l'accord sur les droits numériques signé par l'entité publique Red.es et Political Watch. « Nous voulons un développement durable basé sur des données et des preuves », souligne Wamugu.

Les défis, explique-t-il en référence au continent africain, sont variés. D’une part, dit-il, il est nécessaire d’unifier et de comprendre les informations et les données qui existent dans une multitude de langues et dialectes locaux. D’un autre côté, ajoute-t-il, « il n’y a pas assez de centres de données en Afrique pour stocker nos informations et promouvoir notre souveraineté numérique ». « Cela implique de contrôler et de réguler les flux de données transfrontaliers et de donner aux propriétaires la réelle capacité de décider de leurs propres données. Par exemple, ils peuvent décider qu'une partie est supprimée, modifiée ou non utilisée pour entraîner un algorithme d'IA. »

Demander. Moins de 4 % des données destinées à la formation des modèles d’IA proviennent d’Afrique. Pourquoi est-il important d’inclure les données africaines ?

Répondre. Réduire les dommages causés par les préjugés. Si vous entraînez un modèle avec des données climatiques de l’hémisphère Nord ou des pays occidentaux, qui ont des conditions climatiques très différentes de celles de l’Afrique, ces modèles ne seront pas efficaces pour le contexte africain. Si vous essayez de prédire les catastrophes climatiques, vous rencontrerez de nombreux biais et erreurs, conduisant à des inexactitudes. Un autre problème est la langue. De nombreuses langues africaines sont ce que l’on appelle des langues à faibles ressources, c’est-à-dire qu’elles n’ont pas été suffisamment numérisées. Cela a pour conséquence que de nombreuses voix africaines sont exclues du discours ou des débats numériques mondiaux. Cette exclusion, qui est systémique, est l’un des préjudices qui surviennent lorsque l’on laisse de côté des personnes importantes qui sont affectées par des décisions, mais dont les voix ne sont pas entendues ou incluses dans ces décisions.

Q. Comment peut-on le corriger ?

R. Sur les 54 pays africains, une quarantaine disposent déjà d’une stratégie nationale en matière de données ou d’IA, et même si certains ne l’ont pas encore mise en œuvre, beaucoup en sont au stade d’ébauche. En 2024, l’Union africaine a lancé sa stratégie continentale en matière d’IA. Il faut désormais adapter ces valeurs africaines partagées à chaque pays membre.

De nombreux pays et institutions africains sont désormais prêts à fournir leurs propres données pour la formation à l’IA et d’autres mises en œuvre. Outre Open Africa, qui diffuse des ensembles de données, il existe des initiatives telles que Common Voice ou Mashakhane, qui cherchent à recueillir les voix africaines et à former des modèles pour comprendre les langues avec peu de ressources numériques.

De nombreuses langues africaines sont ce que l’on appelle des langues à faibles ressources, c’est-à-dire qu’elles n’ont pas été suffisamment numérisées. Cela entraîne l’exclusion de nombreuses voix africaines du discours ou des débats numériques mondiaux.

Eric Wamugu, responsable de programme senior et équipe Data Lab chez Code for Africa

Q. Les États-Unis, la Chine et l’Europe hébergent les centres de données les plus puissants, tandis que l’Afrique ou l’Amérique du Sud en possèdent très peu. Quelles conséquences cela entraîne-t-il ?

R. Le manque de centres de données en Afrique affecte la souveraineté numérique, car de nombreuses données, voire informations sensibles, sur la population africaine traversent les frontières sans aucune protection spécifique, comme le Règlement général sur la protection des données. De plus, comme ces centres de données sont très éloignés des sites africains, la latence augmente, c'est-à-dire que le temps d'accès à ces données augmente, ainsi que les coûts. Et même s’il existe des talents ou des développeurs africains possédant les compétences nécessaires, le coût lié à l’accès aux données devient un facteur limitant.

Q. Code pour l’Afrique lutte contre la désinformation. Quelles sont les particularités de la diffusion du sur le continent ?

R. La désinformation ne se propage pas principalement sur les réseaux sociaux, même si elle constitue également un facteur important. Elle se propage principalement via des groupes communautaires de confiance, tels que WhatsApp, mais également à la radio, souvent dans les langues locales. Les chefs religieux peuvent également contribuer à sa diffusion. En outre, nous avons constaté qu’une grande partie de la désinformation en Afrique fonctionne sous la forme d’un réseau de criminalité organisée financé par des acteurs du Nord. Une grande partie de l’industrie de la désinformation en Afrique est en réalité une industrie dotée d’incitations financières ou d’idéologies politiques.

Q. Quels sont les thèmes principaux ?

R. Changement climatique ou genre et sexualité. Un autre problème important concerne les idéologies électorales et la manipulation électorale, qui deviennent très répandues à l’approche d’une période électorale dans un pays. Il existe également des groupes qui diffusent de la désinformation sur les effets négatifs supposés des vaccins, ou de fausses théories, comme celle selon laquelle les Africains seraient utilisés comme « rats de laboratoire ».

La fracture numérique ne concerne plus seulement l’accès à l’information, aux données ou à des outils comme l’IA générative. Désormais, il s'agit également d'abordabilité, de développement des compétences et d'accès significatif.

Eric Wamugu, responsable de programme senior et équipe Data Lab chez Code for Africa

Q. Comment les citoyens peuvent-ils se protéger ?

R. Nous sommes le continent le plus jeune, où l'âge moyen d'un Africain est d'environ 19 ans. Ce sont des gens habitués aux nouvelles technologies et à l’utilisation des réseaux sociaux. Nous formons ces jeunes à des stratégies pour détecter la désinformation, vérifier les sources et reconnaître les différentes formes de manipulation. Un modèle de « formation des formateurs », afin qu’ils puissent ensuite retourner dans leurs communautés et expliquer : « Voici à quoi ressemble la désinformation et voici comment l’identifier. »

Q. L’ONU a averti que la fracture numérique pourrait se creuser à cause de l’IA. L’Afrique risque-t-elle de prendre encore plus de retard ?

R. La fracture numérique ne concerne plus seulement l’accès à l’information, aux données ou à des outils comme l’IA générative. Aujourd’hui, il s’agit également d’abordabilité, de développement des compétences et d’accès significatif. Parce que vous pouvez avoir accès (à cette technologie), mais est-ce vraiment utile ? Est-ce pertinent par rapport à vos besoins locaux ? Un bon exemple est celui des grandes entreprises technologiques qui disposent de modèles d’IA génératifs, tels que ChatGPT et Gemini. Une grande partie de la population africaine ne serait pas en mesure de payer les frais élevés pour accéder à la version offrant une plus grande précision et des capacités avancées.

Q. Dans un environnement où les différentes puissances et technologies sont impliquées sur le continent, y a-t-il un risque que celui-ci devienne une « colonie numérique » ?

R. Je dirais, dans une large mesure, oui. Nous avons assisté à l’exploitation de travailleurs de données dans des pays comme le Kenya, employés pour étiqueter des ensembles de données pour des entreprises qui forment des modèles d’IA comme ChatGPT. Ils ont été exposés à des contenus préjudiciables, sans conseils ni mécanismes suffisants pour protéger leur santé mentale. Les travailleurs des données dans toute l’Afrique se syndiquent parce qu’ils reçoivent des salaires très bas, peut-être deux cents de l’heure, alors qu’un travailleur des pays du Nord pourrait gagner 20 ou 30 dollars de l’heure.

Il y a aussi la nature extractive de ces grandes entreprises technologiques, qui récupèrent essentiellement les données des Africains sans leur en donner la véritable propriété. Les Africains sont utilisés comme sujets d’étude et non comme participants égaux dans l’écosystème des données. Leurs données sont utilisées pour prendre des décisions algorithmiques qui les affectent, mais ils n’ont pas leur mot à dire sur la manière dont ces algorithmes sont formés.