Bonjour le monde.
L'engouement que le monde entier a pour le Data Science, le machine learning ou encore le Deep learning est justifié. Mais est ce pour autant qu'on doit aussi s'y lancé ?
Je vais tenter de donner ma vision de la chose en tant qu'africain résidant au Cameroun.
Je ne vais pas donner de définition de l'intelligence artificielle (que nous noterons dans la suite IA), il y'a assez de définitions disponibles sur la toile. Je vais plutot m'attarder sur les coûts de développement et de déploiement de solutions axées ou utilisant l'IA et le data science, puisque de toutes les façons ces deux domaines semblent désormais liés.
Cas de l'IA
On va donc dans la suite de l'article se baser sur le prix de Google 145$. Notons que ces instances offres differentes performances selon qu'on entraine le modèle ou pas. Maintenant si un développeur lamba où même une entreprise veut héberger un service utilisant de l'IA, il doit donc débourser une somme de 145$ par mois, qui correnpondent à environ 85 000f/mois.
Récemment discutant avec un jeune développeur qui me demandait des hebergeurs vps à bas prix, je lui ai parlé de digital ocean et hostwinds. Les prix les plus bas étaient de 35000f/an. Oui par an. Le jeune developpeur m'a fait savoir que c'était trop cher. Je lui ai rappelé que 100f x 365 = 36 500f. Certains peuvent en rire mais là est justement le problème. La matériel pour exploiter les technologies et techniques liées à l'IA coûte cher. Cher, mais cher par rapport à qui? Par rapport à ceux qui n'ont pas un assez grand revenu. Les prix technologiques sont en général fonction du marché occidental, américain en particulier. Lorsque Google offre un prix de 145$, de prime à bord, les experts qui definissent ces prix savent que le prix est gérable pour un americain moyen. Un developpeur americain, lorsqu'il gagne peu, gagne au moins 3000$/mois. Si on vous demande d'enlever 150f dans 3000f je parie que ça ne va pas vous derangez. Mais en transportant les prix dans notre contexte ils deviennent simplement énormes. Est ce donc logique de se ruéer vers ces technologies sachant que leur exploitation est encore hors de portée? Beaucoup d'entre les jeunes qui s'intéressent à l'AI, le font par convoitise des gros salaires. En esperant travailler dans de grosses boites européennes ou américaines. Les entreprises locales pouvant se payer le luxe d'un tel matériel sont rares. Tombe dans cette catégorie les opérateurs de télécoms. Ne serait il pas plus judicieux de chercher d'abord la capacité de créer ce matériel ou du moins trouver un moyen de le mettre à la disposition d'un developpeur au revenu moyen (je dirais qui gagne 250 000f/mois) et d'une startup. Parce que les startups sont les premières consommatrices et productrices de la technologie.
Cas du Data Science
Le Data Science porte principalement sur les données. Sans vouloir tourner de long en large, je vous pose la question suivante: d'où viennent les données? A cette question, beaucoup d'enthusiasmés repondent qu'il y'a des sites qui ont deja des données, des data sets pretent à l'emploi etc. Et puis je demande encore, ces sites où ont ils pris toutes ces données? Depuis d'autres sites évidemment. Pourqu'on voit mieux de quoi je parle. Prenons Google Trends qui donne les statistiques de recherche dans des pays. Mais en allant làbas vous verrez qu'il n'y a pas de données pour le Cameroun ni même pour d'autres pays africains. Donc à moins que du jour au lendemain on ne devienne un marché juteux ou prometteur pareilles données seront toujours inexistantes. A moins que ..... qu'on les récupere nous mêmes. Oui, nous devons refaire ce qui a été fait ailleurs. Nous devons concevoir d'abord des sites web pour recupérer les données avant de les traiter. Quelle est la pate dentifrice la plus utilisée au Cameroun? Quel est l'âge moyen du début des rapports sexuels au Cameroun? Combien d'ivoiriens consomment du chocolat ivoirien? Les camerounais sont ils satisfaits des transports en commun? On ne peut répondre à toutes ces questions qu'en collectant les réponses. Si nous ne remplissons pas cette condition à savoir, récolter les données par nos propres moyens, la science que nous appliquerons sur les données venant de l'exterieur, donc ne refletant pas ou peu la situation réelle, sera probablement erronée. Il est temps que les sites web poussent comme des champignons. Même une école qui fait des cours du soir, doit avoir un site web ou tout autre outil informatique qui permettent d'avoir des données claires et structurées.
Conclusion
Dans cette première partie, j'ai tenté de montrer les limites de l'application du Data Science et l'IA, dans notre contexte. Nous avons vu que les prix n'étaient pas encore accessibles au développeur moyen et que les données n'étaient pas encore suffisament collectées. Dans la deuxième partie, je jetterai un regard sur le coté social des choses.
Et vous? qu'en pensez-vous? je serais ravi d'avoir votre point de vue.