Fonctionnement des Réseaux Neuronaux et les LLM I
Introduction
La résurgence récente sur la scène technologique de l’intelligence artificielle est principalement liée aux progrès récent dans les techniques à base de réseaux de neurones et plus particulièrement les “Grands modèles de langage” ou LLM (Large Language Models).
Comprendre les principes de leur fonctionnement, comment ils sont créés, comment ils produisent leurs réponses, leurs forces et limitations intrinsèques est fondamental pour leur bon usage. A la différence de nombreuses technologies passées, comme la voiture ou la machine à laver, simplement savoir les utiliser n’est pas suffisant pour bien les utiliser.
[!NOTE] Mais rassurez-vous. Il n’est pas pour autant nécessaire d’être ‘informaticien’ ou ‘Mathématicien’ pour maîtriser ces outils 🫣.
C’est pourquoi ce module se présente sous forme de deux niveaux, seul le premier est requis pour un usage professionnel courant :
Niveau I : Une vue à vol d’oiseau
-
Programmés ou cultivés ?
-
Réseau de neurones
-
Entrainement
-
Propriétés émergentes ?
-
Inférence
-
Tokens et Prompts
-
Qu’est-ce que le “contexte” (I)
-
Fraîcheur des données, et modèles connectés ou non connectés à l’internet
-
Sélection de “personnalité”