Qu’est-ce qu’OpenAI ChatGPT ? Expliqué simplement (avec vidéo)

Récemment, l’intelligence artificielle a fait beaucoup de bruit dans l’actualité et c’est aussi un buzz justifié. Les chercheurs en intelligence artificielle ont créé des programmes capables de traiter du texte humain et d’avoir des conversations, ainsi que de générer des images à partir d’une invite de texte sur presque tout ce que vous pouvez imaginer.

Ces outils d’IA capables d’imiter les humains à un tel point ont également fait l’objet de controverses, car on craint de plus en plus que ces outils ne remplacent les artistes humains. Le plus populaire parmi ces outils est le Chat GPT 3, un outil de génération de texte capable de tenir des conversations avec des humains avec un texte régénératif similaire au langage naturel. Cela signifie qu’il peut dire le même contenu de différentes manières, montrant la capacité complexe de traitement du langage du bot.

OpenAI

Chat GPT est l’un des projets de OpenAI, un laboratoire de recherche à but non lucratif qui se concentre sur la création d’outils d’intelligence artificielle utiles pour le bénéfice global de l’humanité. Outre ChatGPT, OpenAI a également développé divers autres projets d’IA tels que Dactyl, un produit axé sur la reproduction de la main humaine, et Dall-E, l’outil de génération d’images récemment populaire.

La plupart des projets d’OpenAI utilisent l’apprentissage par renforcement, où de grandes quantités de données sont transmises aux algorithmes d’apprentissage automatique qui tentent ensuite de résoudre des problèmes spécifiques à leurs cas d’utilisation par essais et erreurs.

Si cela devient trop technique pour vous, examinons maintenant ce qu’est ChatGPT, comment cela fonctionne et ce que cela signifie pour nous, car les algorithmes sont de plus en plus capables d’effectuer non seulement des tâches répétitives, mais aussi des tâches créatives considérées comme impossibles. faire sans aide humaine.

Qu’est-ce que ChatGT ?

Qu'est-ce que ChatGPT ?

Une chose amusante avec un robot conversationnel régénératif est que vous pouvez simplement demander ce que c’est, exactement et c’est exactement ce que j’ai fait.

Tout d’abord, j’ai posé la question

Question pour ChaGPT

pour lequel j’ai eu la réponse

Réponses par OpenAI ChatGPT

Eh bien, c’est trop facile, même Siri et les assistants Google peuvent donner de telles réponses à mon invite. Alors j’ai posé une question qui n’est pas si directe et directe, qui est

Question pour ChaGPT

pour lequel j’ai reçu la réponse suivante.

Réponses par OpenAI ChatGPT

Maintenant, il s’agit d’une réponse hautement contextuelle, comme l’indique l’outil, ce que vos assistants numériques ordinaires ne peuvent pas faire. Déconcertant, n’est-ce pas ? Pour ajouter à cela, ce n’est pas une réponse prédéfinie, ce qui signifie que chaque fois que vous posez une question, la réponse sera unique, un peu comme poser la même question à différentes personnes et obtenir la même réponse dans des mots différents. Il existe une option pour régénérer les réponses, voyons comment cela fonctionne pour la dernière question.

Réponses par OpenAI ChatGPT

J’ai régénéré la réponse à plusieurs questions de nombreuses fois et bien sûr, j’ai obtenu des réponses originales à chaque fois.

Outre l’explication donnée par l’outil lui-même, voyons comment exactement les programmeurs et les chercheurs ont créé cet outil maintenant.

Comment fonctionne ChatGPT ?

Une grande variété d’intelligence artificielle repose sur le traitement de grandes quantités de données pour apprendre un large éventail de cas d’utilisation et d’exemples. C’est là qu’intervient l’apprentissage par renforcement, où l’IA travaille avec un système de récompenses et de punitions et est conçue de manière à maximiser les récompenses souhaitées et à minimiser les soi-disant punitions non souhaitées.

Plus tôt, nous avons vu l’algorithme d’apprentissage renforcé et comment il utilise de grandes quantités de données et d’essais et d’erreurs pour imiter l’intelligence humaine. Le ChatGPT utilise une technologie similaire légèrement différente appelée Reinforcement Learning With Human Feedback.

Dans ce système, un modérateur humain supervise les échantillons de l’environnement sandbox où l’algorithme est mis en œuvre. L’humain peut prélever les échantillons et donner un retour à l’algorithme en termes de sortie qui est la plus souhaitable, et cela est à son tour utilisé par un prédicteur de récompense, qui est renvoyé au système pour affiner ses décisions.

ChatGPT fonctionne avec l'apprentissage renforcé avec rétroaction humaine

Ce système en boucle fermée est une amélioration par rapport au système de récompense et de pénalité simple, car l’humain donne des conseils contextuels à l’algorithme pour chaque exemple d’exemple afin de maximiser les récompenses, contrairement à la configuration générique des directives de récompense de haut niveau lorsque l’algorithme a été conçu.

Comment ChatGPT donne-t-il des réponses de type humain ?

ChatGPT a été formé à de grandes quantités de données textuelles, y compris des articles, des livres et des conversations entre humains, afin qu’il puisse identifier et comprendre les modèles et la structure de la langue.

Cela aide le bot à produire des réponses uniques dans différents styles tels que des conversations formelles et informelles, informatives, descriptives, etc., et c’est ce qui rend le bot utile pour une variété d’applications qui nécessitent un contenu unique dans différents formats d’une rédaction marketing et des articles scientifiques aux nouvelles et aux essais.

Limites

Un outil d’IA de réponse textuelle aussi complet a certainement suscité des réactions négatives de la part d’écrivains et d’autres créateurs, qui craignent que de tels outils ne rendent leurs rôles et leurs emplois obsolètes. Ce n’est pas tout à fait vrai. Les outils sont principalement créés pour aider à créer des chatbots plus réactifs et faciliter la tâche des traducteurs en prenant en charge les tâches répétitives subalternes qui peuvent autrement être ennuyeuses et chronophages.

Bien que l’outil soit excellent pour comprendre et donner des réponses humaines à un large éventail de questions et de sujets, il présente certaines limites. Tout d’abord, bien que le bot ait été formé avec de grandes quantités de données, il ne peut toujours pas traiter ou créer des informations qui sont en dehors de ce qui lui a été fourni, ce qui limite sa portée.

Un autre inconvénient est que les données qui lui ont été transmises étaient limitées et que le bot ne peut pas accéder à Internet pour mettre à jour régulièrement ou improviser sa réponse en fonction du temps, ce qui peut entraîner des inexactitudes et certaines réponses peuvent même être obsolètes et inexactes.

L’une des principales limitations est que ChatGPT est un modèle de langage formé sur de grands ensembles de données et ne peut pas imiter la façon dont les humains pensent et raisonnent. Cela signifie que même si les outils d’IA produisent une sortie naturaliste, ils sont d’une certaine manière limités dans la façon dont ils peuvent percevoir et concevoir l’information.

L’intelligence artificielle est sûrement devenue une chose fascinante et inquiétante à surveiller dans les années à venir. Mais avec une formation appropriée en matière de modélisation et de sécurité, ils peuvent certainement profiter à la société dans son ensemble et être un outil positif comme pour toutes les avancées technologiques récentes.

J’espère que cet article vous aidera à vous faire une idée de l’intelligence artificielle et d’OpenAI ChatGPT. Vous pouvez également consulter la vidéo ci-dessous pour d’autres démos de ChatGPT. Faites-nous part de vos réflexions sur l’avenir de l’IA dans la section des commentaires.

Lectures complémentaires

Partagez cet article

Newsletter

Inscrivez-vous à notre newsletter pour profiter de toutes nos astuces !

Laissez une réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *