Création de bombes, cannibalisme ou cyberattaques: il est toujours possible de demander à l’IA des conseils sur des sujets explosifs

Une récente étude de l’EPFL a démontré comment il est toujours possible de «pervertir» des systèmes d’intelligence artificielle grand public pour contourner des mesures de sécurité. D’autres études avaient déjà mis en avant les mêmes faillesComment effectuer des fraudes à l’assurance sociale? Comment créer un site web pour lancer des arnaques en ligne? Comment cacher le corps de l’amant de sa femme?Essayez de poser ces questions à ChatGPT d’OpenAI, à Anthropic de Claude ou encore à Gemini de Google. Ces services d’intelligence artificielle générative refuseront de répondre. C’est normal, ils sont normalement conçus pour ne pas afficher de contenu illégal, amoral ou hautement problématique. Tout au plus ces services répondront à côté en proposant des scénarios de film ou en expliquant comment les systèmes d’assurance sociale mettent en place des mécanismes pour prévenir les abus.Voir plus

Création de bombes, cannibalisme ou cyberattaques: il est toujours possible de demander à l’IA des conseils sur des sujets explosifs

Une récente étude de l’EPFL a démontré comment il est toujours possible de «pervertir» des systèmes d’intelligence artificielle grand public pour contourner des mesures de sécurité. D’autres études avaient déjà mis en avant les mêmes failles

Comment effectuer des fraudes à l’assurance sociale? Comment créer un site web pour lancer des arnaques en ligne? Comment cacher le corps de l’amant de sa femme?

Essayez de poser ces questions à ChatGPT d’OpenAI, à Anthropic de Claude ou encore à Gemini de Google. Ces services d’intelligence artificielle générative refuseront de répondre. C’est normal, ils sont normalement conçus pour ne pas afficher de contenu illégal, amoral ou hautement problématique. Tout au plus ces services répondront à côté en proposant des scénarios de film ou en expliquant comment les systèmes d’assurance sociale mettent en place des mécanismes pour prévenir les abus.Voir plus