Lucie : l'IA française entre précipitation et moquerie
23 janvier : OpenLLM/Linagora lancent la plateforme Lucie, un LLM français avec une GenIA. L'entraitement a débuté en août dernier durant 80 jour sur le HPC Jean Zay, soit environ 550 000 heures de temps GPU. Le LLM repose sur des données open source, dont un tiers moitié purement français. La plateforme lucie.chat s'appuie sur le modème Lucie 7B. Mais les limitations du modèle et des données ont rapidement montré les limites de Lucie. Ce modèle utilise donc 6 milliards de paramètres. Les algos sont accessibles et le tout sous licence Apache 2. Pourquoi lancer une version incomplète aussi vite ? Deux éléments sont mis en avant : 1 Le besoin de récupérer des requêtes pour poursuivre l'entrainement. Un LLM de type GPT ou LLAMA représente 12 à 18 mois d'entrainement2 Avoir une plateforme visible pour le sommet pour l'action sur l'IA en févrierLa version en ligne le 23 janvier était une version technique. Mais rapidement, l'accès au service a été compliqué et la qualité des réponses a été mise en doute et partagée sur les réseaux (ex. : les oeufs de vache). Sans doute aurait-il fallu indiquer dès le départ : projet de recherche en cours de développement pour éviter frustrations et critiques.Quelques jours plus tard, des précisions ont été apportées et nuancent fortement les propos initiaux :"Un projet de recherche académique encore en phase initialeLUCIE est avant tout un projet de recherche académique visant à démontrer les capacités à développer des communs numériques d’IA générative. À ce jour, aucun travail spécifique n’a été réalisé avec l’Éducation Nationale pour personnaliser ou adapter le modèle à un usage éducatif.Toute utilisation dans un contexte de production est donc prématurée." dixit la note d'informations. Or, initialement, éduscol Lettres disait que cette IA open source devrait être adaptée pour le monde de l'éducation courant 2025. Donc dans sa version actuelle, Lucie est une plateforme brute pour la recherche, le fonctionnement est minimal, pas d'optimisation pour calibrer les réponses, le RAG, les garde-fous ne sont pas (encore) déployés pour éviter toute dévience du modèle. Linagora fait son mea culpa. C'est bien mais le lancement aurait du être plus encadré pour éviter cette communication de crise. Une bêta privé aurait été une approche prudente pour limiter l'accès et comprendre les retours. Ouvrir un service alpha / bêta est toujours un risque. Et manque de chance, Lucie débarque quand DeepSeek occupe les esprits et arrive à se comparer à OpenAI... A voir commen Lucie va pouvoir évoluer et quand. En face, la concurrence avance vite, très vite. Catégorie actualité: TechnologiesIA, Lucie, OpenLLM, LINAGORAImage actualité AMP:
23 janvier : OpenLLM/Linagora lancent la plateforme Lucie, un LLM français avec une GenIA. L'entraitement a débuté en août dernier durant 80 jour sur le HPC Jean Zay, soit environ 550 000 heures de temps GPU. Le LLM repose sur des données open source, dont un tiers moitié purement français. La plateforme lucie.chat s'appuie sur le modème Lucie 7B. Mais les limitations du modèle et des données ont rapidement montré les limites de Lucie.
Ce modèle utilise donc 6 milliards de paramètres. Les algos sont accessibles et le tout sous licence Apache 2.
Pourquoi lancer une version incomplète aussi vite ? Deux éléments sont mis en avant :
1 Le besoin de récupérer des requêtes pour poursuivre l'entrainement. Un LLM de type GPT ou LLAMA représente 12 à 18 mois d'entrainement
2 Avoir une plateforme visible pour le sommet pour l'action sur l'IA en février
La version en ligne le 23 janvier était une version technique. Mais rapidement, l'accès au service a été compliqué et la qualité des réponses a été mise en doute et partagée sur les réseaux (ex. : les oeufs de vache). Sans doute aurait-il fallu indiquer dès le départ : projet de recherche en cours de développement pour éviter frustrations et critiques.Quelques jours plus tard, des précisions ont été apportées et nuancent fortement les propos initiaux :
"Un projet de recherche académique encore en phase initialeLUCIE est avant tout un projet de recherche académique visant à démontrer les capacités à développer des communs numériques d’IA générative. À ce jour, aucun travail spécifique n’a été réalisé avec l’Éducation Nationale pour personnaliser ou adapter le modèle à un usage éducatif.
Toute utilisation dans un contexte de production est donc prématurée." dixit la note d'informations. Or, initialement, éduscol Lettres disait que cette IA open source devrait être adaptée pour le monde de l'éducation courant 2025.
Donc dans sa version actuelle, Lucie est une plateforme brute pour la recherche, le fonctionnement est minimal, pas d'optimisation pour calibrer les réponses, le RAG, les garde-fous ne sont pas (encore) déployés pour éviter toute dévience du modèle.
Linagora fait son mea culpa. C'est bien mais le lancement aurait du être plus encadré pour éviter cette communication de crise. Une bêta privé aurait été une approche prudente pour limiter l'accès et comprendre les retours. Ouvrir un service alpha / bêta est toujours un risque. Et manque de chance, Lucie débarque quand DeepSeek occupe les esprits et arrive à se comparer à OpenAI...
A voir commen Lucie va pouvoir évoluer et quand. En face, la concurrence avance vite, très vite.