Les stratégies de Linagora pour réduire les coûts de son ChatGPT français

Publié le 15 janvier 2025 à 08h12
modifié le 15 janvier 2025 à 08h12
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

Optimiser le ChatGPT français constitue un défi majeur pour Linagora. Face à une concurrence acharnée, l’entreprise envisage des solutions innovantes et durables. Engagée dans une démarche résolue, Linagora explore une infrastructure cloud souveraine pour son assistant linguistique, Lucie, avec l’ambition de réduire les coûts sans sacrifier la performance.

Les choix technologiques s’articulent autour de cartes graphiques optimales assurant un rapport performance/prix enviable. La sélection des dispositifs GPU comme les Nvidia A4000 permet un déploiement efficace des modèles de langue, tout en maintenant un budget maîtrisé. En parallèle, Linagora envisage une architecture multicloud pour s’assurer de la souveraineté des données tout en répondant à des exigences de volumétrie toujours croissantes.

Stratégies de Linagora pour le déploiement économique de son ChatGPT français

La société Linagora s’oriente vers un assistant virtuel open source, baptisé Lucie. Ce modèle de langue, qui repose sur une infrastructure de cloud souveraine, affiche une ambition : concurrencer les principales solutions du marché, comme ChatGPT. L’architecture de Lucie repose sur 7 milliards de paramètres, permettant ainsi un traitement efficace des demandes utilisateurs.

Infrastructure cloud et choix technologiques

Dans le cadre de sa mise en œuvre, Linagora choisit de s’appuyer sur le cloud d’EDF, Exaion. Ce choix stratégique permet de tirer parti des cartes graphiques RTX A4000, offrant 16 Go de NVRAM, issues d’un supercalculateur. Ce partenariat avec Exaion facilite la création d’une infrastructure de test, essentielle pour la phase de développement de Lucie.

Le coût d’acquisition d’une RTX A4000 s’élève à 1 500 dollars, un tarif bien inférieur à celui des cartes Nvidia H100, qui peuvent atteindre 25 000 dollars. Ce choix se justifie par un rapport performance/coût jugé favorable pour le projet.

Optimisation des performances et gestion des coûts

Les équipes de Linagora cherchent à réduire les coûts d’inférence tout en maximisant les performances. La carte RTX A4000, en affichant une enveloppe thermique de 140 watts, consomme moins d’énergie que la H100, dotée d’un TDP de 350 watts. Cette dynamique se traduit par des économies significatives sur la facture énergétique.

Des tests effectués par Linagora révèlent que la carte A4000 peut traiter environ 10 prompts par seconde, une vitesse jugée insuffisante pour les ambitions d’évolutivité de l’entreprise. Par conséquent, une architecture multicloud semble nécessaire pour répondre à la demande. Linagora envisage d’utiliser plusieurs services cloud, notamment OVHcloud et Scaleway, pour atteindre ses objectifs.

Perspectives d’avenir avec le modèle Mamba

Linagora envisage d’implémenter dans le futur des modèles de type Mamba, qui permettent de traiter les données de manière plus efficace. Contrairement aux modèles basés sur des transformers, Mamba filtre les données moins pertinentes, optimisant ainsi le traitement. Ce choix pourrait offrir une réduction significative des besoins en mémoire et en performances graphiques.

Les architectures Mamba affichent des avantages notables pour l’exécution de modèles d’IA, permettant une exploitation plus souple des ressources disponibles. Cette approche pourrait révolutionner la gestion technologique tout en annulant le débat sur le choix rigide des cartes graphiques.

Enjeux de souveraineté et respect des réglementations

Le développement de Lucie s’intègre dans un contexte de souveraineté numérique. Linagora privilégie des infrastructures labellisées, telles que celles respectant les normes SecnumCloud. Cela garantit l’isolement des données des réglementations extraterritoriales, comme le Cloud Act américain.

En vue de la mise en route de Lucie, Linagora se positionne ainsi comme un acteur clés dans l’écosystème des IA open source, tout en assurant une conformité optimale face aux enjeux de sécurité et de responsabilité numérique.

Afin de parfaire l’expérience utilisateur et d’assurer une offre compétitive, l’entreprise mettra en œuvre un suivi des performances et une adaptation continue de ses choix technologiques. Cette stratégie, fondée sur la réduction des coûts d’exploitation, se traduit par une volonté de rendre l’IA accessible et fonctionnelle pour un large public.

Questions fréquemment posées sur les stratégies de Linagora pour réduire les coûts de son ChatGPT français

Quelles sont les principales stratégies de Linagora pour optimiser les coûts de son ChatGPT français ?
Linagora mise sur l’utilisation d’une architecture multicloud, en s’appuyant sur des infrastructures comme celles d’Exaion d’EDF et d’OVHcloud, pour sélectionner les cartes graphiques offrant le meilleur rapport performance-coût.
Comment Linagora compte-t-elle tirer parti du cloud pour réduire les coûts ?
La société choisit des solutions cloud souveraines qui permettent d’exécuter le modèle sans surcharger les capacités matérielles, tout en maintenant une empreinte environnementale réduite.
Quels types de cartes graphiques Linagora utilise-t-elle pour son modèle Lucie ?
Linagora utilise principalement des cartes Nvidia A4000 et L4, qui offrent de bonnes performances à un coût compétitif, tout en explorant d’autres options pour améliorer la volumétrie de traitement.
Comment Linagora évalue-t-elle le rapport coût-efficacité de ses ressources matérielles ?
Des benchmarks et des tests de performance permettent à Linagora de comparer les cartes graphiques sur la base de leur coût d’acquisition et de leur efficacité dans les tâches d’inférence requises par l’IA.
Quels sont les avantages d’un modèle de langue à petite échelle (SLM) pour Linagora ?
Un SLM comme Lucie permet une exécution plus efficace des requêtes avec moins de besoin en ressources, tout en étant capable de rivaliser avec d’autres modèles de taille similaire sur le marché.
Pourquoi Linagora se tourne-t-elle vers des GPU d’ancienne génération comme les A4000 ?
Les GPU d’ancienne génération, bien que moins puissants, offrent un excellent rapport qualité-prix en termes de coûts d’acquisition et de consommation d’énergie, rendant leur utilisation particulièrement judicieuse pour le projet Lucie.
Comment Linagora aborde-t-elle la question de la souveraineté des données dans sa stratégie ?
Linagora choisit des solutions cloud labellisées SecnumCloud, garantissant que les données restent sous le cadre législatif français et sont isolées des réglementations extraterritoriales, ce qui est crucial pour ses utilisateurs.
Quelles seront les implications de l’architecture multicloud sur les coûts d’exploitation ?
Cette architecture réduit les risques d’engorgement et améliore la capacité de traitement, tout en garantissant une flexibilité qui aide à mieux gérer les coûts operatifs et à optimiser les ressources utilisées.
Linagora prévoit-elle d’utiliser de nouvelles technologies pour améliorer ses coûts à l’avenir ?
Oui, Linagora envisage d’intégrer des modèles de type Mamba qui permettraient une meilleure gestion des ressources, réduisant significativement le temps d’inférence tout en optimisant les performances.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsLes stratégies de Linagora pour réduire les coûts de son ChatGPT français

un aperçu des employés touchés par les récents licenciements massifs chez Xbox

découvrez un aperçu des employés impactés par les récents licenciements massifs chez xbox. cette analyse explore les circonstances, les témoignages et les implications de ces décisions stratégiques pour l'avenir de l'entreprise et ses salariés.
découvrez comment openai met en œuvre des stratégies innovantes pour fidéliser ses talents et se démarquer face à la concurrence croissante de meta et de son équipe d'intelligence artificielle. un aperçu des initiatives clés pour attirer et retenir les meilleurs experts du secteur.
découvrez comment une récente analyse met en lumière l'inefficacité du sommet sur l'action en faveur de l'ia pour lever les obstacles rencontrés par les entreprises. un éclairage pertinent sur les enjeux et attentes du secteur.

IA générative : un tournant décisif pour l’avenir du discours de marque

explorez comment l'ia générative transforme le discours de marque, offrant de nouvelles opportunités pour engager les consommateurs et personnaliser les messages. découvrez les impacts de cette technologie sur le marketing et l'avenir de la communication.

Fonction publique : des recommandations pour réguler l’utilisation de l’IA

découvrez nos recommandations sur la régulation de l'utilisation de l'intelligence artificielle dans la fonction publique. un guide essentiel pour garantir une mise en œuvre éthique et respectueuse des valeurs républicaines.

L’IA découvre une formule de peinture pour rafraîchir les bâtiments

découvrez comment l'intelligence artificielle a développé une formule innovante de peinture destinée à revitaliser les bâtiments, alliant esthétique et durabilité. une révolution dans le secteur de la construction qui pourrait transformer nos horizons urbains.