Optimiser le ChatGPT français constitue un défi majeur pour Linagora. Face à une concurrence acharnée, l’entreprise envisage des solutions innovantes et durables. Engagée dans une démarche résolue, Linagora explore une infrastructure cloud souveraine pour son assistant linguistique, Lucie, avec l’ambition de réduire les coûts sans sacrifier la performance.
Les choix technologiques s’articulent autour de cartes graphiques optimales assurant un rapport performance/prix enviable. La sélection des dispositifs GPU comme les Nvidia A4000 permet un déploiement efficace des modèles de langue, tout en maintenant un budget maîtrisé. En parallèle, Linagora envisage une architecture multicloud pour s’assurer de la souveraineté des données tout en répondant à des exigences de volumétrie toujours croissantes.
Stratégies de Linagora pour le déploiement économique de son ChatGPT français
La société Linagora s’oriente vers un assistant virtuel open source, baptisé Lucie. Ce modèle de langue, qui repose sur une infrastructure de cloud souveraine, affiche une ambition : concurrencer les principales solutions du marché, comme ChatGPT. L’architecture de Lucie repose sur 7 milliards de paramètres, permettant ainsi un traitement efficace des demandes utilisateurs.
Infrastructure cloud et choix technologiques
Dans le cadre de sa mise en œuvre, Linagora choisit de s’appuyer sur le cloud d’EDF, Exaion. Ce choix stratégique permet de tirer parti des cartes graphiques RTX A4000, offrant 16 Go de NVRAM, issues d’un supercalculateur. Ce partenariat avec Exaion facilite la création d’une infrastructure de test, essentielle pour la phase de développement de Lucie.
Le coût d’acquisition d’une RTX A4000 s’élève à 1 500 dollars, un tarif bien inférieur à celui des cartes Nvidia H100, qui peuvent atteindre 25 000 dollars. Ce choix se justifie par un rapport performance/coût jugé favorable pour le projet.
Optimisation des performances et gestion des coûts
Les équipes de Linagora cherchent à réduire les coûts d’inférence tout en maximisant les performances. La carte RTX A4000, en affichant une enveloppe thermique de 140 watts, consomme moins d’énergie que la H100, dotée d’un TDP de 350 watts. Cette dynamique se traduit par des économies significatives sur la facture énergétique.
Des tests effectués par Linagora révèlent que la carte A4000 peut traiter environ 10 prompts par seconde, une vitesse jugée insuffisante pour les ambitions d’évolutivité de l’entreprise. Par conséquent, une architecture multicloud semble nécessaire pour répondre à la demande. Linagora envisage d’utiliser plusieurs services cloud, notamment OVHcloud et Scaleway, pour atteindre ses objectifs.
Perspectives d’avenir avec le modèle Mamba
Linagora envisage d’implémenter dans le futur des modèles de type Mamba, qui permettent de traiter les données de manière plus efficace. Contrairement aux modèles basés sur des transformers, Mamba filtre les données moins pertinentes, optimisant ainsi le traitement. Ce choix pourrait offrir une réduction significative des besoins en mémoire et en performances graphiques.
Les architectures Mamba affichent des avantages notables pour l’exécution de modèles d’IA, permettant une exploitation plus souple des ressources disponibles. Cette approche pourrait révolutionner la gestion technologique tout en annulant le débat sur le choix rigide des cartes graphiques.
Enjeux de souveraineté et respect des réglementations
Le développement de Lucie s’intègre dans un contexte de souveraineté numérique. Linagora privilégie des infrastructures labellisées, telles que celles respectant les normes SecnumCloud. Cela garantit l’isolement des données des réglementations extraterritoriales, comme le Cloud Act américain.
En vue de la mise en route de Lucie, Linagora se positionne ainsi comme un acteur clés dans l’écosystème des IA open source, tout en assurant une conformité optimale face aux enjeux de sécurité et de responsabilité numérique.
Afin de parfaire l’expérience utilisateur et d’assurer une offre compétitive, l’entreprise mettra en œuvre un suivi des performances et une adaptation continue de ses choix technologiques. Cette stratégie, fondée sur la réduction des coûts d’exploitation, se traduit par une volonté de rendre l’IA accessible et fonctionnelle pour un large public.
Questions fréquemment posées sur les stratégies de Linagora pour réduire les coûts de son ChatGPT français
Quelles sont les principales stratégies de Linagora pour optimiser les coûts de son ChatGPT français ?
Linagora mise sur l’utilisation d’une architecture multicloud, en s’appuyant sur des infrastructures comme celles d’Exaion d’EDF et d’OVHcloud, pour sélectionner les cartes graphiques offrant le meilleur rapport performance-coût.
Comment Linagora compte-t-elle tirer parti du cloud pour réduire les coûts ?
La société choisit des solutions cloud souveraines qui permettent d’exécuter le modèle sans surcharger les capacités matérielles, tout en maintenant une empreinte environnementale réduite.
Quels types de cartes graphiques Linagora utilise-t-elle pour son modèle Lucie ?
Linagora utilise principalement des cartes Nvidia A4000 et L4, qui offrent de bonnes performances à un coût compétitif, tout en explorant d’autres options pour améliorer la volumétrie de traitement.
Comment Linagora évalue-t-elle le rapport coût-efficacité de ses ressources matérielles ?
Des benchmarks et des tests de performance permettent à Linagora de comparer les cartes graphiques sur la base de leur coût d’acquisition et de leur efficacité dans les tâches d’inférence requises par l’IA.
Quels sont les avantages d’un modèle de langue à petite échelle (SLM) pour Linagora ?
Un SLM comme Lucie permet une exécution plus efficace des requêtes avec moins de besoin en ressources, tout en étant capable de rivaliser avec d’autres modèles de taille similaire sur le marché.
Pourquoi Linagora se tourne-t-elle vers des GPU d’ancienne génération comme les A4000 ?
Les GPU d’ancienne génération, bien que moins puissants, offrent un excellent rapport qualité-prix en termes de coûts d’acquisition et de consommation d’énergie, rendant leur utilisation particulièrement judicieuse pour le projet Lucie.
Comment Linagora aborde-t-elle la question de la souveraineté des données dans sa stratégie ?
Linagora choisit des solutions cloud labellisées SecnumCloud, garantissant que les données restent sous le cadre législatif français et sont isolées des réglementations extraterritoriales, ce qui est crucial pour ses utilisateurs.
Quelles seront les implications de l’architecture multicloud sur les coûts d’exploitation ?
Cette architecture réduit les risques d’engorgement et améliore la capacité de traitement, tout en garantissant une flexibilité qui aide à mieux gérer les coûts operatifs et à optimiser les ressources utilisées.
Linagora prévoit-elle d’utiliser de nouvelles technologies pour améliorer ses coûts à l’avenir ?
Oui, Linagora envisage d’intégrer des modèles de type Mamba qui permettraient une meilleure gestion des ressources, réduisant significativement le temps d’inférence tout en optimisant les performances.