Les stratégies de Snowflake pour combler son écart avec Databricks dans le domaine de l’intelligence artificielle

Publié le 30 octobre 2024 à 07h35
modifié le 30 octobre 2024 à 07h35
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

L’ascension fulgurante de l’intelligence artificielle façonne l’avenir des entreprises, redéfinissant les stratégies technologiques. Snowflake, reconnu pour sa technologie de data platform révolutionnaire, s’efforce de *réduire l’écart* qui le sépare de Databricks, leader incontesté en matière de machine learning. Le défi dépasse le simple rattrapage technologique; il implique *l’intégration parfaite* de solutions innovantes pour répondre aux besoins d’une clientèle en pleine mutation. Proposer des environnements adaptés et des outils efficaces devient une priorité indiscutable pour cet acteur ambitieux. Une analyse minutieuse des récents développements de Snowflake révèle une stratégie audacieuse, alliant tradition et innovation, destinée à conquérir le domaine de l’IA.

Stratégies d’IA : Un rattrapage ambitieux

L’éditeur Snowflake, bien que parti en retrait, intensifie ses efforts pour rattraper son concurrent Databricks sur le terrain de l’intelligence artificielle. Ce dernier s’est positionné sur le machine learning bien avant l’émergence de l’IA générative, conférant à Snowflake un défi significatif à surmonter.

Snowflake ne s’est pas engagé dans l’IA dès ses débuts, perdant ainsi un avantage stratégique. Databricks, avec ses outils dédiés à l’IA générative, propose des solutions variées. En réponse, Snowflake a introduit un environnement complet de data engineering pour piloter les données. Ce cadre permet aux utilisateurs de gérer des pipelines complexes pour transformer et raffiner les données.

Environnement et outils de machine learning

Snowflake a mis sur pied un atelier de machine learning intégré, incluant un model store et un feature store. Ces outils facilitent la gestion des modèles et des caractéristiques associées. L’éditeur fournit également des outils de monitoring pour contrôler les hallucinations des IA, garantissant ainsi une utilisation adéquate des modèles développés.

Ce dispositif permet à Snowflake de rattraper son retard sur divers aspects. Toutefois, l’ascension vers l’IA générative constitue un défi distinct. Benoit Dageville, co-fondateur de Snowflake, souligne que l’IA générative nécessite des compétences moins complexes que le machine learning traditionnel.

Cortex AI : Une suite innovante et serverless

Snowflake propose Cortex AI, un ensemble de services d’IA entièrement serverless et managés. Cette suite intègre des large language models (LLM) de différents fournisseurs. Les LLM de Meta et de Mistral, par exemple, sont disponibles via des accords stratégiques.

Ces services englobent des fonctionnalités variées, notamment la traduction, la synthèse de contenu, et la génération de langage SQL. Chaque fonctionnalité permet à l’utilisateur de sélectionner le LLM adapté à son cas d’usage, optimisant ainsi les performances et réduisant les coûts liés aux ressources.

La stratégie de Snowflake vise à proposer des LLM légers et spécialisés. Un choix qui permet d’économiser en termes de ressources machine. Les utilisateurs peuvent également faire appel à des LLM tiers via leurs API, étendant ainsi l’éventail des capacités disponibles.

Optimisation des modèles à coûts réduits

Snowflake a également développé une technologie pour le fine tuning de modèles de taille moyenne, permettant d’optimiser les coûts de fonctionnement. Dageville évoque la possibilité de créer des LLM spécifiques pour des cas tels que le classement des appels d’un centre d’appel.

Il est possible d’entraîner des modèles basés sur les Snow Park Container Services, bien que ces modèles ne soient pas spécifiquement des LLM. La complexité de l’entraînement des modèles classiques persiste, avec Databricks à la pointe avec sa solution Mosaic AI Training.

Arctic : Le LLM en open source

Snowflake a lancé son propre LLM, baptisé Arctic, conçu pour être puissant tout en étant économique à l’entraînement. Ce modèle est publié en open source, permettant à la communauté de l’adopter et de l’adapter à différents besoins.

Arctic se décline en deux modèles : le LLM lui-même et un modèle d’embedding pour améliorer la recherche sémantique. Ce développement est intégré à la suite Cortex AI, positionnant Snowflake comme un acteur engagé dans l’innovation des LLM.

Cortex Search : Recherche hybride et précise

Cortex Search représente une avancée significative dans la réalisation de recherches hybrides. Ce service automatise le traitement des contenus, optimisant ainsi l’efficacité des recherches semantiques. Chaque requête génère un vecteur comparé avec les documents indexés.

En parallèle, des requêtes SQL permettent de filtrer et de paramétrer l’accès à l’information de manière précise. Les fonctionnalités de Cortex Search sont en outre enrichies par la technologie issue de l’acquisition de Neeva, offrant des performances rapides.

Streamlit : Création d’applications d’IA générative

Snowflake a introduit Streamlit comme environnement de développement pour concevoir des applications d’IA générative. Cette technologie, acquise en 2022, permet aux développeurs de créer des applications Python sur la plateforme Snowflake.

Streamlit offre des composants prêts à l’emploi, optimisés pour s’intégrer avec Cortex Search, facilitant ainsi le développement d’applications avancées comme des chatbots intelligents. Cet outil représente un atout considérable pour les data scientists.

Des synergies à travers la plateforme

Snowflake s’efforce d’intégrer l’ensemble de ses briques d’IA dans un écosystème cohérent. L’objectif est de fournir une plateforme unifiée qui conjugue machine learning traditionnel et IA générative. Le socle Horizon gère l’ensemble des processus, depuis le management jusqu’à l’interopérabilité des actifs IT.

Cette approche intégrée, à la différence des solutions des grands fournisseurs cloud, vise à simplifier l’expérience utilisateur tout en renforçant l’optimisation des coûts. La volonté de Snowflake de centraliser ces outils marque un tournant dans sa stratégie concurrentielle face à Databricks et à ses propres initiatives.

Foire aux questions courantes

Quelles sont les principales différences entre les offres d’IA de Snowflake et Databricks ?
Snowflake se concentre sur l’intégration d’un environnement de data engineering complet et des fonctionnalités d’IA générative, tandis que Databricks excelle dans l’entraînement de modèles de machine learning et propose des solutions robustes pour l’IA générative, comme Mosaic AI Training.
Comment Snowflake a-t-il comblé son retard dans le domaine du machine learning ?
Snowflake a mis en place un environnement de data engineering qui inclut un atelier de machine learning, un model store et un feature store, ainsi que des outils de monitoring pour le suivi des modèles, améliorant ainsi ses fonctionnalités en IA traditionnelle.
Quelles sont les fonctionnalités clés de Cortex AI de Snowflake ?
Cortex AI propose des services d’IA serverless intégrant des modèles de langage (LLM) tels que ceux de Meta et Mistral, et offre des fonctionnalités comme la traduction de contenus, la synthèse audio en texte, et des capacités de génération de langage SQL.
Qu’est-ce que le fine tuning de modèles dans Snowflake et pourquoi est-ce important ?
Le fine tuning permet d’entraîner des modèles de moyenne taille en utilisant des LLM de grande taille comme références, offrant un compromis entre performance et coût, ce qui est crucial pour une utilisation efficace des ressources en machine learning.
Quelle stratégie Snowflake utilise-t-il pour approcher les modèles de langage ?
Snowflake vise à proposer des LLM spécialisés et légers qui nécessitent moins de ressources, tout en permettant l’intégration d’LLM tiers via des APIs, ce qui renforce sa flexibilité et sa capacité d’adaptation.
Comment fonctionne le Cortex Search de Snowflake pour la recherche sémantique ?
Cortex Search utilise une recherche hybride alliant recherche sémantique et requêtes SQL, permettant des interrogations précises et une gestion efficace des documents stockés dans l’index pour garantir des résultats pertinents.
Quels outils Snowflake propose-t-il pour créer des applications d’IA générative ?
Snowflake a acquis Streamlit, un environnement de développement open source permettant de créer des applications d’IA générative, comme des assistants intelligents, qui s’intègrent facilement avec les services de Snowflake.
Comment Snowflake gère-t-il la sécurité des données dans ses solutions d’IA ?
Snowflake met en place des contrôles d’accès stricts et des fonctionnalités de gestion des droits au sein de sa plateforme, garantissant une sécurité optimale lors de l’utilisation de ses services d’IA.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsLes stratégies de Snowflake pour combler son écart avec Databricks dans le...

Les enjeux économiques et environnementaux de la montée en puissance de l’intelligence artificielle

découvrez les enjeux économiques et environnementaux liés à l'essor de l'intelligence artificielle. cet article explore comment cette technologie révolutionnaire impacte l'économie mondiale tout en soulevant des défis écologiques cruciaux à l'ère numérique.

Les premières estimations inquiétantes du ‘Nostradamus des sondages’ sur la victoire de Harris

découvrez les premières estimations alarmantes du célèbre 'nostradamus des sondages' concernant la victoire de harris. plongez dans une analyse détaillée des prédictions qui secouent le paysage politique et suscitent des interrogations sur l'avenir des élections.
découvrez comment jeff bezos et openai soutiennent physical intelligence, la startup révolutionnaire de la robotique ia, maintenant valorisée à 2,4 milliards de dollars. une évolution marquante dans le domaine de l'intelligence artificielle et de la robotique.
découvrez comment claude révolutionne l'analyse des pdf avec ses nouvelles fonctionnalités. explorez sa capacité à examiner les éléments visuels et à offrir des insights précieux pour optimiser vos documents.

Cybersécurité : Google découvre une faille grâce à son agent intelligent Big Sleep

découvrez comment google a identifié une faille de cybersécurité grâce à son agent intelligent, big sleep. plongez dans les détails de cette avancée technologique et son impact sur la sécurité numérique.

L’Intelligence Artificielle : un Nouveau Partenaire dans la Régulation Génétique

découvrez comment l'intelligence artificielle révolutionne la régulation génétique en offrant des solutions novatrices et efficaces. cet article explore les synergies entre l'ia et les avancées biotechnologiques pour une meilleure compréhension et manipulation de l'adn.