Les stratégies de Snowflake pour combler son écart avec Databricks dans le domaine de l’intelligence artificielle

Publié le 30 octobre 2024 à 07h35
modifié le 30 octobre 2024 à 07h35
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

L’ascension fulgurante de l’intelligence artificielle façonne l’avenir des entreprises, redéfinissant les stratégies technologiques. Snowflake, reconnu pour sa technologie de data platform révolutionnaire, s’efforce de *réduire l’écart* qui le sépare de Databricks, leader incontesté en matière de machine learning. Le défi dépasse le simple rattrapage technologique; il implique *l’intégration parfaite* de solutions innovantes pour répondre aux besoins d’une clientèle en pleine mutation. Proposer des environnements adaptés et des outils efficaces devient une priorité indiscutable pour cet acteur ambitieux. Une analyse minutieuse des récents développements de Snowflake révèle une stratégie audacieuse, alliant tradition et innovation, destinée à conquérir le domaine de l’IA.

Stratégies d’IA : Un rattrapage ambitieux

L’éditeur Snowflake, bien que parti en retrait, intensifie ses efforts pour rattraper son concurrent Databricks sur le terrain de l’intelligence artificielle. Ce dernier s’est positionné sur le machine learning bien avant l’émergence de l’IA générative, conférant à Snowflake un défi significatif à surmonter.

Snowflake ne s’est pas engagé dans l’IA dès ses débuts, perdant ainsi un avantage stratégique. Databricks, avec ses outils dédiés à l’IA générative, propose des solutions variées. En réponse, Snowflake a introduit un environnement complet de data engineering pour piloter les données. Ce cadre permet aux utilisateurs de gérer des pipelines complexes pour transformer et raffiner les données.

Environnement et outils de machine learning

Snowflake a mis sur pied un atelier de machine learning intégré, incluant un model store et un feature store. Ces outils facilitent la gestion des modèles et des caractéristiques associées. L’éditeur fournit également des outils de monitoring pour contrôler les hallucinations des IA, garantissant ainsi une utilisation adéquate des modèles développés.

Ce dispositif permet à Snowflake de rattraper son retard sur divers aspects. Toutefois, l’ascension vers l’IA générative constitue un défi distinct. Benoit Dageville, co-fondateur de Snowflake, souligne que l’IA générative nécessite des compétences moins complexes que le machine learning traditionnel.

Cortex AI : Une suite innovante et serverless

Snowflake propose Cortex AI, un ensemble de services d’IA entièrement serverless et managés. Cette suite intègre des large language models (LLM) de différents fournisseurs. Les LLM de Meta et de Mistral, par exemple, sont disponibles via des accords stratégiques.

Ces services englobent des fonctionnalités variées, notamment la traduction, la synthèse de contenu, et la génération de langage SQL. Chaque fonctionnalité permet à l’utilisateur de sélectionner le LLM adapté à son cas d’usage, optimisant ainsi les performances et réduisant les coûts liés aux ressources.

La stratégie de Snowflake vise à proposer des LLM légers et spécialisés. Un choix qui permet d’économiser en termes de ressources machine. Les utilisateurs peuvent également faire appel à des LLM tiers via leurs API, étendant ainsi l’éventail des capacités disponibles.

Optimisation des modèles à coûts réduits

Snowflake a également développé une technologie pour le fine tuning de modèles de taille moyenne, permettant d’optimiser les coûts de fonctionnement. Dageville évoque la possibilité de créer des LLM spécifiques pour des cas tels que le classement des appels d’un centre d’appel.

Il est possible d’entraîner des modèles basés sur les Snow Park Container Services, bien que ces modèles ne soient pas spécifiquement des LLM. La complexité de l’entraînement des modèles classiques persiste, avec Databricks à la pointe avec sa solution Mosaic AI Training.

Arctic : Le LLM en open source

Snowflake a lancé son propre LLM, baptisé Arctic, conçu pour être puissant tout en étant économique à l’entraînement. Ce modèle est publié en open source, permettant à la communauté de l’adopter et de l’adapter à différents besoins.

Arctic se décline en deux modèles : le LLM lui-même et un modèle d’embedding pour améliorer la recherche sémantique. Ce développement est intégré à la suite Cortex AI, positionnant Snowflake comme un acteur engagé dans l’innovation des LLM.

Cortex Search : Recherche hybride et précise

Cortex Search représente une avancée significative dans la réalisation de recherches hybrides. Ce service automatise le traitement des contenus, optimisant ainsi l’efficacité des recherches semantiques. Chaque requête génère un vecteur comparé avec les documents indexés.

En parallèle, des requêtes SQL permettent de filtrer et de paramétrer l’accès à l’information de manière précise. Les fonctionnalités de Cortex Search sont en outre enrichies par la technologie issue de l’acquisition de Neeva, offrant des performances rapides.

Streamlit : Création d’applications d’IA générative

Snowflake a introduit Streamlit comme environnement de développement pour concevoir des applications d’IA générative. Cette technologie, acquise en 2022, permet aux développeurs de créer des applications Python sur la plateforme Snowflake.

Streamlit offre des composants prêts à l’emploi, optimisés pour s’intégrer avec Cortex Search, facilitant ainsi le développement d’applications avancées comme des chatbots intelligents. Cet outil représente un atout considérable pour les data scientists.

Des synergies à travers la plateforme

Snowflake s’efforce d’intégrer l’ensemble de ses briques d’IA dans un écosystème cohérent. L’objectif est de fournir une plateforme unifiée qui conjugue machine learning traditionnel et IA générative. Le socle Horizon gère l’ensemble des processus, depuis le management jusqu’à l’interopérabilité des actifs IT.

Cette approche intégrée, à la différence des solutions des grands fournisseurs cloud, vise à simplifier l’expérience utilisateur tout en renforçant l’optimisation des coûts. La volonté de Snowflake de centraliser ces outils marque un tournant dans sa stratégie concurrentielle face à Databricks et à ses propres initiatives.

Foire aux questions courantes

Quelles sont les principales différences entre les offres d’IA de Snowflake et Databricks ?
Snowflake se concentre sur l’intégration d’un environnement de data engineering complet et des fonctionnalités d’IA générative, tandis que Databricks excelle dans l’entraînement de modèles de machine learning et propose des solutions robustes pour l’IA générative, comme Mosaic AI Training.
Comment Snowflake a-t-il comblé son retard dans le domaine du machine learning ?
Snowflake a mis en place un environnement de data engineering qui inclut un atelier de machine learning, un model store et un feature store, ainsi que des outils de monitoring pour le suivi des modèles, améliorant ainsi ses fonctionnalités en IA traditionnelle.
Quelles sont les fonctionnalités clés de Cortex AI de Snowflake ?
Cortex AI propose des services d’IA serverless intégrant des modèles de langage (LLM) tels que ceux de Meta et Mistral, et offre des fonctionnalités comme la traduction de contenus, la synthèse audio en texte, et des capacités de génération de langage SQL.
Qu’est-ce que le fine tuning de modèles dans Snowflake et pourquoi est-ce important ?
Le fine tuning permet d’entraîner des modèles de moyenne taille en utilisant des LLM de grande taille comme références, offrant un compromis entre performance et coût, ce qui est crucial pour une utilisation efficace des ressources en machine learning.
Quelle stratégie Snowflake utilise-t-il pour approcher les modèles de langage ?
Snowflake vise à proposer des LLM spécialisés et légers qui nécessitent moins de ressources, tout en permettant l’intégration d’LLM tiers via des APIs, ce qui renforce sa flexibilité et sa capacité d’adaptation.
Comment fonctionne le Cortex Search de Snowflake pour la recherche sémantique ?
Cortex Search utilise une recherche hybride alliant recherche sémantique et requêtes SQL, permettant des interrogations précises et une gestion efficace des documents stockés dans l’index pour garantir des résultats pertinents.
Quels outils Snowflake propose-t-il pour créer des applications d’IA générative ?
Snowflake a acquis Streamlit, un environnement de développement open source permettant de créer des applications d’IA générative, comme des assistants intelligents, qui s’intègrent facilement avec les services de Snowflake.
Comment Snowflake gère-t-il la sécurité des données dans ses solutions d’IA ?
Snowflake met en place des contrôles d’accès stricts et des fonctionnalités de gestion des droits au sein de sa plateforme, garantissant une sécurité optimale lors de l’utilisation de ses services d’IA.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsLes stratégies de Snowflake pour combler son écart avec Databricks dans le...

Le phénomène d’un groupe inexistant qui cartonne sur Spotify : une réflexion sur les enjeux de la plateforme

découvrez l'énigmatique succès d'un groupe fictif sur spotify et plongez dans une réflexion profonde sur les enjeux et dynamiques de la plateforme musicale. qu'est-ce qui rend ce phénomène si captivant ?

Accélérer la découverte scientifique grâce à l’intelligence artificielle

découvrez comment l'intelligence artificielle révolutionne la recherche scientifique en accélérant la découverte de nouveaux traitements, technologies et solutions innovantes. plongez dans un avenir où la science évolue à une vitesse vertigineuse grâce à des algorithmes avancés et des analyses de données puissantes.
découvrez le bilan des fusions-acquisitions en cybersécurité pour juin, où les avancées en intelligence artificielle révolutionnent le secteur. analyse des tendances et des impacts sur le marché.
découvrez comment l'épreuve du grand oral du bac évolue à l'ère de chatgpt, en explorant l'importance de la profondeur des connaissances et de l'argumentation. une réflexion essentielle pour les futurs bacheliers confrontés à de nouveaux outils numériques.

découverte de l’impact de l’IA sur notre vie quotidienne

découvrez comment l'intelligence artificielle transforme notre quotidien en influençant nos habitudes, nos choix et nos interactions. explorez les technologies innovantes qui révolutionnent notre manière de vivre et de travailler, et plongez dans l'avenir façonné par l'ia.

pourquoi l’intelligence artificielle va surpasser McKinsey, mais pas tout de suite

découvrez pourquoi l'intelligence artificielle est en passe de dépasser mckinsey en matière d'analyse et de conseil, tout en expliquant que cette transition ne se produira pas immédiatement. une exploration des forces et des limites de l'ia dans le monde du conseil.