mistral AI pixtral 12B

Pixtral 12B : Mistral lance la première IA française texte, vision et audio !

Ca y est ! La startup française Mistral AI lance sa première IA multimodale, Pixtral 12B. Ce nouveau modèle peut comprendre le texte, mais aussi l’image grâce à ses capacités de vision ! Découvrez ce qu’elle vaut par rapport à -4o ou , et comment la tester ! 

Après les chatbots purement textuels comme GPT-4, la prochaine étape est celle des IA multimodales. Ces modèles sont non seulement capables de comprendre les prompts sous forme de texte, mais aussi d’images, d’audio ou encore de vidéos

Au cours des derniers mois, nous avons notamment assisté au lancement de GPT-4o par OpenAI, 3 par ou encore de Gemini par Google. Ces nouveaux modèles permettent de s’adresser vocalement à l’IA, ou de leur demander d’analyser des audio ou des images

A présent, c’est au tour de Mistral AI, le champion français de l’IA, de lancer sa première IA multimodale : Pixtral 12B.

Pixtral 12B, une IA capable de répondre à vos questions sur des images 

Cette intelligence artificielle allie les capacités de langage et de vision. Les utilisateurs peuvent combiner des prompts textuels avec des images pour demander à l’IA de les analyser. 

Il vous suffira donc d’uploader une image ou de fournir un lien, et de poser des questions pour obtenir des informations supplémentaires à son sujet. 

Les premiers testeurs rapportent sur X que son architecture 24GB est constituée de 40 couches, 14 336 tailles de dimension cachées, et 32 têtes d’attention pour le traitement informatique. 

En ce qui concerne la vision, il est doté d’un encodeur dédié capable de prendre en charge une définition d’image de 1024×1024 et 24 couches cachées pour le traitement d’image avancé. 

On ignore pour l’instant sur quelles données Pixtral 12B a été entraînée. Cette information est tenue secrète par Mistral, probablement pour protéger sa technologie… 

Mistral entre dans l’arène du multimodal

Même s’il s’agit du premier modèle multimodal de Mistral, rappelons qu’il existe déjà plusieurs IA de ce type développées par ses concurrents, dont et Anthropic. Alors, au-delà du chauvinisme, comment Pixtral-12 tire-t-il son épingle du jeu ?

Selon la startup, ce modèle est capable de prendre en charge nativement un nombre arbitraire d’images d’une taille également arbitraire. 

Avec le lancement de cette IA, Mistral va contribuer à démocratiser l’accès aux applications visuelles comme l’analyse de contenu ou de données. 

L’entreprise française continue de s’attaquer agressivement aux géants américains et chinois comme OpenAI. Depuis ses débuts en 2023, elle a lancé de nombreux modèles de haute qualité et a noué des partenariats avec des titans tels que , AWS et Snowflake. 

Ceci lui permet d’étendre la portée de sa technologie. Début juin 2024, la startup a levé 640 millions de dollars pour atteindre une capitalisation de 6 milliards de dollars. 

Elle a ensuite lancé Mistral Large 2 : un modèle rivalisant avec GPT-4 et doté d’importance capacités multilingues, mais aussi de hautes performances en matière de raisonnement, de génération de code et de mathématiques. 

De plus, Mistral a également lancé le modèle Mixtral 8x22B de type mixture-of-experts, le modèle de codage à 22 milliards de paramètres Codestral, et un modèle spécialement dédié au raisonnement mathématique et aux découvertes scientifiques. 

Autant dire que cette startup se hisse peu à peu parmi les plus grands leaders de l’intelligence artificielle, faisant la fierté de la France dans ce domaine en plein essor !

YouTube video

Comment utiliser Pixtral 12B ? 

Pour le moment, Pixtral 12b n’est malheureusement pas disponible sur le web. Néanmoins, vous pouvez télécharger son code source sur Hugging Face ou GitHub pour la tester sur des instances individuelles. 

Comme à son habitude, Mistral a commencé par relâcher un lien torrent pour permettre de télécharger les fichiers pour le nouveau modèle. 

Toutefois, selon Sophia Yang, directrice des relations développeur, la startup proposera très bientôt Pixtral 12B par le biais de son chatbot web Le Chat

Par ailleurs, il sera disponible via «  La Plateforme », qui fournit des endpoints API permettant d’utiliser les différents modèles de Mistral. 

YouTube video

Alors, qu’en pensez-vous ? Comptez-vous utiliser Pixtral 12B ? Attachez-vous de l’importance à la souveraineté française dans le domaine de l’IA ? Partagez votre avis en commentaire !

Restez à la pointe de l’information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d’avance.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *