À propos de Mistral Le Pixtral
Pixtral 12B est le premier modèle multimodal open source de Mistral AI, le laboratoire français d'IA basé à Paris. Publié en septembre 2024 sous Apache 2.0, il associe un backbone de langage de 12 milliards de paramètres à un encodeur vision de 400 millions de paramètres, prend en charge un contexte de 128 K tokens et ingère un nombre quelconque d'images en résolution et ratio natifs. Il vise la compréhension d'images, l'OCR, l'analyse de graphiques et de documents et le visual question answering, tout en conservant les bonnes performances texte, suivi d'instructions, code et maths de Mistral. Poids gratuits à télécharger et auto-hébergeables ; l'API Mistral facture environ 0,15 USD par million de tokens en entrée et en sortie.

Midjourney
Runway
Leonardo.AI
Stability AI
Ideogram 
