Alibaba dévoile deux modèles d’IA open source qui comprennent les images

Lecture 6 minutes

Alibaba a révélé son intention de fournir les deux modèles d’IA sous forme de solutions open source à la communauté mondiale.

Le géant technologique chinois Alibaba Group repousse les limites de l’intelligence artificielle (IA) en introduisant deux modèles innovants de langage à grande vision (LVLM) open source. La société a déclaré que les outils d’IA Qwen-VL et Qwen-VL-Chat peuvent mieux comprendre les images et répondre aux requêtes complexes que ses autres créations.

L’unité cloud de l’entreprise, Alibaba Cloud, a développé et formé les deux modèles de langage d’IA. Selon certaines informations, la société a déclaré que Qwen-VL avait été conçu pour être le descendant sophistiqué de son modèle de 7 milliards de paramètres, Tongyi Qianwen. Ce modèle dynamique présente la capacité de traiter des images et des invites textuelles de manière transparente. La polyvalence s’étend du traitement de requêtes ouvertes liées à diverses images à la création de légendes d’images captivantes.

Qwen-VL-Chat, quant à lui, a été conçu pour aborder des interactions plus complexes. Le modèle d’IA, alimenté par des techniques d’alignement avancées, possède un éventail impressionnant de talents. De la composition de poésie et de récits fondés sur des images d’entrée à la condensation du contenu de plusieurs images et même à la résolution de questions mathématiques complexes intégrées dans les images.

Alibaba explore les capacités de l’IA

Ces deux technologies sont sur le point de redéfinir le paysage des capacités de l’IA, offrant une fusion remarquable entre compréhension d’images et interaction textuelle en anglais et en chinois.

La société a déclaré que le modèle Qwen-VL avait été formé à l’aide d’images et d’informations textuelles. Au cours de la formation, Alibaba a constaté qu’il pouvait gérer des images plus grandes (résolution 448 × 448) par rapport à des modèles similaires qui ne pouvaient fonctionner qu’avec des images de petite taille (résolution 224 × 224).

La technologie de l’IA a également montré des capacités impressionnantes dans les tâches impliquant des images et du langage pendant l’entraînement. Alibaba a révélé que l’outil d’IA pouvait décrire des photos sans informations préalables, répondre à des questions sur les images et même détecter des objets dans les images.

Le deuxième modèle, Qwen-VL-Chat, a également démontré ses compétences dans les conversations autour d’images. Selon l’entreprise, la technologie d’IA a donné des résultats exceptionnellement bons en chinois et en anglais, sur la base d’un test de référence établi par Alibaba Cloud.

Comme le premier modèle, Qwen-VL-Chat a surpassé les autres outils d’IA dans la compréhension et la discussion de la relation entre les mots et les images. Le test comprenait un large éventail de plus de 300 photographies, 800 questions et 27 catégories différentes.

Engagement envers les technologies open source

Alibaba a révélé son intention de fournir les deux modèles d’IA sous forme de solutions open source à la communauté mondiale. Une fois les préparatifs terminés, ces outils seront librement accessibles à tous dans le monde. Cette décision permet le développement d’applications d’IA sans avoir besoin d’une formation système approfondie, ce qui entraîne une réduction des dépenses.

Plus tôt ce mois-ci, la société a fait des vagues en open source pour ses autres applications d’IA, Qwen-7B et Gwen-7B-Chat, moins d’un mois après leur dévoilement. Cette décision a attiré de nombreux développeurs vers l’entreprise, enregistrant plus de 400 000 téléchargements au total.

suivant

Intelligence artificielle, actualités économiques, cloud computing, actualités, actualités technologiques

Chimamanda U. Martha

Chimamanda est un passionné de cryptographie et un écrivain expérimenté qui se concentre sur le monde dynamique des crypto-monnaies. Elle a rejoint l’industrie en 2019 et a depuis développé un intérêt pour l’économie émergente. Elle combine sa passion pour la technologie blockchain avec son amour pour les voyages et la gastronomie, apportant une perspective nouvelle et engageante à son travail.

Source https://www.coinspeaker.com/alibaba-two-open-sourced-ai-models/

Crypto Week

Avertissement : Crypto Week ne fournit pas de conseils financiers de quelque manière que ce soit. Nous ne vous recommandons pas d'investir de l'argent dans une crypto-monnaie ou un actif financier sans avoir effectué des recherches approfondies. Nous ne sommes pas responsables de vos décisions financières de quelque manière que ce soit.

Derniers articles de Featured Posts