Categories
News

Baichuan-13B: Le ChatGPT chinois dévoilé

La Chine n’entend pas se laisser distancer dans le secteur de l’IA. Elle pourrait même se doter d’un concurrent sérieux à ChatGPT, selon TechCrunch.

Baichuan Intelligence, la startup dirigée par Wang Xiaochuan, fondateur du moteur de recherche Sogou, vient de dévoiler un modèle de langage de nouvelle génération, Baichuan-13B.

“La Chine a besoin de son OpenAI”

En février dernier, Wang a fait une déclaration audacieuse sur Weibo : “la Chine a besoin de son propre OpenAI”. Aujourd’hui, cette vision ambitieuse se concrétise avec la création de Baichuan-13B.

Il s’agit d’un modèle de langage à grande échelle (LLM) remarquable, doté de 13 milliards de paramètres et basé sur l’architecture Transformer, la même qui soutient GPT.

Baichuan-13B, qui a été formé à partir de données en chinois et en anglais, est un outil open source optimisé pour une utilisation commerciale. Cette combinaison de caractéristiques devrait favoriser son adoption rapide sur le marché.

Dans le domaine de la formation, Baichuan-13B se distingue également. En effet, le modèle a été formé sur 1,4 trillion de jetons, unités de texte que le modèle apprend à analyser et à générer.

Ce volume impressionnant de données le place directement en concurrence avec LLaMa de Meta, qui a été formé sur 1 trillion de jetons.

L’ascension fulgurante des modèles des LLM en Chine

Malgré un lancement récent, Baichuan Intelligence a déjà fait preuve d’une vitesse de développement impressionnante. Fin avril, l’équipe comptait déjà 50 personnes, et en juin, elle a déployé son premier LLM, Baichuan-7B, doté de 7 milliards de paramètres.

Le modèle d’IA Baichuan-13B est maintenant accessible gratuitement aux universitaires et aux développeurs qui ont reçu l’approbation officielle pour l’utiliser à des fins commerciales.

Cependant, malgré l’entrée prometteuse de Baichuan Intelligence sur le marché des LLM, la concurrence y est déjà rude. En effet, des entreprises renommées telles que le géant du moteur de recherche Baidu, Zhipu.ai – une spin-off de l’Université Tsinghua dirigée par le professeur Tang Jie – et l’institut de recherche IDEA, dirigé par Harry Shum, co-fondateur de Microsoft Research Asia, ont également fortement investi dans les LLM.

Dans ce contexte dynamique, une course à la technologie a été lancée. Celle-ci survient à un moment critique, alors que la Chine se prépare à mettre en œuvre certaines des réglementations sur l’IA les plus strictes au monde.

Les entreprises pourraient également devoir obtenir une licence avant de lancer des LLM, ce qui représente un défi supplémentaire qui pourrait ralentir les efforts de la Chine pour concurrencer les États-Unis dans cette industrie naissante.

Néanmoins, malgré ces obstacles et ce climat concurrentiel, Baichuan Intelligence et son modèle Baichuan-13B sont prêts à faire leur marque. Ils ont en effet la volonté et la capacité de devenir des acteurs de premier plan dans le paysage mondial de l’IA.

Lire l’article original (en anglais)

Leave a Reply

Your email address will not be published. Required fields are marked *