Categories
News

Elon Musk lance xAI, pour “comprendre la réalité”

Quelques mois seulement après avoir plaidé pour une pause dans le développement de l’IA, Elon Musk, le patron de Tesla, Twitter et SpaceX, fait volte-face.

Il a annoncé, évidemment via Twitter, la création de xAI, une nouvelle entité spécialisée en intelligence artificielle dont la mission est de “comprendre la réalité”. Ni plus, ni moins.

Précédemment, Elon Musk avait déjà évoqué sur le ton de la plaisanterie la création de “TruthGPT”, une IA générative “non-woke”.

Selon le site officiel, “le but de xAI est de comprendre la véritable nature de l’univers”. Pour discuter de ce lancement, un salon audio, ou “Space”, a été organisé sur la plateforme Twitter. Musk a donné rendez-vous aux curieux ce vendredi 14 juillet, toujours sur Twitter Space, pour une séance de questions/réponses dédiée à ce projet.

À ce stade, les informations sur xAI restent plutôt floues. xAI se présente comme une entité distincte de X Corp, mais affirme travailler en étroite collaboration avec Twitter, Tesla et d’autres sociétés pour “progresser dans sa mission”.

À la tête de xAI, on retrouve bien sûr Elon Musk, mais aussi d’anciens salariés de DeepMind, OpenAI, Google Research, Microsoft Research, Tesla ou encore de l’Université de Toronto. L’équipe, pour l’instant exclusivement masculine, compte douze membres.

“Collectivement, nous avons contribué à certaines des méthodes les plus largement utilisées dans le domaine, en particulier l’optimiseur Adam, la normalisation par lots, la normalisation par couches et la découverte des exemples contradictoires”, déclare xAI sur son site.

“Nous avons en outre introduit des techniques et des analyses innovantes telles que Transformer-XL, l’autoformalisation, le transformateur de mémorisation, la mise à l’échelle de la taille des lots et le μTransfer. Nous avons […] dirigé le développement de certaines des plus grandes percées dans le domaine, notamment AlphaStar, AlphaCode, Inception, Minerva, GPT-3.5 et GPT-4”.

La société a été enregistrée au registre des sociétés du Nevada en mars dernier, mais l’équipe technique est basée dans la région de San Francisco (Californie). Par ailleurs, Musk avait révélé il y a quelques mois avoir acquis une quantité importante de cartes graphiques (GPU — graphics processing unit), un élément essentiel au développement de logiciels d’intelligence artificielle (IA).

Pour l’instant, il est encore trop tôt pour savoir quel genre de produit sortira xAI. Mais on devrait en savoir plus dès ce vendredi, lors du Twitter Space organisé pour le lancement.

Categories
News

Baichuan-13B: Le ChatGPT chinois dévoilé

La Chine n’entend pas se laisser distancer dans le secteur de l’IA. Elle pourrait même se doter d’un concurrent sérieux à ChatGPT, selon TechCrunch.

Baichuan Intelligence, la startup dirigée par Wang Xiaochuan, fondateur du moteur de recherche Sogou, vient de dévoiler un modèle de langage de nouvelle génération, Baichuan-13B.

“La Chine a besoin de son OpenAI”

En février dernier, Wang a fait une déclaration audacieuse sur Weibo : “la Chine a besoin de son propre OpenAI”. Aujourd’hui, cette vision ambitieuse se concrétise avec la création de Baichuan-13B.

Il s’agit d’un modèle de langage à grande échelle (LLM) remarquable, doté de 13 milliards de paramètres et basé sur l’architecture Transformer, la même qui soutient GPT.

Baichuan-13B, qui a été formé à partir de données en chinois et en anglais, est un outil open source optimisé pour une utilisation commerciale. Cette combinaison de caractéristiques devrait favoriser son adoption rapide sur le marché.

Dans le domaine de la formation, Baichuan-13B se distingue également. En effet, le modèle a été formé sur 1,4 trillion de jetons, unités de texte que le modèle apprend à analyser et à générer.

Ce volume impressionnant de données le place directement en concurrence avec LLaMa de Meta, qui a été formé sur 1 trillion de jetons.

L’ascension fulgurante des modèles des LLM en Chine

Malgré un lancement récent, Baichuan Intelligence a déjà fait preuve d’une vitesse de développement impressionnante. Fin avril, l’équipe comptait déjà 50 personnes, et en juin, elle a déployé son premier LLM, Baichuan-7B, doté de 7 milliards de paramètres.

Le modèle d’IA Baichuan-13B est maintenant accessible gratuitement aux universitaires et aux développeurs qui ont reçu l’approbation officielle pour l’utiliser à des fins commerciales.

Cependant, malgré l’entrée prometteuse de Baichuan Intelligence sur le marché des LLM, la concurrence y est déjà rude. En effet, des entreprises renommées telles que le géant du moteur de recherche Baidu, Zhipu.ai – une spin-off de l’Université Tsinghua dirigée par le professeur Tang Jie – et l’institut de recherche IDEA, dirigé par Harry Shum, co-fondateur de Microsoft Research Asia, ont également fortement investi dans les LLM.

Dans ce contexte dynamique, une course à la technologie a été lancée. Celle-ci survient à un moment critique, alors que la Chine se prépare à mettre en œuvre certaines des réglementations sur l’IA les plus strictes au monde.

Les entreprises pourraient également devoir obtenir une licence avant de lancer des LLM, ce qui représente un défi supplémentaire qui pourrait ralentir les efforts de la Chine pour concurrencer les États-Unis dans cette industrie naissante.

Néanmoins, malgré ces obstacles et ce climat concurrentiel, Baichuan Intelligence et son modèle Baichuan-13B sont prêts à faire leur marque. Ils ont en effet la volonté et la capacité de devenir des acteurs de premier plan dans le paysage mondial de l’IA.

Lire l’article original (en anglais)

Categories
News

Claude 2, un “ChatGPT killer”?

La startup d’intelligence artificielle (IA) Anthropic a annoncé le lancement de sa deuxième génération de chatbot IA, Claude 2.

An illustration for the story on Claude2 ChatBot.

Ce nouveau modèle est désormais disponible aux États-Unis et au Royaume-Uni, accessible à la fois via une interface web et une API payante. Anthropic a été co-fondée par d’anciens dirigeants d’OpenAI, une organisation de recherche en IA de premier plan.

Des performances améliorées

Claude 2 présente des performances améliorées par rapport à son prédécesseur dans plusieurs domaines. Il réussit mieux dans divers tests, notamment l’examen du barreau, l’examen d’obtention de licence médicale aux États-Unis et les tests de codage Python.

De plus, Claude 2 est capable de résoudre correctement un plus grand nombre de problèmes de mathématiques. Ces améliorations sont probablement dues à l’utilisation de données plus récentes pour l’entraînement du modèle.

De meilleures mesures de sécurité

Malgré ses performances améliorées, Claude 2 n’est pas parfait et peut encore générer des réponses nuisibles ou biaisées.

Cependant, Anthropic affirme que Claude 2 est deux fois plus efficace pour générer des réponses “inoffensives” par rapport à Claude 1.3, ce qui montre une amélioration significative des mesures de sécurité du modèle.

Une “IA Constitutionnelle “

Anthropic utilise une technique appelée “IA constitutionnelle” pour guider le comportement de Claude 2. Cette technique fournit au modèle un ensemble de principes pour faire des jugements sur le texte qu’il génère, en encourageant le modèle à être “non toxique” et “utile”.

Cela permet une meilleure compréhension et un ajustement plus facile du comportement du modèle.

La bataille des ChatBots

Claude 2 est en concurrence avec d’autres modèles d’IA développés par des entreprises telles qu’OpenAI, Cohere et AI21 Labs. Dans ses plans futurs, Anthropic prévoit de rendre la constitution de Claude 2 personnalisable.

De plus, la société envisage d’explorer davantage le marché de l’IA générative et prévoit de rendre Claude 2 disponible via la plateforme d’hébergement d’IA générative d’Amazon, Bedrock.

Lire l’article original complet (en anglais)

Categories
Blog

IA Talks : Explorer l’IA dans notre quotidien

Bienvenue sur le blog du podcast IA Talks : Explorer l’IA dans notre quotidien

Bonjour à tous et bienvenue sur le blog du podcast IA Talks !

Nous sommes ravis de vous accueillir dans cet espace dédié à la discussion et à l’exploration de l’intelligence artificielle (IA) dans notre vie quotidienne. IA Talks est un podcast qui vise à démystifier l’IA et à mettre en lumière ses applications concrètes et ses implications dans notre société.

Chaque semaine, nous aurons des conversations passionnantes avec des chercheurs, des chefs d’entreprise, des philosophes et d’autres experts de l’IA. Nous discuterons de sujets allant de l’IA dans les soins de santé et l’éducation à son rôle dans l’art et la culture, en passant par les questions éthiques et philosophiques qu’elle soulève.

Notre objectif est de rendre l’IA accessible et compréhensible pour tous, quels que soient vos antécédents ou votre niveau de connaissance de l’IA. Nous voulons que ce blog soit un lieu d’apprentissage, de discussion et de partage d’idées.

Nous espérons que vous vous joindrez à nous dans cette exploration de l’IA. Que vous soyez un expert en IA, un passionné de technologie ou simplement curieux d’en savoir plus sur la façon dont l’IA façonne notre monde, nous sommes impatients de partager ce voyage avec vous.

Restez à l’écoute pour notre premier épisode, et n’hésitez pas à nous faire part de vos commentaires, questions ou sujets que vous aimeriez voir abordés dans les futurs épisodes.

À très bientôt sur IA Talks !

L’équipe IA Talks