Présentation de l'API YOU : Recherche à l'échelle du web pour les LLM

Contexte

Les grands modèles linguistiques (LLM) ont ouvert de nouvelles possibilités pour transformer divers secteurs de l'économie. Ces modèles ont la capacité d'absorber de grandes quantités de texte, ce qui leur permet de générer des résultats qui peuvent automatiser de nombreuses tâches qui dépendent de la langue. Cependant, les LLM posent trois problèmes principaux que nous nous efforçons de résoudre :

  • Ils hallucinent souvent, produisant des résultats qui ne sont pas fondés sur des informations réelles.
  • Ils peuvent générer du contenu sans l'étayer par des sources crédibles, ce qui rend difficile la vérification de son exactitude.
  • Ils ont du mal à suivre les événements en constante évolution qui se produisent dans le monde entier, ce qui se traduit par des réponses dépassées.

L'API YOU

Pour relever ces défis, nous lançons l'API YOU. Il s'agit d'une suite complète d'outils conçus pour aider les développeurs à ancrer les résultats des LLM dans les informations les plus récentes, les plus précises et les plus pertinentes disponibles. En exploitant la puissance de cette API, les développeurs peuvent s'assurer que le contenu généré par les LLM s'appuie sur des sources fiables et des données actualisées.

L'API est lancée avec trois points d'extrémité dédiés :

  1. Recherche sur le Web - Fournit des résultats de recherche similaires à ceux de Google ou de Bing, sauf qu'au lieu d'extraits courts conçus pour inciter les humains à cliquer sur les liens, nous fournissons de nombreux extraits longs conçus pour fournir à un LLM les informations les plus pertinentes nécessaires pour générer la meilleure réponse. Cette méthode s'apparente aux API SERP, mais elle est plus puissante et plus rapide.
  2. Actualités - Similaire à la recherche sur le web, mais exclusivement des résultats d'actualité pour les applications qui s'appuient principalement sur des événements d'actualité.
  3. LLM Web - Notre solution de bout en bout associe nos résultats de recherche sur le web à un LLM pour la génération augmentée par récupération (RAG), ce qui améliore l'exactitude des faits et réduit les hallucinations dans les réponses.

Pour en savoir plus sur l'utilisation de chacun d'entre eux, consultez docs.you.com. Les points d'accès Web Search, News et Web LLM sont disponibles sur api.you.com. Vous pouvez accéder à une version d'essai gratuite pour les points de terminaison Web Search et News.

Évaluation de l'API YOU

Nous évaluons l'efficacité de l'API YOU en adaptant plusieurs ensembles de données de réponses à des questions académiques au contexte du "web ouvert" : les passages généralement fournis à une IA en tant que contexte doivent être récupérés sur le web lui-même. Cette méthode d'évaluation exige beaucoup plus du système dans son ensemble que les références académiques dont elles sont dérivées. Elle permet une évaluation plus réaliste et plus pratique des performances des systèmes de RAG à l'échelle du web.

Dans la première série de résultats ci-dessous, nous comparons l'utilisation des résultats de recherche de You.com, Google ou Bing avec le LLM par défaut déployé dans notre point final Web LLM. L'API YOU est la plus performante dans tous les cas de figure.

Les scores F1 plus élevés montrent que le LLM est plus susceptible de générer une réponse correcte à partir des résultats de recherche de l'API YOU qu'à partir des résultats de recherche de Google. Le LLM utilisé dans ces expériences a une fenêtre de contexte de 16k tokens et est le plus similaire au modèle ChatGPT 3.5 Turbo d'OpenAI. Les chiffres de rappel ont une marge encore plus large que les scores F1, ce qui suggère que le LLM ne peut pas utiliser pleinement les informations supplémentaires que l'API de recherche Web You.com fournit pour générer de meilleures réponses.

Le rappel signifie ici que la réponse correcte (basée sur la phrase originale de vérité de base des ensembles de données) est incluse dans les extraits renvoyés par l'API :

Rappel FreshQARappel de SquadV2Rappel de HotpotQAMS MARCO Rappel
Vous.com85.1%75.6%67.4%81.5%
Google72.2%50.4%49.0%65.3%
Bing73.8%54.4%56.0%70.5%

Utilisation d'un LLM avec une fenêtre contextuelle de 16k remplie d'extraits pour répondre aux questions :

FreshQA SquadV2 F1HotpotQA F1MS MARCO
Vous.com44.7%27.5%34.7%23.8%
Google41.4%27.0%33.4%20.1%
Bing40.7%25.1%34.5%22.6%

Si vous souhaitez évaluer votre index web à grande échelle pour les LLM sur ces ensembles de données, veuillez nous envoyer un courriel à [email protected] et nous pourrons partager les repères d'évaluation.

Travaux futurs

Nous continuerons à travailler à l'amélioration des fonctionnalités de l'API et de l'expérience utilisateur. Des efforts sont faits pour rendre les API plus intuitives, permettant aux utilisateurs de gérer le contexte sans effort. En outre, des modules intermédiaires tels que la réécriture de requêtes seront exposés en tant que nouveaux points de terminaison, ce qui permettra aux développeurs de personnaliser leur utilisation de l'API YOU en fonction de leurs besoins spécifiques. En outre, l'équipe chargée de l'API a pour objectif d'intégrer des capacités de type agent, similaires à celles des modes Agent et Recherche approfondie de You.com, afin de rendre toutes les fonctionnalités de You.com accessibles par l'intermédiaire de l'API.

Conclusion

L'API YOU permet aux développeurs de surmonter les limites des LLM en leur fournissant les outils nécessaires pour fonder leurs résultats sur les informations les plus récentes, les plus précises et les plus pertinentes. Grâce à ses performances supérieures à celles des fournisseurs de recherche existants et à sa capacité à s'adapter à divers LLM, l'API révolutionne la manière dont les développeurs peuvent exploiter la puissance des LLM dans leurs applications. Nous espérons que cela libérera la connaissance sur le web des options très limitées et restrictives actuellement disponibles. Nous sommes impatients de voir les nombreuses applications créées et nous soutiendrons notre écosystème avec de futures innovations grâce à des connaissances actualisées provenant du web.

Pour en savoir plus sur l'utilisation de l'API, consultez docs.you.com. Visitez api.you.com pour accéder aux points de terminaison Web Search, News et Web LLM. Si vous avez des questions, envoyez un courriel à [email protected].

Youpi, vous avez lu l'article en entier. Si vous avez aimé cette histoire, merci de recommander 👏 et de partager pour aider les autres à la trouver !