La búsqueda inteligente para agentes IA: aprender de los expertos financieros de 2010

Los agentes de inteligencia artificial necesitan superar las limitaciones de la búsqueda tradicional. Inspirarse en las técnicas avanzadas de analistas financieros de hace una década puede transformar la forma en que estos agentes encuentran información, logrando resultados más precisos y contextualizados.

Para que los agentes de inteligencia artificial funcionen correctamente, es fundamental que accedan a la información adecuada. La diferencia entre el éxito y el fracaso en la mayoría de los casos prácticos radica en su capacidad para localizar y utilizar los datos relevantes, una tarea que se vuelve aún más crítica a medida que los modelos se vuelven más sofisticados.

Los expertos en el campo de permitir que los grandes modelos de lenguaje encuentren lo que necesitan han atravesado diversas etapas de aprendizaje.

La primera fase se centró en la llamada era de las bases de datos vectoriales, alrededor de 2024. La idea principal fue fragmentar textos en trozos independientes, generar un vector de incrustación para cada uno y recuperarlos mediante búsquedas de vecinos más cercanos. Aunque simple, esta técnica no funcionaba bien debido a la carencia de contexto en los fragmentos y a la dependencia exclusiva en la similitud vectorial, que no lograba destacar información útil de manera fiable.

Patrocinado

La segunda fase combinó estas técnicas vectoriales con principios tradicionales de recuperación de información basados en décadas de experiencia humana. Nacieron metodologías híbridas, como BM25 y sistemas de ranking aprendidos por máquinas, que mejoraron considerablemente los resultados. Estas soluciones impulsaron muchas aplicaciones desde la experimentación hasta implementaciones robustas en producción.

Aun así, el potencial sigue siendo inmenso y con el reciente anuncio de Perplexity sobre el concepto de búsqueda como generación de código, podríamos estar entrando en la tercera etapa.

El gran desafío de la búsqueda tradicional ha sido lidiar con el comportamiento humano: los usuarios suelen ser perezosos e imprecisos al formular consultas. Por ello, los términos que escriben son indicadores vagos de lo que realmente desean. Intentar ofrecer controles más detallados es inútil porque nadie suele aprovecharlos. Esto se refleja en la evolución de motores como Google, que ha pasado de buscar palabras específicas en páginas web a sistemas mucho más complejos pero criticados por su falta de precisión, basados en observación del comportamiento real de los usuarios.

«El principal problema en la búsqueda es que los usuarios humanos son perezosos y poco precisos, especialmente al realizar consultas.»

Los agentes de IA, no obstante, no sufren esta limitación. No son perezosos ni confusos. Por tanto, no hay razón para restringir sus opciones a las de un usuario cotidiano. Ellos pueden hacer búsquedas mucho más sofisticadas, como:

  • Localizar nombres de personas mencionadas cerca unas de otras en textos jurídicos.
  • Realizar búsquedas semánticas puras priorizando fuentes de alta calidad para obtener un panorama amplio de un tema.
  • Filtrar resultados por intervalos temporales específicos o agrupar datos por meses para construir cronologías detalladas.

Los agentes incluso combinan múltiples consultas para alcanzar sus objetivos: primero obteniendo una visión general, luego investigando temas específicos, formulando hipótesis y verificando datos concretos. En definitiva, buscan y analizan la información como un experto, semejante a un analista financiero haciendo cálculos y evaluaciones complejas.

Los datos y pruebas recientes respaldan que este enfoque produce resultados superiores, como ha mostrado Perplexity en sus investigaciones sobre «búsqueda como código» (más allá del componente técnico del código, que tiene beneficios adicionales pero no afecta directamente la calidad).

Implementar esta mejora con tus propios datos hoy es sencillo. Los modelos ya saben generar consultas complejas en lenguajes compatibles con motores avanzados de búsqueda basados en IA; sólo necesitan ser informados sobre:

  • Que pueden utilizarlas.
  • Qué campos están disponibles y qué representan.
  • Las opciones de ranking o clasificación existentes.

La manera en que se les transmita esta información no es crítica. Una descripción textual simple sobre los campos o las opciones de ranking es suficiente. Actualmente, los modelos tienen la capacidad de conectar sus intenciones con consultas detalladas y efectivas, explotando mejor las herramientas de búsqueda.

«Ha llegado el momento de que tus agentes busquen información como un analista financiero de 2010.»

Cuando se crea una búsqueda orientada a humanos, los desarrolladores deben encontrar soluciones que funcionen bien para múltiples casos, haciendo a menudo concesiones que limitan la mejora de ciertos tipos de búsquedas para no perjudicar otras. En cambio, al diseñar para agentes inteligentes, el enfoque cambia a ofrecer un amplio conjunto de herramientas que cubran necesidades variadas: desde una recuperación léxica amplia y específica hasta filtros sobre metadatos para agrupaciones o agregaciones, junto con métodos de ranking variados según el propósito.

Así, los equipos que trabajan en búsqueda para agentes tienen que dejar atrás técnicas pensadas para usuarios ocasionales y adoptar capacidades mucho más ricas, similares a las empleadas por profesionales competentes.

En resumen: es momento de que tus agentes aprendan a buscar como lo haría un experto cuantitativo de principios de la década de 2010.

Add a Comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Patrocinado