Salesforce lanza entorno de simulación empresarial que pone a prueba agentes de IA
Publicado por Redacción Portal ERP México en 29/08/2025 en Noticias TechSalesforce lanza nuevas herramientas que ofrecen simulación de entornos empresariales, la medición de la preparación de los agentes y la consolidación de datos duplicados.
Foto: cortesía. Portal ERP México.
Salesforce AI Research presentó un entorno de simulación empresarial para poner a prueba la capacidad de los agentes en escenarios empresariales realistas, respaldando el lanzamiento de una nueva herramienta de evaluación comparativa. Además, ha mejorado Data Cloud con capacidades de consolidación que aprovechan modelos de lenguaje pequeños y grandes, unificando datos de forma autónoma. Estas innovaciones buscan impulsar avances en IA que aborden los retos más acuciantes a los que se enfrentan hoy en día los directores de informática y los responsables de TI.
Desde la mejora de la calidad de los datos hasta el establecimiento de nuevos estándares en la medición del rendimiento de los agentes, Salesforce AI Research busca proveer a las empresas de las herramientas necesarias para evolucionar hacia empresas con agentes, es decir, organizaciones que adoptan el trabajo digital y utilizan la IA para trabajar junto a los seres humanos.
Nota relacionada: Salesforce lanza Agentforce 3 con mayor visibilidad y control de agentes de IA
Simulación de entornos empresariales con CRMArena-Pro
Los agentes de IA ahora podrán ser puestoa a pruebas y formación mediante simulación, que los prepara para gestionar la imprevisibilidad de los escenarios empresariales cotidianos antes de implementarlos. Basándose en el CRMArena original, que se centraba en tareas de servicio B2C de un solo turno, Salesforce AI Research ha lanzado CRMArena-Pro, para probar el rendimiento de los agentes en escenarios complejos, de múltiples turnos y agentes, como la previsión de ventas, la clasificación de casos de servicio y los procesos CPQ.
CRMArena-Pro crea un marco de entorno empresarial simulado riguroso y rico en contexto, con datos sintéticos en los que se pueden evaluar de forma segura las llamadas API a los sistemas pertinentes, así como la capacidad de proteger los datos de identificación personal. Las empresas pueden probar la precisión, la eficiencia y la coherencia de un agente a escala en casos de uso específicos de la empresa, actuando como un gemelo digital de una empresa
Medición de la preparación de los agentes con el índice de referencia agéntica para CRM
Con la aparición diaria de nuevos modelos y actualizaciones de IA, las empresas se enfrentan al creciente dilema de qué modelo —o combinación de modelos— es el más adecuado para ayudar a los agentes en entornos empresariales reales. La respuesta no puede provenir únicamente de los ciclos de expectación o del tamaño bruto; requiere una forma rigurosa de medir el rendimiento de los agentes dentro de flujos de trabajo empresariales específicos.
Esta necesidad imperiosa llevó a Salesforce a presentar el nuevo Agentic Benchmark for CRM, una herramienta comparativa, diseñada para evaluar a los agentes de IA no en función de sus capacidades genéricas, sino en los contextos que más importan a las empresas, como el servicio de atención al cliente, el de campo, marketing y ventas.
La sostenibilidad, la métrica más reciente de la herramienta de medición agéntica, es especialmente importante de seguir. Esta medida destaca el impacto medioambiental relativo de los sistemas de IA, que pueden requerir importantes recursos computacionales. Este punto de referencia les ayuda a emparejar los modelos adecuados con los agentes adecuados para obtener un rendimiento fiable y de nivel empresarial.
Salesforce también lanza MCP-Eval y MCP-Universe, dos benchmarks adicionales y complementarios publicados este trimestre, diseñados para evaluar a los agentes con diferentes niveles de rigor y realizar un seguimiento de los LLM mientras interactúan con los servidores MCP en entornos de uso reales. MCP-Eval proporciona una evaluación escalable y automática a través de tareas sintéticas, mientras que MCP-Universe presenta tareas desafiantes del mundo real con evaluadores basados en la ejecución, que someten a pruebas de estrés a los agentes en escenarios complejos, ofreciendo un marco ampliable para crear y evaluar a los mismos.
Por último, la compañía presentó Account Matching, una función que identifica y unifica de forma autónoma cuentas en conjuntos de datos dispersos e inconsistentes para tener acceso a datos limpios y unificados que potencian a los agentes de IA con confianza, lo que permite una automatización más inteligente, una personalización más rica y decisiones más rápidas a gran escala.