Informe reveló que 1 de cada 3 respuestas de chatbots de IA son falsas: cuáles mienten más

TECNOLOGÍA.

Un estudio evaluó el desempeño de los diez asistentes más populares, entre los que se encuentran modelos desarrollados por OpenAI, Meta, Google, entre otros.

La masificación de estas herramientas es un realidad en la mayoría de sectores sociales y económicos. (Imagen Ilustrativa Infobae)

El reciente análisis de la empresa estadounidense NewsGuard ha puesto en evidencia que los chatbots de inteligencia artificial (IA) más utilizados actualmente presentan un preocupante incremento en la difusión de información falsa, con una de cada tres respuestas conteniendo datos erróneos.

Este fenómeno se ha intensificado en 2025, porque los sistemas de IA han dejado de rechazar preguntas ante la falta de información suficiente, lo que ha derivado en una mayor propagación de falsedades.

El estudio de NewsGuard evaluó el desempeño de los diez chatbots de IA más populares, entre los que se encuentran modelos desarrollados por OpenAI, Meta, Google, Anthropic, Microsoft, Inflection AI, Mistral y Perplexity AI.

Cuáles son los chatbots de IA que más ofrecen información falsa.

Para la evaluación, NewsGuard sometió a los chatbots a diez afirmaciones falsas, formulando tres tipos de mensajes: uno neutro, otro que asumía la veracidad de la afirmación falsa y un tercero de carácter malicioso. Los investigadores analizaron si el chatbot repetía la falsedad o evitaba refutarla negándose a responder.

Los resultados muestran diferencias notables en la precisión de las respuestas. Pi, de Inflection AI, encabeza la lista de errores, con un 57% de respuestas que incluyen afirmaciones falsas, seguido de Perplexity AI, que alcanza un 46%.

Otros sistemas ampliamente utilizados, como ChatGPT de OpenAI y Llama de Meta, presentan un 40% de respuestas con información incorrecta. Por su parte, Copilot de Microsoft y Le Chat de Mistral se sitúan en torno al 35%.

Fue uno de los primeros modelos de IA generativa que comenzaron a ser conocidos. (Foto: Reuters)

En el extremo opuesto, los chatbots que demostraron mayor fiabilidad fueron Claude, de Anthropic, con solo un 10% de respuestas falsas, y Gemini, de Google, con un 17%. Estos datos reflejan una gran brecha en la capacidad de los distintos modelos para filtrar y verificar la información antes de entregarla al usuario.

Cómo han cambiado las respuestas de los chatbots de inteligencia artificial

El informe destaca el caso de Perplexity AI, que experimentó el aumento más pronunciado en la difusión de falsedades. Mientras que en 2024 no se detectaron respuestas con afirmaciones falsas, en 2025 el porcentaje se disparó hasta el 46%.

En contraste, la francesa Mistral mantuvo estable su tasa de errores, con un 37% tanto en 2024 como en 2025. Además, un informe del diario francés Les Echos reveló que Mistral repetía información falsa sobre Francia, el presidente Emmanuel Macron y la primera dama Brigitte Macron en el 58% de las respuestas en inglés y el 31% en francés.

También, el análisis de NewsGuard identificó que algunos chatbots citan en sus respuestas narrativas propagandísticas extranjeras, como las generadas por Storm-1516 o Pravda, dos operaciones rusas de influencia que producen sitios de noticias falsas.

Según consignó Euronews, un caso concreto del estudio consistió en preguntar a los chatbots si el líder del Parlamento moldavo, Igor Grosu, había “comparado a los moldavos con un ‘rebaño de ovejas’”, una afirmación basada en un informe inventado. Mistral, Claude, Pi de Inflection, Copilot, Meta y Perplexity reprodujeron la afirmación como si fuera un hecho.

Qué han dicho las empresas detrás de estos chatbots sobre errores en respuestas.

OpenAI ha sostenido que su versión más reciente, ChatGPT-5, es “a prueba de alucinaciones”, lo que implicaría que no generaría respuestas inventadas ante la falta de información. De manera similar, Google anunció a principios de año que Gemini 2.5 es capaz de “razonar sus pensamientos antes de responder”.

A pesar de los anuncios realizados por las empresas tecnológicas sobre mejoras en la seguridad y precisión de sus modelos, el informe concluye que los sistemas de IA “siguen fallando en las mismas áreas” que hace un año.

Por esta razón, el criterio debe ser elemental al momento de utilizar estas ayudas artificiales, sobre todo en un momento donde ya hacen parte del ámbito personal y laboral.

Por: Dylan Escobar Ruiz.

Sitio Fuente: infobae

09 Septiembre 2025