Investigadores de ciberseguridad detectaron una vulnerabilidad que permite insertar enlaces, alertas falsas y códigos QR maliciosos dentro de respuestas generadas por IA
Especialistas en ciberseguridad identificaron una nueva técnica de ataque denominada "ChatGPhish" que aprovecha la forma en que Chat GPT procesa y resume páginas web para introducir contenido malicioso dentro de sus respuestas. El hallazgo revela un nuevo vector de phishing que utiliza la confianza de los usuarios en las herramientas de inteligencia artificial para facilitar fraudes digitales.
La investigación, realizada por Permiso Security y documentada por el especialista Andi Ahmeti, demostró que un atacante puede ocultar instrucciones maliciosas en una página web y lograr que esos elementos aparezcan directamente en el resumen generado por ChatGPT cuando un usuario solicita información sobre ese sitio. De esta forma, una consulta aparentemente inocente puede convertirse en el inicio de un ataque.
La técnica explota el sistema de renderizado basado en Markdown que utiliza ChatGPT para presentar contenidos. Este formato permite incorporar enlaces, imágenes y otros elementos interactivos que pueden ser interpretados y mostrados dentro de la conversación como si formaran parte legítima de la respuesta generada por la inteligencia artificial.
Según los investigadores, el riesgo radica en que los usuarios suelen otorgar un alto nivel de credibilidad a la interfaz de Chat GPT. En lugar de recurrir a correos electrónicos fraudulentos o páginas falsas, los atacantes pueden utilizar la propia respuesta de la IA como vehículo para distribuir contenido engañoso y aumentar las probabilidades de éxito.
Uno de los escenarios más preocupantes involucra imágenes manipuladas. Los expertos advirtieron que, cuando Chat GPT procesa determinados recursos externos, un atacante puede recopilar información técnica de la víctima, incluyendo la dirección IP, el navegador utilizado y otros datos asociados a la consulta, sin necesidad de que el usuario haga clic sobre ningún elemento.
La investigación también mostró que los enlaces incluidos en páginas comprometidas pueden aparecer como botones o componentes interactivos dentro de la respuesta. Esto incrementa el riesgo de que las víctimas accedan a sitios fraudulentos creyendo que forman parte de una recomendación legítima generada por la inteligencia artificial.
Otra capacidad detectada consiste en la inserción de falsas alertas de seguridad. Los atacantes pueden diseñar mensajes que imitan notificaciones del sistema y hacer que aparezcan integrados en las respuestas de Chat GPT. Los especialistas también comprobaron que es posible incorporar códigos QR maliciosos alojados en servicios externos, capaces de redirigir a las víctimas hacia sitios fraudulentos cuando son escaneados desde un teléfono móvil.
Para los investigadores, ChatGPhish representa una evolución de los ataques de phishing tradicionales porque traslada el punto de engaño desde el correo electrónico hacia las plataformas de inteligencia artificial. En este modelo, el usuario no necesita visitar previamente una página sospechosa ni descargar archivos infectados: basta con solicitar un resumen de un sitio comprometido para quedar expuesto al contenido manipulado.
El descubrimiento se suma a otras vulnerabilidades recientes vinculadas a sistemas de IA, como SymJack, TrustFall y ClaudeBleed. Aunque afectan a plataformas diferentes, todas comparten una característica común: explotan la confianza que los modelos depositan en la información que procesan. Los expertos advierten que, a medida que la inteligencia artificial se integre más en entornos laborales y actividades cotidianas, será necesario reforzar los mecanismos de validación para impedir que contenidos controlados por atacantes sean interpretados como información legítima.
comentar