- El estudio de Vipnet360, consultora de marketing y de IA, realizado con la herramienta AIBrandPulse360 analiza cómo los portales de medios regulan el acceso a las IA a sus contenidos
- El 50% de la prensa deja vía libre a las inteligencias artificiales, mientras que el 46% aplica bloqueos selectivos sólo para algunos bots
- ClaudeBot, de Anthropic, es el rastreador más bloqueado y, en general, se dificulta más el acceso a los bots de entrenamiento de modelos
| Fuente: Moussa Idriss Pexels. |
ROIPRESS / ESPAÑA / INFORMES - Casi la mitad de los portales web de medios de comunicación españoles, un 46% de los casi 150 analizados, impone algún tipo de restricción de acceso a sus contenidos a los rastreadores de las diferentes IA, mientras que el 52% restante deja vía libre, según el estudio que ha realizado Vipnet360 a través de su herramienta AIBrandPulse360.
Esa auditoría basada en el funcionamiento del archivo robots.txt, se ha realizado sobre medios de comunicación - de información generalista, deportiva, económica, regional, radio, televisión y portales sectoriales- y la regulación que establecen para los principales rastreadores de IA: OpenAI (ChatGPT), Anthropic/Claude, Perplexity y el de Google vinculado a sus modelos generativos. En total, se han examinado diez ‘user-agents’ distintos, repartidos entre bots de entrenamiento de modelos y bots de agente o búsqueda en tiempo real.
Los bloqueos, selectivos
El estudio revela que las restricciones que aplican los portales web analizados son selectivos, tanto hacia las empresas que están detrás de los bots como hacia el tipo de bot. Así, comprobamos que la hostilidad en forma de bloqueos es más habitual hacia los bots que recopilan contenido para entrenar modelos, mientras que los bots de agente, que solo acceden a una página cuando un usuario lo pide expresamente desde un chat, se bloquean a un ritmo tres veces menor (10,6% frente a 37,2%).
ClaudeBot, de Anthropic, es el rastreador individual más bloqueado (45,9% de los medios), por delante de GPTBot (43,2%), PerplexityBot (32,2%) y Google-Extended (27,4%).
¿Qué medios son más amables con las IA?
Dentro del 52% de los medios que no aplican ninguna restricción a los diez bots analizados encontramos perfiles muy distintos, como las grandes cadenas de TV (RTVE, Antena 3, La Sexta, Telecinco y Cuatro), agencias de noticias (Efe, Europa Press), y un nutrido grupo de medios especializados en tecnología (Xataka, Hipertextual o Computerhoy).
En el lado de los medios que sí establecen bloqueos, la tipología editorial marca diferencias. La prensa local y regional es, con diferencia, el bloque más restrictivo: 3,75 de los 10 bots son bloqueados como promedio, y entre el 49 y 78% de las cabeceras cierran el paso a alguno de los bots de cada compañía de IA. Le siguen la prensa deportiva (3,67 de media) y los portales de turismo (3,33, y fuertemente influidos por el caso extremo de Preferente, con un bloqueo total),
El grupo editorial, el factor decisivo
La tipología de medios explica parte del comportamiento, pero un análisis por grupos editoriales arroja más claridad. Vocento (5,8 bloqueos de media en 14 cabeceras), Unidad Editorial (5,8 en 4 cabeceras) y Prensa Ibérica (5,6 bloqueos de promedio en 15 cabeceras), son los grupos más restrictivos, muy por encima de PRISA y el Grupo Joly (3,0 en ambos). Los medios independientes se sitúan a gran distancia, con un índice medio de bloqueo de solo 1,1.
En general, dentro de los grupos, se aplican unas configuraciones de robots.txt similares para todas las cabeceras. La excepción podría ser el grupo PRISA, que aplica las políticas de forma diferente. Mientras deja completamente abiertas las puertas a OpenAI, Perplexity y Google en El País, establece un bloqueo para Claude. La SER añade al de Claude el bloqueo para Perplexity, pero no restringe la entrada a los bots de Open AI. Cinco Días, otra cabecera del grupo, no aplica ninguna restricción.
Utilidad para estrategias de contenidos
La herramienta AIBrandPulse360, desarrollada por la consultora Vipnet360 y que cuenta con un módulo específico de PR, permite conocer lo que las diferentes IA están diciendo sobre una marca, producto o servicio y cómo es su posicionamiento competitivo, así como las fuentes de información que las IA utilizan para las respuestas de potenciales clientes. Toda esta información sirve de ayuda a la hora de establecer estrategias de visibilidad y posicionamiento en los motores generativos (GEO).






