Ahora existe un estándar que cobra a las empresas por la eliminación de sitios web – La nación

Cuando utilizamos Gemini, ChatGPT o Grok, es fácil pensar que esta capacidad de obtener resultados en pocos segundos roza lo extraordinario, a pesar de sus habituales carencias. Pero no es ningún secreto: se basan en modelos entrenados con enormes cantidades de información. Este proceso ha provocado un debate cada vez más intenso sobre cómo se utiliza todo este contenido y el grado de control por parte de quienes lo crean. En este clima aparece una propuesta que intenta crear orden.
Extracción masiva de contenidos. El crecimiento acelerado de la IA ha expuesto el fenómeno anterior. Las empresas utilizan rastreadores propietarios y conjuntos de datos de terceros que recopilan material de miles de sitios web. Para los editores, el problema no es sólo de escala, sino también de falta de transparencia sobre qué se recopila, cómo se utiliza y quién se beneficia de ello. El conflicto entre estos intereses ha alimentado llamados y debates sobre el equilibrio entre innovación y derechos de autor.
¿Qué es RSL 1.0? ahora viene RSL 1.0un estándar abierto que permite a los editores expresar en forma legible por máquina cómo se debe utilizar su contenido en la era de la IA. La iniciativa surge del Colectivo RSL y del Comité Directivo Técnico de RSL, que incluye empresas de Internet, medios y organizaciones de estándares como Yahoo, Ziff Davis y O’Reilly Media. El objetivo es que los medios puedan establecer reglas transparentes de uso y licencias que los sistemas de IA deben cumplir.
Un estándar operativo. Aquí es donde aparece el archivo robots.txt, que era la herramienta básica para controlar los rastreadores web y permitir o denegar el acceso a rutas específicas de un sitio web. Esta simplicidad fue útil durante años, aunque no preveía aplicaciones específicas como el entrenamiento de modelos de IA. RSL 1.0 va un paso más allá y describe permisos diferenciados a través de categorías como “ai-input”, diseñada para entrenamiento, o “ai-index”, vinculada a la indexación clásica. La categoría “ai-all” le permite bloquear cualquier uso relacionado con la IA.
La idea es que este sistema permita a los editores establecer límites específicos sin perder visibilidad en los motores de búsqueda. Las reglas siguen siendo simples, pero ahora mucho más informativas.
Solucionar una limitación importante. Hasta ahora, según los defensores de la iniciativa, un editor que quiera evitar este uso debe contar con que su contenido ya no aparezca en la búsqueda clásica, ya que Google no ofrece una opción individual para separar las dos áreas. Para los cofundadores del colectivo RSL, “RSL aporta exactamente la capa que faltaba” al permitir un control independiente entre ambos usos.
El modelo de contribución. Una de las novedades más destacadas de RSL 1.0 es el “sistema de contribución”, diseñado para que los creadores y las organizaciones sin fines de lucro puedan solicitar contribuciones a los sistemas de inteligencia artificial que utilizan su material. Desarrollada en asociación con Creative Commons, la iniciativa tiene como objetivo fortalecer la sostenibilidad de los bienes comunes digitales, que reúne miles de millones de recursos abiertos en la web. La directora ejecutiva Anna Tumadóttir señala que “es esencial que existan opciones de reparto justo más allá de las licencias comerciales para seguir apoyando los bienes comunes y protegiendo el acceso al conocimiento en la era de la IA”.
Amplia aceptación. El lanzamiento de RSL 1.0 ha generado un apoyo notable por parte de editores, plataformas y juntas técnicas, así como de proveedores de infraestructura como Cloudflare, Akamai y Fastly. Su participación es relevante porque estos servicios pueden aplicar directamente las reglas definidas por los editores.
Aunque RSL 1.0 introduce un marco más claro para formular reglas de uso, no resuelve todos los problemas que surgen del entrenamiento de modelos de IA. El estándar depende de rastreadores que lo sigan y de proveedores de infraestructura que lo hagan cumplir, de modo que las empresas que ignoren estas señales puedan continuar recopilando contenido sin permiso. Tampoco está claro cómo afectará esto a los pequeños editores que carecen de recursos para negociar con grandes plataformas.
El avance de la IA ha cambiado la forma en que interactuamos con la información, aunque muchas veces olvidamos que detrás de estos rápidos resultados hay contenido creado por millones de personas. Tendremos que esperar y ver si RSL 1.0 nivelará el campo de juego.
Imágenes | Xataka con Géminis 3 Pro | Solen Feyissa
En Xataka | McDonald’s no ha aprendido de Coca-Cola y presenta un anuncio navideño creado con IA. Las reacciones fueron aún peores.