
La IA no deja de robar contenido de Internet para mejorar. Y Internet hinchó la nariz – La nación

El reddit bloquea la acción en el archivo de Internet es una tragedia. Y también una forma de detener la terminación insaciable e implacable
El precio del pago de IA es el saqueo de todo el contenido de Internet. En Reddit lo sabe bien y acaba de tomar una medida extrema contra estos robos indiscriminados: no es el caso de que ya esté bloqueando el acceso a su contenido directamente a los “restos” de las compañías de IA. Ahora bloquearlos cuando estas compañías intenten acceder a Rodeos. ¿La fiesta lesionada? Archivo de Internet.
Qué pasó. Reddit, que “su” contenido (que los usuarios generaron voluntariamente por los usuarios), se dio cuenta de algo: los robaron. Pero no directamente, sino a través de versiones anteriores que se almacenan en esta gigantesca hemeroteca digital como un archivo de Internet.
Wayback Machine sin acceso. Wayback Machine es la “máquina en el tiempo” del archivo de Internet y permite el acceso a versiones antiguas de cada sitio web. Sin embargo, para evitar más robo de contenido, Reddit ha prohibido esta plataforma para indicar la gran mayoría del contenido de Reddit. Solo se puede indicar la página de inicio de Reddit.com.
Argumento de Reddid. Tim Rathschmidt, portavoz de Reddit, explicó Al borde Aunque el archivo de Internet es un servicio dirigido a la web abierta, han “violado la inteligencia artificial contra las pautas de la plataforma, incluidas las nuestras y extraer datos de la máquina Wayback”. También señaló lo siguiente:
“Hasta que pueda defender su sitio web y cumplir con las pautas de la plataforma (por ejemplo, la privacidad de los usuarios en relación con la eliminación del contenido eliminado), limitamos parte de su acceso a datos de Reddit para proteger a los usuarios de Reddit”.
Si quieres nuestro contenido, pagas. Este mensaje del altavoz es razonable, pero muy poco está incompleto. Especialmente desde que Reddit ha seguido este tipo de saqueo de las compañías de IA. Trató de bloquear a los que lo hicieron con medios técnicos, y el objetivo antes y ahora era el mismo: que las compañías pagan su contenido.
Es algo que se ha logrado con los acuerdos que se han logrado desde el comienzo de este tipo de procesos. Lo primero que hizo fue su API, un desastre para todo Internet. Luego llegó a un acuerdo de Google que paga $ 60 millones al año para acceder a este contenido. Y la misma acción con OpenAi, con la que selló un pacto, cuyos detalles económicos no se revelaron, pero eso da el contenido de Reddit a los modelos que mejoran a Chatt.
Mi contenido me pertenece (más o menos). Las plataformas sociales han estado alimentando el contenido de los usuarios durante años. Hasta ahora, el modelo de negocio se ha concentrado en la publicidad, pero la llegada de IA ha hecho posible que tengamos un modelo alternativo interesante: que las compañías de KI pagan por poder acceder a este contenido.
Los usuarios apenas ganan, reddit y redes sociales. Contenido confirma que son, como Reddit, el de junio Él demandó antropicalmente– Pero eso en realidad creó a los usuarios de estas plataformas que se han convertido en esclavos de estas redes sociales sin darse cuenta: no dejan de producir contenido que consuma a otros y lo hagan sin calcular un euro.
Estas plataformas son mediadores que ofrecen la infraestructura requerida para este contenido para estar disponibles de forma gratuita, pero apenas hay una consideración para los creadores. Por ejemplo, algunos pueden ganarse la vida en YouTube, Tiktok o Instagram. En Reddit existir Una remuneración metálica para los “contribuyentes” que crean más para la plataforma.
Cloudflare y bloqueos de contenido. Las compañías de contenido comienzan a actuar de manera similar, y en los últimos dos años hemos visto cómo algunos grupos editoriales, incluidos los propios, logran acuerdos con compañías de inteligencia artificial para que puedan usar su contenido.
¡No debe pasar! Sin embargo, hay empresas que continúan. Tenemos un claro ejemplo de CloudFlare que ha creado un sistema para empresas que usan sus servicios para bloquear el “Ki -Crawler” que intentan robar su contenido. Si es un cliente de CloudFlare, puede activar este bloque, que evita o al menos clasificó el problema Mucho más difícil A las compañías de IA que intentan capacitar a sus modelos con sus datos. Los medios y plataformas como Associated Press, Fortune, Time o Stack Overflow son algunas de las compañías que ya usan este sistema.
Consideración. Este juego de gato y mouse es particularmente sorprendente para todo el segmento de creación de contenido, ya que las compañías de IA usan todos los enlaces que registran (y roban), tienen derechos de autor o no. Lo que aumenta Reddit es un modelo en el que los creadores de la IA compensan para tomar estos datos. O más que creadores, plataformas que sirven como su reunión y presentación. Los grupos de medios y los productores de contenido audiovisual tienen una oportunidad interesante aquí en vista del posible colapso del tráfico, que es causado por soluciones como las descripciones de Google AI.
En Xataka | El “desmontaje digital”: cómo han desaparecido el 38% de los sitios web de Internet que existieron en 2013