Aventuras y desventuras contra la IA

 


Soy el administrador de una pequeña web para el dojo en el que entreno (zanshin-madrid.com). Es una web pequeña (sin registro de usuarios, sin foros, chats, etc). Solo información y un formulario de contacto.

Tenemos un presupuesto MUY limitado y nuestro plan de hosting es básico (un paquete Single de Hostinger). Usamos un promedio diario del 10% de los recursos asignados (bastante saludable) y nuestra web no tiene demasiadas visitas (unas unas 2500 mensuales). Hasta hace un par de semanas.

De pronto me empiezan a llegar correos del servicio de hospedaje avisándome que estamos sobrepasando el límite de recursos y la página está fallando. Obviamente se me dispararon todas las alarmas y pensé que nos habían hackeado y estaban enviando spam o minando datos.

Empecé por lo básico, me metí en el panel de administrador y revisé el consumo de recursos y me encontré con picos de peticiones de acceso de más de 20000 accesos a la web en menos de 24 horas. Como un ataque de DDoS. Analizando el tráfico, el 90% de esas peticiones eran de Singapur. En el registro de accesos ya encontré la pista final, todas las peticiones de Singapur tenían la misma firma en el User Agent: Bytespider. ¿Y qué es esto? Un bot araña de la empresa ByteDance (del dueño de TikTok) que rastrea la web y descarga tu contenido para entrenar su modelo de IA.

Desde un centro de datos de Singapur y varias máquinas, lanzaban decenas de miles de peticiones a mi web (y las de mucha otra gente) para (sin permiso) usar nuestro contenido para entrenar su IA. Y en el proceso inhabilitan el acceso a la web porque agotan los recursos.

Mi web ha estado inaccesible a humanos (los usuarios finales) para que una megaempresa gigante entrene con mi contenido (sin mi permiso) un modelo de IA generativa. La IA es una herramienta muy poderosa y, como tal, su uso no debería hacerse a la ligera y sin unas limitaciones éticas claras.

Y a mí esta forma de proceder de ByteDance no me parece demasiado ética. Y no es la única empresa que hace esto.

Comentarios

Lo más leído