Amazon bloquea discretamente bots de IA de Meta, Google o Huawei

Amazon está intensificando sus esfuerzos para evitar que empresas de inteligencia artificial extraigan datos de su e-commerce. Para ello, ha añadido recientemente seis rastreadores de IA a su archivo público robots.txt.

El cambio fue detectado por Juozas Kaziukėnas, un analista independiente, que señaló que el código actualizado del extenso sitio web de Amazon ahora incluye lenguaje que prohíbe bots de empresas como Meta, Google, Huawei, Mistral y otras. “Amazon está desesperadamente tratando de evitar que las empresas de IA entrenen modelos con sus datos”, escribió Kaziukėnas en una publicación en LinkedIn el jueves. “Creo que ya es demasiado tarde para detener el entrenamiento de IA: los datos de Amazon ya están en los conjuntos de datos que usan ChatGPT y otros. Pero definitivamente Amazon no está interesado en ayudar a nadie más a construir el futuro del e-commerce con IA. Si ese es el futuro, Amazon quiere construirlo por sí mismo”, comentó. La actualización se suma a restricciones previas que Amazon añadió al menos hace un mes, dirigidas a rastreadores de Claude de Anthropic, Perplexity y agentes de Project Mariner de Google, según recoge Digiday. Los archivos robots.txt son una herramienta estándar que los sitios web usan para dar instrucciones a rastreadores automatizados como los motores de búsqueda. Aunque las restricciones que se indican en los archivos robots.txt no son vinculantes, actúan como señales para los sistemas automatizados (es decir, si los rastreadores están “bien educados”, se espera que respeten el bloqueo), según explicó Kaziukėnas.

Amazon defiende su negocio publicitario

La medida pone de relieve la postura cada vez más agresiva de Amazon frente a herramientas de IA de terceros que podrían rastrear sus páginas de productos, monitorear precios o incluso intentar realizar compras automatizadas. Para Amazon, lo que está en juego es significativo. Su marketplace no solo es la mayor fuente de datos de e-commerce del mundo, sino también la base de un negocio publicitario de 56.000 millones de dólares construido en torno a los compradores que navegan por su sitio. Permitir que herramientas de IA externas muestren productos directamente a los usuarios podría evitar el paso por la tienda de Amazon, socavando tanto el tráfico como los ingresos publicitarios. Los cambios de Amazon se producen poco después de que Shopify, el proveedor de tecnología de e-commerce, introdujera una advertencia en el archivo robots.txt de los sitios de sus comerciantes, como informó Modern Retail en julio. La “Política de robots y agentes” de Shopify exige que los agentes “compra por mí” incluyan una revisión humana e indica a los desarrolladores que integren la tecnología de pago de Shopify en sus herramientas. En lugar de nombrar a empresas específicas de IA, la política de Shopify se aplica de forma general a los agentes automatizados. Shopify se ha asociado con Perplexity y, según The Financial Times, se está preparando para integrarse con OpenAI y permitir transacciones a través de chatbots con IA.

Un enfoque estricto y restrictivo

En comparación, Amazon parece estar adoptando un enfoque más estricto. En lugar de adaptarse a las empresas de IA externas, ha optado por mantenerlas a distancia mientras desarrolla sus propias herramientas internas como Rufus, un chatbot de compras diseñado para responder preguntas de los usuarios sobre productos, comparar opciones y realizar recomendaciones personalizadas. No obstante, grupos editoriales como Condé Nast y Hearst ya llegaron a acuerdos con Amazon para ceder parte de su contenido con el fin de alimentar Rufus. Según una revisión de sus archivos robots.txt realizada por Modern Retail, otras plataformas como Walmart o eBay no han realizado cambios para bloquear bots de IA en sus sitios. Aun así, queda la duda de si tales restricciones pueden mantenerse. Gran parte del catálogo de Amazon ya ha sido extraído por los conjuntos de datos para entrenamiento de IA, y los archivos robots.txt dependen del cumplimiento voluntario. Como lo expresó Kaziukėnas: “Amazon es un tesoro de datos de e-commerce. Es notable que Amazon parezca ser el único que realmente está luchando contra esto”.

IANCAmazon