Los nuevos y temerarios "atracos SEO" plantean espinosas cuestiones a Google

Exceljet

iStock; Rebecca Zisser/BI

  • En el último año, la página web Exceljet ha sido víctima de un "atraco SEO" impulsado por IA.
  • Un vendedor online utilizó inteligencia artificial para clonar miles de artículos de Exceljet para un competidor.
  • La trama muestra cómo la IA generativa está transformando la web y planteando espinosas cuestiones a Google.

El tráfico se desplomaba y David Bruns no entendía por qué.

Exceljet, su página web para aprender a usar Microsoft Excel, había sido un éxito desde 2012, convirtiéndose rápidamente en un negocio rentable a tiempo completo para este residente de Utah, en Estados Unidos.

Sin embargo, a finales de 2022, las visitas a Exceljet empezaron a caer, y luego siguieron bajando. La página depende en gran medida del tráfico de búsqueda de Google y, dado que el gigante tecnológico actualiza periódicamente la forma de clasificar los sitios web, Bruns se preguntó si había perdido la preferencia de la empresa. También se había embarcado en una reconstrucción técnica; ¿quizás eso tuviera algo que ver?

Entonces, en otoño de 2023, un amigo le señaló una publicación en las redes sociales y todo cobró sentido. Bruns había sido víctima de un "atraco SEO", uno de los primeros de la nueva era de la inteligencia artificial generativa. Se trataba de un complot descarado para copiar su web y robarle el tráfico derivado de Google que tanto le había costado ganar utilizando nuevas y potentes herramientas de inteligencia artificial.

El atraco formaba parte de una campaña de gran éxito que multiplicó por 60 el tráfico hacia el cliente del agresor, a pesar de que las visitas online de Exceljet se redujeron a la mitad.

"Una cosa es ser superado en el ranking por un artículo que posiblemente sea mejor que el que tú has escrito, y otra muy distinta es ser superado en el ranking por un artículo escrito por una máquina que ningún humano ha revisado", explica Bruns a Business Insider. "Está mal ganar dinero con eso".

Los problemas de Exceljet plantean grandes interrogantes sobre el futuro de internet. Ahora se puede generar contenido sobre cualquier tema con sólo pulsar un botón, y es casi imposible distinguir entre este material sintético y lo que un humano podría producir sobre el mismo tema. Esto está alterando rápidamente las reglas de funcionamiento de internet y supone un reto especialmente difícil para Google.

"Los métodos de señalización habituales de lo que es cierto ya no están claros, y las fuentes de confianza como las búsquedas de Google ya no muestran lo correcto", afirma Ethan Mollick, profesor asociado de la Escuela Wharton de la Universidad de Pensilvania, que estudia el impacto de la IA. "Vamos a tener que cambiar radicalmente nuestra forma de relacionarnos con la información. Pero no sé si lo haremos tan rápido como necesitamos".

Confiar en la inteligencia artificial para las búsquedas en internet acelerará la propagación de la desinformación.

SEO con esteroides

El principal campo de batalla es el posicionamiento en buscadores. Los profesionales del SEO ayudan a las webs a mejorar su posición en los resultados de búsqueda, utilizando tácticas que van desde el análisis oficial de tendencias de Google hasta trucos más dudosos para engañar al sistema. La idea básica es averiguar qué busca la gente y ofrecer contenidos relevantes para esas búsquedas.

Los expertos en SEO no tardaron en ver el potencial comercial de la IA generativa cuando ChatGPT irrumpió en escena hace más de un año. Una vez que se sabe a qué términos de búsqueda de Google (o palabras clave) hay que apuntar, ya no es necesario pedir a los humanos que escriban laboriosamente un artículo relevante. Ahora, los modelos de IA pueden hacerlo en cuestión de segundos, gracias a startups como Jasper y SEO.AI.

Es SEO con esteroides, y Jake Ward ha sido más valiente que la mayoría de los profesionales del sector a la hora de aprovecharlo. El robo de Exceljet es obra suya impulsada por la IA. Y no se arrepiente.

Ward argumenta que lo que ha hecho no es diferente de lo que hace cualquier otro estratega de contenidos SEO; la IA generativa simplemente lo ha hecho mucho más rápido. "Es inusual que algo aceptable, si se hace una vez, de repente se convierta en poco ético cuando se reproduce a escala", escribió en X a principios de este mes.

"La mayoría de las páginas web, sobre todo las de proyectos a gran escala, contratan a redactores baratos que no saben nada del tema sobre el que escriben", añade. "Copian y repiten el contenido de los primeros resultados de Google. La IA es más inteligente que el 99% de las personas que escriben esos artículos".

El robo de Exceljet, explicado

Ward, un expatriado del norte de Inglaterra que ahora vive en Dubai, y su socio trabajaron para aumentar la presencia de la empresa de software de gestión empresarial Causal en Google, en parte mediante el uso de IA generativa para alimentarse del contenido existente de Exceljet.

En primer lugar, descargaron el "sitemap" de Exceljet, es decir, un directorio de las aproximadamente 1.800 páginas del sitio web de Exceljet. Tomaron las URL de cada página y las introdujeron en las herramientas de generación de contenidos de IA. A partir de esas URL, las herramientas generaron un torrente de artículos sobre los mismos temas, sin necesidad de un autor humano.

No está del todo claro en qué momento Causal empezó a publicar artículos inspirados en Exceljet, pero su tráfico no ha dejado de aumentar desde hace más de un año. Tampoco es el único intento de Causal de utilizar la IA para mejorar su posicionamiento: El socio comercial de Ward, Mack Grenfell, escribió anteriormente sobre el uso de IA generativa para trabajar con Causal ya en octubre de 2021.

A principios de mayo de 2022, Causal tenía una media de menos de 10.000 visitas de tráfico orgánico a la semana, según las estimaciones de la herramienta de análisis web Ahrefs. A principios de 2023, alcanzaba las 200.000, y en octubre llegó a un máximo de más de 600.000 a la semana.

En el mismo periodo, el tráfico de Exceljet se desplomó. Según Bruns, en 2022 tenía una media de 2 millones de usuarios al mes, y en 2023 apenas superaba el millón. (Los cambios en el algoritmo de Google, los ajustes en la web de Exceljet y otros competidores que no utilizan IA también pueden haber influido en ese descenso).

El 24 de noviembre, Ward publicó en X que había atacado a Exceljet, diciendo que había "robado" tráfico de un competidor.

La publicación se hizo viral y las reacciones no se hicieron esperar. Gergely Orosz, un destacado ingeniero de software y redactor de newsletters, argumentó que suponía una amenaza significativa para Google.

"La generación de basura absoluta con IA sólo para ganar algo de dinero se está produciendo a un ritmo alarmantemente rápido. Primero sitios/artículos, luego imágenes y pronto vídeos", escribió Orosz. "Las búsquedas en internet como las de Google se están volviendo mucho más inútiles, incluso mientras tratan de luchar contra todo esto. Las fuentes de confianza son cada vez más valiosas".

En una conversación con BI, Bruns se hace eco de las críticas de Orosz. "Es un gran problema para Google", afirma. "Si la gente sigue encontrando artículos de mierda en la parte superior de los resultados de búsqueda, van a terminar cuestionando si Google está haciendo un buen trabajo, pero el hecho de que los artículos estén cerca o puedan estar en la parte superior del resultado hace que parezca que son legítimos".

Y lo que es aún más irritante para Bruns: cuando examinó los artículos de Causal generados por la IA, encontró errores factuales en algunos de ellos, en uno de los cuales se describía una supuesta función que no existe en Excel. Según Bruns, Google incluso seleccionó este artículo de la IA como "fragmento destacado" y lo colocó en un lugar prominente en la parte superior de los resultados de búsqueda relevantes.

"Empecé a fijarme en la calidad de los artículos y me di cuenta de que estábamos perdiendo tráfico en favor de cosas que ni siquiera tenían sentido", afirma.

Cuando BI se puso en contacto con Ward, éste se mostró inicialmente dispuesto a conceder una entrevista, pero posteriormente declinó hablar en privado. "El cliente en cuestión no quiere más exposición con lo que hicimos", respondió en un mensaje de voz.

Causal no ha respondido a las múltiples peticiones de comentarios.

Lo que necesitas saber para estar informado

Lo que necesitas saber para estar informado

¿Te gusta lo que lees? Comienza tu día sabiendo qué piensan y qué les preocupa a los ejecutivos de las principales empresas del mundo con una selección de historias enviada por Business Insider España a primera hora cada mañana.

Recibe la newsletter

Google responde

A Google no le preocupan los contenidos generados por inteligencia artificial. El gigante de las búsquedas, valorado en 1,67 billones de dólares, no penalizará los artículos sintéticos en sus resultados de búsqueda, siempre que considere que el contenido es útil para los usuarios.

"La IA puede ser una herramienta útil para ayudar a la gente en sus esfuerzos creativos, incluido el desarrollo de grandes contenidos", afirma Jennifer Kutz, portavoz de Google, en un comunicado. "Pero como cualquier herramienta, tiene el potencial de ser mal utilizada, por lo que hemos realizado una serie de esfuerzos para proteger la integridad de la Búsqueda y asegurarnos de que estamos adoptando un enfoque responsable."

Sin embargo, si Google determina que la IA se está utilizando principalmente para manipular las clasificaciones de búsqueda, eso está prohibido. Es un criterio nebuloso que puede resultar difícil incluso para una empresa con la destreza de Google en IA.

Poco después de que Ward publicara su hilo, el tráfico web orgánico de Causal cayó en picado. A principios de octubre, acumulaba más de 610.000 visitas de tráfico orgánico a la semana, según los datos de Ahrefs; a mediados de diciembre, esa cifra se había desplomado a unas 190.000 visitas. Según algunos expertos, parece como si Google hubiera llevado a cabo una "acción manual", penalizando deliberadamente a la página web en sus clasificaciones de búsqueda. (Google no ha querido hacer comentarios sobre sitios web concretos).

"No puedo confirmar que haya una penalización", asegura Patrick Stox, experto en SEO de Ahrefs. "Pero básicamente no existe ninguna alternativa, aparte de eliminar un montón de páginas, que pueda causar una caída como esa".

Un dilema para Google

Mientras Google juzga el contenido sintético de otras páginas web, trabaja duro en la creación de sus propios modelos de inteligencia artificial para producir texto automatizado y otro tipo de información.

The New York Times ha publicado que Google está intentando vender algunas de estas herramientas de IA generativa a importantes editores de noticias. Y se avecinan cambios mayores. Google está desarrollando Search Generative Experience, o SGE, una herramienta experimental de respuesta a preguntas mediante IA integrada directamente en la búsqueda. Podría ser el mayor cambio en los 25 años de historia de Google, ya que ofrece respuestas personalizadas directamente a los usuarios.

Según la firma de capital riesgo Insight Partners, este tipo de experiencias de búsqueda basadas en la IA pueden provocar un descenso del tráfico de hasta el 25% en muchos sitios web.

"Como ocurre con todas las grandes disrupciones, o te adaptas a ellas o acabas pereciendo", afirma Gary Survis, socio de Insight.

Para los editores y los sitios web que dependen de Google para obtener tráfico, se trata de un doble golpe: sus enlaces pueden quedar relegados por debajo del contenido generado por la IA de Google, y competirán en los resultados de búsqueda tradicionales que queden con otras páginas web que utilicen la IA para redactar contenidos automáticamente. 

 

Meterse de cabeza en el agua

Las empresas de medios de comunicación ya están metiendo los pies en el agua de la IA, con resultados a veces catastróficos. La empresa editora de Gizmodo, G/O Media, fue denunciada a principios de este año por publicar artículos generados por IA que contenían numerosos errores factuales. La empresa editora de Sports Illustrated despidió recientemente al director general de la revista tras un escándalo por la publicación de artículos en los que aparecían falsos escritores y fotos de perfil generadas por IA.

Sin embargo, otros editores no se amilanan. Michael Núñez, director editorial de la web de noticias tecnológicas VentureBeat, anima a sus redactores a experimentar con herramientas de IA. Nich Carlson, redactor jefe global de BI, dijo en abril que la redacción aprendería cuidadosamente a utilizar esta nueva tecnología.

"Lo más importante para nosotros es que nunca confiamos en la IA ciegamente o sin sentido crítico, y la utilizamos como una herramienta para aumentar la habilidad o el juicio humano en lugar de sustituirlo", afirma Núñez, de VentureBeat, a BI. (Nota: Núñez y el autor de este artículo forman parte de la junta del Club de Prensa de San Francisco).

Incluso Bruns, de Exceljet, está empezando a utilizar la IA en su flujo de trabajo a pesar del atraco SEO de Ward.

"Muchas veces, cuando termino un artículo, lo introduzco en ChatGPT y le pido que lo revise. Me interesan sobre todo las erratas o los errores de lógica", explica Bruns. "A veces lo uso para generar ideas", añade.

"Como de vez en cuando, le pregunto: ¿Puedes decirme cómo resolverías este problema en Excel?".

Conoce cómo trabajamos en Business Insider.