Por qué es tan frustrante buscar cualquier cosa en internet

¿Por qué buscar casi cualquier cosa hoy en día —un tuit, un documento de Word, un correo electrónico— parece como buscar una aguja en un pajar?
¿Por qué buscar casi cualquier cosa hoy en día —un tuit, un documento de Word, un correo electrónico— parece como buscar una aguja en un pajar?

Savanna Durr / Business Insider

El otro día necesitaba encontrar un viejo correo electrónico. Una tarea bastante simple. Sin embargo, me preocupaba bastante no encontrarlo porque utilizo Gmail. Y la función de búsqueda de Gmail, como saben millones de usuarios por amarga experiencia personal, hace casi imposible encontrar lo que buscas.

Si buscas el número de confirmación de tu vuelo, encuentras todos los correos de tus vuelos frecuentes. Si buscas el nombre del remitente, encuentras únicamente los correos más recientes. Si buscas un archivo adjunto, no diferencias el mensaje que lo contiene del resto de respuestas. Me reiría de esta situación si no me doliera la cabeza de darme golpes contra el escritorio. ¿Cómo es posible que la empresa que fabrica la mejor y más robusta tecnología para buscar en internet sea la responsable de una aplicación de correo electrónico en el que la función de búsqueda no funciona?

Para ser justos, la realidad es que Gmail no es una excepción en lo que respecta al motor de búsqueda. En Spotlight, de Apple, sucede algo similar; si hablamos de Finder, su problema es que encuentra demasiadas opciones. Las pantallas de Google Maps y Apple Maps están demasiado abarrotadas de funciones para verlas, especialmente en el móvil. Amazon te enseña literalmente cosas que no has pedido, seguidas de sus propias imitaciones, antes de mostrarte la opción que has escrito en la barra de búsqueda. Instagram ni siquiera tiene búsqueda de imágenes. ¿Buscas un tuit específico que recuerdas, incluso por el nombre del tuitero? Buena suerte.

Así que mi pregunta es la siguiente: ¿Por qué los motores de búsqueda son tan malos

Resolver el tema de buscar cosas ha sido la clave de la integración de la web en la vida cotidiana, lo que hizo que internet saliera de los sótanos de las universidades y llegara a nuestros bolsillos. Ahora, parece que nuestra capacidad para localizar y recuperar información está empeorando en lugar de mejorar, justo en el momento en que los hechos reales son el bien más preciado de la humanidad. Cuando entramos en la era digital, tomamos la decisión colectiva de almacenar casi todo lo que sabemos, incluso nuestros recuerdos más personales e íntimos. Llegados a este punto, la búsqueda es la memoria. Y cuando todos utilizamos las mismas herramientas deficientes para recordar, corremos el riesgo de olvidarnos de nosotros mismos.

Para entender cómo hemos llegado hasta aquí (desde nuestro pasado pulcramente organizado hasta el presente irremediablemente desordenado) tenemos que comprender que la búsqueda tiene diferentes sabores. Diferentes tipos de información requieren diferentes tipos de búsqueda. Pero todas las formas de búsqueda tienen algo en común. Por decirlo técnicamente, todas son un asco.

Por qué buscar en el correo electrónico apesta

En términos generales, hay 2 tipos de búsqueda. Una es la de "elemento conocido", en la que se tiene en mente un hecho, un objeto o un destino concreto y solo se necesita saber dónde está. La otra es "exploratoria", en la que no se sabe lo que se quiere encontrar.

El correo electrónico es una especie de caso especial. Cuando alguien realiza una búsqueda de un mail, suele saber que existe un mensaje específico, quién lo envió, o cuándo, pero esos criterios se pueden aplicar a un montón de correos electrónicos. La mayoría de las veces, la gente quiere encontrar un mensaje reciente, del último mes más o menos, pero otras veces no es así. Las personas suelen recordar algunos detalles clave, pero a veces no son precisos. 

"La razón por la que la búsqueda proporcionada por los proveedores individuales, incluyendo Gmail, es a menudo tan deficiente es que el problema subyacente es bastante difícil de resolver", explica Sridhar Ramaswamy, un ex ejecutivo de Google que actualmente es CEO de Neeva, una startup de motores de búsqueda.

Cuando Google llegó por primera vez, resolvió el problema de las búsquedas de varias formas ingeniosas. La más famosa, de la que probablemente hayas oído hablar, se llama PageRank, un sistema que contaba los "enlaces entrantes", es decir, el número de veces que otros sitios citaban el mismo resultado como fuente. PageRank te daba la respuesta que el resto de internet consideraba acertada. Pero el poder de Google consiste en identificar de qué tratan esas páginas y ser capaz de asociar el tipo de palabras que tú y yo podríamos buscar con ese contenido. Y luego está el índice: el rastreo que Google actualiza regularmente de todo Internet, o de una gran parte de él. En la actualidad, el índice rastrea 100 millones de gigabytes de datos, cientos de millones de páginas web. Esa escala le da a Google una enorme ventaja: estadísticas sobre todas las cosas diferentes que la gente busca, y las formas en que lo hacen.

Por desgracia, la mayor parte de esa ventaja no está presente en Gmail. Sí, hay mucho correo electrónico en el mundo: según un libro sobre el problema escrito por un grupo de ingenieros de Gmail, se reciben más de 300.000 millones de correos electrónicos cada día, contando los mensajes enviados de forma automática, recibos, notificaciones, etc. 

Parece una base de datos lo suficientemente grande como para que las estadísticas a escala de Google funcionen. Pero el correo electrónico no es colectivo como la web. La bandeja de entrada de tu correo electrónico es tuya, y no importa cuántos correos tengas, no es suficiente para que un motor de búsqueda tipo Google funcione correctamente.

búsqueda

"Los algoritmos que utiliza Google para buscar noticias no son necesariamente eficaces. Aunque sea mucha información para ti, realmente es muy poca, por lo que las estadísticas no funcionan tan bien", afirma Ian Ruthven, científico de la información de la Universidad de Strathclyde

Además, aunque Gmail ayude a los anunciantes a dirigirse a ti en función de tu comportamiento en el correo electrónico, no recoge ni comparte información sobre los tipos de búsqueda que lleva la gente a cabo. Si lo hiciera, estaría violando tu privacidad. Esto dificulta la tarea de los ingenieros, a los que les falta información para poder mejorar la herramienta de búsqueda. Tienen que basarse en datos de encuestas o en datos de uso anónimos o en gigantescos depósitos de correo electrónico de empresas muertas. Uno de los mayores archivos de investigación resulta ser todo el correo electrónico enviado dentro de Enron, la empresa energética estadounidense que quebró hace más de dos décadas.

"En internet, tienes un gran número de páginas web que se comparten para todos los usuarios. Si buscas algo, haces clic en un resultado, y luego yo busco lo mismo, Google puede utilizar esos clics para mejorar mi búsqueda. En una bandeja de entrada, tú tienes tu colección de correos y yo tengo la mía. La transferencia de conocimientos entre los clics, o cualquier información que Google obtenga de los usuarios, no se puede compartir", aclara Hamed Zamani, director asociado del Centro de Recuperación Inteligente de Información de la UMass Amherst.

Básicamente, la búsqueda de correos electrónicos es un problema de programación masivo repartido entre millones de usuarios. Tratar de localizar un correo, irónicamente, puede ser la actividad más solitaria de la era digital, el único momento en el que estamos realmente solos con nuestros datos.

Por qué apesta buscar en webs de noticias o en redes sociales

La mayoría de las web, sobre todo las de nueva creación, no tienen el dinero o los conocimientos necesarios para crear su propia función de búsqueda. Puedes hacer clic en la lupa de la página de inicio de una web de noticias, pero es probable que aparezcan artículos irrelevantes o que no se remontan lo suficiente en el tiempo. Lo mismo ocurre si intentas buscar en las redes sociales: se te indicarán muchos usos específicos de tus palabras de consulta, pero no necesariamente del usuario que realmente quieres. Y si existe una opción de "búsqueda avanzada" más calibrada, buena suerte para encontrarla.

La omnipresencia de Google nos ha llevado a asumir que todos los cuadros horizontales con una pequeña lupa en el lateral funcionan igual. Pero no es así. Los gigantes de internet como Amazon o Facebook dedican mucho tiempo y dinero a las funciones de búsqueda, pero las organizaciones más pequeñas no pueden, o no lo hacen. 

Muchas utilizan software de búsqueda estándar (productos como Elastic o Apache Lucene) y lo personalizan un poco. Son productos sólidos, pero no tienen las ventajas de escala que tiene Google. Y como la mayoría de la gente acabará utilizando Google de todos modos, crear una función de búsqueda personalizada no merece la pena para la mayoría de las empresas.

Eso también significa que lo que Google nos ha enseñado a hacer (escribir palabras clave en la barra de búsqueda, una y otra vez, hasta encontrar lo que buscamos) no necesariamente funciona en otros sitios. "Cuando la gente adquiere estos hábitos y luego visita otra página esperando que el sistema sea igual de eficaz, suele llevarse una gran decepción", afirma Chirag Shah, científico de la información de la Universidad de Washington.

El problema tiene una solución sencilla: las empresas podrían dar a los robots de Google acceso a sus páginas web. El algoritmo ayudaría a los clientes a encontrar lo que buscan. Pero eso expondría los datos internos de una empresa (y los hábitos y comportamientos de sus usuarios) a un gigante de Silicon Valley conocido por sus feroces instintos competitivos. Dejar que Google se encargue de tu búsqueda implica dejar que Google se meta en tu negocio, literalmente.

"Regalar la puerta de entrada a tu producto te pone en un riesgo increíble. Facebook, Instagram, Twitter, Pinterest son excepcionalmente cuidadosos sobre lo que dejan hacer a Google y lo que no. Todos ellos han aprendido que hay cero incentivos para dar toda su información a Google", afirma Ramaswamy. 

Por qué apesta buscar en webs de compras

Después de un par de décadas utilizando Google, todos estamos entrenados para asumir que los resultados de búsqueda se clasifican por la relevancia de nuestra consulta. Pero el hecho es que una página web que intenta vender algo siempre jugará con los resultados en su beneficio

El problema es que las opciones de búsqueda de una tienda online no pueden ser tan deficientes, porque entonces la gente no lo utilizaría. Una página que intenta venderte algo tiene que mostrar lo suficiente de lo que quieres comprar y lo suficiente de lo que quiere vender.

Por qué apesta especialmente buscar en plataformas de 'streaming'

Los servicios de streaming, gestionados por grandes creadores de contenidos como Netflix y Disney, son como la mayoría de las páginas web: no quieren que Google tenga acceso a datos que puedan suponer una ventaja competitiva. Por eso, una simple consulta a Google no siempre arroja resultados útiles. También es la razón por la que la función de búsqueda en el Apple TV da resultados confusos en el mejor de los casos, porque los servicios de streaming no permiten a Apple acceder a sus datos. ¿Por qué querría HBO Max confundir a sus clientes con un mar de resultados utilizando la interfaz de Apple en lugar de buscar directamente en la suya?

En cuanto a la razón por la que su propia funcionalidad de búsqueda interna tiene tantos fallos, eso se remonta al juego de los resultados. Los representantes de los servicios de streaming con los que he hablado hacen hincapié en su enfoque en los algoritmos de recomendación, que te muestran contenidos basados en lo que pueden saber sobre tus preferencias a partir de lo que ya has visto. 

Esto se debe, en parte, a que una búsqueda más directa mostraría que su contenido es finito. Si buscas cosas que no están ahí, podrías empezar a pensar en suscribirte a otro servicio. Así que te muestran proactivamente Los Goonies, que sí están, antes de que empieces a buscar Gremlins, que no aparecerán.

Los algoritmos de recomendación basados en el comportamiento anterior son en realidad motores de búsqueda en los que las consultas están implícitas. A eso se le llama búsqueda de consulta cero. Cada búsqueda que hacemos tiene una búsqueda secreta e implícita de consulta cero incrustada en ella. Buscamos algo que satisfaga una curiosidad intelectual o emocional, algo que nos haga sentir mejor de alguna manera no articulada. 

Por eso las recomendaciones algorítmicas son tan perniciosas. Funcionan. Nos dan lo que queremos, confirman nuestras sospechas, nos reconfortan y nos dicen que teníamos razón sobre lo que ya creíamos, incluso cuando no es lo que necesitamos.

Por qué incluso buscar en Google apesta

Hay una razón por la que el nombre de la empresa es un verbo (en español existe el neologismo Googlear). No se trata sólo de su cuota de mercado de más del 90%, ni de su índice imbatiblemente masivo, ni siquiera de la rapidez con la que responde a las consultas. Para la mayoría de las búsquedas, Google funciona.

Por supuesto, hay cierta tensión entre el producto "editorial" de Google (los resultados de búsqueda) y sus anuncios. Cada pocos meses, un nuevo artículo o informe confirma que cada vez más resultados de Google son de pago, incluyendo un montón de spam o estafas. Al fin y al cabo, el objetivo de la optimización de los motores de búsqueda (SEO) es que los sitios se abran camino hasta la cima de Google. De una forma u otra, la mayoría de los resultados que se obtienen en Google son el producto de un esfuerzo concertado para acaparar la atención del usuario.

Una forma de pensar en la búsqueda es verla como un intento de interactuar con cualquier sistema de información organizada. Se trata de mirar fijamente a un abismo lleno de información y conseguir que nos diga lo que sabe de una manera que tanto él como nosotros entendamos.

Las personas que empezaron a pensar en cómo iban a funcionar los ordenadores señalaron que estos nuevos dispositivos resolverían tanto la búsqueda de elementos conocidos como la búsqueda exploratoria. En 1945, Vannevar Bush, que dirigió la investigación científica para el Gobierno de EEUU durante la Segunda Guerra Mundial, indicó que los "índices asociativos", es decir, los enlaces, serían la clave de un dispositivo de procesamiento de información de escritorio que llamó memex. Las primeras guías de la web, de hecho, eran listados literales de páginas web. "La idea era intentar crear una jerarquía de temas por los que se navegaba. Era una gran manera de organizar la web cuando era pequeña. Pero rápidamente se volvió inviable", explica Nayak. Había demasiado Internet.

Google descubrió cómo buscar a través de ese vasto volumen tan rápidamente que los usuarios podían hacer consultas de palabras clave una y otra vez, hasta que apareciera la respuesta correcta.

Pero, con el paso del tiempo, en su afán por ser grande y exhaustivo, Google fue empeorando su servicio. "Intentan servir bien a la mayoría de los clientes la mayor parte del tiempo. Pero, si haces una búsqueda inusual, o tienes un gusto musical poco frecuente, obtendrás peores resultados", explica Ruthven, científico de información.

lupa

La gran mayoría del contenido de internet es basura, o cosas que no interesan a casi nadie. Google ignora casi todo eso, optimizando una fracción de sus páginas indexadas. "De entrada, es un filtro", dice Cutting, constructor de motores de búsqueda.

Google acaba favoreciendo a lo más buscado sobre lo menos buscado. 

Las interacciones de búsqueda en Google pueden llegar a parecerse menos a un intercambio de palabras clave por enlaces y más a una interacción con un bibliotecario de los viejos tiempos, un intercambio de preguntas y respuestas. Pero no es más que una ilusión. Los algoritmos de Google podrán responder a consultas en 75 idiomas, pero esas respuestas seguirán procediendo de partes de la web en el índice de Google que la empresa ha determinado como "un subconjunto de alta calidad". La barra de búsqueda será más fácil de usar, pero las respuestas no serán más correctas. 

Es difícil imaginar un desafío técnico a la hegemonía de Google. Muchos de los cerebros y muchos de los datos que podrían arreglar la búsqueda se encuentran en el complejo de Google.

Aun así, más de media docena de startups esperan llegar a la altura del rey. Algunas ofrecen la posibilidad de personalizar lo que se busca y cómo se busca, transparencia a la que Google renuncia en favor de respuestas cada vez más directas a las preguntas. 

Neeva, la competidora de Google dirigida por Ramaswamy, promete una experiencia sin anuncios que buscará tanto en la web como en la información de tu propio ordenador protegiendo tu privacidad, a cambio de una cuota de suscripción. O podrías mejorar tu búsqueda en Google, como sugieren algunos expertos.

Por qué tú también apestas a la hora de buscar

Hace un par de meses, un crítico e historiador de cómics tuiteó algo de un viejo cómic de Batman. Mostraba a Batman sentado en lo que parece una biblioteca, hojeando libros y quejándose de que sus editores en DC Comics lo están fastidiando porque le han pedido que elija sus mejores historias para una compilación. "Los editores son hombres despiadados", dice Batman.

Mientras trabajaba en este artículo, pensé que sería divertido enviar ese panel de Batman a mi propio editor. Pero, por supuesto, no pude encontrar el tuit. Utilicé la función de búsqueda básica de Twitter para combinar el nombre del tipo con algún lenguaje que recordara del tuit. Pero el tuit seguía sin aparecer. Fui a la búsqueda avanzada de Twitter, hice lo mismo, añadí "los editores son hombres sin piedad" y "Batman", y seguí sin encontrar nada. Desesperado, abrí el feed de Twitter del escritor y empecé a desplazarme. Nada. Cuando llegué demasiado atrás en el tiempo, me detuve, desconcertado.

Por una corazonada, fui a Google y escribí todo lo que recordaba sobre el tuit, excepto el nombre del escritor. Y ahí estaba, entre los 10 primeros enlaces azules. Resulta que había recordado mal quién lo había tuiteado. Era otro crítico e historiador de cómics, que también me gusta. 

El problema no era la búsqueda. Era yo.

La gente espera que Google o Bing o la lupa de su ordenador respondan a las preguntas como los bibliotecarios de antaño, incluso a preguntas complejas y abiertas que generan respuestas complejas y a menudo contradictorias. "En cierto sentido, los grandes motores de búsqueda nos han entrenado para comportarnos de ciertas maneras: consultas cortas, mirar superficialmente la primera página", reflexiona Ruthven.

Y cuando una búsqueda no produce la respuesta que se espera, ¿qué es lo más humano que se puede hacer? Seguir haciendo infinitas variaciones de la misma pregunta, una y otra vez, hasta encontrar algo. "Hemos visto en algunos de nuestros estudios que la gente sigue probando el mismo tipo de consultas una y otra vez, con la esperanza de que dé los resultados correctos", afirma Shah, científico de información. "No están dispuestos a cambiar mucho su comportamiento", añade.

Las búsquedas siempre se verán afectadas por lo que los buscadores sabemos, o creemos saber, y por lo que no sabemos. Nuestra propia certeza errante, nuestra confusión, pone límites a lo que escribimos en un cuadro de búsqueda. Y como Google es bastante bueno encontrando casi todo lo que queremos a partir de nada más que unas palabras clave mal escritas, creemos que somos bastante buenos buscando. Cualquier fallo, suponemos, debe estar al otro lado de la pantalla. Pero la búsqueda, por necesidad, siempre implicará una interfaz entre el ser humano y la máquina, una relación, si se quiere.

Entonces, ¿cómo podemos arreglar nuestras problemáticas interacciones con la búsqueda? Sabiendo que una relación sana se basa en un diálogo abierto.

"¿Cómo puedo arreglar nuestra relación?" pregunté a Google.

"Enfrentaos y aceptad vuestras diferencias", respondió Google.

Otros artículos interesantes:

Google ofrece la opción de retirar tu información personal para que no aparezca en el buscador

Apple es una de las razones clave por las que Google, Meta y Snap han tenido un trimestre terrible

Esta startup derivada de Google quiere asomarse a los secretos de tu cerebro a través de unos innovadores auriculares

Te recomendamos