Pasar al contenido principal

Google introduce BERT, la mayor actualización de su algoritmo de búsqueda en años

Google Search en iPad
Pixabay
  • El 15% de las millones de consultas que se hacen a diario en el buscador no se habían hecho antes.
  • BERT es una red neuronal de código abierto entrenada por Google para procesar de forma más efectiva el lenguaje natural, es decir, la manera en que nos expresamos.
  • BERT procesa palabras en relación al resto de palabras en una oración, en lugar de una por una en orden.
  • Descubre más historias en Business Insider España.

El vicepresidente de Google Search Pandu Nayak ha presentado en un comunicado más detalles acerca de Google BERT (Bidirectional Encoder Representations from Transformers), la mayor actualización en su buscador en años.

BERT es una red neuronal de código abierto entrenada por Google para procesar de forma más efectiva el lenguaje natural, es decir, la manera en que nos expresamos.

Nayak cuenta que en los 15 años que lleva trabajando para el gigante tecnológico the aprendido que "la curiosidad de las personas es infinita", por lo que el 15% de las millones de consultas que se hacen a diario en el buscador no se habían hecho antes. Con BERT han creado maneras de devolver resultados para consultas que no pueden anticipar.

BERT es el mayor cambio en su sistema de búsqueda desde que la compañía introdujo RankBrain, hace casi cinco años. La compañía dijo que esto afectará a 1 de cada 10 consultas en términos de cambiar los resultados que se clasifican para esas consultas

Leer más: Comparamos Google, Bing y DuckDuckGo para ver cuál es el mejor buscador y el resultado ha estado reñido

"Con los últimos avances de nuestro equipo de investigadores en la ciencia de la comprensión del lenguaje, que ha sido posible gracias al aprendizaje automático, estamos mejorando significativamente la forma en que entendemos las consultas”, explica Nayak. “Esto representa nuestro mayor avance en los últimos cinco años, y uno de los mayores avances en la historia del buscador”.

Según Nayak, cuando realizamos una búsqueda hay veces que no sabemos qué palabras usar o incluso cómo deletrear algo en concreto, por lo que acudimos al buscador para aprender, sin necesidad de tener el conocimiento para empezar. "Nuestro trabajo es descubrir qué estás buscando y mostrar información útil de la web, sin importar cómo deletrees o combines las palabras en la consulta", explica.

Así funciona BERT

BERT procesa palabras en relación al resto de palabras en una oración, en lugar de una por una en orden. Por lo tanto, los modelos BERT pueden considerar el contexto completo de una palabra al observar las palabras que vienen antes y después, lo cual es particularmente útil para comprender la intención de una consulta.

La nueva herramienta de Google es útil para consultas más largas o, por ejemplo, en búsquedas en las que la diferencia en el significado de preposiciones como "para" y "por" son muy importantes.

Antes de BERT, la búsqueda “2019 viajar de Brasil a Estados Unidos hace falta visado” devolvía un artículo del Washington Post sobre viajar a Brasil desde Estados Unidos; el buscador no entendía la importancia de la preposición “a” en la frase. Con BERT, el buscador devuelve como primer resultado la web de la embajada estadounidense en Brasil; en concreto, una página sobre visados para turistas brasileños:

Búsqueda con BERT en Google
Google

Otra consulta: "soportan mucho en el trabajo las esteticistas". Anteriormente, el sistema adoptaba un enfoque de palabras clave coincidentes, que coincidían con el término "stand-alone" en el resultado con la palabra "stand" en la consulta. Pero ese no es el uso correcto de la palabra "stand", que en este contexto se refiere a soportar. BERT, por otro lado, entienden que "soportar" está relacionado con el concepto de las demandas físicas de un trabajo y muestra una respuesta más útil.

Búsqueda con BERT de Google
Google

Por ahora, BERT solo se aplica a las búsquedas en inglés dentro de Estados Unidos, pero Google promete extenderlo a otros idiomas en el futuro, empezando por el coreano, el hindi y el portugués.

Y además