
Hola. Quizás ya nos conocieras de antemano, pero también es muy probable que hayas llegado aquí desde el buscador de Google. Más que nada porque es el más utilizado del mundo junto a Yandex en Rusia y Baidu en China y Asia. ¿Nunca te has preguntado cómo funciona el buscador de Google para conseguir los mejores resultados a tus búsquedas en apenas un segundo?
No es que nosotros sepamos exactamente los entresijos de Google (¡ojalá!), pero existen ciertos aspectos que son conocidos, y que ahora la propia Google nos explica de forma muy gráfica desde su web: "How search works". Te explicamos de forma resumida cómo funciona el buscador de Google.
El buscador de Google: Rastreo e indexación

La web es un ecosistema en continuo crecimiento formado por más de 30 trillones de páginas individuales. ¿Cómo podemos encontrar nuestra aguja en un pajar tan inmenso? Google rastrea y organiza el contenido para convertir esta maraña de webs en una fuente de información catalogada.
Lo primero que hace Google es rastrear todas las páginas que puede con su motor, leyendo a través de texto y enlaces. Es lo que llaman "Crawling", y los webmasters pueden decidir si quieren o no que Google pueda rastrear sus webs. Si se niegan, no saldrán en los resultados del buscador... y es que no todo Internet está en Google; el llamado "internet invisible" (páginas privadas, intranets, etc.) es aún mayor que el número de páginas indexadas. Podría ser la "materia oscura" del universo Internet.
Una vez rastreada una web, esta se organiza y cataloga según su contenido y otros factores. Toda la información de las páginas rastreadas va al "Index" (es decir, se indexa). El Index es un catálogo gigantesco que pesa más de 100 millones de Gigabytes...
El buscador de Google: Los algoritmos de búsqueda
Ahora vamos a lo más interesante, saber el proceso que sigue el buscador de Google cuando escribimos nuestra consulta.

Ya mientras estás escribiendo en el cuadro de búsqueda, Google trabaja para ofrecer los mejores resultados utilizando diversos programas y algoritmos (instrucciones definidas). Lo primero que hace el buscador es averiguar lo que realmente queremos a través de varias pistas y funciones, que van más allá de la palabra que usemos. Aquí están algunos:
- Google Instant: si tenemos esta opción activada, se nos irán mostrando resultados conforme vamos escribiendo; a veces, con la primera palabra de nuestra búsqueda ya es suficiente para llegar al resultado.
- Últimamente Google ha implementado formas de buscar contenidos multimedia por separado. Podemos buscar un vídeo o una imagen directamente, e incluso buscar una imagen similar a otra.
- Contexto del usuario: si no estamos en navegación privada y estamos metidos en nuestra cuenta Google, el buscador también usará cierta información personal para ofrecer mejores resultados, como nuestro idioma, país, o búsquedas anteriores. De esta forma se sacrifica privacidad a cambio de unos resultados más ajustados (esto ya es decisión de cada uno).
- Con autocompletar se predice el final de las palabras y frases que estamos escribiendo, mostrando lo más buscado o cercano a nuestro historial.
- El buscador también predice errores ortográficos para que estos no anulen la búsqueda. Así, nuestras madres podrán tranquilamente ir al "Feisbuk" desde "Gugle" y quizás mirar algún vídeo de "llutube". Probadlo y veréis.
- Además, se buscan sinónimos con significados similares a las palabras que estamos buscando.


El buscador de Google: Primeros puestos
Con estas pistas se indexan los resultados y se ofrecen al usuario listados en un ranking. El orden de aparición de las webs en este ranking es de suma importancia, ya que los usuarios se suelen cansar en seguida de buscar y se irán al primer resultado bueno que vean. Se tienen en cuenta más de 200 factores para un proceso tan sensible, y los expertos en SEO se pasan el día intentando encontrar la manera de posicionar sus páginas bien arriba... Algunos de los factores conocidos que hacen que una página esté más arriba en el ranking son:
- Calidad de la página: se analiza hasta que punto una web es respetable, fiable e importante. Para ello se utiliza uno de los primeros algoritmos de Google, el PageRank, que mide la cantidad de sitios que enlazan a esa web. Sin embargo, el PageRank ha sido objeto de trampas y abusos por parte de webmasters que compraban estos enlaces, así que ha perdido algo de peso en la actualidad en favor de otros factores.
- "Frescura": aunque no pongamos en la búsqueda una fecha concreta, Google nos suele mostrar primero aquellas páginas actualizadas de forma reciente. De esta forma evitaremos páginas abandonadas y con información desfasada.
- De nuevo, el historial de búsqueda del usuario se usa para mostrar antes los contenidos similares a los que ya ha visitado antes. Si queremos limpiar nuestro historial definitivamente existen muchos programas limpiadores.
Todo este proceso se lleva a cabo en tan solo 1/8 de segundo... los factores y algoritmos de búsqueda son una de las señas de éxito de Google, y están continuamente en un proceso de experimentación y mejora por parte de sus técnicos (solo hay que ver lo que pasó con Panda).

Los resultados de la página se muestran en varios formatos, según desde que dispositivo accedamos. Los resultados pueden mostrar páginas patrocinadas (publicidad), resultados relacionados con nuestros contactos en redes sociales (sobre todo en Google+), imágenes, vídeos y fragmentos de texto para tener mejor idea del contenido, medios online... si con todo esto no afinamos, podemos irnos a la búsqueda avanzada y optar por los clásicos operadores booleanos.
El buscador de Google: Elimina el spam
Internet está lleno de Spam: contenido falso, nocivo o molesto que solo busca inundarnos de publicidad recurriendo a estrategias a menudo masivas y agresivas. La mayor parte de la detección y eliminación por parte de Google es automática, pero también se realiza de forma manual.

Entre los elementos que suelen compartir las páginas consideradas de spam, está el contenido oculto; los sitios con apenas contenidos que solo se usan para guardar dominios; los patrones de links no naturales; las redirecciones ocultas; el spam generado por los propios usuarios... existen páginas enteras que funcionan de esta forma, dedicadas a llevarnos donde les interesa de forma poco honesta.
Cuando Google detecta una página con comportamientos que derivan en Spam, intenta notificarlo a los propietarios de la web, que pueden rectificar posteriormente para volver a estar en los resultados de Google.
La punta del Iceberg
Si lo preferís, desde Google os explican el proceso con un vídeo
Como veis, se esconde un proceso bien complicado detrás de la simple fachada del buscador de Google. Y solo es la parte que sabemos, ya que sus políticas se revisan continuamente en un intento manifiesto de mejorar la experiencia de los usuarios y mantener el liderazgo. ¿Vosotros que opináis de Google y su funcionamiento?