Ir al contenido principal

Las matemáticas de Google (Matemáticas de la vida cotidiana_Tarea5)

Hoy en día, la información está por todas partes. Hay demasiada, y por ello es necesario seleccionar aquella que realmente nos interesa. Para esto existe nuestro amigo Google. ¡Gracias Google!

Realmente deberíamos dar las gracias a Larry Page y Sergey Brin, creadores del algoritmo de búsqueda de Google. Este algoritmo se llama PageRank (en honor a Larry Page) y, como bien sabréis por experiencia, se basa en ordenar las páginas web relacionadas con las palabras clave que nos interesen, mostrando primero las más relevantes.

Para nosotros, como usuarios de un servicio, el buscador de Google es un motor de búsqueda fácil, sencillo y para toda la familia. Sin embargo, esto es así gracias a la complejidad que hay detrás, una complejidad matemática.

Cada vez que buscamos algo hay miles de páginas en Internet que podrían contener información sobre lo buscado. Para empezar, Google tiene que tener almacenadas todas estas páginas. Para ello, usa un rastreador que navega por la red y va añadiendo a un índice nuevas páginas y actualizaciones. Este proceso se llama indexación.

Sin embargo, una vez que las páginas están indexadas hay que organizar semejante cantidad de sitios web cuando se hace una búsqueda. Para ello, Google usa distintos algoritmos con los que se consigue ordenar las búsquedas según distintas variables: veces que aparecen las palabras buscadas, actualidad de las páginas, localización, spam, experiencia de los usuarios, búsquedas recientes, etc.

Todo esto se consigue gracias a las matemáticas. Entender el funcionamiento del motor de búsqueda de Google es muy complejo, así que nos vamos a centrar en una pequeña parte de este: el PageRank. Antes del PageRank (antes de 1999, que fue cuando se registró), los buscadores ofrecían las páginas que contenían las palabras que habías introducido, pero no había orden en cuanto a importancia o calidad. El algoritmo PageRank sí que tiene esto en cuenta, ordenando las páginas según su relevancia.

Para saber la relevancia de una página tuvieron en cuenta los enlaces entre páginas. Una página relevante es aquella que ha sido enlazada por más páginas y/o páginas más relevantes. Para entender esto fíjate en el siguiente grafo:

Cada nodo corresponde a una página y las flechas indican qué páginas han sido enlazadas por qué páginas. Por ejemplo, la página A ha sido enlazada por la página D, la B ha sido enlazada por 7 páginas distintas y las páginas moradas no han sido enlazadas por ninguna.

Como puede observarse, también tiene importancia la relevancia de las páginas que te enlazan. Si nos fijamos en la C, vemos que es bastante relevante (aparecería la segunda en nuestra búsqueda), pero solo ha sido enlazada una vez. La clave está que ha sido enlazada por la página más relevante y esto da más peso en el posicionamiento.

Esto se expresa así de forma matemática:

Donde:

PR(A) es el PageRank de la página A.

d es un factor de amortiguación que tiene un valor entre 0 y 1.

PR(i) son los valores de PageRank que tienen cada una de las páginas i que enlazan a A.

C(i) es el número total de enlaces salientes de la página i (sean o no hacia A).


Esto es relativamente sencillo, pero cambió la forma de buscar en Internet. Aunque actualmente se usan muchísimos algoritmos más para una búsqueda más eficiente, el PageRank sentó las bases de lo que tenemos hoy.

Aquí os dejo un par de enlaces por si queréis conocer algo más de las matemáticas detrás de Google:


¿Estaré mejorando sus posicionamientos en el PageRank? ;)

Comentarios

Entradas populares de este blog

Comienza la experiencia Twitter. (Redes sociales_Tarea 10.1.)

¡Comienza un nuevo experimento! Esta vez en Twitter.  Dispongo de una cuenta personal, pero en la que básicamente me quejo de la vida, así que he decidido hacer esta tarea con una nueva cuenta que abrí hace unos meses con el fin de hablar un poco de ciencia, pero que, al estar pasando por tiempos complicados, jamás comencé a usar. Así que… ¡ahora es el momento de empezar!  Mi cuenta es @cat_alisis y como biografía he puesto la siguiente descripción:  Indico mi nombre, estudios y dedicación. También menciono, de manera más sutil (mediante emojis), mis intereses gustos e ideas. La ciencia está claramente representada, ya que va a ser el tema principal del que trataré, pero también están escondidas en mi descripción otros aspectos de mi vida, que inevitablemente se van a colar en mis tuits: libros, veganismo, feminismo, dibujo, etc.  He buscado algunas cuentas similares:  - @herenciaciencia.   Otro biólogo sanitario que trata temas diversos sobre biología, bioquímica, sanidad, etc.  -

Cajal: científico y ¿artista? (Ciencia y artes_Tarea final)

Santiago Ramón y Cajal fue un científico conocido principalmente por sus descubrimientos sobre el sistema nervioso. Acompañando a sus investigaciones destacan sus elegantes dibujos, y es que las ilustraciones son elementos que pueden acompañar a los textos científicos y ayudarnos a comprenderlos mejor. Está claro que un dibujo ameniza y contribuye a la mejor comprensión de la ciencia, pero, ¿pueden estos dibujos científicos considerarse arte? En este post vamos a repasar brevemente los aportes de Ramón y Cajal, discutir la relación entre ciencia y arte, y analizar si podemos hablar de Cajal como artista. ¿Quién fue Santiago Ramón y Cajal? Santiago Ramón y Cajal. Fotografía autorretrato a color Cajal como Científico Santiago Ramón y Cajal nació en Navarra en 1852, estudió medicina en Zaragoza y fue médico en Lérida. En 1874, poco después de acabar la carrera, fue destinado como médico militar a Cuba, regresando a España un año más tarde. Fue catedrático en distintas Universidades y,  en

Conferencia Solvay de 1927 (Historia de la Ciencia en Europa_Tarea 7)

Estamos ante una de las fotografías más importantes de la Ciencia  en Europa. Se trata de una fotografía que tomó Benjamin Couprie en la Conferencia de Solvay de 1927. En ella aparecen los siguientes científicos (de atrás adelante y de izquierda a derecha): Auguste Piccard, Émile Henriot, Paul Ehrenfest, Édouard Herzen, Théophile de Donder, Erwin Schrödinger, Jules-Émile Verschaffelt, Wolfgang Pauli, Werner Heisenberg, Ralph Howard Fowler, Léon Brillouin, Peter Debye, Martin Knudsen, William Lawrence Bragg, Hendrik Anthony Kramers, Paul Dirac, Arthur Compton, Louis de Broglie, Max Born, Niels Bohr, Irving Langmuir, Max Planck, Marie Skłodowska-Curie, Hendrik Lorentz, Albert Einstein, Paul Langevin, Charles-Eugène Guye, Charles Thomson Rees Wilson y Owen Williams Richardson. Las Conferencias Solvay son una serie de congresos propuestos por el químico industrial belga Ernest Solvay, con el fin de reunir a los científicos destacados de la época para exponer y discutir diversos temas rela

El nombre de los microbios (Introducción a la microbiología_Tarea1)

Los microbios son organismos de vida libre o parasitaria de pequeñísimo tamaño, menos de 100 µm (aunque hay excepciones). Dentro de los microbios podemos hablar de virus, bacterias, hongos, arqueas, algas y protozoos. Además, dentro de cada uno de estos grupos, hay una enorme variedad de especies. Ante tantos microorganismos diferentes, los científicos decidieron poner orden ayudándose de los nombres.  Los científicos tenemos la manía de organizarlo todo, para facilitar así el estudio y la comprensión de lo que estudiamos. Para organizar a los seres vivos existe la taxonomía, la ciencia que se encarga de la clasificación y ordenación jerarquizada y sistemática de los seres vivos. Dentro de la taxonomía se incluye la nomenclatura, la rama encargada de asignar nombres apropiados a las especies. Los nombres no se ponen al azar, sino que se tiene en cuenta la clasificación y las características de los organismos. Los microbios se clasifican, al igual que el resto de los seres vivos, según

Iconografía científica (Introducción a la Historia de la Ciencia_Tarea 5.1.)

Os propongo un reto. ¿A cuántos de estos personajes reconocéis? Quizá alguno os suene si estáis familiarizados con ellos por alguna razón. También tenéis la pista de que esto es un blog de cultura científica… Pero seguro que os resulta mucho más fácil reconocerlos si veis las imágenes completas. La primera es... Marie Curie , comúnmente representada con alguna sustancia radiactiva . La imagen B).... es Crick , en su famosa foto junto con Watson y el modelo de la doble hélice de DNA . Es común verle junto a ella. La C) es... Copérnico . Le delata su modelo heliocéntrico , con el que se le suele representar.    La imagen D) es... Ernest Rutherford . Con su modelo atómico y sus experimentos al lado se reconoce más fácilmente, ¿verdad?  Por último, tenemos a... Santa Bárbara , representada con su icónica torre de tres ventanas . Este personaje no es precisamente científico, pero creo que sirve para mostrar como la iconografía es de gran utilidad para reconocer personajes, tanto en relig