PRÁCTICA 4

Transcripción

PRÁCTICA 4
Buscadores
Práctica 4
Carmen Alija Martínez
I.- El Buscador en Internet. Justificación y necesidad.
Definiciones. Funcionamiento.
En Internet se puede encontrar información de casi cualquier tema que se nos
ocurra. Esto es posible porque toda clase de instituciones y empresas, y también muchas
personas, han publicado información en sus espacios en la red, con carácter público,
para que cualquier visitante pueda acceder a ella. Esto que tiene un potencial enorme
también presenta importantes inconvenientes, pues el primero es que resulta imposible
saberse de memoria cada una de las direcciones que nos interesan y, aunque se pueden
guardar como favoritos, nadie conoce todas las páginas que contienen la información
que les puede interesar, además que al igual que la vida las necesidades de información
son dinámicas. No buscamos lo mismo a los 20 que a los 40 años, ni si alquilamos o
compramos una casa.
Hoy en día Internet se ha convertido en una herramienta para la búsqueda de
información rápida. Para facilitar la búsqueda existen los buscadores, como por
ejemplo Google, Yahoo, Ask, Lycos, Live search, Baidu por mencionar sólo algunos
entre muchos otros.
Los buscadores que no son otra cosa que el Front-end, la parte del software
que interactúa con el usuario, el nivel accesible por el internauta de un motor de
búsqueda que nos facilita encontrar información rápida de cualquier tema de
interés, en cualquier área de las ciencias, y de cualquier parte del mundo.
Un motor de búsqueda es un sistema informático que indexa archivos
almacenados en servidores y páginas web. Un ejemplo son los buscadores de Internet.
Las búsquedas se hacen con palabras clave o con esquemas jerárquicos por temas. El
resultado de la búsqueda es un listado de direcciones web relacionadas con las palabras
clave buscadas.
Se pueden clasificar en dos tipos:
•
•
Índices Temáticos: Son sistemas de búsqueda por temas o categoría
jerarquizados (aunque también suelen incluir sistemas de búsqueda por palabras
clave). Se trata de bases de datos de direcciones Web elaboradas
“manualmente”, es decir, hay personas que se encargan de asignar cada página
web a una categoría o tema determinado.
Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases
de datos que incorporan automáticamente páginas web mediante "robots" de
búsqueda en la red.
Como operan en forma automática, los motores de búsqueda contienen
generalmente más información que los directorios. Sin embargo, estos últimos también
han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos
dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos
directorios combinan ambos sistemas.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 1 de 23
Funcionamiento
Para un usuario de buscadores el funcionamiento de este sistema es muy
sencillo: escribes un texto, pulsas “Intro” y aparecen resultados con enlaces a páginas
que contienen ese texto. Pero detrás de este sencillo proceso hay mucha tecnología y
una importante labor de búsqueda y clasificación del contenido de páginas web.
Además, es necesaria una actualización constante de los datos de cada sitio.
Para poder efectuar búsquedas en Internet es preciso tener una base de
información, que es donde se tiene que buscar. Internet incluye millones de Terabytes
de información, por lo que revisar la totalidad de estos datos llevaría mucho tiempo. Por
eso se han creado los robots de búsqueda.
En su trabajo los buscadores utilizan un web crawler o araña de la web que es
un pequeño software, un pequeño programa que recorre el entramado de páginas Web
de Internet de forma metódica, automática y sistematizada. Es un tipo especializado de
webbot - robot de la Web - que se encarga de llevar a cabo un tipo concreto de tareas.
En particular, se encarga de recorrer las páginas Web de Internet, descargarlas al
ordenador local para su procesado posterior por un motor de búsqueda que indexa las
páginas proporcionando un sistema de búsquedas rápido.
Las arañas Web (crawlers), como cualquier otro tipo de software, pueden ser
utilizadas con fines diversos, aunque el uso más conocido es el de agente software en
los motores de búsqueda, donde su función básica es proporcionar al indizador el
contenido apropiado para ser indizado. Algunas arañas Web (crawlers) de este tipo
son Googlebot o Yahoo slurp, las arañas Web (crawlers) de Google y Yahoo,
respectivamente.
Es interesante conocer el funcionamiento de estos Webbots para entender
cómo y en qué orden se nos presentan las distintas páginas ante una búsqueda
introducida en un buscador, en definitiva porqué un buscador indexa y presenta el
enorme contenido de Internet en el modo jerarquizado que lo hace, pues no hay que
desconocer que los primeros enlaces de las primeras páginas tienen un mayor potencial
de ser visitados.
Por lo general, una araña Web (crawler) dispone de un conjunto inicial de URLs,
conocidas como semillas. La araña Web (crawler) va descargando las páginas Web
asociadas a las semillas y buscando dentro de éstas otras URLs. Cada nueva URL
encontrada se añade a la lista de URLs que la araña Web (crawler) debe visitar. A este
proceso se le denomina recolección URLs. Cuando la araña Web (crawler) pasea por
una página Web, lo que hace es decidir qué partes de ésta son de utilidad. Por ejemplo,
puede quedarse sólo con los enlaces, sólo con imágenes, sólo con texto... Tras la visita,
la araña Web (crawler) procesa la información disponible, es decir, aplica distintos tipos
de algoritmo para conseguir el objetivo establecido. Por ejemplo, comprobar la
disponibilidad de un enlace, las referencias cruzadas de otras páginas a esa, el tamaño
de las imágenes, la profundidad de enlaces dentro de la web, el número de veces que
aparecen las palabras clave relacionadas, etc. Pero estos robots también tienen
importantes limitaciones: ninguna araña Web (crawler) puede acceder a todas las URLs
que hay en Internet, pues el número de páginas existentes es gigantesco (entre otras
causas: enormes cantidades de páginas que recorrer con crecimiento exponencial,
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 2 de 23
elevado número de actualizaciones de páginas existentes, páginas que crean su
contenido de forma dinámica interactuando con el usuario, redireccionamientos)
Estadísticamente, el porcentaje de Internet que suele ser explorado por una araña Web
(crawler) es aproximadamente del 15%.
Éstos robots que se encargan de revisar “todas” las webs y crear una lista de
información que contiene sólo ciertas partes de cada página, actualizan periódicamente
los datos referentes a las webs, de manera que la base de datos de páginas indexadas por
el buscador esté más o menos al día. Según el Page Rank de la página, se actualizan los
datos cada mes o menos.
De esta forma, cuando solicitas una búsqueda desde un motor de este tipo, se
revisa la información que contiene ese índice y no la totalidad de Internet. Gracias a ello
se tarda muy poco en obtener resultados, aunque esto tiene sus desventajas. Un ejemplo
es que no se incluyen en el índice todas las páginas web que existen, y que los
resultados están basados en criterios que no siempre son los que el usuario necesita.
Los “robots” de búsqueda sólo recopilan la información. Después hay que
clasificarla. El criterio que se emplea para ello, en todos los motores de búsqueda
basados en Google, es el establecido por el Page Rank.
Este sistema valora las páginas en función del número de enlaces a ellas que hay
en otras webs. Así, cuantas más páginas tengan enlaces a la tuya, más “votos” tendrá
ésta en el Page Rank. Pero Google también introduce algoritmos que hacen ponderar los
enlaces en función de la clasificación de la página. Para que no haya fraudes, Google
descarta automáticamente los sitios que se emplean sólo para colocar links. Además,
está comprobado que es imposible saber cuántas páginas tienen enlaces a la tuya, lo que
hace que este sistema sea más fiable. La puntuación que otorga el sistema Page Rank va
de 0 a 10, donde 10 es la más alta.
Existe otro método parecido, que se usa en menos sistemas, denominado HITS
(Hypertext Induced Topic Selection). Según este otro sistema las webs se valoran en
función de los enlaces a esta página desde otras (Authority) pero, también, según los
vínculos que tenga este sitio a otras páginas (Hub).
Además de la clasificación para ordenar los resultados de una búsqueda, existe
otro sistema que se encarga de descartar las webs que tienen determinados contenidos,
considerados inadecuados.
II.- Clases de Buscadores.
En Internet existen varios tipos de buscadores. Algunos están diseñados para
búsquedas generales. Otros se ciñen a contenidos que se encuentran en determinada
página o portal y, también, existen buscadores temáticos y de tipos de archivo muy
concretos. Podemos clasificarlos en cuatro grandes grupos:
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 3 de 23
- Buscadores jerárquicos (Arañas o Spiders).
La mayoría de grandes buscadores internacionales de uso habitual y conocidos
son de este tipo. Requieren muchos recursos para su funcionamiento. No están al
alcance de cualquiera.
•
Sus robots recorren las páginas recopilando información sobre los contenidos.
Cuando se busca una información en los motores, ellos consultan su base de
datos y presentan resultados clasificados por su relevancia. De las webs, los
buscadores pueden almacenar desde la página de entrada, a todas las páginas que
residan en el servidor. Los robots de búsqueda deben analizar gran cantidad de
webs, que pueden tener mucha información, y no es posible utilizarlos con la
rapidez que se requiere para una búsqueda. Por ello, lo que extraen del rastreo se
incluye en una base de datos, que es de donde se obtiene la información cuando
solicitas una búsqueda. Algunos cuentan con función Caché que permite ver
páginas almacenadas en los servidores del buscador tal y como la recopilaron
sus bots.
•
Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que
ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra
en alguna parte de su texto.
•
Si consideran que un sitio web es importante para el usuario, tienden a
registrarlas todas. Si no la consideran importante, sólo almacenan una o más
páginas.
•
Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos
de su base de datos, por lo que no es infrecuente que los resultados de la
búsqueda estén desactualizados. Generalmente, googlebot rastrea las webs cada
mes, por lo que mucha información no está al día. Por ello, Google cuenta con
otro robot (denominado freshbot) que analiza cada día (varias veces)
determinado tipo de webs, como las de noticias, blogs y otros tipos de páginas
de información. De todas formas, una vez que se ha accedido a una, si no está
actualizada, se puede solicitar la actualización desde el navegador.
•
Los buscadores jerárquicos tienen una colección de programas simples y
potentes con diferentes cometidos. Se suelen dividir en tres partes:
o Los programas que exploran la red -arañas (spiders).
o los que construyen la base de datos.
o los que utiliza el usuario, el programa que explota la base de datos.
•
Si se paga, se puede aparecer en las primeras páginas de resultados, aunque los
principales buscadores delimitan estos resultados e indican al usuario que se
trata de resultados esponsorizados o patrocinados. Hasta el momento,
aparentemente, esta forma de publicidad, es indicada explícitamente. Los
buscadores jerárquicos se han visto obligados a este tipo de publicidad para
poder seguir ofreciendo a los usuarios el servicio de forma gratuita.
Ejemplos de arañas: Google, MSN Search, Hotbot.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 4 de 23
Aunque la mayor parte de los buscadores jerárquicos son Generales, presentan
variantes.
Una variante de los mismos son los buscadores específicos, buscadores que
analizan la información de las webs en busca de determinados formatos de archivo,
como imágenes, música, vídeos, etc. No se trata de encontrar estos ficheros en una base
de datos concreta, sino de hacerlo en la red al completo. Los archivos que muestran no
siempre contienen los parámetros de búsqueda en su nombre, sino que, en muchos
casos, esas palabras están en determinada página, y el buscador te muestra las fotos que
hay en ella. En Google se pone en la búsqueda filetype:xxx, siendo xxx la extensión del
archivo.
Los buscadores temáticos también se encuentran integrados en muchos
buscadores “generales”, aunque hay algunos que son independientes. Son herramientas
que sirven para buscar en páginas de determinados contenidos, que se actualizan con
mucha frecuencia. En este aspecto son como los catálogos de los buscadores verticales,
pero se diferencian en que están especializados en noticias, blogs y otras páginas de
información de actualidad. Suelen estar asociados a determinados sitios, de manera que
no ofrecen la información de todos los medios. Muestran la información más
actualizada que encuentran, que ha sido recopilada por un robot similar a freshbot.
Google News.
- Directorios.
Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el
mercado. No se requieren muchos recursos de informática. En cambio, se requiere más
soporte humano y mantenimiento.
•
Los algoritmos son mucho más sencillos, presentando la información sobre los
sitios registrados como una colección de directorios. No recorren los sitios web
ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra
página, como el título y la descripción que se introduzcan al momento de
registrar el sitio en el directorio.
•
Los resultados de la búsqueda, estarán determinados por la información que se
haya suministrado al directorio cuando se registra sitio. En cambio, a diferencia
de los motores, son revisadas por operadores humanos, y clasificadas según
categorías, de forma que es más fácil encontrar páginas del tema de nuestro
interés.
•
Más que buscar información sobre contenidos de la página, los resultados serán
presentados haciendo referencia a los contenidos y temática del sitio.
•
Su tecnología es muy barata y sencilla.
Ejemplos de directorios: Open Directory Project, Yahoo!, Terra (Antiguo
Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su
directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son
directorios. Google en un paso en sentido contrario también tiene su directorio.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 5 de 23
- Metabuscadores.
Es una clase de buscador que carece de base de datos propia y, en su lugar, usa
las de otros buscadores y muestra una combinación de las mejores páginas que ha
devuelto cada buscador. Un buscador normal recopilan la información de las páginas
mediante su indexación, como Google o bien mantiene un amplio directorio temático,
como Yahoo. La definición simplista sería que un metabuscador es un buscador de
buscadores.
Permite lanzar varias búsquedas en motores seleccionados respetando el formato
original de los buscadores. Lo que hacen, es realizar búsquedas en auténticos
buscadores, analizan los resultados de la página, y presentan sus propios resultados,
según un orden definido por el sistema estructural del metabuscador. No permite
diferente sintaxis en las búsquedas para cada buscador.
Hoy en día existe diversos metabuscadores como clusty, kartoo que presenta sus
resultados en forma de mapas de relaciones, copernic, turbo10, webcrawler,
metacrawler, dogpile, entre otros. Los metabuscadores facilitan y hacen más eficiente la
búsqueda de información, aunque algunos se limitan a presentar los primeros 10
resultados de cada buscador.
-Buscadores verticales.
Buscadores especializados en un sector concreto, lo que les permite analizar la
información con mayor profundidad, disponer de resultados más actualizados y ofrecer
al usuario herramientas de búsqueda avanzadas. Es importante resaltar que utilizan
índices especializados para de esta manera acceder a la información de modo más
específico y fácil. Ejemplos de este tipo de buscadores son: Trovit un buscador de
anuncios clasificados de inmobiliaria, motor y empleo, y Nestoria buscador
inmobiliario.
Una categoría dentro de éstos la representan los catálogos de Internet, entre los
que se encuentran buscadores de hoteles, viajes, etc. Se centran exclusivamente en
contenidos de determinado tipo de bases de datos. Para ello acceden a las páginas que
tienen asociadas y extraen la información actualizada, según los parámetros
especificados en la búsqueda. Por ejemplo, en un buscador de viajes como Lastminute,
se puede buscar vuelos a un destino concreto y aparecerán resultados de diferentes
compañías. Generalmente, estos buscadores incluyen ofertas más complejas, como
alojamiento, transportes, y packs de vacaciones, extraídos de las bases de datos de las
webs de origen.
Otra categoría son las búsquedas internas en webs. Las páginas más complejas
suelen tener herramientas de búsqueda interna. Existen todo tipo de herramientas de este
tipo, en páginas de información general, como las wikis (por ejemplo, wikipedia), pero
también en webs de compras de software, como Softonic o Softpedia . Lo que tienen en
común es que la información se extrae exclusivamente de la base de datos interna de esa
página Web. Estos motores de búsqueda tienen herramientas de búsqueda avanzada
adaptadas a los contenidos de ese sitio. Youtube es un buen exponente.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 6 de 23
No podemos terminar este apartado sin hacer una siquiera una somera referencia
a las Búsquedas avanzadas y su potencial. Para hacer una búsqueda de este tipo se
usan herramienta con más parámetros, como el sitio web en el que se quiere buscar, o
que sólo muestre páginas actualizadas en los últimos días o meses. Para acceder a este
modo se debe pinchar en el vínculo que aparece en el propio buscador, que suele
llamarse “búsqueda avanzada”. Además de esto, muchos buscadores ofrecen
sugerencias para modificar la búsqueda, y que pueden ayudar más a encontrar lo que
uno busca. Si has escrito una frase, por ejemplo “vuelos Venecia”, al aparecer los
primeros resultados, el sistema te ofrece cambiarlos por palabras similares, por ejemplo,
“Viajes Venecia, Hoteles Venecia”, o frases similares.
Existe otra forma de hacer búsquedas más específicas, que es añadiendo
operadores “booleanos” (and, or, not, xor), palabras clave y otros símbolos y
expresiones a las palabras que se buscan. Por ejemplo, si se escribes una frase
entrecomillada, sólo se buscarán páginas que contengan esas palabras en ese orden. Si
quieres que no aparezca un término en concreto, después de las palabras básicas para la
búsqueda, deja un espacio, escribe el símbolo“-” y, seguidamente, la palabra que no
quieres. Si quieres añadir más palabras o frases, y te interesa que todos los resultados de
búsqueda las muestren, puedes poner el símbolo “+” y después esa palabra o frase
(puedes entrecomillarla si quieres que se busque la frase completa).Para saber más
acerca de este tema, se puede visitar la página web abcdatos o wikilearning.
III.- Breve Historia de los Buscadores.
El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por
la World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en
1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía
está en funcionamiento.
El primer motor de búsqueda de texto completo fue WebCrawler, que apareció
en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda
por palabras en cualquier página web, lo que llegó a ser un estándar para la gran
mayoría de los buscadores. WebCrawler fue también el primero darse a conocer
ampliamente por el público. También apareció en 1994 Lycos (que comenzó en la
Carnegie Mellon University).
Muy pronto aparecieron muchos más buscadores, como Excite, Infoseek,
Inktomi, Northern Light y Altavista. De algún modo, competían con directorios (o
índices temáticos) populares tales como Yahoo!. Más tarde, los directorios se integraron
o se añadieron a la tecnología de los buscadores para aumentar su funcionalidad.
Antes del advenimiento de la Web, había motores de búsqueda para otros
protocolos o usos, como el buscador Archie, para sitios FTP anónimos y el motor de
búsqueda Verónica, para el protocolo Gopher.
En la actualidad se aprecia una tendencia por parte de los principales buscadores
de Internet a dar el salto hacia entornos móviles creando una nueva generación de
buscadores: los buscadores móviles, a la vez que van ampliando su función con
diferentes servicios y programas de software gratuitos.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 7 de 23
IV.- Análisis de los Principales Buscadores.
Vamos a realizar una visita a los siguientes buscadores: Google, Yahoo, Live
Search, Ask, emagister y WolframAlpha.
GOOGLE:
En 1997 una empresa formada por dos estudiantes de la Universidad de Stanford
comenzaban su andadura por una nueva forma de entender Internet. Los fundadores de
Google, Larry Page y Sergey Brin, supieron ver una evidencia que, hasta entonces se le
había escapado al resto: En un panorama de saturación informativa donde el volumen de
documentación está en constante aumento, para el usuario adquiere una importancia
vital encontrar lo que busca en el momento en que lo necesita.
A partir de esta idea, en otoño de 1997 desarrollaron un motor de búsqueda tan
certero que su uso pronto se extendió. Decidieron crear su propia empresa después de
buscar financiación para lanzar el proyecto al mercado. En 1999, dos sociedades de
capital riesgo: Kleiner Perkins Caufield y Sequoia Capital invirtieron 25 millones de
dólares en Google Inq., por lo que disponía de un capital más que suficiente para
ponerse a trabajar.
Los jóvenes directivos de Google consiguieron atraer a destacados cerebros de
otras empresas gracias a su flexibilidad y a unas ventajas laborales entre las que
destacan: La gratificación a los empleados con acciones de la compañía y la posibilidad
de dedicar un 20% de su tiempo de trabajo a proyectos propios. La salida a bolsa en
2004 fue todo un acontecimiento y, poco después Google tenía un valor bursátil
superior al de muchas empresas más antiguas y consolidadas. En la actualidad Google
es el motor de búsqueda por Internet más potente y usado del mundo. Tiene capacidad
para efectuar 120.000 búsquedas por minuto. Ello suponen clicks en los anuncios junto
a los resultados, sin olvidar la gran cantidad de webs afiliadas en publicidad.
El buscador de Google es la página de inicio de muchos internautas: cuando
abres el navegador es lo primero que aparece. Es una página limpia, minimalista, sin
publicidad, que presenta el logo del buscador, que cambia para referirse a ciertos
eventos históricos, un cuadro para entrar los términos de búsqueda y dos botones
principales, Buscar con Google y Voy a tener suerte, que presentan los resultados de la
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 8 de 23
búsqueda o remite directamente a la página Web mejor posicionada en relación a esa
búsqueda, respectivamente.
Google es el buscador más usado en Europa, con un dominio aplastante casi el
90% llegando al 95% en algunos países. En USA. Su cuota de mercado alcanza el 60%,
respetable pero no abrumadora.
Si se utiliza con mucha frecuencia, y al mismo tiempo se emplean otros servicios
como YouTube, se puede personalizar la página de inicio con todo el contenido que te
interese mediante iGoogle.
iGoogle es como un portal personalizado de entrada a Internet que
refleja tus gustos e intereses y se articula en trono al buscador Google. Accediendo a
iGoogle, la primera vez que entras te ofrece la opción de crear tu página web principal
en menos de 30 segundos. Primero tienes que marcar los intereses. Hay muchos donde
elegir: noticias, deportes, ocio, finanzas, tecnología, viajes, pasatiempos, etc. Puedes
elegir un tema, es decir, la apariencia de tu portada. Existen varios fondos y diseños.
Como último paso consulta Tu página. Se mostrará la portada personalizada. En la
esquina superior derecha elige el país y tu ubicación, ya que el diseño irá cambiando
según la hora del día y las fiestas y acontecimientos locales. Los intereses elegidos
anteriormente se mostrarán en forma de pestañas. Además en el buscador hay un
montón de recuadros: Los últimos videos de YouTube, el tiempo, titulares de
periódicos, acceso a la Wikipedia… Si no te interesa pulsa en la x de cada ventana para
cerrarla. Al pulsar el botón Añadir más cosas, en la esquina superior derecha, podemos
incluir cientos de gadgets, con aplicaciones para todos los gustos. Desde cotizaciones de
bolsa en tiempo real hasta el tiempo atmosférico, la hora de distintos lugares, y un largo
etc.
Cuando has terminado de configurar la portada, puedes fijar esta página,
iGoogle como predeterminada o de inicio. Así puedes acceder a Tu Google cada vez
que pongas en marcha el navegador. Pero para ello es necesario tener cuenta en Gmail y
vincularla a iGoogle o los cambios se perderán en la próxima sesión.
Ventajas de este buscador:
Google tiene hoy en día el motor de búsqueda más potente, es rápido, utiliza una
publicidad no invasiva, separando claramente los resultados patrocinados de los que no
lo son. En definitiva ocupa una sólida posición de número uno más que justificada.
Don't Be Evil, es el eslogan informal de Google Inc., que guía sus decisiones y resume
sus actuaciones, incluso las más polémicas, como la censura del buscador en China
PRC. (para Google era peor no estar que estar con censura, advirtiendo de que la página
está censurada).
Es sin lugar a dudas el número uno, con una cuota en el mercado de los
buscadores muy superior a sus inmediatos competidores. Pero este reinado sin estar
amenazado puede verse erosionado. Y son todos los demás contra el número uno
tratando de ser un número dos que supone cuantiosos beneficios. Que Google marca el
paso es indudable y en este ir hacia delante tenemos todos los servicios que se han ido
articulando a partir del buscador y su fuente de ingresos, el cobro por la publicidad de
los anunciantes. De ello nos ocupamos en una sección propia.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 9 de 23
Desde hace tiempo Google no sólo reconoce palabras clave, sino que también es
capaz de interpretar frases del lenguaje natural e incluso preguntas como: ¿Quién fue
Mozart?, directamente te enviará a una página web con la biografía del compositor o a
la wikipedia.
Puedes usarlo como calculadora para las operaciones básicas, pero también
acepta funciones matemáticas complejas y fórmulas. Puede convertir monedas y
también temperaturas en grados Celsius o Fahrenheit.
Google permite buscar archivos de diferentes tipos añadiendo al final de la
cadena de búsqueda la expresión filetype:“extensión del archivo”. Así se pueden buscar
archivos PDF, DOC, XLS, JPG etc. para refinar las búsquedas.
El buscador de Google realiza visitas esporádicas a las webs, durante la
indexación, y guarda una foto de la portada, en un almacén temporal llamado Caché. Si
visitas una web ofrecida en la lista de resultados del buscador y por alguna razón no está
disponible, puedes pulsar en el enlace En Caché para ver el contenido de la última
portada que almacenó Google.
El botón Páginas Similares, incluido en cada resultado de las búsquedas, sirve
además de para encontrar webs con la misma temática que la que muestra el resultado,
otras páginas relacionadas. Por ejemplo si buscas webs sobre perros también te mostrará
páginas genéricas sobre mascotas.
A veces resulta de utilidad saber que páginas Web apuntan a otra. Es una forma
de conocer las páginas relacionadas. Al escribir en el buscador “Link: dirección”, nos
informa de quién tiene enlaces que llevan a una página.
Si te interesa saber si una web de la competencia está mejor posicionada en
Google, sólo tienes que indicar en el buscador la dirección completa, separada por un
OR. Por ejemplo: www.realmadrid.es OR www.fcbarcelona.com. Te mostrará
primero la mejor posicionada.
Tiene diccionario incorporado, para conocer el significado de una palabra hay
que ponerla en el buscador con el comando define: palabra. Por ejemplo define:
albornoz. Obtendrás varias definiciones provenientes de la Wikipedia, de webs
académicas y de diccionarios en línea.
En ocasiones conoces el nombre de una empresa o de una afición, pero no sabes
la dirección URL exacta. Con el comando inurl: palabra te aseguras de encontrar webs
que incluyan dicha palabra.
Servicios complementarios:
En su búsqueda del reinado de Internet, en torno a Google se han articulado una
pléyade de servicios que complementan o no necesariamente el buscador. Haremos una
somera referencia a ellos, no sin olvidar que el resto de empresas con buscadores han
tratado de crear servicios similares en un afán de competir y desbancar al rey
indiscutible Google.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 10 de 23
El Traductor de Google. Puede traducir no sólo textos, sino Webs enteras.
Incluso en el blog podemos poner un enlace que lo traduzca en tiempo real a otros
idiomas. La calidad de las traducciones ha mejorado con el paso del tiempo, ya que si
en un principio usaba el motor de traducción de Systram, Google ha desarrollado el
suyo propio y nos permite mejorarlo con la opción de proponer una traducción mejor.
Google Adsense permite colocar publicidad contextual en una página Web, es
decir relacionada con el contenido de la misma. Google pagará una cantidad de dinero
por cada “click” en los enlaces. Es una forma de financiar una Web.
El correo Gmail ha sido desde su inicio, cuando sólo podías tenerlo por
invitación de otro usuario hasta que se abrió al público en general, una referencia sobre
todo por su capacidad de almacenamiento, inicialmente de 2 Gb. que se ha ido
expandiendo hasta 7 Gb. Permite mensajes con adjuntos de hasta 20 Mg y permite
clasificar los mensajes e indexarlos mejor que ningún otro. Tiene un servicio de pago
que amplia las prestaciones y la capacidad de almacenamiento. Aunque en número de
usuarios es todavía pequeño en comparación a Yahoo y Hotmail su crecimiento es
exponencial.
Google Talk es el servicio de mensajería instantánea de Google. En principio
está vinculado a usuarios que tengan cuenta en Gmail. El otro gran competidor,
Microsoft con su utilidad Messenger, renombrada Windows Live Messenger, domina
claramente relegando a Google a un tercer puesto tras otros programas de mensajería
instantánea.
Google Maps permite consultar el callejero de las ciudades, ver sus planos,
planificar rutas, ver fotografías de los sitios vinculadas por los usuarios, personalizar los
mapas. Una característica sorprendente es Street view que permite pasear a nivel de
calle de las ciudades en un entorno virtual. Sólo las principales ciudades (en España,
Madrid, Barcelona, Valencia, Sevilla y Oviedo) están digitalizadas con este servicio,
pero la sensación de inmersión es enorme. Maps también permite consultar el tiempo a
través The Weather Channel.
Google Earth permite observar fotografías tomadas por satélite de cualquier
lugar del planeta. A partir de la versión 4.2 incluye una opción oculta: un simulador de
vuelo que permite navegar como si fueras en un avión. Pero aparte del aspecto lúdico
Google Earth, el Ministerio de Economía y Hacienda ha desarrollado una aplicación
basada en él que permite consultar los datos fiscales y catastrales de los inmuebles. Para
ello debes descargar Google Earth y un complemento. Pero la versión 5 ha
aumentado las funciones permitiendo explorar Marte, la Luna y los Océanos.
Youtube, adquirido por Google es un portal con videos aportados por los
usuarios y en torno a los cuales se ha ido creando una comunidad. Es una de las páginas
que mayor número de visitas recibe y cuenta con un alto grado de fidelidad de sus
usuarios.
Aplicaciones de escritorio de Google, entre las que se encuentran el paquete de
programas gratuitos Google Pack que incluye entre otros su navegador Chrome,
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 11 de 23
Mozilla Firefox, Picasa, Adobe Reader, Skype y Norton Security Scan. También
incluye Google Desktop y la Barra de Google para el explorador.
Google Desktop permite disfrutar de buena parte de los servicios de Google
directamente desde el Escritorio de Windows. Permite añadir gadgets creados por los
usuarios y complementos que amplían sus funcionalidades. Además cuenta con una
caché de los archivos que manipulas y que puedes recuperar en caso de borrado
accidental. Incluso puedes añadir un buscador de palabras en el diccionario de la Real
Academia.
La Barra de Google se instala en el navegador, Explorer o Firefox con
versiones distintas pero igualmente funcionales, y permite acceder desde el navegador
de forma rápida y cómoda a distintas opciones como traducir la página, un diccionario,
a las otras aplicaciones de Google, a las cabeceras de los correos de Gmail, etc.
Terminaremos con Google Docs. Aunque no están potente y compleja como
Ms. Office tiene la ventaja de que no es necesario instalar nada en el ordenador para
funcionar con ella y los documentos se almacenan en Internet, por lo que están
accesibles desde cualquier lugar, siempre que haya conexión. Sólo es necesario disponer
de una cuenta en Gmail para crear documentos de texto, hojas de cálculo o
presentaciones. Permite compartir los documentos realizados y trabajar sobre el mismo
archivo en tiempo real. Un paso hacia la Web 2.0 y el cloud computing que ha sido
seguido por otros competidores como Microsoft con su limitada Office Live
Workspace.
Por todo lo expuesto Google es mi buscador preferido. Integra funciones que
los otros sólo remotamente y tiempo después pretenden igualar. Sólo Microsoft y en
menor medida Yahoo tienen capacidad tecnológica y músculo financiero suficiente para
pretender erosionar su posición. Pero Google también plantea dudas sobre su
tratamiento de la privacidad y de los datos personales. Y esto no hay que dejarlo de
lado. Amenaza con convertirse en el Gran Hermano cuya mirada pronto llegará a los
lugares más recónditos de nuestra vida privada. Lo que buscamos, clickeamos,
vinculamos o escribimos queda registrado por esta versión moderna del clásico de
George Orwell, 1984.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 12 de 23
YAHOO:
Yahoo irrumpió en la red como empresa de servicios web en Marzo de 1995.
Concebida en los primeros días de Internet por dos jóvenes estudiantes de la
Universidad de Stanford, Jerry Yang y David Filo, pronto se convirtió en el buscador y
directorio más popular del momento y en Abril de 1996 comenzó a cotizar en el índice
NASDAQ.
Hasta la aparición de Google, su buscador era el más popular y sus servicios de
correo electrónico y mensajería instantánea se disputaban el mercado con Hotmail y
Messenger de Microsoft, con gran implantación tanto en países anglosajones como
hispanohablantes.
Sin embargo desde que Google entró en escena Yahoo no levanta cabeza. Lo
último ha sido la oferta de compra por parte de Microsoft. Tras la retirada de la Opa por
parte de Microsoft, queda por ver como saldrá a flote. Ha llegado a acuerdos con
Google para usar su motor de búsqueda y compartir ingresos publicitarios pero corre el
peligro de enfrentarse a las autoridades antitrust americanas.
El algoritmo de posicionamiento de Yahoo se conoce como WebRank. Presenta
un funcionamiento similar al PageRank de Google.
A diferencia de Google, Yahoo se nos presenta como un portal en el que el
buscador ocupa un lugar central. La página está más recargada que la de Google, pero
aún así se presenta con la suficiente ergonomía y claridad para que la experiencia de
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 13 de 23
navegación sea agradable. Yahoo también muestra en su portal, página de inicio un
directorio temático, por lo que no renuncia a esta variante de los buscadores. Hay así
mismo links al Correo Yahoo y Yahoo Messenger.
Y ya en la página de inicio, Yahoo nos presenta publicidad, algo que Google y
Live no hacen.
A través de un vínculo en la página de inicio permite acceder a Mi Yahoo! que
no es otra cosa que una personalización del portal, al modo como se hacia en iGoogle,
pero bastante más simple y sin los complementos y añadidos que permite Google, entre
otras cosas porque la comunidad a diferencia de iGoogle no los ha desarrollado.
En esta página de inicio personal en Yahoo, Mi Yahoo, se pueden añadir
pestañas que contienen frames con vínculos a otras cuentas de correo que definamos,
titulares con enlaces de los periódicos principales, Traductor BabelFish, Agenda y Bloc
de notas.
Para mantener esta configuración personalizada es necesario tener cuenta de
correo en Yahoo, aceptar las cookies e identificarse para guardar los cambios. En esto
no se diferencia de iGoogle.
Comparando los resultados obtenidos con los de Google observamos que Yahoo
encuentra un mayor número de páginas, lo que no significa mayor calidad de los
resultados siendo en este aspecto similares. Los resultados son más o menos los
mismos, de hecho ambas compañías han compartido y comparten tecnologías de
búsqueda. Donde si hay una clara diferencia es en la orientación comercial de los
primeros resultados por parte de Google frente a Yahoo.
Normalmente con los resultados de Google encuentro lo que quiero buscar,
pero si no aparece en Google en las primeras posiciones busco en Yahoo, pues a
veces el sistema de clasificación de las Web posiciona antes otras que en Google
quedan rezagadas por no tener carácter comercial.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 14 de 23
Live Search:
Microsoft Corporation es una empresa multinacional estadounidense, fundada en
1975 por Bill Gates y Paul Allen. Dedicada al sector de la informática, con sede en
Redmond, Washington, Estados Unidos. Microsoft desarrolla, fabrica, licencia y
produce software y equipos electrónicos. Siendo sus productos más usados el Sistema
operativo Microsoft Windows y la suite Microsoft Office, estos productos tienen una
importante posición entre los ordenadores personales. Con una cuota de mercado
cercana al 90% para Office en 2003 y para Windows en el 2006.
La compañía también suele ser nombrada como MS, por sus iniciales en el
NASDAQ: MSFT o simplemente como Redmond. Tiene 80.000 empleados en 102
países diferentes y cuenta con unos ingresos de 51.120 millones de dólares durante el
año 2007.
A mediados de los 80 consiguió dominar el mercado de ordenadores personales
con el sistema operativo MS-DOS. La compañía inició una Oferta Pública de Venta en
el mercado de valores en 1986. Durante su historia, ha sido objeto de críticas, como
acusaciones de realizar prácticas monopolísticas que la han llevado ante la Comisión
Europea y el Departamento de Justicia de los Estados Unidos.
Microsoft afianzó su posición en otros mercados como el de sistemas operativos
y suites de oficina, con recursos como la red de televisión por cable MSNBC, el portal
de Internet MSN, y la enciclopedia multimedia Microsoft Encarta. La compañía
también comercializa hardware como el ratón de Microsoft y productos de
entretenimiento como Xbox, Xbox 360, Zune y WebTV. Su Web oficial es una de las
páginas más visitadas de la red, recibiendo por día más de 2'4 millones de visitas únicas.
Aunque Microsoft existía antes que Google, su falta de visión y previsión de lo
que la World Wide Web significa y representa ahora y en el futuro ha hecho que en este
aspecto vaya por detrás de Google. Un error estratégico que puede pasarle una fuerte
factura y que trata de superar a pasos agigantados. Su intento de adquisición de Yahoo
tenía un doble objetivo, por un lado crecer en el segmento de Internet con su
adquisición y por otro evitar la alianza de ésta con Google.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 15 de 23
Windows Live Search vio la luz en septiembre de 2006, sustituyendo a MSN
Search. Live es el buscador y MSN queda posicionado como el portal. El buscador de
Microsoft tiene un aspecto minimalista y limpio, asemejándose al de Google. No
presenta publicidad. Permite realizar búsquedas en la Web, por imágenes, de noticias y
X-Rank. Este presenta una página en la que los famosos aparecen ordenados según la
popularidad de las búsquedas al objeto de determinar quién está de moda y quién no.
Incluye la posibilidad de guardar las búsquedas habituales en el perfil propio de
Live Search.
Aunque ha mejorado, el motor de búsqueda de Google es netamente superior. Se
calcula que Google lleva un adelanto de 9 a 12 meses en el desarrollo de la tecnología
sobre su inmediato competidor. Y este tiempo, que puede parecer poco, en el ámbito
informático supone casi una Era.
No obstante Microsoft va incorporando actualizaciones y mejoras atendiendo a
las prácticas más comunes de los usuarios. Un ejemplo son los enlaces profundos a las
páginas Web en los resultados de las búsquedas, ya que los usuarios tienden a buscar las
páginas interiores de los dominios.
Microsoft también cuenta con servicios complementarios articulados entorno al
buscador y con orientación a la Web. En muchos casos han sido una respuesta al
servicio ofrecido por Google, en otras consecuencia de adquisiciones de otras
compañías. Microsoft Virtual Earth, Office Live Workspace, Live Search Maps,
Windows Live Spaces son réplicas a los servicios de Google.
Sin embargo hay un segmento en el que Microsoft es líder indiscutible y es el de
la mensajería instantánea. Messenger, rebautizado como Windows Live Messenger con
93 millones de usuarios es líder indiscutible. La búsqueda de ingresos podría derivarlo
hacia una aplicación de llamadas telefónicas tipo Skype.
El anuncio del cierre de Microsoft Encarta ante la imposibilidad de competir con
la Wikipedia, dados los cambios en la forma en que la gente busca información
actualizada y vinculada frente a productos acabados, ponen en evidencia el descuido de
Microsoft en este frente de batalla que es Internet.
Personalmente no utilizo Live en las búsquedas por que lo encuentro
inferior a los competidores precedentes. Además si hago búsquedas en Google y hay
alguna página Web que tiene versión en Castellano, me la presentará antes que esa
misma página en francés u otro idioma que no sea el inglés. Live no hace este
refinamiento y nos encontramos en los resultados con páginas en otros idiomas cuando
esa página tiene versión en castellano.
Sin embargo hay un buscador de Microsoft que si uso y es Microsoft
Knowledge Base debido a la utilización de sus sistemas operativos. Microsoft
Knowledge Base contiene más de 150.000 artículos. Estos artículos han sido creados
por miles de profesionales de soporte técnico que han resuelto los problemas que les
exponen sus clientes. Microsoft Knowledge Base se actualiza, se amplía y se mejora
con regularidad, para contribuir a asegurar que se dispone de acceso a la información
más reciente.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 16 de 23
Ask:
Ask.com también conocido inicialmente como Ask Jeeves es un motor de
búsqueda de Internet. Es parte de la compañía InterActive Corporation, fundada en
1996 por Garrett Gruener y David Warthen en Berkley, California. El programa original
fue implementado por Gary Chevsky basado en su propio diseño. Los primeros
inversionistas fue el Grupo RODA. Ask.com posee una gran variedad de sitios Web que
son populares, además de tener las portadas para países específicos como Reino Unido,
Italia, Alemania, Japón, Países Bajos y España, junto con la versión de Ask para Niños,
Teoma (actualmente fuera de línea), Excite, MyWay.com, iWon.com, Bloglines y otros
portales temáticos. Debido al tráfico combinado entre todos los sitios web, ask.com fue
una de las diez compañías con más visitas en Estados Unidos, en septiembre de 2004.
Ask.com fue conocido en un principio como Ask Jeeves, donde Jeeves es el
nombre del mayordomo que buscaba las respuestas a cualquier pregunta. A partir de
2006 fue eliminado.
La idea original tras Ask Jeeves es permitir que los usuarios obtengan las
respuestas a las preguntas que se formulan a diario en un lenguaje natural. Con el paso
del tiempo y debido a la creciente eficiencia de buscadores como Google, Ask Jeeves
comenzó a perder usuarios, pero tras una reingeniería de la tecnología, permitió que
existieran palabras claves para que el buscador de Ask Jeeves se basará en otros
buscadores para sus respuestas. Sin embargo, como ask.com es lento para indexar todas
sus páginas, no sufre de spam como los otros buscadores importantes de Internet.
Ask.com fue el primer buscador comercial del tipo pregunta-respuesta que fue
desarrollado para WWW. Soporta una amplia variedad de consultas de usuarios
realizadas en inglés, así como las tradicionales búsquedas con palabras claves y se
esfuerza en que las búsquedas sean más intuitivas y amigables que los otros buscadores.
Ask Jeeves vendió la misma tecnología que utiliza en el sitio ask.com a distintas
empresas como Dell, Toshiba y ETrade. Parte de la empresa fue vendida a Kanisa en el
año 2002. En 2008 anuncio al adquisición de Lexico Publishing Group, poseedor de las
Webs Dictionary.com, Thesaurus.com, y Reference.com. Combinan 28 millones de
visitantes.
Ask.com también posee la tecnología de búsqueda basado en temas de
popularidad para calcular el grado de autoría en un resultado. La tecnología fue
nombrada como Teoma. En 2006, Teoma fue renombrado y redirigido directamente a
ask.com. El algoritmo de ExpertRank provee resultados ordenados mediante la
preminencia de la autoría de los sitios web. Así como la popularidad por click, también
se considera la búsqueda de términos por popularidad.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 17 de 23
La página Web inicial adopta el look de Google, es decir limpia y minimalista.
Permite a través de selectores buscar en la Web, imágenes, videos y cientos de
respuestas. Esta última no es más que una vinculación a una base de datos de respuestas
aportadas por otros usuarios de Internet o por Webs. Pretende contestar a preguntas
planteadas en lenguaje natural. ¿Cuantos habitantes tiene Nueva York? Es evidente que
la versión más desarrollada y precisa es la versión en inglés. Cuando las preguntas son
planteadas en castellano en la versión local del buscador, los resultados no son tan
precisos. Cuando se plantean preguntas la mayoría de las veces remite en los primeros
lugares al correspondiente artículo de la Wikipedia. Por su parte los enlaces a Noticias y
mapas abren el portal correspondiente.
Una característica llamativa es que a través de un pequeño icono al lado de los
resultados de la búsqueda, unos prismáticos, posicionando el cursor podemos ver una
pequeña imagen de la página Web vinculada. Es un paso importante pues sólo
representa la página que seleccionemos evitando ralentizar el buscador haciendo una
presentación preliminar de todas.
La calidad de los resultados es inferior a Google. Por ello no es un buscador
que utilice mucho. Pero a veces cuando planteas una pregunta en inglés en la versión
americana las respuestas pueden ser muy precisas. El hecho de que Google también
tenga soporte para preguntas en lenguaje natural le ha quitado gran parte de su
atractivo. Pero sin lugar a dudas ha sido el primero en señalar la senda a seguir.
EMagister:
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 18 de 23
Emagister es un buscador vertical especializado en la búsqueda de cursos. En
este concepto se engloban Masters, Programas de Licenciatura y Diplomatura de las
Universidades públicas y privadas, Oposiciones, Cursos subvencionados y de
Formación Profesional.
Permite buscar cursos no sólo en España sino también en otros países (UE.,
EE.UU. y América Latina).
Además del buscador presenta pestañas que actúan como directorios,
clasificando los cursos de acuerdo al esquema antes expuesto. Llama la atención la
existencia de un directorio con Cursos Gratis, predominando los cursos de idiomas,
entre ellos el inglés y los de informática. Pone a disposición de los usuarios recursos
interesantes y además presenta la ventaja de que los cursos están valorados por los
usuarios a través de sus opiniones.
En la pestaña Universidades podemos acceder a las distintas carreras
universitarias, que al seleccionarlas nos presenta una completa información, desde
donde cursarlas, planes de estudio y asignaturas, salidas laborales, titulaciones
relacionadas y pasarelas a otras titulaciones.
En la pestaña oposiciones presenta un directorio con las convocatorias por sector
y un buscador de cursos y temarios. Aunque estos últimos flojean bastante pues apenas
tienen referencias, viviendo de los anuncios que Google inserta en las páginas de
resultados de las búsquedas que o no aparece ningún resultado o son escasos.
Sin embargo el directorio de las convocatorias de oposiciones por sector es
bastante completo, bien ordenado y pleno de referencias.
En la pestaña cursos subvencionados aparecen los distintos cursos de las
Administraciones Públicas subvencionados para parados o personal en activo. Dispone
además de un servicio de alertas. Dentro de la ficha de cada curso se puede obtener
información adicional como temario, horarios e incluso las opiniones de los alumnos,
además de suscribirnos a alertas de cursos similares.
En el apartado de Formación Profesional aparecen cursos de empresas de
educación a distancia, la mayor parte de pago. A diferencia de lo que ocurría con las
universidades no se presentan aquí los distintos estudios oficiales.
Hay también un foro con distintos subforos para que los estudiantes y los que ya
no lo son intercambien opiniones, siendo los más activos los de los opositores a los
Cuerpos y Fuerzas de Seguridad del Estado y Autonómicas.
El apartado Publicar Cursos cuenta con dos grandes apartados, para promocionar
cursos ya existentes, y otro para crear un curso propio online gratuito compartiendo los
conocimientos. Una vez dotado de contenido, Emagister lo publica en su Web para libre
acceso del resto de los usuarios.
Es una Web bastante completa en su especialidad. A veces descubres
verdaderas joyas entre los cursos gratuitos publicados. Siempre puedes aprender cosas
nuevas en Informática y en Idiomas. En todo caso el coste de probarlos no va a ser un
impedimento. Destaca así mismo el directorio de Oposiciones. Muy completo y bien
organizado. En definitiva una Web a tener en cuenta si preparas oposiciones o deseas
actualizar tus conocimientos, aunque los cursos se refieren a unos determinados niveles
de conocimiento.
Aunque se podrían haber probado otros buscadores jerárquicos, la mayor
parte de ellos entran en una de las siguientes categorías: o la distancia en cantidad
y calidad de los resultados respecto a Google es abismal, o usan el propio motor
que Google les ha licenciado (Powered by Google). Es por ello que terminaremos
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 19 de 23
nuestra exposición con un buscador que sólo algunos privilegiados previa solicitud
han probado.
WolframAlpha:
WolframAlpha, es el nuevo buscador anunciado en Marzo de 2009 para ser
lanzado en Mayo de este mismo año. En principio podría parecer un buscador más sino
fuera por una serie de circunstancias.
En primer lugar el proyecto es obra de Stephen Wolfram, un emprendedor
británico que tiene en su haber diversos logros y proyectos, y fue el ganador más joven
del premio MacArthur Fellow, otorgado a los trabajos más creativos en Estados Unidos.
Es un científico reconocido por su trabajo en física de partículas, autómatas celulares y
álgebra computacional y es el autor del novedoso programa de ordenador Mathematica,
de computación y álgebra simbólica. Pero también es un hábil hombre de negocios. El
prestigioso portal de tecnología TechCrunch no ha dudado en comparar las
implicaciones de este proyecto con la llegada de Google a nuestras pantallas.
Es inevitable comparar WolframAlpha con el buscador por excelencia, Google
y, sin embargo, las diferencias son notables. Google devuelve una serie de vínculos de
páginas que contienen el texto o cadena buscado, mientras que WolframAlpha se
adentra en las entrañas de la pregunta e interpreta su significado. ¿Cómo lo hace?
Mediante complejos modelos y algoritmos aderezados con potentes bases de datos que
representan el mundo real. Dicho de otra manera, dispone de ingentes cantidades de
datos que de alguna manera interpreta y filtra atendiendo a nuestra consulta. Lo
realmente innovador es que este sistema no está programado para dar respuesta a cada
una de las preguntas que formulamos, sino que las interpreta y devuelve una respuesta
concreta.
Por si todo esto fuera poco, WolframAlpha habla un lenguaje llano y responde
también a los modismos. Así, uno podrá preguntar con lenguaje de la calle y obtener
una respuesta científica y contrastada con una descomunal base de datos. Con todo y
pese a su poderío, WolframAlpha no es más que una herramienta que maneja los datos
con una sorprendente agilidad y precisión y no puede equipararse a una mente humana
(ni desde luego llegará a ello). El secreto de esta bestia es una base datos alimentada por
el equipo de Wolfram y gestionada por un algoritmo matemático de gran precisión.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 20 de 23
Pero este poderío plantea también interrogantes y peligros. Uno de ellos es la
suspicacia sobre las respuestas. Por qué elegir esa respuesta en concreto y no otra
cuando planteamos cuestiones opinables y sujetas a debate. ¿Se equivoca? ¿Quién y
cómo se mantiene? Pueden ser tendenciosas las respuestas ¿Podemos preguntar qué
opción política es más adecuada para un país? Evidentemente, la respuesta dependerá de
la información introducida en el sistema y cómo se haya entrenado a éste a buscarla. Por
otro lado, existen numerosas preguntas que tienen más de una respuesta acertada y
WolframAlpha tendrá que lidiar con ellas.
Se trata en definitiva de un buscador inteligente que sabe interpretar nuestras
preguntas y que no devuelve links en masa sin miramientos como los buscadores
convencionales. Un proyecto que sorprende que haya pasado desapercibido hasta
apenas un par de meses de su lanzamiento, sobre todo si consideramos que hay un
equipo de no menos de cien personas alimentando terabytes de información a un ritmo
frenético. Google, por su parte, no parece quedarse de brazos cruzados y ya en 2007
apuntaba en esta dirección, lo cual abre un horizonte apasionante en el terreno de las
búsquedas en un futuro inmediato.
En breve Stephen Wolfram y su equipo han construido lo que ellos llaman una
“computational knowledge engine” para la Web, en texto claro, tú preguntas y él te
responde.
El acceso al buscador ahora es limitado mediante invitación. Está en período de
pruebas. Pero dada la trayectoria de este emprendedor promete ser algo grande. Dentro
de unos años quizás recuerdes este trabajo y su referencia a este novedosos buscador.
De momento y como conclusión final sigo utilizando Google como
buscador general, sin renunciar a los portales verticales ni a los directorios cuando
tengo que buscar información sectorial. Y como enciclopedia Wikipedia. La
calidad de sus artículos no tiene que envidiar a Encarta (Microsoft ha anunciado
que abandona su publicación) ni a la Britannica. En ella han escrito Premios Nobel,
doctorados y estudiantes. Es una gran obra comunitaria. Os invito a contribuir en
sus artículos y a mejorar los publicados.
Internet: un recurso para la investigación educativa
Práctica 4 Buscadores
Pág. 21 de 23

Documentos relacionados