RecolectorBlogs AlmacenPaginasBlogs

Transcripción

RecolectorBlogs AlmacenPaginasBlogs
Servidor: BuscadorMiCaminoBlogs
RecolectorBlogs
(proyecto ASO2008)
• Pg. Web con resúmenes
de Blogs que contiene
una palabra búsqueda.
• Compuesta por
resúmenes enlazados por
otros blogs desde mí
blog.
• Flujo de interacción: 1)
usuario selecciona su
pagina de inicio, 2)
usuario pide buscar.
• Control de acceso: cada
usuario puede registrarse
y modificar la dirección
de su blog de inicio.
AlmacenPaginasBlogs
Directorio root
/
/blogs_alianzo_com/
Ficheros
• Tipos de datos: paginas de
Directorios
blogs enteras comprimidas,
• Organización / Metadatos:
/redessociales/
páginas guardas como
ficheros, un directorio por
/2006/
blog,…
/01/
• Persistencia y
disponibilidad: sin replicar
/del-software-
http://blogs.alianzo.com/
redessociales/2007/12/30/
si-montas-una-startupsubcontrata-el-mar/
S
Si montas una startup,
subcontrata el marketing, pero
no el desarrollo…
S
Pg.
Blogs
S
S
S
S
Recolector
S
http://blog.consultorartesano.c
om/2006/01/del-softwaresocial-al-cara-a-cara.html
Hoy hemos tenido la
oportunidad de compartir un
rato David y yo mismo con
<a> href=
http://www.alianzo.com/blogs/
redessociales José Antonio
del Moral</a>, de Alianzo.
Como casi siempre el espacio
digital ……
• Tipos de datos: pg.
Web de Blogs,..
• Método para
identificar fuentes: 1)
Info de usuario, 2)
Enlaces a Blogs, …
• Periodicidad de
recogida: diaria,….
Procesador (I): IndexadorEnlazador
• Datos entrada: pág. Blog
• Datos salida: 1) lista de
palabras clave y estadisticas,
2) enlaces de blog.
• Clase de algoritmo:
indexador + enlazador.
http://blogs.alianzo.com/redessoci
ales/2007/12/30/ si-montasuna-startup-subcontrata-el-mar/
• Startup: 3,…
• Compañía: 2,…
• Creativa: 1,…
• Empresas: 6,…
http://turanzas.wordpress.com/
social-al-caraa-cara.html
Indices
Pg. Blog
http://www.galder.net/
Grafos
Pg. Blog
IndexadorEnlazador
Recolector
http://blogs.alianzo.com/redessociales/2007/12/3
0/ si-montas-una-startup-subcontrata-el-mar/
Almacen (II): IndiceBlogs
• Tipos de datos: índice de
palabras y paginas.
• Organización / Metadatos:
índices en hashtables
• Persistencia y disponibilidad:
datos replicados.
……….
“Startup” •
•
http://blogs.alianzo.com/redessociales/
2007/12/30/si-montas-una-startupsubcontrata-el-mar/
http://nomada.blogs.com/jfreire/2007/1
2/startups-e-inno.html
Almacen (III): GrafoBlogs
• Tipos de datos: URLs
• Organización / Metadatos:
grafo de enlaces y tipo
• Persistencia y disponibilidad:
datos replicados.
http://fluxchange.typepad.com/ramonsanguesa/2007/11/in
novacin-soc-1.html
http://fluxchange.typepad.com/ramonsanguesa/2007/09/e
streno-de-citi.html
http://beyondaround.wordpress.com/2007/11/07/v
isitando-citilab-colaboracion-y-propuestas-allaboratorio-abierto/ /
…
http://blogs.alianzo.com/redessociales/2007/12/30/ simontas-una-startup-subcontrata-el-mar/
“Sterling” • …
• …..
…………
IndiceBlogs
Grafo
http://artesaniaenred.blogspot.com/2006/01/del-softwaresocial-al-cara-cara.html
http://beyondaround.wordpress.com/2007/05/24/p
anel-educacion-20 /
http://beyondaround.wordpress.com/
IndexadorEnlazador
IndexadorEnlazador
Procesador (II):
BuscadorEncaminadorMiBlog
• Datos entrada: palabra buscada, mi blog.
• Datos salida: resultado búsqueda y cadena de enlaces.
• Clase de algoritmo: buscador y encaminador.
BuscadorMiCaminoBlogs
Grafo
Grafo
U
U
S
S
Usuarios
Encaminador
Grafo
U
U
U
S
Pg. Blogs
U
S
U
S
Usuarios
U
Encaminador
Indices
U
U
Servidor Web
Buscador
S
Indexador
Recolector
S
U
U
Indices
Servidor Web
Buscador

Documentos relacionados