RecolectorBlogs AlmacenPaginasBlogs
Transcripción
RecolectorBlogs AlmacenPaginasBlogs
Servidor: BuscadorMiCaminoBlogs RecolectorBlogs (proyecto ASO2008) • Pg. Web con resúmenes de Blogs que contiene una palabra búsqueda. • Compuesta por resúmenes enlazados por otros blogs desde mí blog. • Flujo de interacción: 1) usuario selecciona su pagina de inicio, 2) usuario pide buscar. • Control de acceso: cada usuario puede registrarse y modificar la dirección de su blog de inicio. AlmacenPaginasBlogs Directorio root / /blogs_alianzo_com/ Ficheros • Tipos de datos: paginas de Directorios blogs enteras comprimidas, • Organización / Metadatos: /redessociales/ páginas guardas como ficheros, un directorio por /2006/ blog,… /01/ • Persistencia y disponibilidad: sin replicar /del-software- http://blogs.alianzo.com/ redessociales/2007/12/30/ si-montas-una-startupsubcontrata-el-mar/ S Si montas una startup, subcontrata el marketing, pero no el desarrollo… S Pg. Blogs S S S S Recolector S http://blog.consultorartesano.c om/2006/01/del-softwaresocial-al-cara-a-cara.html Hoy hemos tenido la oportunidad de compartir un rato David y yo mismo con <a> href= http://www.alianzo.com/blogs/ redessociales José Antonio del Moral</a>, de Alianzo. Como casi siempre el espacio digital …… • Tipos de datos: pg. Web de Blogs,.. • Método para identificar fuentes: 1) Info de usuario, 2) Enlaces a Blogs, … • Periodicidad de recogida: diaria,…. Procesador (I): IndexadorEnlazador • Datos entrada: pág. Blog • Datos salida: 1) lista de palabras clave y estadisticas, 2) enlaces de blog. • Clase de algoritmo: indexador + enlazador. http://blogs.alianzo.com/redessoci ales/2007/12/30/ si-montasuna-startup-subcontrata-el-mar/ • Startup: 3,… • Compañía: 2,… • Creativa: 1,… • Empresas: 6,… http://turanzas.wordpress.com/ social-al-caraa-cara.html Indices Pg. Blog http://www.galder.net/ Grafos Pg. Blog IndexadorEnlazador Recolector http://blogs.alianzo.com/redessociales/2007/12/3 0/ si-montas-una-startup-subcontrata-el-mar/ Almacen (II): IndiceBlogs • Tipos de datos: índice de palabras y paginas. • Organización / Metadatos: índices en hashtables • Persistencia y disponibilidad: datos replicados. ………. “Startup” • • http://blogs.alianzo.com/redessociales/ 2007/12/30/si-montas-una-startupsubcontrata-el-mar/ http://nomada.blogs.com/jfreire/2007/1 2/startups-e-inno.html Almacen (III): GrafoBlogs • Tipos de datos: URLs • Organización / Metadatos: grafo de enlaces y tipo • Persistencia y disponibilidad: datos replicados. http://fluxchange.typepad.com/ramonsanguesa/2007/11/in novacin-soc-1.html http://fluxchange.typepad.com/ramonsanguesa/2007/09/e streno-de-citi.html http://beyondaround.wordpress.com/2007/11/07/v isitando-citilab-colaboracion-y-propuestas-allaboratorio-abierto/ / … http://blogs.alianzo.com/redessociales/2007/12/30/ simontas-una-startup-subcontrata-el-mar/ “Sterling” • … • ….. ………… IndiceBlogs Grafo http://artesaniaenred.blogspot.com/2006/01/del-softwaresocial-al-cara-cara.html http://beyondaround.wordpress.com/2007/05/24/p anel-educacion-20 / http://beyondaround.wordpress.com/ IndexadorEnlazador IndexadorEnlazador Procesador (II): BuscadorEncaminadorMiBlog • Datos entrada: palabra buscada, mi blog. • Datos salida: resultado búsqueda y cadena de enlaces. • Clase de algoritmo: buscador y encaminador. BuscadorMiCaminoBlogs Grafo Grafo U U S S Usuarios Encaminador Grafo U U U S Pg. Blogs U S U S Usuarios U Encaminador Indices U U Servidor Web Buscador S Indexador Recolector S U U Indices Servidor Web Buscador