¿Qué es la web semántica?, ¿por qué supondrá una revolución de

Transcripción

¿Qué es la web semántica?, ¿por qué supondrá una revolución de
La Web Semántica, la siguiente generación de Webs
José Manuel Cantera Fonseca, Juan José Hierro Sureda y Pedro Ángel Romo Zabala
Tecnologías
¿Qué es la web semántica?, ¿por qué supondrá una revolución de los contenidos y servicios dispo- nibles
en Internet?. Adéntrese en el futuro de la Web en este interesante artículo.
Descargar archivo de audio (17:51 min / 4,08 Mb) Introducción
La web semántica propone superar las limitaciones de la web actual y la estructura global de los
contenidos y servicios disponibles. Frente a la introducción de descripciones explícitas del significado, la
estructura interna semántica implícita, el crecimiento caótico de recursos y la ausencia de una
organización clara de la web actual, la web semántica aboga por clasificar, dotar de estructura y anotar los
recursos con semántica explícita procesable por máquinas.
La Figura 1 ilustra esta propuesta. Actualmente la web se asemeja a un grafo formado por nodos del
mismo tipo, y arcos que representan hiperenlaces igualmente indiferenciados. Se puede decir, por
ejemplo, que no se hace distinción entre la página personal de un pintor y el portal de una galería de arte
online, como tampoco se distinguen explícitamente los enlaces a las páginas personales de los pintores de
los enlaces a fotografías de sus cuadros. Por el contrario, en la web semántica cada nodo (recurso) tiene
un tipo (pintor, escuela, cuadro, lugar, etc.), y los arcos representan relaciones explícitamente
diferenciadas (pintor-escuela, pintor-cuadro, escuela-lugar, etc.).
Figura 1. Comparación entre la web actual y la web semántica
La web semántica mantiene los principios que han hecho que la web actual sea un éxito, como son los
principios de descentralización, compartición, compatibilidad, máxima facilidad de acceso y contribución,
o la apertura al crecimiento y uso no previstos de antemano. En este contexto, un problema clave es
alcanzar un entendimiento entre las partes que han de intervenir en la construcción y explotación de la
web: usuarios, desarrolladores y programas de muy diverso perfil.
La web semántica rescata la noción de ontología del campo de la Inteligencia Artificial (IA) como
vehículo para cumplir este objetivo. Una ontología contiene definiciones que nos proporcionan un
vocabulario para referirse a un determinado área de conocimiento, a un conjunto de conceptos (como
cosas, propiedades, eventos y relaciones), que se especifican, por ejemplo, en lenguaje natural con el
objetivo de crear un idioma común para intercambiar información. Ese vocabulario se define mediante un
conjunto de términos básicos y relaciones entre dichos términos, así como las reglas que combinan los
términos y las relaciones que permiten ampliar las definiciones dadas en el vocabulario. Por tanto, una
ontología es una forma de ver el mundo, ya que determina los términos a utilizar para describir y
representar un determinado área de conocimiento, haciendo énfasis en la compartición del conocimiento y
el consenso en la representación de éste. De esta forma, una ontología sobre arte podría, por ejemplo,
incluir conceptos como 'pintor', 'cuadro', 'estilo' o 'museo', y relaciones como 'autor de un cuadro',
'pintores pertenecientes a un estilo artístico' u 'obras localizadas en un museo'.
La utilización de las ontologías aporta una serie beneficios, ya que:
Proporcionan una forma de representar y compartir el conocimiento utilizando un vocabulario
común.
Permiten usar un formato de intercambio de conocimiento.
Proporcionan un protocolo específico de comunicación.
Permiten una reutilización del conocimiento.
En la web semántica, las ontologías capturan un conocimiento consensuado de un modo genérico, de
forma que pueda ser compartido y reutilizado por distintos grupos de personas y aplicaciones de software.
Una de las condiciones para que funcione la web semántica es que el contenido de los documentos se
presente por medio de la utilización de ontologías que sean públicas y accesibles, de uso común y, a ser
posible, normalizadas. Así estos documentos con contenido semántico podrán ser utilizados por robots
software.
La idea es que la web semántica está formada (al menos en parte) por una red de nodos tipificados e
interconectados mediante clases y relaciones definidas por una ontología compartida por sus distintos
autores. Por tanto, una vez establecida una ontología sobre cuadros y pintura, un museo virtual puede, por
ejemplo, organizar sus contenidos creando materializaciones concretas de esos conceptos para cada uno
de los pintores, cuadros, etc. que conforman dicho museo, interrelacionándolas y publicándolas en la web.
En este sentido, la adopción de ontologías comunes es clave para todos los que participen de la web
semántica. Así, por ejemplo, varios museos podrán colaborar para dar lugar a un gran 'metamuseo' que
integre los contenidos de todos ellos. Un programa que navegue por una red como esta puede reconocer
las distintas unidades de información, obtener datos específicos o razonar sobre relaciones complejas.
Todo esto permitiría, por ejemplo, distinguir entre un cuadro pintado por un artista y un retrato de un
artista. De forma que cuando una persona busque un 'retrato de Velázquez', le muestre todos los cuadros
del museo en los que aparece un retrato del pintor Velázquez y no todos los retratos que pintó Velázquez
de diferentes personajes.
Se puede decir, por último, que la web no solamente proporciona acceso a contenidos, sino que también
ofrece interacción y servicios (comprar un libro, reservar una plaza en un vuelo, hacer una transferencia
bancaria, simular una hipoteca). Los servicios web semánticos son una línea importante de la web
semántica, que propone describir no sólo la información sino definir ontologías de funcionalidad y
procedimientos para describir servicios web: sus entradas y salidas, las condiciones necesarias para que se
puedan ejecutar, los efectos que producen o los pasos a seguir cuando se trata de un servicio compuesto.
Estas descripciones, que pueden ser procesadas por máquinas, permitirán automatizar el descubrimiento,
la composición y la ejecución de los servicios, así como la comunicación entre unos y otros. De la web
actual a la web semántica
La primera pregunta que se debe responder es cómo encaja la web semántica con la actual, es decir, cómo
accederá el usuario a la web semántica, y sobre todo, cómo hacer la transición de la web actual a la web
semántica.
Para que la web semántica pueda realizarse es importante que guarde, al menos al principio, una
compatibilidad con la tecnología actual. Es deseable, por ejemplo, mantener el lenguaje HTML
(HyperText Markup Language), u otros lenguajes compatibles con los navegadores actuales, como
vehículo de comunicación con el usuario. La asociación entre las instancias de la web semántica y el
código HTML se puede establecer mediante distintos mecanismos.
Una de las formas posibles consiste en conservar los documentos actuales, y crear las instancias asociadas
anotando su correspondencia con los documentos. Esta posibilidad es la más viable cuando se parte de un
gran volumen de material antiguo. Otra forma consiste en generar dinámicamente páginas web a partir de
las ontologías y sus instancias. Esta última opción puede resultar factible cuando los documentos antiguos
ya se estaban generando automáticamente a partir, por ejemplo, de una base de datos.
La transición de la web actual a la web semántica puede implicar un coste altísimo si se tiene en cuenta el
volumen de contenidos que ya forman parte de la web. Crear y poblar las ontologías supone un esfuerzo
extra que puede resultar tedioso cuando se agregan nuevos contenidos, pero directamente prohibitivo en
lo que respecta a integrar los miles de gigabytes de contenidos antiguos. Las estrategias más viables
combinan una pequeña parte de trabajo manual con la automatización del resto del proceso. Las técnicas
para la automatización incluyen, entre otras, el mapeo de la estructura de las bases de datos a ontologías,
el aprovechamiento, previa conversión, de los metadatos y estándares de clasificación presentes en la web
(y fuera de ella), y la extracción automática de los metadatos a partir de texto y recursos multimedia.
Otra dificultad importante a la hora de realizar la web semántica en la práctica, es la de consensuar
ontologías en una comunidad, por poco amplia que sea. Converger a una representación común es una
labor más compleja de lo que puede parecer, ya que cada parte del sistema conlleva, típicamente, ciertas
peculiaridades necesarias, y un punto de vista propio que a menudo necesita incidir en la propia ontología.
La representación del mundo no es neutra respecto al uso que se le va a dar: tanto un dietista como un
biólogo tienen el conocimiento suficiente sobre las plantas, pero la representación que pueden hacer de
esa materia es muy distinta, y probablemente no será adecuado imponer la misma representación para
ambas perspectivas. Las vías para salvar esta dificultad consisten en compartir ontologías para las áreas
comunes en que puede tener lugar una interacción o intercambio de información entre las partes, y
establecer formas de compatibilidad con las ontologías locales, mediante extensión y especialización de
las ontologías genéricas, o por mapeo y exportación entre ontologías. La web semántica hoy
Los resultados alcanzados hasta la fecha en la adopción universal de la web semántica son muy
preliminares. Se ha avanzado mucho con las herramientas, la infraestructura y los estándares necesarios
para el despliegue de la web semántica, y se han desarrollado proyectos y experiencias piloto para poner a
prueba las herramientas y las ideas. En este punto, el desarrollo de aplicaciones reales basadas en esta
tecnología se ha identificado como una realización necesaria para que la web semántica prospere.
Existe un gran interés desde el entorno corporativo, el sector público y el mundo académico por hacer de
la web semántica una realidad, ya que se piensa que puede ser una pieza importante para el progreso de la
sociedad de la información. Las grandes agencias de financiación pública (programas marco EU-IST en
Europa, DARPA en EEUU) incluyen áreas prioritarias específicas dedicadas a la web semántica, y están
invirtiendo grandes presupuestos en proyectos de investigación y desarrollo en este campo. En este
sentido, las principales empresas (IBM, Microsoft, Sun, Oracle, BEA, SAP, HP, etc.) están participando
activamente en el desarrollo de los estándares y tecnologías.
La web semántica se ha convertido en un tema de moda en los centros de investigación de todo el mundo,
entre los que se encuentra el MIT (Massachusetts Institute of Technology), la Universidad de Stanford, la
Universidad de Maryland, la Universidad de Innsbruck (Austria), la Universidad de Karlsruhe
(Alemania), la Universidad de Manchester o la Open University en el Reino Unido, por citar tan sólo
algunos de los grupos más destacados.
En pocos años se ha consolidado una comunidad investigadora considerable, de cuyo reflejo cabe destacar
un gran congreso internacional que se celebra con carácter anual (International Semantic Web
Conference48), y revistas como el Journal of Web Semantics o el área The Semantic Web de Electronic
Transactions on Artificial Intelligence (ETAI). Es de gran importancia el apoyo del W3C en el proyecto
de la web semántica, con la creación de grandes y muy activos grupos de trabajo para el desarrollo de esta
área, y especialmente su liderazgo en el esfuerzo de estandarización de lenguajes y tecnologías específicas
para la web semántica.
Aún queda mucho trabajo por hacer. En este sentido, se necesita crear más y mejor tecnología e
infraestructura, y más aún, es necesario desarrollar aplicaciones reales que pongan en práctica los
principios de la web semántica, que pueblen la web con ontologías y que hagan que la web semántica
adquiera la masa crítica imprescindible para hacerse realidad. En espera de que se alcance esta meta, y al
margen de ese debate, se han desarrollado ideas muy aprovechables a niveles específicos y se han abierto
nuevos campos para la innovación, suficientemente interesantes para motivar la investigación en esta
área. Aplicaciones de la web semántica
Existen multitud de campos donde son aplicables las tecnologías de web semántica. Muchos de ellos
están aún por explorar y descubrir, y sin ánimo de ser exhaustivos, se puede realizar una clasificación de
las aplicaciones de la web semántica, que incluiría:
Aplicaciones de búsqueda. Las tecnologías de web semántica permiten desarrollar buscadores
avanzados aplicados a distintos dominios. Los dominios con mayor potencial son la administración
pública, la medicina, las búsquedas sociales, el empleo, las artes, la ciencia, la política, la
economía, la gestión del conocimiento, y otros.
Los buscadores disponibles en la actualidad (de segunda generación) llevan a cabo el proceso de
búsqueda utilizando técnicas clásicas de recuperación de información (IR, Information Retrieval)
basadas en la ocurrencia de determinadas palabras clave en las páginas (búsqueda sintáctica),
combinado con mecanismos de sinonimia denominados genéricamente tesauros. En el caso de los
buscadores web, estas técnicas se complementan con algoritmos de relevancia basados en el número
de enlaces entre páginas (pagerank).
Las tecnologías de web semántica van a permitir construir buscadores de tercera generación
(buscadores semánticos). Estos buscadores van a complementar las soluciones de búsqueda
tradicionales, haciéndolas mucho más ricas, ya que no sólo se buscará en el universo web la
ocurrencia de ciertas palabras clave, sino que también se buscará atendiendo al significado
(semántica) de dichas palabras clave en un contexto.
Es el caso, por ejemplo, de una persona que puede estar interesada en buscar libros que hablen sobre
la vida y obra de un determinado escritor. En un buscador de segunda generación se encontrarán
muchas entradas correspondientes a libros escritos por ese escritor, pero no se encontrarán
fácilmente aquellos libros que realmente buscaba el usuario. Esto se debe a que la búsqueda se
realiza por la ocurrencia de palabras y no por su significado.
Aplicaciones de asistencia al usuario. Estas aplicaciones están relacionadas con los agentes
personales de usuario que permiten realizar búsquedas avanzadas en Internet, descubrimiento de
servicios, composición de servicios, etc.
Aplicaciones de integración de fuentes de datos heterogéneas. Estas aplicaciones permiten
obtener, agrupar y correlacionar información dispersa en Internet sobre un dominio, como, por
ejemplo, deportes o noticias.
Aplicaciones de anotación semántica de contenidos multimedia. Estas aplicaciones permiten
catalogar los contenidos multimedia de forma semántica, pudiéndose realizar catálogos de
contenidos personalizados para los usuarios, descubrimiento de nuevos recursos multimedia de
interés para el usuario, etc.
Aplicaciones de adaptación automática de contenidos en base a la anotación semántica de los
mismos. La idea que subyace en estas aplicaciones es que los contenidos web sean adaptados
dinámicamente teniendo en cuenta su semántica y la personalización asociada al usuario.
Actualmente existen mecanismos automáticos de adaptación de contenidos, pero basados
únicamente en aspectos sintácticos de las páginas.
Aplicaciones para las empresas. Bajo este punto aparecen todas aquellas aplicaciones de la web
semántica encaminadas a mejorar los mecanismos actuales de gestión de las empresas, explotando
al máximo el nuevo abanico de posibilidades que ofrecen las tecnologías y plataformas de web
semántica.
Conclusiones
El concepto de web semántica implicará un cambio radical en el modo de navegar en Internet. Gracias a
ello se podrán ofrecer funciones avanzadas a los usuarios como resultado de correlacionar información
acerca del significado de los contenidos en la web, información que caracteriza el contexto de
navegación, información que caracteriza al usuario e información acerca de los servicios disponibles.
Todo ello derivará en que Internet evolucione para ser un elemento 'vivo' capaz de tomar un papel
proactivo y asistir al usuario final (individuo, empresa u organización) en las tareas de su vida diaria,
incrementando su productividad y su calidad de vida.
La investigación en el terreno de la web semántica se advierte como una de las áreas en las que las
empresas tecnológicas deben prestar especial interés si quieren protagonizar un papel relevante en el
futuro de la red Internet. Telefónica no es una excepción en este sentido, así en su filial Telefónica I+D se
está avanzando en diversas líneas de investigación dirigidas a superar las limitaciones de aplicación
práctica identificadas en relación con la tecnología de la web semántica. En este punto, se está trabajando
en la aplicación de la web semántica en el ámbito de la movilidad (desarrollando el concepto de Semantic
Mobile Web), así como en el de la aplicación de las tecnologías Web 2.0 (técnicas de etiquetado,
folksonomias) como vehículo para superar las limitaciones derivadas de la creación y estandarización de
las ontologías.
José Manuel Cantera Fonseca, Juan José Hierro Sureda y Pedro Ángel Romo Zabala. Telefónica
I+D
(Nota: Este artículo es un extracto del artículo 'Web semántica: Tecnologías y arquitectura' publicado en
el número 39 de la revista Comunicaciones I+D. Si se desea profundizar más en las tecnologías de la web
semántica, así como conocer una propuesta de arquitectura, se recomienda la lectura de dicho artículo.)
Otro artículo relacionado: Cómo será la web 3.0 Descargar archivo de audio (17:51 min / 4,08 Mb)

Documentos relacionados