RECUPERACIÓN DE INFORMACIÓN: ONTOLOGÍAS

 

 

 


 

 

 

 

 

Qué te ofrecemos

Sobre ontologias
Recuperación de Información web
Enlaces
 

Información Complementaria

Mapa del Web
Sobre los autores
 

Especiales

Lozano Telló, Adolfo: Ontologías en la web Semántica

Documento en PDF

 

Página creada por: Ana Belén Redondo, Montse Robledo y Mari Carmen Romero

Envíanos tus sugerencias

 

 

RECUPERACIÓN DE INFORMACIÓN: ONTOLOGÍAS

SOBRE ONTOLOGÍAS

HOME

Artículo


Ontologías y Documentación

A continuación os querremos ofrecer una guía que os sirva (o eso al menos deseamos) de acercamiento al mundo de las ontologías y su uso en Documentación. Esperamos que os permita tener una idea general de qué son, en qué consisten y cómo pueden aplicarse las ontologías en los sistemas de información y en la recuperación del conocimiento.
Este trabajo está basado en el estudio de nuestras compañeras Esther Sánchez Lucas y Rosa Martínez Rubio.

El trabajo se divide en dos bloques:
- Ontologías: definición, características, clasificación, uso, diseño y
- La segunda gran área se centra en la aplicación de las aplicaciones de dichas ontologías.


A. ONTOLOGÍAS
1.- SISTEMAS DE INFORMACIÓN BASADOS EN ONTOLOGÍAS
2.- CARACTERÍSTICAS
3.- CLASIFICACIÓN
4.- USO DE ONTOLOGÍAS
5.-DISEÑO Y CONSTRUCCIÓN DE ONTOLOGÍAS
B. EL PAPEL DE LAS ONTOLOGÍAS: ALGUNAS APLICACIONES.
C. REFLEXIONES
E. BIBLIOGRAFÍA Y ENLACES


1.- SISTEMAS DE INFORMACIÓN BASADOS EN ONTOLOGÍAS

Ontología es una antigua disciplina que en sentido filosófico, se define como un esquema específico de categorías que refleja una visión específica del mundo. Desde el punto de vista informático ontologías son como teorías que especifican un vocabulario relativo a un cierto dominio. Este vocabulario define entidades, clases, propiedades, predicados y funciones y, las relaciones entre estos componentes. Las ontologías toman un papel clave en la resolución de interoperabilidad semántica entre sistemas de información y su uso.
Filósofos e ingenieros de software tienen puntos de vista diferentes sobre ontologías. Para Guarino (1998), ontología describe una cierta realidad con un vocabulario específico, usando un conjunto de premisas de acuerdo con un sentido intencional de palabras del vocabulario. Gruber (1992) define una ontología como una especificación explícita de una conceptualización, es decir, que proporciona una estructura y contenidos de forma explícita que codifica las reglas implícitas de una parte de la realidad; estas declaraciones explícitas son independientes del fin y del dominio de la aplicación en el que se usarán o reutilizarán sus definiciones.


De esta forma, se puede decir que para un ingeniero de software existen diversas ontologías, en cuanto que para un filósofo existe apenas una, la Ontología, con letra mayúscula. Para resolver esta cuestión, Smith (1998) sugiere una distinción terminológica entre una ontología basada en una realidad (ontología-R) y una ontología epistemológica (ontología-E). Ontología-R es una teoría que explica cómo el universo está organizado y corresponde al mundo de los filósofos.

Apartándonos del aspecto filosófico, podemos definir ontología como una teoría que explica cómo un individuo, grupo, lenguaje o ciencia entiende un determinado dominio.
El desarrollo de sistemas basados en el conocimiento y de software en general, normalmente se realiza en diferentes contextos, puntos de vista y suposiciones acerca de su materia de estudio. Cada uno usa su propio vocabulario, y por ello pueden tener diferentes conceptos con significados que, a veces, se solapan y, pueden tener diferentes métodos y estructuras.

Por tanto, se crea problemas de comunicación por falta de entendimiento compartido que limita la interoperabilidad y, por tanto, el potencial de reutilizar y compartir información.
Interoperabilidad es la capacidad de un sistema para compartir e intercambiar informaciones y aplicaciones. De acuerdo con Sheth (1999), la nueva generación de sistemas de información (SI) deberá ser capaz de resolver la interoperabilidad semántica, en la cual un hecho puede ser más que una descripción, para poder hacer un buen uso de las informaciones disponibles como la llegada de Internet y la computación distribuida.

Estos sistemas deberán ser capaces de entender:
· El modelo de un usuario de cualquier parte del mundo y sus significados.
· Los modelos procedentes de otras fuentes de información.
Sheth (1999) acredita que el uso de mediadores es la solución para comunicar usuarios y estas fuentes de información.

La forma de resolverlo consiste en crear un entendimiento compartido, como son las ontologías, que unifican los diferentes puntos de vista y sirven para:
· Entender cómo diferentes sistemas comparten informaciones.
· Descubrir ciertas distorsiones presentes en los procesos cognitivos de aprendizaje en un mismo contexto.
· Formar patrones para el desarrollo de SI.
Dicho lo cual, el uso de ontologías en el desarrollo de Sistemas de Información (SI) permite establecer correspondencia y relaciones entre los diferentes dominios de entidades de información.

Frank (1997) acredita que el uso de ontologías en el desarrollo de sistemas contribuye en una mejora en la calidad del producto final, ya que ellas pueden ayudar a evitar problemas como:
· Inconsistencia entre ontologías implícitas en SI.
· Conflictos entre conceptos ontológicos e implementaciones.
· Conflictos entre ontología de sentido común y conceptos básicos no incluidos en el software.

Una posibilidad a tener en cuenta es tener un modelo de conocimiento, haciendo una analogía con un modelo de datos. Un modelo de datos describe la estructura lógica de los datos y su aplicación. Uno de los trabajos seminales fue el modelo entidad - relación.
El modelo es una descripción esquemática de las instancias del modelo. Estas instancias representan los datos que son usados por la aplicación. Se han hecho muchas extensiones del modelo entidad - relación para tratar de capturar el significado de los datos (la parte semántica). Una extensión común es usar jerarquías de subclases.

Algunas de sus limitaciones son:
· El modelo de datos toma un solo punto de vista del mundo. Describe los objetos o instancias de interés, pero bajo una sola posible interpretación. Si se quiere reutilizar algún término, se hace evidente que el término puede tener diferentes interpretaciones dependientes del contexto.

La reutilización de conocimiento complejo es imposible sin tomar en cuenta los diferentes puntos de vista.

Algo de esto existe en bases de datos pero toda la información tiene que estar presente: los puntos de vista no añaden información por lo que la visión global es limitada.
· Por otro lado, existen desarrollos en modelo de datos orientados a objetos. Sin embargo, la representación de relaciones entre objetos sigue siendo pobre. La jerarquía y herencia basada en la relación IS-A es sólo una de las posibles relaciones que pueden existir.

Se puede observar, por tanto, que existe una frontera difusa entre:
· Conocimiento e información
· Ontologías y modelos de datos
Finalmente, una ontología se puede ver como un modelo de datos de conocimiento.

volver al sumario

2.- CARACTERÍSTICAS

Una ontología especifica una forma de ver el mundo. Por lo cual cada ontología incorpora un punto de vista. Una ontología pues, contiene definiciones que proveen del vocabulario para referirse a un dominio y éstas dependen del lenguaje que se usa para describirlas.

En consecuencia, se pueden señalar algunas de sus características típicas:
· Pueden existir ontologías múltiples:
El propósito de una ontología es hacer explícito algún punto de vista. Por ello, a veces, se necesita combinar dos o más ontologías. Cada una de ellas introduce conceptualizaciones específicas.
· Se puede identificar niveles de abstracción de las ontologías:

Estos niveles de generalización proporcionan una topología de ontologías. La idea es caracterizar una red de ontologías usando multiplicidad y abstracción. Como no se puede aspirar a tener una descripción completa del mundo, se puede pensar en una estrategia de construcción gradual de abajo hacia arriba.
· Multiplicidad de la representación:

Un concepto puede ser representado de muchas formas por lo que pueden coexistir múltiples representaciones de un mismo concepto.
· Mapeo de ontologías:
Permite crear relaciones entre los elementos de una o más ontologías para establecer conexiones, especializaciones, generalizaciones, etc.

volver al sumario

3.- CLASIFICACIÓN


Guarino (1997) clasifica las ontologías de acuerdo con su dependencia y relación con una tarea específica desde un punto de vista:
· Ontologías de Alto Nivel o Genéricas: Describen conceptos más generales. En relación con los SI, estas ontologías describirían conceptos básicos. Por ejemplo: una teoría describiría partes y todos, y sus relaciones con la topología.
.Ontologías de Dominio: Describen un vocabulario relacionado con un dominio genérico.
Por ejemplo, podría ser una descripción de datos y entidades relacionados con la sensorización remota con un ambiente urbano.
· Ontologías de Tareas o de Técnicas básicas: Describen una tarea, actividad o artefacto.
Por ejemplo la evaluación de la contaminación sonora en ambientes urbanos o la descripción de características generales de componentes, procesos o funciones.
· Ontologías de Aplicación: Describen conceptos que dependen tanto de un dominio específico como de una tarea específica y, generalmente son una especialización de ambas. Federico Fonseca et al. (2000) proponen que este tipo de ontologías nazcan a partir de una combinación de ontologías de niveles superiores. Ellas representan las necesidades de los usuarios relacionados con una aplicación específica como, por ejemplo, una evaluación de disponibilidad de camarones en la costa de Espíritu Santo (Brasil).


Otra clasificación es la propuesta por Van Heist:
· Ontologías terminológicas:Especifican los términos que son usados para representar el conocimiento en el universo del discurso. Suelen ser usadas para unificar vocabulario en un campo determinado.
· Ontologías de información:Especifican la estructura de almacenamiento de bases de datos. Ofrecen un marco para el almacenamiento estandarizado de información.
· Ontologías de modelado de conocimiento:Especifican conceptualizaciones del conocimiento. Contienen una rica estructura interna y suelen estar ajustadas al uso particular del conocimiento que describen.

volver al sumario

4.- USO


El uso de las ontologías puede aplicarse a:
1. Comunicación: En modelos normativos, crea la semántica de un sistema y el modelo para extenderlo y transformarlo entre diferentes contextos.
2. Interoperabilidad: usa ontologías como una inter-lengua.
3. Ingeniería de sistemas


El uso de ontologías explícitas en el desarrollo y uso de sistemas de información lleva a los que son llamados Sistemas de Información basados en ontologías (Guarino, 1998). En la propuesta de Fonseca et al. (2000) de un SI basado en ontologías, las ontologías son representadas en una estructura formal basada en Rodríguez (2000), que describe ontologías a través de sus componentes: partes, funciones y atributos.

En Cranefield (1999) puede ser encontrada una discusión completa sobre las formas de almacenamiento de ontologías de acuerdo con el uso pretendido. Las ontologías son organizadas en una estructura jerárquica ya que ésta es considerada como una de las mejores formas de representar el conocimiento. El mapeamiento de las entidades en las ontologías para componentes de software es realizado usando técnicas de orientación a objetos de herencia múltiple. Este tipo de mapeamiento permite la integración parcial de informaciones cuando una integración completa es posible. Este sistema permite la unión o el reaprovechamiento de clases ya desarrolladas, incorporando, así mismo, unos nuevos sistemas, o un conocimiento existente entre otros SI.

volver al sumario

5.- DISEÑO Y CONSTRUCCIÓN


La construcción de ontologías no responde a una única aproximación lógica sino que depende, en gran manera, del contexto en el que se construyen. Además hay que tener en cuenta que una ontología especifica una conceptualización, una forma de ver el mundo. Por lo cual cada ontología incorpora un punto de vista. Una ontología pues, contiene definiciones que se proveen del vocabulario para referirse a un dominio y éstas dependen del lenguaje que se usa para describirlas.


Algunas cuestiones sobre el diseño:
· Claridad: una ontología debe de poder comunicar de manera efectiva el significado de sus términos. Las definiciones deben ser objetivas y comentadas en lenguaje natural.
· Coherencia: debe permitir hacer inferencias que sean consistentes con las definiciones.
· Extendible: debe anticipar usos y permitir extensiones y especializaciones monotónicas.
· Sesgo de codificación mínimo (Minimal encoding bias): debe especificar al nivel de conocimiento sin depender de una codificación particular al nivel de símbolo.
· Mínimo compromiso ontológico: debe hacer la menor cantidad posible de "pretensiones" acerca del mundo modelado.

Una posible estructura para la construcción de una ontología.
1.- Identificación del propósito y alcance (usuarios potenciales).
2.- Captura:
· Identificación de los conceptos y relaciones claves en el dominio de interés.
· Producción de definiciones no ambigüas de conceptos y de sus relaciones.
· Identificación de términos para referirse a estos conceptos y relaciones.
2.1.- Codificación: representación explícita de la conceptualización en un lenguaje formal:
· Términos básicos de especificación (a veces llamado metaontología).
· Lenguaje de representación adecuado.
· Codificación de este lenguaje.
· Integración de ontologías existentes: cómo, cúales y si se va a usar alguna ontología existente.
3.- Evaluación:
Se considera que la ontología construida va a ser reutilizada por lo tanto debe seguir unos principios básicos:
· Abstracción: lo más abstracto posible pero suficientemente concreto.
· Modularización: permite aislar conceptos.
· Jerarquización: debe seguir un orden.
· Estandarización.
4.- Documentación:
Debe de hacerse de forma paralela a los puntos anteriores y debe de contener esta clase de puntos:
· Tener el tipo de mapeo en que se basa la nueva teoría.
· Contener diferencias semánticas con las ontologías seleccionadas.
· Justificación de las decisiones tomadas.
· Evaluación.
· Conocimiento adicional para usarla, etc.
Además la ontología construida debe ser indexada y ordenada con las ontologías existentes para su posterior reutilización.

volver al sumario

B. EL PAPEL DE LAS ONTOLOGÍAS: ALGUNAS APLICACIONES


En Documentación se puede considerar de especial interés la aplicación, por un lado, de ontologías terminológicas que unificarían la terminología de cada concepto y las relaciones entre ellos; y por otro, las ontologías de información que unificarían las estructuras de almacenamiento de forma que pudieran ser reutilizadas por varias aplicaciones informáticas que utilizasen la misma fuente de información.

Según Tramuyas (1999) las ontologías pueden desempeñar varios papeles o roles bajo el concepto unificador de "knowledge sharing" (Gruber, 1993):
· Repositorios para la organización de conocimientos e información, tanto de tipo corporativo como científico.
· Herramienta para la adquisición de información, en situaciones en la que un equipo de trabajo la utiliza como soporte común para la organización del dominio.
· Herramienta de referencia en la construcción de sistemas basados en el conocimiento, ya que la utilización consistente de los términos que supone es básica en la ingeniería del conocimiento.
· Para permitir la reutilización del conocimiento ya existente, en la creación de nuevas aplicaciones.
· Como base para la construcción de lenguajes de representación del conocimiento, acompañada de la formalización del cálculo que tenga lugar entre los términos.

El conocimiento documental tradicionalmente ha sido organizado utilizando mecanismos básicos de clasificación jerárquica de Dewey (o la CDU) y los encabezamientos de materia (clasificación asociativa) sobre los que también se han establecido un gran número de acuerdos. Actualmente, más orientado a la recuperación, se utilizan descriptores de un lenguaje controlado con el soporte de un tesauro. Dichos modos de almacenamiento y recuperación de información han jugado un papel fundamental en el uso generalizado y estandarizado de sistemas documentales permitiendo a los documentalistas tener unos modelos comunes y aceptados en la descripción y almacenamiento de información.

En los tesauros los descriptores se enlazan mediante tres tipos principales de relaciones muy simples formando un árbol taxonómico del sistema de información. Estas relaciones se utilizan para la recuperación y para también tener una idea general del contenido de la base o navegar a través de los mismos descriptores.
La construcción de ontologías lleva implícito que cada término y cada relación entre términos se defina formalmente. Los conceptos se describen explícitamente para entender su significado, mediante acuerdos ontológicos. Con ello un usuario que desee reutilizar una ontología desarrollada por otros, puede conseguir la información de todos los conceptos que soporta, su taxonomía y los axiomas. A diferencia de los tesauros, las ontologías poseen una mayor variedad de relaciones entre conceptos. Estas relaciones se crean a propósito del modelo conceptual existente en el dominio que se está formalizando.

De igual forma, el conocimiento almacenado en un sistema documental se puede organizar definiendo cada concepto como, por ejemplo: Revista, Artículo, Libro, Autor, etc. También se puede organizar las relaciones que existen entre un consenso tanto en el significado de cada término, como en una unificación formal de almacenamiento de esa información. Las ontologías se construyen siguiendo esta filosofía, por lo que pueden ser reutilizadas en diferentes dominios y con diferentes fines. Poniendo axiomas del tipo: si A es coautor de B y sabes que B ha escrito el libro L1 y L2, se sabe que A ha escrito alguno de estos dos libros, es decir, se puede deducir conocimientos que no están explícitos en la ontología.

Aplicaciones. Uso de Ontologízas para la indización, recuperación y divulgación de la información web:
Agentes inteligentes para encontrar páginas especializadas en la Web: El agente debe ser capaz de identificar una página dada que pertenece a una materia o un dominio específico tratado. Ejemplos de dominios con los cuales se trabaja son: llamadas de trabajo para eventos científicos (call for papers), páginas como listas de publicaciones, páginas de universidades, etc. El agente ejecuta una meta-búsqueda en las bases de índices de varios mecanismos de búsqueda y, seguidamente, clasifica las páginas recuperadas, utilizando las ontologías de clases que las indexará por palabras clave. Son también utilizadas las reglas que describen las características específicas de las páginas de este dominio. Por ejemplo: detalles de estructura e información de la página.

Herramientas para mejorar la eficacia de búsquedas en la Web: Consiste en el desarrollo de un diseño de frames (framework) para la construcción y manipulación de ontologías que representan dinámicamente una estructura semántica de Bases de Índices del mecanismo de búsqueda asociado. Un usuario selecciona un tema en el que se inserta su búsqueda (o contexto de búsqueda) a partir de una ontología ofrecida por la herramienta. Este trabajo está relacionado con el proyecto BRight (BRazilian Internet Guide in Hypertext) que evoluciona hacia un mecanismo de búsqueda RADIX.
Agentes inteligentes Notificadores: Avisan a los usuarios de Bases de Datos de gran magnitud sobre inclusiones/alteraciones de datos acerca de temas de interés de cada usuario. Los temas deben ser previamente seleccionados por el usuario. El prototipo inicial utiliza el Banco de Datos del CNCT (Cadastro Nacional de Competência em Ciência e Tecnologia) como base para pruebas. Los usuarios registrados para recibir informaciones sobre las actualizaciones del banco antes citado, necesariamente, deben estar registrados en el CNCT. En un principio, cualquier interesado puede recibir informaciones sobre este banco.

volver al sumario

REFLEXIONES


Como nota final no queremos más que enumerar algunas de las ventajas que supone el uso de las ontologías sobre todo en el ámbito de la Documentación:
1. El uso de ontologías en lugar de bases de conocimiento particulares puede optimizar la aplicación de sistemas basados en conocimiento, su desarrollo e interoperabilidad.
2. Preservación del conocimiento perecedero de los expertos en cualquier campo de aplicación.
3. La descripción de los conceptos y sus relaciones pueden ser empleadas de forma más general que los actuales tesauros de manera que se pueden establecer un mayor número de relaciones distintas, y tener definidas cada una de ellas.
4. La problemática de la indización, recuperación y divulgación de la información depositada en Internet u otros repositorios se aborda desde la perspectiva de la construcción de ontologías. Estas podrán permitir una gestión rápida, eficaz, pertinaz y permanentemente actualizada de las necesidades a cubrir.
5. Al ser las ontologías un nuevo tipo de documento, se debe estudiar su almacenamiento y recuperación para la satisfacción de las necesidades que se puedan plantear.


volver al sumario

BIBLIOGRAFÍA
FONSECA, Frederico; EGENHOFER, Max. "Ontology-Driven Geographic Information Systems" en C.B. MEDEIROS, 7th. ACM Simposium on Advances in Geographic Information Systems. Kansas City, 1999. P. 14-19
· FONSECA, Frederico; EGENHOFER, Max; BORGES, Karla A. V. "Ontologias e Interoperabilidade Semântica entre SIGs" en GeoInfo 2000. II Workshop Brasileiro de GeoInformática. Brasil, 2000 http://www.spatial.maine.edu/~max/RJ40.html (consultado el 28-11-2000)
· FRANKLIN, S. Y GRAESSER, R., "It is an Agent, or just a Program? : A Taxonomy for Autonomous Agents". En Third International Workshop on Agent Theories, Arquitectures, and Languages. Springer-Verlag, 1996, p.193-206
· HERMANS, B. Intelligent Software Agents on the Internet: An Inventory of Currently Offered Funcionality in the Information Society and a Prediction of (Near) Future Developments. Tilburg: Tilburg University, 1996. http://www.hermans.org/agents/index.html (consultado 24-1-2001)
· LUKE, S., SPECTOR, L. Y RAGER, D. "Ontology-Based Knowledge Discovery on the World-Wide Web". En Proceedings of the Workshop on Internet-based Information Systems, AAAI-96, 1996. http://www.cs.umd.edu/projects/plus/SHOE/aaai-paper.html (consultado 24-1-2001)
· GRUBER, T. R. "Toward Principles for the Design of Ontologies Used for Knowledge Sharing" en International Journal of Human and Computer Studies, 43 (5-6), 1995, p.907-928
· GRUBER, T. R. "What is an Ontology?" http://www-ksl.stanford.edu/kst/what-is-an-ontology.html (consultado el 15-12-2001)
· GUARINO, N. "Understanding, Building, and Using Ontologies" en Kwnoledge Acquisition Workshop 1996. http://ksi.cpsc.ucalgary.ca/KAW/KAW96/guarino.html (consultado el 15-12-1998)
· GUARINO, N. "Formal Ontology, Conceptual Analysis and Kwoledge Representation" en International Journal of Human and Computer Studies, 43(5-6), 1995, p. 625-640
· GUERRERO BOTE, Vicente; LOZANO TELLO, Adolfo."Vínculos entre las Ontologías y la Biblioteconomía y Documentación" en La Representación y la Organización del Conocimiento en sus distintas perspectivas: su influencia en la Recuperación de la Información : Actas del IV Congreso ISKO-España EOCONSID'99 22-24 de abril de 1999 Granada. Granada: ISKO; Universidad de Granada. Facultad de Biblioteconomía y Documentación, 1999, p. 25-31
· MEDEIROS SANTI, Sergio; HEUSER, Carlos Alberto. "Uma Arquitetura para Integraçâo Semântica de Fontes Heterogêneas de Informação Semi-Estructurada Baseada em Ontologias" en http://www.inf.ufrgs.br/pos/SemanaAcademica/Semana2000/SergioSanti/ (consultado el 30-11-2000)
· MORALES, Eduardo; SUCAR, Enrique. "Representación de Conocimiento" en http://w3.mor.itesm.mx/~ rdec/ (consultado el 5-12-2000)
· DIAS, M.C.P.; QUENTAL, V.S.T.D.B.; OLIVEIRA, D.A.S. "Ontologias de Domínio e Base Lexical" en http://www.inf.puc-rio.br/~linx/parte32.htm (consultado el 28-11-2000)
· Ontologías. http://www.ontology.org/ (consultado el 28-11-2000)
· TRAMUYAS, Jesús. "Agentes y ontologías para el tratamiento de la información: clasificación y recuperación en Internet" en La Representación y la Organización del Conocimiento en sus distintas perspectivas: su influencia en la Recuperación de la Información : Actas del IV Congreso ISKO-España EOCONSID'99 22-24 de abril de 1999 Granada. Granada: ISKO; Universidad de Granada. Facultad de Biblioteconomía y Documentación, 1999, p.247-252
· VAN HEIJST, G., SCHEREIBER, A.T. Y WIELINGA, B.J. "Using Explicit Ontologies in KBS Development" en International Journal of Human and Computer Studies, 1996
· http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-18 (consultado 5-12-2000)

volver al sumario

1