RECUPERACIÓN DE INFORMACIÓN: ONTOLOGÍAS
Qué te ofrecemos |
| Sobre ontologias |
| Recuperación de Información web |
| Enlaces |
Información Complementaria |
| Mapa del Web |
| Sobre los autores |
Especiales |
|
RECUPERACIÓN DE INFORMACIÓN: ONTOLOGÍAS SOBRE ONTOLOGÍAS |
Artículo
Ontologías y Documentación
A continuación os querremos
ofrecer una guía que os sirva (o eso al menos deseamos) de acercamiento
al mundo de las ontologías y su uso en Documentación. Esperamos
que os permita tener una idea general de qué son, en qué consisten
y cómo pueden aplicarse las ontologías en los sistemas de información
y en la recuperación del conocimiento.
Este trabajo está basado en el estudio de nuestras compañeras
Esther Sánchez Lucas y Rosa Martínez Rubio.
El trabajo se divide en dos bloques:
- Ontologías: definición, características, clasificación,
uso, diseño y
- La segunda gran área se centra en la aplicación de las aplicaciones
de dichas ontologías.
A. ONTOLOGÍAS
1.- SISTEMAS DE INFORMACIÓN BASADOS EN ONTOLOGÍAS
2.- CARACTERÍSTICAS
3.- CLASIFICACIÓN
4.- USO DE ONTOLOGÍAS
5.-DISEÑO Y CONSTRUCCIÓN DE ONTOLOGÍAS
B. EL PAPEL DE LAS ONTOLOGÍAS: ALGUNAS APLICACIONES.
C. REFLEXIONES
E. BIBLIOGRAFÍA Y ENLACES
1.- SISTEMAS DE INFORMACIÓN BASADOS EN ONTOLOGÍAS
Ontología es una antigua
disciplina que en sentido filosófico, se define como un esquema específico
de categorías que refleja una visión específica del mundo.
Desde el punto de vista informático ontologías son como teorías
que especifican un vocabulario relativo a un cierto dominio. Este vocabulario
define entidades, clases, propiedades, predicados y funciones y, las relaciones
entre estos componentes. Las ontologías toman un papel clave en la
resolución de interoperabilidad semántica entre sistemas de
información y su uso.
Filósofos e ingenieros de software tienen puntos de vista diferentes
sobre ontologías. Para Guarino (1998), ontología describe una
cierta realidad con un vocabulario específico, usando un conjunto de
premisas de acuerdo con un sentido intencional de palabras del vocabulario.
Gruber (1992) define una ontología como una especificación explícita
de una conceptualización, es decir, que proporciona una estructura
y contenidos de forma explícita que codifica las reglas implícitas
de una parte de la realidad; estas declaraciones explícitas son independientes
del fin y del dominio de la aplicación en el que se usarán o
reutilizarán sus definiciones.
De esta forma, se puede decir que para un ingeniero de software existen diversas
ontologías, en cuanto que para un filósofo existe apenas una,
la Ontología, con letra mayúscula. Para resolver esta cuestión,
Smith (1998) sugiere una distinción terminológica entre una
ontología basada en una realidad (ontología-R) y una ontología
epistemológica (ontología-E). Ontología-R es una teoría
que explica cómo el universo está organizado y corresponde al
mundo de los filósofos.
Apartándonos del aspecto
filosófico, podemos definir ontología como una teoría
que explica cómo un individuo, grupo, lenguaje o ciencia entiende un
determinado dominio.
El desarrollo de sistemas basados en el conocimiento y de software en general,
normalmente se realiza en diferentes contextos, puntos de vista y suposiciones
acerca de su materia de estudio. Cada uno usa su propio vocabulario, y por
ello pueden tener diferentes conceptos con significados que, a veces, se solapan
y, pueden tener diferentes métodos y estructuras.
Por tanto, se crea problemas de
comunicación por falta de entendimiento compartido que limita la interoperabilidad
y, por tanto, el potencial de reutilizar y compartir información.
Interoperabilidad es la capacidad de un sistema para compartir e intercambiar
informaciones y aplicaciones. De acuerdo con Sheth (1999), la nueva generación
de sistemas de información (SI) deberá ser capaz de resolver
la interoperabilidad semántica, en la cual un hecho puede ser más
que una descripción, para poder hacer un buen uso de las informaciones
disponibles como la llegada de Internet y la computación distribuida.
Estos sistemas deberán ser
capaces de entender:
· El modelo de un usuario de cualquier parte del mundo y sus significados.
· Los modelos procedentes de otras fuentes de información.
Sheth (1999) acredita que el uso de mediadores es la solución para
comunicar usuarios y estas fuentes de información.
La forma de resolverlo consiste
en crear un entendimiento compartido, como son las ontologías, que
unifican los diferentes puntos de vista y sirven para:
· Entender cómo diferentes sistemas comparten informaciones.
· Descubrir ciertas distorsiones presentes en los procesos cognitivos
de aprendizaje en un mismo contexto.
· Formar patrones para el desarrollo de SI.
Dicho lo cual, el uso de ontologías en el desarrollo de Sistemas de
Información (SI) permite establecer correspondencia y relaciones entre
los diferentes dominios de entidades de información.
Frank (1997) acredita que el uso
de ontologías en el desarrollo de sistemas contribuye en una mejora
en la calidad del producto final, ya que ellas pueden ayudar a evitar problemas
como:
· Inconsistencia entre ontologías implícitas en SI.
· Conflictos entre conceptos ontológicos e implementaciones.
· Conflictos entre ontología de sentido común y conceptos
básicos no incluidos en el software.
Una posibilidad a tener en cuenta
es tener un modelo de conocimiento, haciendo una analogía con un modelo
de datos. Un modelo de datos describe la estructura lógica de los datos
y su aplicación. Uno de los trabajos seminales fue el modelo entidad
- relación.
El modelo es una descripción esquemática de las instancias del
modelo. Estas instancias representan los datos que son usados por la aplicación.
Se han hecho muchas extensiones del modelo entidad - relación para
tratar de capturar el significado de los datos (la parte semántica).
Una extensión común es usar jerarquías de subclases.
Algunas de sus limitaciones son:
· El modelo de datos toma un solo punto de vista del mundo. Describe
los objetos o instancias de interés, pero bajo una sola posible interpretación.
Si se quiere reutilizar algún término, se hace evidente que
el término puede tener diferentes interpretaciones dependientes del
contexto.
La reutilización de conocimiento
complejo es imposible sin tomar en cuenta los diferentes puntos de vista.
Algo de esto existe en bases de
datos pero toda la información tiene que estar presente: los puntos
de vista no añaden información por lo que la visión global
es limitada.
· Por otro lado, existen desarrollos en modelo de datos orientados
a objetos. Sin embargo, la representación de relaciones entre objetos
sigue siendo pobre. La jerarquía y herencia basada en la relación
IS-A es sólo una de las posibles relaciones que pueden existir.
Se puede observar, por tanto, que
existe una frontera difusa entre:
· Conocimiento e información
· Ontologías y modelos de datos
Finalmente, una ontología se puede ver como un modelo de datos de conocimiento.
volver al sumario
2.- CARACTERÍSTICAS
Una ontología especifica
una forma de ver el mundo. Por lo cual cada ontología incorpora un
punto de vista. Una ontología pues, contiene definiciones que proveen
del vocabulario para referirse a un dominio y éstas dependen del lenguaje
que se usa para describirlas.
En consecuencia, se pueden señalar
algunas de sus características típicas:
· Pueden existir ontologías múltiples:
El propósito de una ontología es hacer explícito algún
punto de vista. Por ello, a veces, se necesita combinar dos o más ontologías.
Cada una de ellas introduce conceptualizaciones específicas.
· Se puede identificar niveles de abstracción de las ontologías:
Estos niveles de generalización
proporcionan una topología de ontologías. La idea es caracterizar
una red de ontologías usando multiplicidad y abstracción. Como
no se puede aspirar a tener una descripción completa del mundo, se
puede pensar en una estrategia de construcción gradual de abajo hacia
arriba.
· Multiplicidad de la representación:
Un concepto puede ser representado
de muchas formas por lo que pueden coexistir múltiples representaciones
de un mismo concepto.
· Mapeo de ontologías:
Permite crear relaciones entre los elementos de una o más ontologías
para establecer conexiones, especializaciones, generalizaciones, etc.
volver al sumario
3.- CLASIFICACIÓN
Guarino (1997) clasifica las ontologías de acuerdo con su dependencia
y relación con una tarea específica desde un punto de vista:
· Ontologías de Alto Nivel o Genéricas: Describen conceptos
más generales. En relación con los SI, estas ontologías
describirían conceptos básicos. Por ejemplo: una teoría
describiría partes y todos, y sus relaciones con la topología.
.Ontologías de Dominio: Describen un vocabulario relacionado con un
dominio genérico. Por
ejemplo, podría ser una descripción de datos y entidades relacionados
con la sensorización remota con un ambiente urbano.
· Ontologías de Tareas o de Técnicas básicas:
Describen una tarea, actividad o artefacto. Por
ejemplo la evaluación de la contaminación sonora en ambientes
urbanos o la descripción de características generales de componentes,
procesos o funciones.
· Ontologías de Aplicación: Describen conceptos que dependen
tanto de un dominio específico como de una tarea específica
y, generalmente son una especialización de ambas. Federico Fonseca
et al. (2000) proponen que este tipo de ontologías nazcan a partir
de una combinación de ontologías de niveles superiores. Ellas
representan las necesidades de los usuarios relacionados con una aplicación
específica como, por ejemplo, una evaluación de disponibilidad
de camarones en la costa de Espíritu Santo (Brasil).
Otra clasificación es la propuesta por Van Heist:
· Ontologías terminológicas:Especifican los términos
que son usados para representar el conocimiento en el universo del discurso.
Suelen ser usadas para unificar vocabulario en un campo determinado.
· Ontologías de información:Especifican la estructura
de almacenamiento de bases de datos. Ofrecen un marco para el almacenamiento
estandarizado de información.
· Ontologías de modelado de conocimiento:Especifican conceptualizaciones
del conocimiento. Contienen una rica estructura interna y suelen estar ajustadas
al uso particular del conocimiento que describen.
volver al sumario
4.- USO
El uso de las ontologías puede aplicarse a:
1. Comunicación: En modelos normativos, crea la semántica de
un sistema y el modelo para extenderlo y transformarlo entre diferentes contextos.
2. Interoperabilidad: usa ontologías como una inter-lengua.
3. Ingeniería de sistemas
El uso de ontologías explícitas en el desarrollo y uso de sistemas
de información lleva a los que son llamados Sistemas de Información
basados en ontologías (Guarino, 1998). En la propuesta de Fonseca et
al. (2000) de un SI basado en ontologías, las ontologías son
representadas en una estructura formal basada en Rodríguez (2000),
que describe ontologías a través de sus componentes: partes,
funciones y atributos.
En Cranefield (1999) puede ser encontrada una discusión completa sobre las formas de almacenamiento de ontologías de acuerdo con el uso pretendido. Las ontologías son organizadas en una estructura jerárquica ya que ésta es considerada como una de las mejores formas de representar el conocimiento. El mapeamiento de las entidades en las ontologías para componentes de software es realizado usando técnicas de orientación a objetos de herencia múltiple. Este tipo de mapeamiento permite la integración parcial de informaciones cuando una integración completa es posible. Este sistema permite la unión o el reaprovechamiento de clases ya desarrolladas, incorporando, así mismo, unos nuevos sistemas, o un conocimiento existente entre otros SI.
volver al sumario
5.- DISEÑO Y CONSTRUCCIÓN
La construcción de ontologías no responde a una única
aproximación lógica sino que depende, en gran manera, del contexto
en el que se construyen. Además hay que tener en cuenta que una ontología
especifica una conceptualización, una forma de ver el mundo. Por lo
cual cada ontología incorpora un punto de vista. Una ontología
pues, contiene definiciones que se proveen del vocabulario para referirse
a un dominio y éstas dependen del lenguaje que se usa para describirlas.
Algunas cuestiones sobre el diseño:
· Claridad: una ontología debe de poder comunicar de manera
efectiva el significado de sus términos. Las definiciones deben ser
objetivas y comentadas en lenguaje natural.
· Coherencia: debe permitir hacer inferencias que sean consistentes
con las definiciones.
· Extendible: debe anticipar usos y permitir extensiones y especializaciones
monotónicas.
· Sesgo de codificación mínimo (Minimal encoding bias):
debe especificar al nivel de conocimiento sin depender de una codificación
particular al nivel de símbolo.
· Mínimo compromiso ontológico: debe hacer la menor cantidad
posible de "pretensiones" acerca del mundo modelado.
Una posible estructura para la
construcción de una ontología.
1.- Identificación del propósito y alcance (usuarios potenciales).
2.- Captura:
· Identificación de los conceptos y relaciones claves en el
dominio de interés.
· Producción de definiciones no ambigüas de conceptos y
de sus relaciones.
· Identificación de términos para referirse a estos conceptos
y relaciones.
2.1.- Codificación: representación explícita de la conceptualización
en un lenguaje formal:
· Términos básicos de especificación (a veces
llamado metaontología).
· Lenguaje de representación adecuado.
· Codificación de este lenguaje.
· Integración de ontologías existentes: cómo,
cúales y si se va a usar alguna ontología existente.
3.- Evaluación:
Se considera que la ontología construida va a ser reutilizada por lo
tanto debe seguir unos principios básicos:
· Abstracción: lo más abstracto posible pero suficientemente
concreto.
· Modularización: permite aislar conceptos.
· Jerarquización: debe seguir un orden.
· Estandarización.
4.- Documentación:
Debe de hacerse de forma paralela a los puntos anteriores y debe de contener
esta clase de puntos:
· Tener el tipo de mapeo en que se basa la nueva teoría.
· Contener diferencias semánticas con las ontologías
seleccionadas.
· Justificación de las decisiones tomadas.
· Evaluación.
· Conocimiento adicional para usarla, etc.
Además la ontología construida debe ser indexada y ordenada
con las ontologías existentes para su posterior reutilización.
volver al sumario
B. EL PAPEL DE LAS ONTOLOGÍAS: ALGUNAS APLICACIONES
En Documentación se puede considerar de especial interés la
aplicación, por un lado, de ontologías terminológicas
que unificarían la terminología de cada concepto y las relaciones
entre ellos; y por otro, las ontologías de información que unificarían
las estructuras de almacenamiento de forma que pudieran ser reutilizadas por
varias aplicaciones informáticas que utilizasen la misma fuente de
información.
Según Tramuyas (1999) las
ontologías pueden desempeñar varios papeles o roles bajo el
concepto unificador de "knowledge sharing" (Gruber, 1993):
· Repositorios para la organización de conocimientos e información,
tanto de tipo corporativo como científico.
· Herramienta para la adquisición de información, en
situaciones en la que un equipo de trabajo la utiliza como soporte común
para la organización del dominio.
· Herramienta de referencia en la construcción de sistemas basados
en el conocimiento, ya que la utilización consistente de los términos
que supone es básica en la ingeniería del conocimiento.
· Para permitir la reutilización del conocimiento ya existente,
en la creación de nuevas aplicaciones.
· Como base para la construcción de lenguajes de representación
del conocimiento, acompañada de la formalización del cálculo
que tenga lugar entre los términos.
El conocimiento documental tradicionalmente
ha sido organizado utilizando mecanismos básicos de clasificación
jerárquica de Dewey (o la CDU) y los encabezamientos de materia (clasificación
asociativa) sobre los que también se han establecido un gran número
de acuerdos. Actualmente, más orientado a la recuperación, se
utilizan descriptores de un lenguaje controlado con el soporte de un tesauro.
Dichos modos de almacenamiento y recuperación de información
han jugado un papel fundamental en el uso generalizado y estandarizado de
sistemas documentales permitiendo a los documentalistas tener unos modelos
comunes y aceptados en la descripción y almacenamiento de información.
En los tesauros los descriptores
se enlazan mediante tres tipos principales de relaciones muy simples formando
un árbol taxonómico del sistema de información. Estas
relaciones se utilizan para la recuperación y para también tener
una idea general del contenido de la base o navegar a través de los
mismos descriptores.
La construcción de ontologías lleva implícito que cada
término y cada relación entre términos se defina formalmente.
Los conceptos se describen explícitamente para entender su significado,
mediante acuerdos ontológicos. Con ello un usuario que desee reutilizar
una ontología desarrollada por otros, puede conseguir la información
de todos los conceptos que soporta, su taxonomía y los axiomas. A diferencia
de los tesauros, las ontologías poseen una mayor variedad de relaciones
entre conceptos. Estas relaciones se crean a propósito del modelo conceptual
existente en el dominio que se está formalizando.
De igual forma, el conocimiento
almacenado en un sistema documental se puede organizar definiendo cada concepto
como, por ejemplo: Revista, Artículo, Libro, Autor, etc. También
se puede organizar las relaciones que existen entre un consenso tanto en el
significado de cada término, como en una unificación formal
de almacenamiento de esa información. Las ontologías se construyen
siguiendo esta filosofía, por lo que pueden ser reutilizadas en diferentes
dominios y con diferentes fines. Poniendo axiomas del tipo: si A es coautor
de B y sabes que B ha escrito el libro L1 y L2, se sabe que A ha escrito alguno
de estos dos libros, es decir, se puede deducir conocimientos que no están
explícitos en la ontología.
Aplicaciones. Uso de Ontologízas
para la indización, recuperación y divulgación de la
información web:
Agentes inteligentes para encontrar páginas especializadas en la Web:
El agente debe ser capaz de identificar una página dada que pertenece
a una materia o un dominio específico tratado. Ejemplos de dominios
con los cuales se trabaja son: llamadas de trabajo para eventos científicos
(call for papers), páginas como listas de publicaciones, páginas
de universidades, etc. El agente ejecuta una meta-búsqueda en las bases
de índices de varios mecanismos de búsqueda y, seguidamente,
clasifica las páginas recuperadas, utilizando las ontologías
de clases que las indexará por palabras clave. Son también utilizadas
las reglas que describen las características específicas de
las páginas de este dominio. Por ejemplo: detalles de estructura e
información de la página.
Herramientas para mejorar la eficacia
de búsquedas en la Web: Consiste en el desarrollo de un diseño
de frames (framework) para la construcción y manipulación de
ontologías que representan dinámicamente una estructura semántica
de Bases de Índices del mecanismo de búsqueda asociado. Un usuario
selecciona un tema en el que se inserta su búsqueda (o contexto de
búsqueda) a partir de una ontología ofrecida por la herramienta.
Este trabajo está relacionado con el proyecto BRight (BRazilian Internet
Guide in Hypertext) que evoluciona hacia un mecanismo de búsqueda RADIX.
Agentes inteligentes Notificadores: Avisan a los usuarios de Bases de Datos
de gran magnitud sobre inclusiones/alteraciones de datos acerca de temas de
interés de cada usuario. Los temas deben ser previamente seleccionados
por el usuario. El prototipo inicial utiliza el Banco de Datos del CNCT (Cadastro
Nacional de Competência em Ciência e Tecnologia) como base para
pruebas. Los usuarios registrados para recibir informaciones sobre las actualizaciones
del banco antes citado, necesariamente, deben estar registrados en el CNCT.
En un principio, cualquier interesado puede recibir informaciones sobre este
banco.
volver al sumario
Como nota final no queremos más que enumerar algunas de las ventajas
que supone el uso de las ontologías sobre todo en el ámbito
de la Documentación:
1. El uso de ontologías en lugar de bases de conocimiento particulares
puede optimizar la aplicación de sistemas basados en conocimiento,
su desarrollo e interoperabilidad.
2. Preservación del conocimiento perecedero de los expertos en cualquier
campo de aplicación.
3. La descripción de los conceptos y sus relaciones pueden ser empleadas
de forma más general que los actuales tesauros de manera que se pueden
establecer un mayor número de relaciones distintas, y tener definidas
cada una de ellas.
4. La problemática de la indización, recuperación y divulgación
de la información depositada en Internet u otros repositorios se aborda
desde la perspectiva de la construcción de ontologías. Estas
podrán permitir una gestión rápida, eficaz, pertinaz
y permanentemente actualizada de las necesidades a cubrir.
5. Al ser las ontologías un nuevo tipo de documento, se debe estudiar
su almacenamiento y recuperación para la satisfacción de las
necesidades que se puedan plantear.
volver al sumario
BIBLIOGRAFÍA
FONSECA, Frederico; EGENHOFER, Max. "Ontology-Driven Geographic Information
Systems" en C.B. MEDEIROS, 7th. ACM Simposium on Advances in Geographic
Information Systems. Kansas City, 1999. P. 14-19
· FONSECA, Frederico; EGENHOFER, Max; BORGES, Karla A. V. "Ontologias
e Interoperabilidade Semântica entre SIGs" en GeoInfo 2000. II
Workshop Brasileiro de GeoInformática. Brasil, 2000 http://www.spatial.maine.edu/~max/RJ40.html
(consultado el 28-11-2000)
· FRANKLIN, S. Y GRAESSER, R., "It is an Agent, or just a Program?
: A Taxonomy for Autonomous Agents". En Third International Workshop
on Agent Theories, Arquitectures, and Languages. Springer-Verlag, 1996, p.193-206
· HERMANS, B. Intelligent Software Agents on the Internet: An Inventory
of Currently Offered Funcionality in the Information Society and a Prediction
of (Near) Future Developments. Tilburg: Tilburg University, 1996. http://www.hermans.org/agents/index.html
(consultado 24-1-2001)
· LUKE, S., SPECTOR, L. Y RAGER, D. "Ontology-Based Knowledge
Discovery on the World-Wide Web". En Proceedings of the Workshop on Internet-based
Information Systems, AAAI-96, 1996. http://www.cs.umd.edu/projects/plus/SHOE/aaai-paper.html
(consultado 24-1-2001)
· GRUBER, T. R. "Toward Principles for the Design of Ontologies
Used for Knowledge Sharing" en International Journal of Human and Computer
Studies, 43 (5-6), 1995, p.907-928
· GRUBER, T. R. "What is an Ontology?" http://www-ksl.stanford.edu/kst/what-is-an-ontology.html
(consultado el 15-12-2001)
· GUARINO, N. "Understanding, Building, and Using Ontologies"
en Kwnoledge Acquisition Workshop 1996. http://ksi.cpsc.ucalgary.ca/KAW/KAW96/guarino.html
(consultado el 15-12-1998)
· GUARINO, N. "Formal Ontology, Conceptual Analysis and Kwoledge
Representation" en International Journal of Human and Computer Studies,
43(5-6), 1995, p. 625-640
· GUERRERO BOTE, Vicente; LOZANO TELLO, Adolfo."Vínculos
entre las Ontologías y la Biblioteconomía y Documentación"
en La Representación y la Organización del Conocimiento en sus
distintas perspectivas: su influencia en la Recuperación de la Información
: Actas del IV Congreso ISKO-España EOCONSID'99 22-24 de abril de 1999
Granada. Granada: ISKO; Universidad de Granada. Facultad de Biblioteconomía
y Documentación, 1999, p. 25-31
· MEDEIROS SANTI, Sergio; HEUSER, Carlos Alberto. "Uma Arquitetura
para Integraçâo Semântica de Fontes Heterogêneas
de Informação Semi-Estructurada Baseada em Ontologias"
en http://www.inf.ufrgs.br/pos/SemanaAcademica/Semana2000/SergioSanti/ (consultado
el 30-11-2000)
· MORALES, Eduardo; SUCAR, Enrique. "Representación de
Conocimiento" en http://w3.mor.itesm.mx/~ rdec/ (consultado el 5-12-2000)
· DIAS, M.C.P.; QUENTAL, V.S.T.D.B.; OLIVEIRA, D.A.S. "Ontologias
de Domínio e Base Lexical" en http://www.inf.puc-rio.br/~linx/parte32.htm
(consultado el 28-11-2000)
· Ontologías. http://www.ontology.org/ (consultado el 28-11-2000)
· TRAMUYAS, Jesús. "Agentes y ontologías para el
tratamiento de la información: clasificación y recuperación
en Internet" en La Representación y la Organización del
Conocimiento en sus distintas perspectivas: su influencia en la Recuperación
de la Información : Actas del IV Congreso ISKO-España EOCONSID'99
22-24 de abril de 1999 Granada. Granada: ISKO; Universidad de Granada. Facultad
de Biblioteconomía y Documentación, 1999, p.247-252
· VAN HEIJST, G., SCHEREIBER, A.T. Y WIELINGA, B.J. "Using Explicit
Ontologies in KBS Development" en International Journal of Human and
Computer Studies, 1996
· http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-18
(consultado 5-12-2000)
volver al sumario