ARTíCULO ORIGINAL

 

Modelo de sistema de organización del conocimiento basado en ontologías

 

Model of a knowledge organization system based on ontologies

 

Modelo de sistema de organização do conhecimento baseado en ontologias

 

 

Anisleiby Fernández Hernández,I María José López Huertas,II Yusnerkis Prevot UrgellésI

I Universidad de las Ciencias Informáticas. La Habana, Cuba.
II Universidad de Granada. España.

 

 

 


RESUMEN

El presente trabajo tiene como objetivo proponer un modelo para el diseño y construcción de un sistema de organización del conocimiento basado en ontologías. Se propone, a través del uso de métodos descriptivos y criterios de otros autores, un modelo a partir del cual se puede obtener un sistema de información basado en ontologías. Se muestra y se explica la relación entre cada una de las partes del modelo, y se demuestran sus propiedades holísticas. Se plantean los resultados obtenidos de la evaluación del modelo para su validación a través del criterio de expertos. Todos los pasos establecidos a través del modelo resultaron importantes. La mayoría de los encuestados estuvieron a favor y en ningún caso se consideró que los pasos eran poco importantes o no importantes. Con la aplicación del modelo se espera estructurar las bases de un dominio del conocimiento en específico, tras una progresiva sustitución de los modelos convencionales del proceso de recuperación de la información por un modelo cognitivo.

Palabras clave: sistemas de organización del conocimiento, ontologías, modelos de organización del conocimiento.


ABSTRACT

The study is aimed at proposing a model for the design and construction of a knowledge organization system based on ontologies. Descriptive methods and criteria provided by other authors were used to devise and propose a model to obtain an information system based on ontologies. It is expected that the bases of a specific knowledge domain may be structured with the application of this method, following gradual replacement of conventional information retrieval models by a cognitive model. A discussion is also provided about the relationship between the various parts of the model, showing its holistic properties. The results obtained from evaluation of the model are presented for consideration by experts. All the steps established by the model were important. Most respondents were in favor and none considered that the steps were not very important or not important at all.

Key words
: knowledge organization systems, ontologies, knowledge organization models.


RESUMO

O presente trabalho tem como objetivo propor um modelo para o desenho e construção dum sistema de organização do conhecimento baseado em ontologias. Propõe-se, a través do uso de métodos descriptivos e critérios de outros autores, um modelo a partir do qual se pode obter um sistema de informação baseado em ontologias. Com a aplicação do modelo se espera estruturar as bases de um domínio do conhecimento em específico, trás uma progressiva substituição dos modelos convencionais do processo de recuperação da informação, por um modelo cognitivo. Também se mostra e se explica a relação entre cada uma das partes do modelo, e são demonstradas suas propriedades holísticas. São colocados os resultados obtidos da avaliação do modelo para sua validação a través do critério de expertos. Todos os passos estabelecidos mediante o modelo resultaram importantes. A maioria dos sondados estiveram a favor em caso nenhum foi considerado que os passos eram pouco importantes ou não importantes.

Palavras chave: sistemas de organização do conhecimento, ontologias, modelos de organização do conhecimento.



 

INTRODUCCIÓN

El surgimiento del paradigma sociocognitivo introduce la necesidad de apostar por las determinaciones sociales y culturales en cualquier propuesta conceptual en el terreno informacional. Esto provocó un interés creciente, alrededor de los años 90, en puntos de vista sociales e interpretativos de la Organización del Conocimiento (OC); se desarrollaron enfoques semióticos y crítico-hermenéuticos, como el análisis de discurso, los estudios de género, y el análisis de dominio.1 Hjørland y Albrechtsen2 formularon un enfoque de manera particular para la OC. Se basaron en una teoría explícita del conocimiento,1 la cual plantea como su principio fundamental que la mejor manera para entender la información en la Ciencia de la Información es a través del estudio de los dominios de conocimiento, como comunidades discursivas, las cuales son parte de la división social del trabajo.

La OC es un campo amplio e interdisciplinar, mucho más extenso que la Biblioteconomía y la Documentación.3 No obstante, otros autores se refieren a la OC como una especialidad dentro de la Bibliotecología y la Ciencia de la Información, conocida como la ciencia de estructurar y organizar sistemáticamente las unidades de conocimiento (conceptos), de acuerdo con sus propios elementos de conocimiento (características) y la aplicación de conceptos y clases de conceptos ordenados por este campo, para la asignación de los contenidos válidos de conocimiento de referentes (objetos/sujetos) de todo tipo.4 Esto implica la existencia de un sistema utilizado para recuperar y transmitir el conocimiento. Los sistemas de organización del conocimiento son propuestas para la recuperación de dicha organización y representación del conocimiento en un área especializada o propósito.5

Recientemente se ha demostrado que la OC tiene también un papel importante en la gestión del conocimiento de organizaciones y empresas.6 La organización y la representación del conocimiento, en esencia, son vías de importante relevancia en el proceso de identificación de los elementos abstractos y cognitivos del pensamiento humano, acerca del mundo que lo rodea y de los saberes que constituyen el pilar de conocimiento de su entorno o ambiente. Permite mapearlos por medio de diversas técnicas. Por tanto, estas ventajas hacen que la organización y representación del conocimiento juegue un papel importante tanto para una organización como para la sociedad en general.6

El enfoque tradicional de los sistemas de organización de conocimientos como vehículos para organizar y representar el conocimiento establece los cimientos en la estructuración disciplinaria de los saberes. La disciplinariedad es un elemento clave para los sistemas de organización de conocimientos. Ellos se estructuran básicamente de acuerdo con las disciplinas.7,8 Por lo general, los sistemas de organización de conocimientos se enmarcan en espacios disciplinarios específicos o con un enfoque universalista; se adscriben al esquema disciplinar establecido por la ciencia.8

El uso de la expresión sistema de organización del conocimiento está actualmente consolidado en la literatura. Esta designación es mucho más ajustada a las funciones que desempeña, lo que anteriormente se llamaba lenguajes documentales. Los sistemas de organización del conocimiento tienen ciertamente una parte terminológica, pero incluyen otras características; la más importante es la propuesta de organización del conocimiento, la que no alude la expresión lenguajes documentales. Son sistemas formados por distintos elementos, entre los que está el terminológico. Por eso, la nueva expresión ha tenido una acogida tan favorable entre los especialistas. Por supuesto, que sus funciones principales son la representación de contenidos documentales relevantes y la posterior recuperación de estos, cosa que comparte en gran medida con cualquier otro sistema que se diseñe para la recuperación de la información.

Los métodos de OC estuvieron basados, en un principio, en modelos propuestos por teóricos que a menudo compartían esta condición con la de ser bibliotecarios, para pasar después a generar sistemas con un fundamento teórico inspirado en modelos generales, como los propuestos por la corriente sociocognitiva, o la de análisis del dominio, entre otras. Algunos ejemplos de sistemas de organización del conocimiento son: vocabularios controlados, esquemas de clasificación, taxonomías, tesauros y ontologías. Estas tres últimas, especialmente las ontologías, pueden tener otras funciones además de la recuperación de la información, pero responden al mismo concepto y, como tal, se incluyen dentro de dichos sistemas.

Este artículo se realiza en el marco del desarrollo de una tesis de doctorado titulado "Modelo ontológico de recuperación de información como apoyo a la toma de decisiones en gestión de proyectos". El modelo constituye uno de sus resultados. El estudio presentado en este artículo es de naturaleza exploratoria-descriptiva. Su metodología se apoya en las revisiones bibliográficas realizadas. Para esto, se ha seguido el criterio de autores que han incursionado desde hace ya varios años en estas temáticas y en la experiencia adquirida por los autores en el proceso de investigación.Los resultados de este estudio se muestran a través de la aplicación del modelo al dominio del conocimiento Gestión de Proyectos y su validación a través del criterio de expertos.

LOS SISTEMAS DE ORGANIZACIÓN DEL CONOCIMIENTO Y LAS ONTOLOGÍAS

La complejidad inherente al proceso de representación y OC es evidente, entre otras cosas porque actualmente se ha producido un cambio en la forma de producir conocimiento. Muchos autores han descrito las tendencias actuales en sus investigaciones sobre elementos implicados en la OC. Estos se han centrado en los sistemas universales, las equivalencias e interoperabilidad entre vocabularios, los problemas de sesgo, Internet y los motores de búsqueda, la exploración de recursos, tesauros, los sistemas de organización del conocimiento orientados a dominios y la representación visual, los cuales constituyen una significativa base para el desarrollo de este campo.3-8-12

Según Ramírez,13 existen trabajos recientes con propuestas para representar y organizar el conocimiento, tanto desde una perspectiva universal como desde una aproximación contextual; entre los más destacados están las aproximaciones siguientes:

Siguiendo a Ramírez, entre los diferentes tipos de sistemas de organización del conocimiento están las ontologías. Barité15 ve a las ontologías como diseños de estructuras funcionales. Estos diseños contienen entidades o elementos que se relacionan entre sí, para llevar a efecto determinados propósitos o para cumplir con ciertos objetivos, en un entorno habitualmente electrónico. Son funcionales porque no pretenden representar un segmento del conocimiento o un área de actividad, sino desplegar una red de asuntos o acciones con sus relaciones, y volver explícitos los circuitos que en su conjunto configuran un dominio. Más que una estructura de conocimiento, una ontología es ante todo un sistema relacional de acciones que persigue tanto una gestión corporativa de calidad como la satisfacción plena del usuario. Mientras sigue siendo un área fecunda de investigación en el campo de la filosofía, la ontología es actualmente materia de investigación, desarrollo y aplicación en disciplinas relacionadas con la computación, la información y el conocimiento.

Es imposible representar el mundo real, o alguna parte de él, con todos los detalles. Para reproducir algún fenómeno o parte del mundo, llamado dominio, es necesario focalizar o limitar el número de conceptos que sean suficientes y relevantes para crear una abstracción del fenómeno.16 Así, el aspecto central de cualquier actividad de modelización consiste en realizar una conceptualización; o sea, identificar los conceptos (objetos, eventos, comportamientos, etc.) y las relaciones conceptuales que se asume que existen y son relevantes. Es decir, independientemente del ámbito en que se desarrollen, la base para una ontología es la conceptualización, la cual constituye un vocabulario controlado al referirse a las entidades de un dominio particular. Por tanto, uno de los usos de las ontologías es para especificar y comunicar el conocimiento de un área del conocimiento, de manera genérica, que son muy útiles para estructurar y definir el significado de los términos.

Las ontologías, para representar el conocimiento, precisan los siguientes componentes:17 conceptos, relaciones, funciones, instancias y axiomas. Retomando la definición de Gruber,17 si se logra especificar los componentes y sus relaciones de un ámbito del conocimiento siguiendo un formalismo estricto codificado en un lenguaje informático (no de programación, sino de descripción), entonces es una ontología. Además, debe ser capaz de soportar pruebas lógicas; por ejemplo, si se define que un individuo X pertenece a la clase B, la cual, a su vez, es miembro de la clase A, se puede inferir que todo miembro de B es un miembro de A y que por tanto X es un A. La insuficiencia consiste, según Codina y Pedraza,18 en que una ontología por sí sola en principio no tiene sentido si no hay un sistema complementario que permita realizar inferencias sobre esta para, por ejemplo, facilitar búsquedas en lenguaje natural.

Para diseñar una ontología, es necesario considerar algunas de las características deseables que estas deberían exhibir. Según criterios de los autores Ramos y Núñez,19 los principios de diseño a considerar son los siguientes:

 En un sistema a partir de una ontología, la parte declarativa y procedimental se convierte en una base de conocimiento y en un motor de inferencias, respectivamente. Se obtiene de esta manera un sistema basado en conocimiento (SBC).

MODELADO DE LOS SISTEMAS DE ORGANIZACIÓN DEL CONOCIMIENTO

El modelo naturalista (análisis de dominio) se centra en formulaciones declaradas inicialmente por Hjørland y Albrechtsen2 en la década del 90 del pasado siglo. A su vez, estos postulados son modelizaciones conceptuales en constante movimiento.20 Según López-Huertas, el dominio temático como modelo y referente, para el diseño y elaboración de estructuras de conocimiento, es un proceder importante para el desarrollo de sistemas de representación de la información individuales. Permite analizar y estructurar los dominios de forma independiente.5 

Es por eso que es imposible tratar todos los dominios con los mismos criterios estructurantes. Desde las Ciencias de la Información se considera preponderante el tratamiento de las comunidades de discurso como herramienta diferenciadora. Esto hace que se considere el conocimiento del dominio en cuestión como unidad de análisis para la representación y la organización del conocimiento. Esta aseveración viene a mostrar diversas divisiones del análisis de dominio, las cuales tienen diversas formas como: ontológicas, epistemológicas y sociales.20

Las teorías ontológicas que se desarrollan dentro del análisis de dominio facilitan el conocimiento del mundo y sus objetos; además, describen la realidad y su estructura. Para López-Huertas5 el valor esencial de estas teorías está en su capacidad de reconocer la naturaleza de los fenómenos conocidos, independientemente de los medios utilizados para conocerlos. El principio ontológico constituye una forma intelectual de organización del conocimiento frente a la utilización de principios sociológicos para la organización del conocimiento. En su aplicación subyace una forma detallada del conocimiento. En su forma práctica, el conocimiento ontológico asume estructura de clasificaciones especializadas, tesauros y ontologías, herramientas útiles en el desarrollo de resúmenes. Todos estos productos se constituyen por conceptos centrales de un dominio determinado y sus relaciones semánticas correspondientes.5

El filósofo Chisholm21 propuso una ontología de sentido común crítico, que demanda un estándar riguroso de soporte para el conocimiento a adquirir. Sobre la base de esta postura epistemológica, Milton y Kazmierczak sostienen que la ontología de Chisholm puede ser utilizada (sin necesidad de adaptaciones) para el análisis ontológico de los lenguajes de modelación de datos. Estos autores propusieron un modelo que permite evaluar los lenguajes desde el punto de vista ontológico. Por lo tanto, se puede considerar que la ontología de Chisholm constituye en sí misma un modelo ontológico de Sistema de Información (SI).22-23

Por otra parte, Bunge24 es el autor de la ontología filosófica qué más influencia tuvo en los Sistemas de Información (SI). Esta ontología se basa en un realismo científico, el cual requiere una compresión teórica profunda y detallada de la realidad, propia de la ciencia contemporánea. La ontología de Bunge sostiene que el mundo está hecho de sistemas interconectados. Basados en esta postura epistemológica, Wand y Weber25 construyeron el modelo ontológico BWW (Bunge-Wand-Weber). Este es un modelo de descomposición de los SI. Es formal, libre de contenido, compuesto por: el modelo de representación, el modelo de transición de estados y el modelo de buena descomposición.

Estos modelos abstractos de los SI constituyen un importante soporte teórico para el proceso de modelación. Se utilizan para la evaluación de los lenguajes o técnicas de análisis y diseño de SI. En general, esta evaluación radica en que los lenguajes que cumplen con los aspectos considerados en los modelos ontológicos son más eficientes que aquellos que no los contemplan.22-23 En síntesis, se conjetura que la ontología de Chisholm21 es útil para la modelación de fenómenos que están relacionados a dominios de aplicación donde dominan los temas sociales o los humanos, por tratarse de una ontología de sentido común. Por el contrario, la ontología de Bunge se adaptaría mejor a ambientes de implementación o dominios de aplicación donde los aspectos humanos o sociales están ausentes.22 Por tanto, a partir de las ontologías filosóficas y los modelos ontológicos de los SI disponibles, se pueden crear o modificar lenguajes o técnicas de modelación de los SI.

Como se puede evidenciar, el uso de las ontologías en los SI permite establecer correspondencia y relaciones entre los diferentes dominios de entidades de información. Esto ha llevado a la noción de SI basados en ontología (SIBO), un concepto que, aunque en una fase preliminar de desarrollo, abre nuevas maneras de pensar sobre las ontologías y los SI en conjunción una con otra, y cubre las dimensiones estructurales, las dimensiones temporales de los SI e involucra tanto a los desarrolladores como a los usuarios de los SI.16

El presente trabajo tiene como objetivo fundamental proponer un modelo para el diseño y construcción de un sistema de organización del conocimiento basado en ontologías. Con la aplicación del modelo se espera estructurar las bases del conocimiento de un dominio del conocimiento en específico, tras una progresiva sustitución de los modelos convencionales del proceso de recuperación de la información, por un modelo cognitivo. Los servicios de ontologías ofrecerán un marco contextualmente rico y moderno para elaborar otros modelos de sistemas de recuperación de información, prestar servicios y gestionar la terminología del dominio en cuestión. El modelo permitirá, además, diseñar y construir un sistema de información basado en ontologías, a través del cual el usuario pueda obtener la información requerida para la toma de decisiones en su organización.

 

PROPUESTA DEL MODELO

El modelo que se propone a continuación se diseñó aplicándolo al dominio de Gestión de Proyectos. Es importante resaltar que los autores, para definir los criterios aquí expuestos, tomaron en consideración lo planteado por los autores Barchin,16 Guarino y Welty.36 El objetivo fundamental para proponer un modelo de OC en Gestión de Proyectos para diseñar un sistema de recuperación de información basado en ontologías como apoyo a la toma de decisiones, estuvo dado a partir de las necesidades de información referidas a la Gestión de Proyectos.

Los usuarios que son actores directos en el uso y aplicación de información referente a este campo de estudios se encuentran muchas veces frente a sistemas con información poco estructurada, carente de sentido y, por tanto, con dificultad para recuperarla. Esta situación provoca la pérdida considerable de recursos económicos y atrasos en proyectos con gran impacto social. Entre otras de las necesidades detectadas, también estuvo la falta de conocimiento en el control y seguimiento de proyectos, así como las debilidades de las herramientas para la toma de decisiones en la Gestión de Proyectos. Estas últimas fueron expresadas en carencias en las áreas de conocimiento e insuficiencias para el tratamiento de la incertidumbre de los datos y la ambigüedad en los conceptos, lo cual trajo consigo duplicidad y heterogeneidad de la información.

Lo anteriormente referido surgió a partir de una motivación, que partió de una necesidad de información del usuario o lo que es igual a un requerimiento de información, una pregunta o una consulta. Para esto el usuario necesitaba obtener información relevante, útil para la toma de decisiones.24-27 La disciplina de la recuperación de la información en este sentido cobra vital importancia, ya que a partir de ella se diseñan, construyen y se prueban los sistemas de recuperación de información. Trata, a su vez, con procesos tales como: representación, almacenamiento, organización y acceso a elementos de información. Que el sistema cuente con una ontología, permitirá ventajas especiales al usuario al insertar una consulta, ya que el sistema tratará entonces de insertar el conocimiento de las ontologías para enriquecer la expresión de la consulta y mejorar la probabilidad de obtener documentación relevante. Esta constituye la esencia de las ontologías en los sistemas de recuperación de información.25

La propuesta de este modelo basado en ontologías en Gestión de Proyectos permitirá el diseño y construcción de un sistema de información basado en ontologías, para la recuperación de la información como apoyo a la toma de decisiones en este dominio del conocimiento. Permitirá, en este caso, aprovechar las ventajas que ofrecen las ontologías, para especificar y comunicar el conocimiento del dominio de una manera genérica, además de ser muy útiles para estructurar y definir el significado de los términos. El modelo que se muestra en la figura 1 surgió del análisis de diferentes casos, a partir de un criterio sistémico, el cual permitió comprender la necesidad de la estructura del modelo.

PRINCIPIOS QUE SE HAN TENIDO EN CUENTA PARA EL MODELO

El modelo que se propone posee un carácter flexible, ya que es una propuesta genérica, válida para cualquier temática relacionada con los sistemas de recuperación de información basados en ontologías, lo que garantiza su singularidad, factibilidad y pertinencia. El enfoque holístico del modelo estuvo dado primeramente en la concepción acerca de este como un todo, como un proceso general que emerge a los componentes, pero que a la vez se retroalimenta de ellos. Presenta, además, un carácter sistémico. Se construyó sobre la base del método sistémico-estructural-funcional, el cual posibilita comprender la organización, la planificación y la ejecución del proceso de creación de un sistema de información basado en ontologías. Por tanto, el modelo representa en sí a un sistema. El modelo se enmarca sobre la base de la recolección del conocimiento del dominio a partir de la aplicación y combinación de varios métodos, técnicas y soporte en las Tecnologías de la Información y las Comunicaciones para la construcción del SIBO (Fig. 1).

 

El modelo está representado por capas siguiendo la pirámide informacional de datos, información y conocimiento. Está presente en todo el proceso la retroalimentación. Esto permite que los resultados obtenidos de una tarea o actividad sean reintroducidos nuevamente en el sistema con el fin de controlar y optimizar su comportamiento. Es importante destacar que para la definición de estos pasos se ha tenido en cuenta el criterio de otros autores, quienes en sus propuestas metodológicas para el diseño de ontologías coinciden, aunque en posiciones diferentes, en que estos son los pasos más importantes para obtener una ontología; ellos son: la metodología CYC,28 la metodología de Uschold y King,29 la metodología de Gruninger y Fox,30 la metodología Methontology,31 la ontología de Sensus,32  la metodología Terminae33 y, por último, Ontology Development 101.34

A continuación se describen cada una de ellas:

Metodología CYC

Metodología de Uschold y King

Metodología de Gruninger y Fox

El primer paso consiste en identificar intuitivamente las aplicaciones posibles en las que se usará la ontología. Luego se utiliza un conjunto de preguntas en lenguaje natural, llamadas cuestiones de competencia, para determinar el ámbito de la ontología. Se usan estas preguntas para extraer los conceptos principales, sus propiedades, relaciones y axiomas.

Metodología Methontology

Es una de las propuestas más completas, ya que toma la creación de ontologías como un proyecto informático. Así, además de las actividades propias de la generación de la ontología, esta metodología abarca actividades para la planificación del proyecto, la calidad del resultado, la documentación, etc. Además, permite construir ontologías totalmente nuevas o reutilizar otras ontologías. A continuación se muestran sus pasos:

Ontología de Sensus

Constituye un enfoque top-down para derivar ontologías específicas del dominio a partir de grandes ontologías. En esta metodología se identifican un conjunto de términos semilla que son relevantes en un dominio particular. Tales términos se enlazan manualmente a una ontología de amplia cobertura. Los usuarios seleccionan automáticamente los términos relevantes para describir el dominio y acotar la ontología Sensus. Consecuentemente, el algoritmo devuelve el conjunto de términos estructurados jerárquicamente para describir un dominio, que puede ser usado como esqueleto para la base de conocimiento.

Metodología Terminae

Se basa en un análisis lingüístico de los textos, el cual se realiza mediante la aplicación de diferentes herramientas para el procesamiento del lenguaje natural. En particular se usan dos herramientas:

1. Syntex para identificar términos y relaciones. 

2. Cameleon para identificar roles o relaciones.

La metodología funciona como sigue: mediante la aplicación de Syntex se obtiene una lista de posibles palabras y frases del texto y algunas dependencias sintácticas y gramaticales entre ellas. Estos datos se usan como entrada para el proceso de modelado junto con el texto original.

Ontology Development 101

Se desarrolla a partir de los pasos que siguen:

Como consecuencia del estudio realizado se llegó a una metodología ecléctica propia, que se detalla en los siguientes pasos:

- Análisis del dominio. Este paso surgió con la necesidad de comprender el dominio de Gestión de Proyectos para su posterior representación. Para el estudio y comprensión del dominio se deben identificar las fuentes sobre las cuales se obtendrá la información. En este sentido, se deben tener en cuenta los principales postulados existentes sobre el tema; los preceptos presentados en la guía práctica del PMBok (Project Management Body of knowledge), por ser un estándar internacional de buenas prácticas en la Gestión de Proyectos; CMMI (Capability Maturity Model Integration) u otros estándares que también se consideren importantes; los criterios de expertos, dígase gestores de proyectos, directivos, etc.;  los datos contenidos en bases de datos de gestión de proyectos, sistemas que respondan a la toma de decisiones. Todos ellos constituirán la red de conocimiento del dominio en cuestión.

- Extracción de datos. El conjunto de datos obtenidos debe ser organizado de manera tal que estos resulten útiles para la conceptualización del dominio como próximo paso. Aquí deben quedar representados todos los conceptos que describen y representen al dominio de la Gestión de Proyectos, lo que constituye su base terminológica.

- La formalización. Este paso debe realizarse a través del uso de una herramienta que facilite el trabajo de la conceptualización formal del dominio. Aquí quedarán representadas las clases definidas en la conceptualización, las propiedades, los axiomas y las instancias de la ontología. De esta manera queda descrito el proceso para la obtención de la ontología.

Luego que se obtiene la ontología debe crearse una interfaz de usuario, sobre la cual este pueda escribir sus consultas en lenguaje natural para la obtención de la información útil para la toma de decisiones. En este caso debe construirse un sistema de información basado en la ontología de dominio obtenida anteriormente, la cual facilite la recuperación de la información y que contenga una interfaz de usuario amigable para las consultas. Para la construcción del sistema se debe seleccionar una metodología de desarrollo de software. Dicha metodología debe ser seleccionada por el equipo de desarrollo de software.

ESTRUCTURA DEL MODELO

Para determinar los componentes del modelo se consideró la lógica general del proceso de construcción de sistemas basados en ontologías. Para esto se ha tenido en cuenta el contexto de la gestión de proyectos, desde una perspectiva que responda a las particularidades, objetivos y exigencias de este proceso. La estructura del modelo está integrada en cinco secciones que permiten de manera lógica expresar su contenido, o sea, las subestructuras o pasos que componen cada una de estas secciones. Ellos son: 

I. Análisis del dominio.

a) Preparación del escenario o detección de necesidades. En este paso se debe organizar un encuentro con los participantes que se tendrán en cuenta para desarrollar el proceso de construcción del sistema. Se debe presentar el proyecto, se explican los resultados que se obtendrán a partir de la propuesta del modelo y se identifican los requerimientos necesarios para la construcción del sistema basado en ontologías. Las actividades en las que intervienen los participantes tendrán que ver con su visión clara en la aplicabilidad del modelo. Se recogen sus criterios y consideraciones al respecto, su nivel de compromiso para lograr el diseño y la construcción del sistema basado en ontologías y la importancia que requiere la revisión de toda la información existente que pueda resultar útil para comprender el dominio de Gestión de Proyectos, lo que constituye el objetivo fundamental de la actividad a realizar. Los participantes podrán expresar sus opiniones sobre cómo consideran que debe ser el sistema que será desarrollado y ante qué interrogantes debe responder, entre otros elementos que consideren importantes.

 

b) Identificación, detección y recopilación de las fuentes de información.En este paso se identificarán las fuentes de información existentes que contengan información relevante para la comprensión del dominio, ya sean personas, fuentes institucionales, sistemas, herramientas, bases de datos etcétera.En este paso pueden realizarse las siguientes acciones:

 

- una selección de los documentos especializados, previamente identificados, de la documentación existente sobre la temática Gestión de Proyectos y extraer los elementos que aportan información temática para describir el dominio preliminarmente.

 

- por medio del método de análisis de expertos, provenientes de los participantes, se aplica un cuestionario para conocer el nivel de experticia con que cuentan los participantes.

 

- una entrevista estructurada con una guía de posibles preguntas al grupo de expertos identificados previamente, para conocer qué fuentes de información consideran relevantes dentro del campo y con cuáles cuentan como apoyo a la toma de decisiones en Gestión de Proyectos.

 

c) Aplicación de técnicas que describan el dominio. Una vez identificadas las fuentes de información se procederá a la aplicación de diversas técnicas que faciliten la obtención del dominio. Estas técnicas deben ser aplicadas al grupo de expertos previamente identificado. Pueden ser entrevistas, encuestas, reuniones, tormenta de ideas etcétera. El análisis del dominio es uno de los puntos más complejos a atender en la obtención de una ontología. Este proceso depende en gran medida del entendimiento, percepción que tenga cada individuo de representarse una realidad concreta y de los juicios personales del que esté desarrollando la actividad. Esto requiere la repetición del proceso cuantas veces sea considerado necesario, hasta obtener un resultado suficientemente depurado para realizar el proceso de conceptualización en la ontología, a partir del dominio identificado.

II. Extracción de datos recopilados.

La extracción de datos recopilados se refiere a la depuración o refinamiento de los resultados que se obtienen a partir de las técnicas aplicadas, mediante mecanismos de retroalimentación. En este caso se revisarán los resultados con los involucrados a partir de actividades interactivas para recoger sus opiniones definitivas sobre la concepción del dominio de gestión de proyectos.

a) Extracción del conocimiento explícito e implícito de las fuentes de información. La extracción de los datos obtenidos es donde se organizan todos los resultados a partir de las técnicas aplicadas, se obtienen mapas conceptuales o modelos abstractos del pensamiento o representación que tienen los involucrados del dominio.

b) Refinamiento de los elementos seleccionados como dominio representativo.Una vez alcanzados los resultados de los encuentros se procederá al refinamiento del dominio a partir de la aplicación de otras técnicas como es el caso de las encuestas, como proceso de refinamiento de los resultados alcanzados. 

III. Conceptualización o definición terminológica del dominio.

A medida que el desarrollo de la ontología avanza, es relevante categorizar todos y cada uno de los términos definidos como áreas o conceptos representativos del dominio. En la conceptualización deberán quedar definidas las clases o conceptos que se tendrán en cuenta para el diseño de la ontología; por eso se le llama a este paso definición terminográfica del dominio. Es uno de los pasos de mayor complejidad, ya que a partir de aquí se realizará todo el diseño posterior de la ontología:

a) Capturar los conceptos identificados y relaciones entre estos conceptos. En este paso se establece una relación de los conceptos identificados a partir de los resultados obtenidos en el análisis de dominio y la extracción de datos. Aquí es importante encontrar términos similares con el fin de agruparlos e ir eliminando la sinonimia, homonimia y polisemia entre conceptos.

 

b) Construcción de un glosario de términos con los conceptos identificados. El glosario de términos deberá incluir todos los términos relevantes del dominio (conceptos, instancias, atributos, relaciones entre conceptos, etc.). Sus descripciones serán en lenguaje natural y soportarán la creación de una taxonomía de conceptos.

c) Elaboración de diccionario de conceptos. En esta etapa se elaborará el diccionario en el cual son descritos los conceptos, las instancias/individuos, los atributos de las clases, los atributos de las instancias/individuos y relaciones.

d) Elaboración de la taxonomía o jerarquía terminográfica. Luego de obtener la relación de conceptos del dominio debe realizarse una taxonomía que establezca niveles de jerarquía entre los conceptos identificados.

 

e) Establecimiento de las relaciones de cardinalidad entre los conceptos. El objetivo de este diagrama es establecer las relaciones entre los conceptos de una o más taxonomías de conceptos. Para cada relación binaria se deberá especificar: nombre, conceptos fuente y destino, cardinalidad y relación inversa.

f) Descripción de reglas/axiomas y sus condicionantes. En este paso se deben considerar las reglas y axiomas definidos en el diccionario de conceptos. Para cada definición de axioma formal de debe especificar: nombre, descripción, expresión lógica que formalmente lo describe, los conceptos, atributos y relaciones binarias a las cuales el axioma hace referencia y las variables utilizadas. Para cada regla se debe especificar: nombre, descripción, expresión que formalmente la describe, los conceptos, los atributos y las relaciones a los que hace referencia, y las variables usadas en la expresión. Para la especificación de las reglas se sugiere la forma: Si <condiciones> entonces <consecuencias o acciones>.

 IV. Formalización.

Uno de los mayores inconvenientes a la hora de desarrollar una ontología es la selección del lenguaje de representación, el cual debe ser el más adecuado para el usuario final de la ontología. Para esto han sido desarrolladas herramientas como editores de ontologías en un determinado lenguaje. Estas herramientas proporcionan un núcleo de servicios relacionados con ontologías y se pueden extender fácilmente con otros módulos. En la etapa de formalización se selecciona la herramienta que contendrá o modelará cada uno de los elementos que se tuvieron en cuenta en el diseño de la estructura ontológica:

a) Selección de una herramienta para formalizar la ontología. En este paso el experto en ontologías o ingeniero ontológico establecerá la formalización del proceso a partir del uso de una herramienta que permita formalizar los resultados obtenidos de los procesos anteriores.

b) Representación de los conceptos, relaciones, instancias/individuos y reglas/axiomas identificados. A partir de la herramienta seleccionada en este paso quedan representados en la herramienta los conceptos, relaciones, instancias/individuos y reglas/axiomas identificados en el diccionario de conceptos.

e) Resultados de la ontología como base de conocimiento. En este paso serán presentadas las propuestas de ontologías obtenidos a partir de la herramienta seleccionada a través de la cual se pueda mostrar su validez.

V. Interfaz de usuario.

Un sistema de recuperación de información, en su forma más simple, puede verse como una "caja negra" que acepta inputs y produce outputs.34 Durante este proceso realiza actividades que incluyen: el reconocimiento de la estrategia de búsqueda planteada, la aplicación de diferentes algoritmos de recuperación y de ordenación de los resultados según su relevancia o utilidad probable para el usuario, la selección de items de información (documentos o su representación), etc. Intentan localizarlos y recuperarlos tan veloz y económicamente como sea posible, por lo que su valor depende de su capacidad para identificar rápida y correctamente la información útil, de su facilidad para rechazar los items extraños o irrelevantes y de la versatilidad de los métodos que emplea Salton.35 De esto trata la interfaz de usuario, la cual es la que permite realizar las consultas en tiempo real al SIBO.

Las ontologías presentan como limitantes la interfaz de usuario, ya que el usuario final que hará uso de la ontología como sistema de recuperación de información para la toma de decisiones, no tiene por qué conocer el lenguaje de consulta que contiene el editor de ontologías usado por el ingeniero ontológico para editar la ontología. En este caso, sería para un usuario más avanzado. Por estas razones, en el modelo se ha tenido en cuenta un paso para el diseño de la interfaz de usuario. El usuario final que hará uso de la información en este caso para la toma de decisiones en Gestión de Proyectos será un gestor de proyectos, un experto o cualquier otro miembro de la organización para la cual será desarrollado el sistema. Para esto se propone la implementación de un sistema de información basado en ontologías, a través del cual se pueda obtener una interfaz de usuario amigable que permita hacer consultas a la ontología en lenguaje natural:

a) Representación de la arquitectura del sistema. La representación de la arquitectura del sistema tendrá que ver con la descripción del funcionamiento interno de la ontología, vista como sistema de información. Los diseñadores de los SIBO frecuentemente se enfrentan a un conjunto de obstáculos. La ontología representa el conocimiento de un dominio, generalmente dinámico y cambiante. No solo deben lograr la integración y la interoperabilidad, sino también lograr que estos sean extensibles y adaptables a los dominios de aplicación.16 Por esta razón, los autores de esta investigación consideraron que debe existir un enlace entre la ontología y una base de datos de un sistema perteneciente al dominio representado que los conecte entre sí. Esto permitirá que la ontología se nutra de esos individuos que están en constante actualización, dar respuestas más actualizadas y agregar además contenido semántico a los datos del dominio representado en la base de datos. Atendiendo a los criterios de Barchini,16 las ontologías en los SIBO pueden verse de dos formas desde el punto de vista estructural: la ontología como parte de cada uno de los componentes estructurales y la ontología como un componente más del SI que coopera con los otros componentes para lograr los propósitos del sistema. En dependencia del criterio que se siga, se diseñará entonces la estructura interna del sistema. Dado que la ontología que se obtendrá no responderá directamente a las consultas del usuario en lenguaje natural, sino en el lenguaje que soporte la herramienta que se use para su diagramación y representación, se propone que se cree un nexo o conector entre la ontología y la interfaz de usuario.  En este caso los autores propusieron que se diseñe un traductor, que interfiera como programa de aplicación entre la ontología y el usuario del sistema. Este sistema de traducción interno llevará las consultas de lenguaje natural a lenguaje ontológico y viceversa. De esta manera, las ontologías soportan la comunicación con los usuarios, y representan explícitamente la comprensión que ellos tienen de la funcionalidad del sistema y de los datos.  Siguiendo esta postura a consideración de los autores, la arquitectura interna del sistema pudiera quedar representada como se muestra en la figura 2.



b) Selección de la metodología de desarrollo de software. En este paso el equipo de desarrollo del sistema selecciona la más adecuada a partir del estudio de las metodologías de software existentes. Deben quedar claramente evidenciadas y fundamentadas las ventajas que ofrece la metodología seleccionada.

c) Selección de las tecnologías para el desarrollo del Sistema. Al igual que en el paso anterior, el equipo de desarrollo del sistema deberá seleccionar las tecnologías adecuadas. Quedará fundamentado por qué se seleccionan estas tecnologías y no otras.

d) Diseño de la interfaz de usuario. En este paso se debe diseñar la interfaz de usuario que constituirá la sección de trabajo que le permitirá a este interactuar con el sistema. La interfaz de usuario deberá estar representada por un área destinada a introducir las prescripciones de búsquedas requeridas por el usuario, a través de una caja de texto y un botón con el nombre de "buscar", a través del cual se ejecuta la búsqueda. Una vez ejecutada esta acción, el usuario obtendrá la respuesta. Se debe tener en cuenta si la interfaz del usuario permite realizar múltiples tareas que a su vez implemente correctamente las tareas del usuario. También podrá contar con opciones de "búsqueda simple" y "búsqueda avanzada", esta última aprovechando las ventajas que ofrecen las ontologías, ya que la interfaz incluirá una verificación de las restricciones contenidas implícitamente en las clases, relaciones y axiomas de la ontología. Además podrá incluir una etiqueta con el nombre "Lo más buscado" o "Lo más relevante", la cual se refiere a un listado de preguntas que ya han sido introducidas por otros usuarios en un período de tiempo. El sistema en este caso puede disponer de un contador que mida a partir de la frecuencia de aparición de términos, cuáles han sido los más consultados dentro de un período de tiempo determinado. Las consultas se organizarán en forma de lista y la cantidad que se mostrará visible en la interfaz de usuario estará en dependencia de los criterios del desarrollador del sistema. No obstante, los autores consideraron que la interfaz de usuario deberá ser diseñada a partir de los requerimientos referidos por los usuarios e identificados en la primera fase de concepción del sistema, y por un arquitecto de información que organice, estructure y represente la información que será mostrada al usuario final. En dependencia de esto, podrá considerarse el diseño de una aplicación web o una aplicación de escritorio.

 

e) Implementación del sistema. En este paso se desarrollará el sistema a partir de la metodología y de tecnologías seleccionadas previamente.

 

 VALIDACIÓN DEL MODELO

Para la validación del modelo propuesto se tuvo en cuenta la opinión de un grupo de profesionales con experiencia en la temática de Gestión de Proyectos. La propuesta se sometió a evaluación a través del criterio de expertos. Para eso se aplicó un cuestionario, y a partir de los pasos propuestos en el modelo se midieron los siguientes indicadores: muy importante, bastante importante, importante, poco importante, no importante, los cuales fueron evaluados para obtener un total según valores añadidos por cada indicador, y se obtuvieron los siguientes resultados:

De los 9 expertos encuestados, el 88 % coincidió en que el paso 1 (análisis de dominio) era muy importante y solo el 11 % lo consideró bastante importante. Así para el paso 2 (extracción de datos), el 77 % muy importante y el 22 % bastante importante. Para el paso 3 (conceptualización) el 99 % estuvo de acuerdo con que era un paso muy importante y el 1 % bastante importante. El paso 4 (formalización) el 66 % se refirió como muy importante, el 22 % bastante importante y el 11 % como importante y, por último, en el paso 5, definido como interfaz de usuario, el 100 % alegó que era muy importante. De estos resultados se puede evidenciar que, de una forma u otra, todos los pasos establecidos a través del modelo son importantes, ya que la mayoría de los encuestados estuvieron a favor y en ningún caso se correspondió con que los pasos eran poco importantes o no importantes (Fig. 3)

 

 

CONCLUSIONES

El uso de ontologías se ha incrementado en varias áreas de la Informática, y existe en la actualidad un interés creciente sobre su uso en el diseño y en el desarrollo de los sistemas de organización del conocimiento.La disponibilidad del conocimiento almacenado en ontologías puede proveer los mecanismos necesarios para organizar, almacenar y acceder a la información de ítems que incluyen esquemas de bases de datos, objetos de interfaz de usuario y programas de aplicación.

El uso de ontologías en el desarrollo de los sistemas de recuperación de información permitirá establecer correspondencia y relaciones entre los diferentes dominios de entidades de información.Los servicios de ontologías a partir de la terminología de un dominio ofrecerán ventajas para elaborar otros modelos de sistemas de recuperación de información, prestar servicios y gestionar el conocimiento del dominio que se represente.La elaboración y la construcción de una ontología debe tener en cuenta su relación con la arquitectura del Sistema de información en el que va a estar inmersa, sin olvidar la importancia que se deriva de formular teorías del conocimiento sobre un dominio determinado.

Las metodologías para el diseño de ontologías todavía hoy son objeto de búsqueda y en general ninguna cubre todas las alternativas posibles en cada paso, aunque se plantea que las metodologías, a pesar de sus diferencias, poseen algunos componentes básicos, en particular: especificación, conceptualización, formalización, implementación y mantenimiento. Las ontologías y los SIBO están desarrollándose y aplicándose en una variedad de áreas de aplicación emergentes tales como modelización de empresas, diagnósticos, toma de decisión, planeamiento y adaptación, modelado de procesos y sistemas.

El modelo propuesto permitirá la obtención de nuevos conocimientos respecto a un dominio del conocimiento a través de sus características, propiedades, relaciones esenciales y funcionales. Su construcción teórica facilitará interpretar, diseñar y reproducir de forma simplificada la realidad que representa a partir de una necesidad concreta.  El diseño del modelo permitirá diseñar y construir sistemas de información basados en ontologías de dominio para la recuperación de información, que faciliten la gestión del conocimiento y la toma de decisiones.

 

REFERENCIAS BIBLIOGRÁFICAS

 

1. Hjørland B. Theories of knowledge organization-theories of knowledge: 13th Meeting of the German ISKO in Potsdam. Knowledge organization. 2013;40(3):169-81.

 

2. Hjørland B, Albrechtsen H. Toward a new horizon in information science: domain-analysis. J Amer Soc Inf Sci. 1995;46(6):400-25.

3. Hjørland B. Epistemologic fundamentals and paradigms of research in knowledge organization. In: Frías JA Travieso C. Tendencias de Investigación en Organización del Conocimiento: Edición Universidad de Salamanca; 2010.

 

4. Dalhberg K. Knowledge organization: A new science? El profesional de la información. 2012;21(3):225-7.

 

5. López-Huertas MJ. Some current research questions in the field of knowledge organization. Knowledge organization. 2008;35(2):113-36.

 

6. Rodríguez‐Bárcenas G, López‐Huertas MJ. Saaty's analytic hierarchies method for knowledge organization in decision-making. J Amer Soc Info Scie Techn. 2013;64(7):54-67.

 

7. Gnoli C. A new relationship for multidisciplinary knowledge organization systems: dependence. VIII Congreso ISKO. 2010 [citado 10 de mayo de 2014]. Disponible en: http://www.iskoi.org/ilc/dependence.rdf

 

8. Rivero D. Análisis, diseño e implantación de aplicación LIMS para la automatización de la gestión de los laboratorios de INTEVEP. Escuela de Ingeniería de Sistemas. Universidad de Los Andes; 2008.

 

9. Albacete R. Influencia de las prácticas de gestión de la calidad sobre la gestión del conocimiento y la innovación en los servicios: el caso de las empresas hoteleras [Tesis doctoral]. Granada: Universidad de Granada; 2010.

 

10. Anass E, Berrada I. Xplor: the competitive intelligence system based on a multidimensional analysis model. Paper presented in Information System & Economic Intelligence SIIE; 2011.

 

11. Andersen J. Ascribing cognitive authority to scholarly document on the (possible) role of knowledge organization in scholarly comunication. Paper presented in Proceedings of the Seventh International ISKO Conference; 2004.

 

12. Finardi R. Migración y salud en zonas fronterizas: informe comparativo sobre cinco fronteras seleccionadas. CEPAL; 2010.

 

13. Ramírez Z. Las ontologías como herramienta en la gestión del conocimiento. Departamento de Bibliotecología y Ciencia de la Información. Universidad de La Habana; 2011.

 

14. Hjørland B. Information science and its core concepts: Levels of disagreement. Theories of information, communication and knowledge. Springer Netherlands; 2014:205-35.

 

15. Barité M. El control de vocabulario en la era digital: revisión conceptual. Rev Scire. 2014;20(1):2.

 

16. Barchini A, Álvarez-Herrera M. Dimensiones e indicadores de la calidad de una Ontología. Rev Av Sist Inform. 2011;7(1):29-38.

 

17. Gruber T. Principles for the design of ontologies used for knowledge sharing. Available as Technical Report KSL 93-04. Knowledge Systems Laboratory, Stanford University. 1993 [citado 12 de marzo de 2015]. Disponible en: http://citeseer.ist.psu.edu/gruber93toward.html

 

18.  Pedraza-Jiménez R. Tesauros y ontologías en sistemas de información documental. El Profesional de la Información. 2011;20(5):555-63.

 

19. Ramos E, Núñez H. Ontologías: componentes, metodologías, lenguajes y aplicaciones. RT 2007-12. Centro de Ingeniería de Software y Sistemas (YSYS) Laboratorio de Inteligencia Artificial (LIA) Universidad Central de Venezuela. ISSN 1316-6239. 2012 [citado 20 de febrero de 2015]. Disponible en: http://www.ciens.ucv.ve/escueladecomputacion/documentos/archivo/51

20. Leiva A. An automat for the semantic processing of structured information. Paper presented at the International Conference on Intelligent Systems Design and Applications; 2009.

 

21. Chlsholm R. Realistic Theory of Categories – An Essay on Ontology. Cambridge University Press; 1996.

 

22. Milton S, Kazmierczak E. Enriching the Ontological Foundations of Modelling in Information Systems. Macquarie University; 2000.

 

23. Milton S, Kazmierczak E. An ontological study of data modelling languages using Chisholm's Ontology. Maribor: 11th European-Japanese Conference Information Modelling and Knowledge bases; 2001.

 

24. Bunge M. Treatise on Basic Philosophy: Ontology II. Reidel; 1979.

 

25. Wand Y, Weber R. An ontological model of an information system. IEEE transactions on software engineering; 1990:82-92.

26. Rijsbergen V. Information retrieval: uncertainty and logics: advanced models for the representation and retrieval of information. Springer Science & Business Media; 2012.

 

27. Baeza Y, Ribeiro N. Modern Information Retrieval: ACM Press Books & Addison-Wesley; 1999.

 

28. Lenat D. Building large knowledge-based systems: representation and inference in the Cyc Project. Boston, Massachusetts: Addison-Wesley: 1990.

 

29. Lenat D, Guha RV. Reinforcing math knowledge by immersing students in a simulated learning-by-teaching experience. Internat J Artif Intellig Educ; 2014:24(3):216-50.

 

30. Corcho O, Fernández-López M, Gómez-Pérez A, Juristo N. Methontology: from ontological art towards ontological engineering. Spring Symposium on Ontological Engineering of AAAI. California: Stanford University; 1997. p. 33-40.

 

31. Uschold M, King M. Towards a methodology for building ontologies. In: Skuce D (eds) IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing; 1995.

 

32. Grüninger M, Fox M. Methodology for the design and evaluation of ontologies. In: Skuce D (ed) IJCAI'95 Workshop on Basic Ontological Issues in Knowledge Sharing; 1995.

 

33. Gómez-Pérez A, Juristo N, Montes C, Pazos J. Ingeniería del Conocimiento: Diseño y Construcción de Sistemas Expertos. Madrid: 1998.

 

34. Guzmán L. Metodologías y métodos para la construcción de ontologías. Rev Cien Tec. 2012 [citado 3 de abril de 2015];2(50). Disponible en: http://revistas.utp.edu.co/index.php/revistaciencia/article/view/6693

 

35. Hertz R. Introduction: reflexivity and voice. London: Sage Publications, Inc.; 1997.

 

36. Salton G. A vector space model for automatic indexing. Communications of the ACM. 1983;18(11):613-20.

37. Guarino N. Ontologies and knowledge bases: towards a terminological clarification. Roma: Laboratory for Applied Ontology. 2005 [citado 3 abril 2015]. Disponible en: http://www.loa-cnr.it/Papers/KBKS95.pdf

 

 

Recibido: 13 de marzo de 2015.
Aprobado: 24 de agosto de 2015.

 

 

Anisleiby Fernández Hernández. Universidad de las Ciencias Informáticas. La Habana, Cuba. Correo electrónico: ani@uci.cu