ARTíCULO ORIGINAL
Modelo de sistema de organización del conocimiento basado en ontologías
Model of a knowledge organization system based on ontologies
Modelo de sistema de organização do conhecimento baseado en ontologias
Anisleiby
Fernández Hernández,I María José López
Huertas,II Yusnerkis Prevot UrgellésI
I Universidad de las Ciencias
Informáticas. La Habana, Cuba.
II Universidad de Granada. España.
El presente trabajo tiene como objetivo proponer un modelo para el diseño y construcción de un sistema de organización del conocimiento basado en ontologías. Se propone, a través del uso de métodos descriptivos y criterios de otros autores, un modelo a partir del cual se puede obtener un sistema de información basado en ontologías. Se muestra y se explica la relación entre cada una de las partes del modelo, y se demuestran sus propiedades holísticas. Se plantean los resultados obtenidos de la evaluación del modelo para su validación a través del criterio de expertos. Todos los pasos establecidos a través del modelo resultaron importantes. La mayoría de los encuestados estuvieron a favor y en ningún caso se consideró que los pasos eran poco importantes o no importantes. Con la aplicación del modelo se espera estructurar las bases de un dominio del conocimiento en específico, tras una progresiva sustitución de los modelos convencionales del proceso de recuperación de la información por un modelo cognitivo.
Palabras
clave: sistemas de organización del conocimiento, ontologías,
modelos de organización del conocimiento.
O presente trabalho tem como objetivo propor um modelo para o desenho e construção dum sistema de organização do conhecimento baseado em ontologias. Propõe-se, a través do uso de métodos descriptivos e critérios de outros autores, um modelo a partir do qual se pode obter um sistema de informação baseado em ontologias. Com a aplicação do modelo se espera estruturar as bases de um domínio do conhecimento em específico, trás uma progressiva substituição dos modelos convencionais do processo de recuperação da informação, por um modelo cognitivo. Também se mostra e se explica a relação entre cada uma das partes do modelo, e são demonstradas suas propriedades holísticas. São colocados os resultados obtidos da avaliação do modelo para sua validação a través do critério de expertos. Todos os passos estabelecidos mediante o modelo resultaram importantes. A maioria dos sondados estiveram a favor em caso nenhum foi considerado que os passos eram pouco importantes ou não importantes.
Palavras chave: sistemas de organização do conhecimento, ontologias, modelos de organização do conhecimento.
INTRODUCCIÓN
El surgimiento del paradigma sociocognitivo introduce la necesidad de apostar por las determinaciones sociales y culturales en cualquier propuesta conceptual en el terreno informacional. Esto provocó un interés creciente, alrededor de los años 90, en puntos de vista sociales e interpretativos de la Organización del Conocimiento (OC); se desarrollaron enfoques semióticos y crítico-hermenéuticos, como el análisis de discurso, los estudios de género, y el análisis de dominio.1 Hjørland y Albrechtsen2 formularon un enfoque de manera particular para la OC. Se basaron en una teoría explícita del conocimiento,1 la cual plantea como su principio fundamental que la mejor manera para entender la información en la Ciencia de la Información es a través del estudio de los dominios de conocimiento, como comunidades discursivas, las cuales son parte de la división social del trabajo.
La OC es un campo amplio e interdisciplinar, mucho más extenso que la Biblioteconomía y la Documentación.3 No obstante, otros autores se refieren a la OC como una especialidad dentro de la Bibliotecología y la Ciencia de la Información, conocida como la ciencia de estructurar y organizar sistemáticamente las unidades de conocimiento (conceptos), de acuerdo con sus propios elementos de conocimiento (características) y la aplicación de conceptos y clases de conceptos ordenados por este campo, para la asignación de los contenidos válidos de conocimiento de referentes (objetos/sujetos) de todo tipo.4 Esto implica la existencia de un sistema utilizado para recuperar y transmitir el conocimiento. Los sistemas de organización del conocimiento son propuestas para la recuperación de dicha organización y representación del conocimiento en un área especializada o propósito.5
Recientemente se ha demostrado que la OC tiene también un papel importante en la gestión del conocimiento de organizaciones y empresas.6 La organización y la representación del conocimiento, en esencia, son vías de importante relevancia en el proceso de identificación de los elementos abstractos y cognitivos del pensamiento humano, acerca del mundo que lo rodea y de los saberes que constituyen el pilar de conocimiento de su entorno o ambiente. Permite mapearlos por medio de diversas técnicas. Por tanto, estas ventajas hacen que la organización y representación del conocimiento juegue un papel importante tanto para una organización como para la sociedad en general.6
El enfoque tradicional de los sistemas de organización de conocimientos como vehículos para organizar y representar el conocimiento establece los cimientos en la estructuración disciplinaria de los saberes. La disciplinariedad es un elemento clave para los sistemas de organización de conocimientos. Ellos se estructuran básicamente de acuerdo con las disciplinas.7,8 Por lo general, los sistemas de organización de conocimientos se enmarcan en espacios disciplinarios específicos o con un enfoque universalista; se adscriben al esquema disciplinar establecido por la ciencia.8
El uso de la expresión sistema de organización del conocimiento está actualmente consolidado en la literatura. Esta designación es mucho más ajustada a las funciones que desempeña, lo que anteriormente se llamaba lenguajes documentales. Los sistemas de organización del conocimiento tienen ciertamente una parte terminológica, pero incluyen otras características; la más importante es la propuesta de organización del conocimiento, la que no alude la expresión lenguajes documentales. Son sistemas formados por distintos elementos, entre los que está el terminológico. Por eso, la nueva expresión ha tenido una acogida tan favorable entre los especialistas. Por supuesto, que sus funciones principales son la representación de contenidos documentales relevantes y la posterior recuperación de estos, cosa que comparte en gran medida con cualquier otro sistema que se diseñe para la recuperación de la información.
Los métodos de OC estuvieron basados, en un principio, en modelos propuestos por teóricos que a menudo compartían esta condición con la de ser bibliotecarios, para pasar después a generar sistemas con un fundamento teórico inspirado en modelos generales, como los propuestos por la corriente sociocognitiva, o la de análisis del dominio, entre otras. Algunos ejemplos de sistemas de organización del conocimiento son: vocabularios controlados, esquemas de clasificación, taxonomías, tesauros y ontologías. Estas tres últimas, especialmente las ontologías, pueden tener otras funciones además de la recuperación de la información, pero responden al mismo concepto y, como tal, se incluyen dentro de dichos sistemas.
Este artículo se realiza en el marco del desarrollo de una tesis de doctorado titulado "Modelo ontológico de recuperación de información como apoyo a la toma de decisiones en gestión de proyectos". El modelo constituye uno de sus resultados. El estudio presentado en este artículo es de naturaleza exploratoria-descriptiva. Su metodología se apoya en las revisiones bibliográficas realizadas. Para esto, se ha seguido el criterio de autores que han incursionado desde hace ya varios años en estas temáticas y en la experiencia adquirida por los autores en el proceso de investigación.Los resultados de este estudio se muestran a través de la aplicación del modelo al dominio del conocimiento Gestión de Proyectos y su validación a través del criterio de expertos.
LOS SISTEMAS DE ORGANIZACIÓN DEL CONOCIMIENTO Y LAS ONTOLOGÍAS
La complejidad inherente al proceso de representación y OC es evidente, entre otras cosas porque actualmente se ha producido un cambio en la forma de producir conocimiento. Muchos autores han descrito las tendencias actuales en sus investigaciones sobre elementos implicados en la OC. Estos se han centrado en los sistemas universales, las equivalencias e interoperabilidad entre vocabularios, los problemas de sesgo, Internet y los motores de búsqueda, la exploración de recursos, tesauros, los sistemas de organización del conocimiento orientados a dominios y la representación visual, los cuales constituyen una significativa base para el desarrollo de este campo.3-8-12
Según Ramírez,13 existen trabajos recientes con propuestas para representar y organizar el conocimiento, tanto desde una perspectiva universal como desde una aproximación contextual; entre los más destacados están las aproximaciones siguientes:
Siguiendo a Ramírez, entre los diferentes tipos de sistemas de organización del conocimiento están las ontologías. Barité15 ve a las ontologías como diseños de estructuras funcionales. Estos diseños contienen entidades o elementos que se relacionan entre sí, para llevar a efecto determinados propósitos o para cumplir con ciertos objetivos, en un entorno habitualmente electrónico. Son funcionales porque no pretenden representar un segmento del conocimiento o un área de actividad, sino desplegar una red de asuntos o acciones con sus relaciones, y volver explícitos los circuitos que en su conjunto configuran un dominio. Más que una estructura de conocimiento, una ontología es ante todo un sistema relacional de acciones que persigue tanto una gestión corporativa de calidad como la satisfacción plena del usuario. Mientras sigue siendo un área fecunda de investigación en el campo de la filosofía, la ontología es actualmente materia de investigación, desarrollo y aplicación en disciplinas relacionadas con la computación, la información y el conocimiento.
Es imposible representar el mundo real, o alguna parte de él, con todos los detalles. Para reproducir algún fenómeno o parte del mundo, llamado dominio, es necesario focalizar o limitar el número de conceptos que sean suficientes y relevantes para crear una abstracción del fenómeno.16 Así, el aspecto central de cualquier actividad de modelización consiste en realizar una conceptualización; o sea, identificar los conceptos (objetos, eventos, comportamientos, etc.) y las relaciones conceptuales que se asume que existen y son relevantes. Es decir, independientemente del ámbito en que se desarrollen, la base para una ontología es la conceptualización, la cual constituye un vocabulario controlado al referirse a las entidades de un dominio particular. Por tanto, uno de los usos de las ontologías es para especificar y comunicar el conocimiento de un área del conocimiento, de manera genérica, que son muy útiles para estructurar y definir el significado de los términos.
Las ontologías, para representar el conocimiento, precisan los siguientes componentes:17 conceptos, relaciones, funciones, instancias y axiomas. Retomando la definición de Gruber,17 si se logra especificar los componentes y sus relaciones de un ámbito del conocimiento siguiendo un formalismo estricto codificado en un lenguaje informático (no de programación, sino de descripción), entonces es una ontología. Además, debe ser capaz de soportar pruebas lógicas; por ejemplo, si se define que un individuo X pertenece a la clase B, la cual, a su vez, es miembro de la clase A, se puede inferir que todo miembro de B es un miembro de A y que por tanto X es un A. La insuficiencia consiste, según Codina y Pedraza,18 en que una ontología por sí sola en principio no tiene sentido si no hay un sistema complementario que permita realizar inferencias sobre esta para, por ejemplo, facilitar búsquedas en lenguaje natural.
Para diseñar una ontología, es necesario considerar algunas de las características deseables que estas deberían exhibir. Según criterios de los autores Ramos y Núñez,19 los principios de diseño a considerar son los siguientes:
En un sistema a partir de una ontología, la parte declarativa y procedimental se convierte en una base de conocimiento y en un motor de inferencias, respectivamente. Se obtiene de esta manera un sistema basado en conocimiento (SBC).
MODELADO DE LOS SISTEMAS DE ORGANIZACIÓN DEL CONOCIMIENTO
El modelo naturalista (análisis de dominio) se centra en formulaciones declaradas inicialmente por Hjørland y Albrechtsen2 en la década del 90 del pasado siglo. A su vez, estos postulados son modelizaciones conceptuales en constante movimiento.20 Según López-Huertas, el dominio temático como modelo y referente, para el diseño y elaboración de estructuras de conocimiento, es un proceder importante para el desarrollo de sistemas de representación de la información individuales. Permite analizar y estructurar los dominios de forma independiente.5
Es por eso que es imposible tratar todos los dominios con los mismos criterios estructurantes. Desde las Ciencias de la Información se considera preponderante el tratamiento de las comunidades de discurso como herramienta diferenciadora. Esto hace que se considere el conocimiento del dominio en cuestión como unidad de análisis para la representación y la organización del conocimiento. Esta aseveración viene a mostrar diversas divisiones del análisis de dominio, las cuales tienen diversas formas como: ontológicas, epistemológicas y sociales.20
Las teorías ontológicas que se desarrollan dentro del análisis de dominio facilitan el conocimiento del mundo y sus objetos; además, describen la realidad y su estructura. Para López-Huertas5 el valor esencial de estas teorías está en su capacidad de reconocer la naturaleza de los fenómenos conocidos, independientemente de los medios utilizados para conocerlos. El principio ontológico constituye una forma intelectual de organización del conocimiento frente a la utilización de principios sociológicos para la organización del conocimiento. En su aplicación subyace una forma detallada del conocimiento. En su forma práctica, el conocimiento ontológico asume estructura de clasificaciones especializadas, tesauros y ontologías, herramientas útiles en el desarrollo de resúmenes. Todos estos productos se constituyen por conceptos centrales de un dominio determinado y sus relaciones semánticas correspondientes.5
El filósofo Chisholm21 propuso una ontología de sentido común crítico, que demanda un estándar riguroso de soporte para el conocimiento a adquirir. Sobre la base de esta postura epistemológica, Milton y Kazmierczak sostienen que la ontología de Chisholm puede ser utilizada (sin necesidad de adaptaciones) para el análisis ontológico de los lenguajes de modelación de datos. Estos autores propusieron un modelo que permite evaluar los lenguajes desde el punto de vista ontológico. Por lo tanto, se puede considerar que la ontología de Chisholm constituye en sí misma un modelo ontológico de Sistema de Información (SI).22-23
Por otra parte, Bunge24 es el autor de la ontología filosófica qué más influencia tuvo en los Sistemas de Información (SI). Esta ontología se basa en un realismo científico, el cual requiere una compresión teórica profunda y detallada de la realidad, propia de la ciencia contemporánea. La ontología de Bunge sostiene que el mundo está hecho de sistemas interconectados. Basados en esta postura epistemológica, Wand y Weber25 construyeron el modelo ontológico BWW (Bunge-Wand-Weber). Este es un modelo de descomposición de los SI. Es formal, libre de contenido, compuesto por: el modelo de representación, el modelo de transición de estados y el modelo de buena descomposición.
Estos modelos abstractos de los SI constituyen un importante soporte teórico para el proceso de modelación. Se utilizan para la evaluación de los lenguajes o técnicas de análisis y diseño de SI. En general, esta evaluación radica en que los lenguajes que cumplen con los aspectos considerados en los modelos ontológicos son más eficientes que aquellos que no los contemplan.22-23 En síntesis, se conjetura que la ontología de Chisholm21 es útil para la modelación de fenómenos que están relacionados a dominios de aplicación donde dominan los temas sociales o los humanos, por tratarse de una ontología de sentido común. Por el contrario, la ontología de Bunge se adaptaría mejor a ambientes de implementación o dominios de aplicación donde los aspectos humanos o sociales están ausentes.22 Por tanto, a partir de las ontologías filosóficas y los modelos ontológicos de los SI disponibles, se pueden crear o modificar lenguajes o técnicas de modelación de los SI.
Como
se puede evidenciar, el uso de las ontologías en los SI permite establecer
correspondencia y relaciones entre los diferentes dominios de entidades de información.
Esto ha llevado a la noción de SI basados en ontología (SIBO),
un concepto que, aunque en una fase preliminar de desarrollo, abre nuevas maneras
de pensar sobre las ontologías y los SI en conjunción una con
otra, y cubre las dimensiones estructurales, las dimensiones temporales de los
SI e involucra tanto a los desarrolladores como a los usuarios de los SI.16
PROPUESTA DEL MODELO
El modelo que se propone a continuación se diseñó aplicándolo al dominio de Gestión de Proyectos. Es importante resaltar que los autores, para definir los criterios aquí expuestos, tomaron en consideración lo planteado por los autores Barchin,16 Guarino y Welty.36 El objetivo fundamental para proponer un modelo de OC en Gestión de Proyectos para diseñar un sistema de recuperación de información basado en ontologías como apoyo a la toma de decisiones, estuvo dado a partir de las necesidades de información referidas a la Gestión de Proyectos.
Los
usuarios que son actores directos en el uso y aplicación de información
referente a este campo de estudios se encuentran muchas veces frente a sistemas
con información poco estructurada, carente de sentido y, por tanto, con
dificultad para recuperarla. Esta situación provoca la pérdida
considerable de recursos económicos y atrasos en proyectos con gran impacto
social. Entre otras de las necesidades
detectadas, también estuvo la falta de conocimiento en el control y seguimiento
de proyectos, así como las debilidades de las herramientas para la toma
de decisiones en la Gestión de Proyectos. Estas últimas fueron
expresadas en carencias en las áreas de conocimiento e insuficiencias
para el tratamiento de la incertidumbre de los datos y la ambigüedad en
los conceptos, lo cual trajo consigo duplicidad y heterogeneidad de la información.
Lo anteriormente referido surgió
a partir de una motivación, que partió de una necesidad de información
del usuario o lo que es igual a un requerimiento de información, una
pregunta o una consulta. Para esto el usuario necesitaba obtener información
relevante, útil para la toma de decisiones.24-27 La disciplina
de la recuperación de la información en este sentido cobra vital
importancia, ya que a partir de ella se diseñan, construyen y se prueban
los sistemas de recuperación de información. Trata, a su vez,
con procesos tales como: representación, almacenamiento, organización
y acceso a elementos de información. Que
el sistema cuente con una ontología, permitirá ventajas especiales
al usuario al insertar una consulta, ya que el sistema tratará entonces
de insertar el conocimiento de las ontologías para enriquecer la expresión
de la consulta y mejorar la probabilidad de obtener documentación relevante.
Esta constituye la esencia de las ontologías en los sistemas de recuperación
de información.25
La propuesta de este modelo basado
en ontologías en Gestión de Proyectos permitirá el diseño
y construcción de un sistema de información basado en ontologías,
para la recuperación de la información como apoyo a la toma de
decisiones en este dominio del conocimiento. Permitirá, en este caso,
aprovechar las ventajas que ofrecen las ontologías, para especificar
y comunicar el conocimiento del dominio de una manera genérica, además
de ser muy útiles para estructurar y definir el significado de los términos.
El modelo que se muestra en la figura 1 surgió del análisis de
diferentes casos, a partir de un criterio sistémico, el cual permitió
comprender la necesidad de la estructura del modelo.
PRINCIPIOS QUE SE HAN TENIDO EN CUENTA PARA EL MODELO
El modelo que se propone posee un carácter flexible, ya que es una propuesta genérica, válida para cualquier temática relacionada con los sistemas de recuperación de información basados en ontologías, lo que garantiza su singularidad, factibilidad y pertinencia. El enfoque holístico del modelo estuvo dado primeramente en la concepción acerca de este como un todo, como un proceso general que emerge a los componentes, pero que a la vez se retroalimenta de ellos. Presenta, además, un carácter sistémico. Se construyó sobre la base del método sistémico-estructural-funcional, el cual posibilita comprender la organización, la planificación y la ejecución del proceso de creación de un sistema de información basado en ontologías. Por tanto, el modelo representa en sí a un sistema. El modelo se enmarca sobre la base de la recolección del conocimiento del dominio a partir de la aplicación y combinación de varios métodos, técnicas y soporte en las Tecnologías de la Información y las Comunicaciones para la construcción del SIBO (Fig. 1).
El modelo está representado por capas siguiendo la pirámide informacional de datos, información y conocimiento. Está presente en todo el proceso la retroalimentación. Esto permite que los resultados obtenidos de una tarea o actividad sean reintroducidos nuevamente en el sistema con el fin de controlar y optimizar su comportamiento. Es importante destacar que para la definición de estos pasos se ha tenido en cuenta el criterio de otros autores, quienes en sus propuestas metodológicas para el diseño de ontologías coinciden, aunque en posiciones diferentes, en que estos son los pasos más importantes para obtener una ontología; ellos son: la metodología CYC,28 la metodología de Uschold y King,29 la metodología de Gruninger y Fox,30 la metodología Methontology,31 la ontología de Sensus,32 la metodología Terminae33 y, por último, Ontology Development 101.34
A continuación se describen cada una de ellas:
Metodología CYC
Metodología de Uschold y King
Metodología de Gruninger y Fox
El primer paso consiste en identificar intuitivamente las aplicaciones posibles en las que se usará la ontología. Luego se utiliza un conjunto de preguntas en lenguaje natural, llamadas cuestiones de competencia, para determinar el ámbito de la ontología. Se usan estas preguntas para extraer los conceptos principales, sus propiedades, relaciones y axiomas.
Metodología Methontology
Es una de las propuestas más completas, ya que toma la creación de ontologías como un proyecto informático. Así, además de las actividades propias de la generación de la ontología, esta metodología abarca actividades para la planificación del proyecto, la calidad del resultado, la documentación, etc. Además, permite construir ontologías totalmente nuevas o reutilizar otras ontologías. A continuación se muestran sus pasos:
Ontología de Sensus
Constituye un enfoque top-down para derivar ontologías específicas del dominio a partir de grandes ontologías. En esta metodología se identifican un conjunto de términos semilla que son relevantes en un dominio particular. Tales términos se enlazan manualmente a una ontología de amplia cobertura. Los usuarios seleccionan automáticamente los términos relevantes para describir el dominio y acotar la ontología Sensus. Consecuentemente, el algoritmo devuelve el conjunto de términos estructurados jerárquicamente para describir un dominio, que puede ser usado como esqueleto para la base de conocimiento.
Metodología Terminae
Se basa en un análisis lingüístico de los textos, el cual se realiza mediante la aplicación de diferentes herramientas para el procesamiento del lenguaje natural. En particular se usan dos herramientas:
1. Syntex para identificar términos y relaciones.
2. Cameleon para identificar roles o relaciones.
La metodología funciona como sigue: mediante la aplicación de Syntex se obtiene una lista de posibles palabras y frases del texto y algunas dependencias sintácticas y gramaticales entre ellas. Estos datos se usan como entrada para el proceso de modelado junto con el texto original.
Ontology Development 101
Se desarrolla a partir de los pasos que siguen:
Como consecuencia del estudio realizado se llegó a una metodología ecléctica propia, que se detalla en los siguientes pasos:
- Análisis del dominio. Este paso surgió con la necesidad de comprender el dominio de Gestión de Proyectos para su posterior representación. Para el estudio y comprensión del dominio se deben identificar las fuentes sobre las cuales se obtendrá la información. En este sentido, se deben tener en cuenta los principales postulados existentes sobre el tema; los preceptos presentados en la guía práctica del PMBok (Project Management Body of knowledge), por ser un estándar internacional de buenas prácticas en la Gestión de Proyectos; CMMI (Capability Maturity Model Integration) u otros estándares que también se consideren importantes; los criterios de expertos, dígase gestores de proyectos, directivos, etc.; los datos contenidos en bases de datos de gestión de proyectos, sistemas que respondan a la toma de decisiones. Todos ellos constituirán la red de conocimiento del dominio en cuestión.
- Extracción de datos. El conjunto de datos obtenidos debe ser organizado de manera tal que estos resulten útiles para la conceptualización del dominio como próximo paso. Aquí deben quedar representados todos los conceptos que describen y representen al dominio de la Gestión de Proyectos, lo que constituye su base terminológica.
- La formalización. Este paso debe realizarse a través del uso de una herramienta que facilite el trabajo de la conceptualización formal del dominio. Aquí quedarán representadas las clases definidas en la conceptualización, las propiedades, los axiomas y las instancias de la ontología. De esta manera queda descrito el proceso para la obtención de la ontología.
Luego que se obtiene la ontología debe crearse una interfaz de usuario, sobre la cual este pueda escribir sus consultas en lenguaje natural para la obtención de la información útil para la toma de decisiones. En este caso debe construirse un sistema de información basado en la ontología de dominio obtenida anteriormente, la cual facilite la recuperación de la información y que contenga una interfaz de usuario amigable para las consultas. Para la construcción del sistema se debe seleccionar una metodología de desarrollo de software. Dicha metodología debe ser seleccionada por el equipo de desarrollo de software.
ESTRUCTURA DEL MODELO
Para determinar los componentes del modelo se consideró la lógica general del proceso de construcción de sistemas basados en ontologías. Para esto se ha tenido en cuenta el contexto de la gestión de proyectos, desde una perspectiva que responda a las particularidades, objetivos y exigencias de este proceso. La estructura del modelo está integrada en cinco secciones que permiten de manera lógica expresar su contenido, o sea, las subestructuras o pasos que componen cada una de estas secciones. Ellos son:
I.
Análisis del dominio.
a) Preparación del escenario o detección de necesidades. En este paso se debe organizar un encuentro con los participantes que se tendrán en cuenta para desarrollar el proceso de construcción del sistema. Se debe presentar el proyecto, se explican los resultados que se obtendrán a partir de la propuesta del modelo y se identifican los requerimientos necesarios para la construcción del sistema basado en ontologías. Las actividades en las que intervienen los participantes tendrán que ver con su visión clara en la aplicabilidad del modelo. Se recogen sus criterios y consideraciones al respecto, su nivel de compromiso para lograr el diseño y la construcción del sistema basado en ontologías y la importancia que requiere la revisión de toda la información existente que pueda resultar útil para comprender el dominio de Gestión de Proyectos, lo que constituye el objetivo fundamental de la actividad a realizar. Los participantes podrán expresar sus opiniones sobre cómo consideran que debe ser el sistema que será desarrollado y ante qué interrogantes debe responder, entre otros elementos que consideren importantes.
b) Identificación, detección y recopilación de las fuentes de información.En este paso se identificarán las fuentes de información existentes que contengan información relevante para la comprensión del dominio, ya sean personas, fuentes institucionales, sistemas, herramientas, bases de datos etcétera.En este paso pueden realizarse las siguientes acciones:
- una selección de los documentos especializados, previamente identificados, de la documentación existente sobre la temática Gestión de Proyectos y extraer los elementos que aportan información temática para describir el dominio preliminarmente.
- por medio del método de análisis de expertos, provenientes de los participantes, se aplica un cuestionario para conocer el nivel de experticia con que cuentan los participantes.
- una entrevista estructurada con una guía de posibles preguntas al grupo de expertos identificados previamente, para conocer qué fuentes de información consideran relevantes dentro del campo y con cuáles cuentan como apoyo a la toma de decisiones en Gestión de Proyectos.
c) Aplicación de técnicas que describan el dominio. Una vez identificadas las fuentes de información se procederá a la aplicación de diversas técnicas que faciliten la obtención del dominio. Estas técnicas deben ser aplicadas al grupo de expertos previamente identificado. Pueden ser entrevistas, encuestas, reuniones, tormenta de ideas etcétera. El análisis del dominio es uno de los puntos más complejos a atender en la obtención de una ontología. Este proceso depende en gran medida del entendimiento, percepción que tenga cada individuo de representarse una realidad concreta y de los juicios personales del que esté desarrollando la actividad. Esto requiere la repetición del proceso cuantas veces sea considerado necesario, hasta obtener un resultado suficientemente depurado para realizar el proceso de conceptualización en la ontología, a partir del dominio identificado.
II. Extracción de datos recopilados.
La
extracción de datos recopilados se refiere a la depuración o refinamiento
de los resultados que se obtienen a partir de las técnicas aplicadas,
mediante mecanismos de retroalimentación. En este caso se revisarán
los resultados con los involucrados a partir de actividades interactivas para
recoger sus opiniones definitivas sobre la concepción del dominio de
gestión de proyectos.
a)
Extracción del conocimiento explícito e implícito de
las fuentes de información. La extracción de los datos obtenidos
es donde se organizan todos los resultados a partir de las técnicas aplicadas,
se obtienen mapas conceptuales o modelos abstractos del pensamiento o representación
que tienen los involucrados del dominio.
b) Refinamiento de los elementos seleccionados como dominio representativo.Una vez alcanzados los resultados de los encuentros se procederá al refinamiento del dominio a partir de la aplicación de otras técnicas como es el caso de las encuestas, como proceso de refinamiento de los resultados alcanzados.
III. Conceptualización o definición terminológica del dominio.
A
medida que el desarrollo de la ontología avanza, es relevante categorizar
todos y cada uno de los términos definidos como áreas o conceptos
representativos del dominio. En la conceptualización deberán quedar
definidas las clases o conceptos que se tendrán en cuenta para el diseño
de la ontología; por eso se le llama a este paso definición terminográfica
del dominio. Es uno de los pasos de mayor complejidad, ya que a partir de aquí
se realizará todo el diseño posterior de la ontología:
a) Capturar los conceptos identificados y relaciones entre estos conceptos. En este paso se establece una relación de los conceptos identificados a partir de los resultados obtenidos en el análisis de dominio y la extracción de datos. Aquí es importante encontrar términos similares con el fin de agruparlos e ir eliminando la sinonimia, homonimia y polisemia entre conceptos.
b)
Construcción de un glosario de términos con los conceptos identificados.
El glosario de términos deberá incluir todos los términos
relevantes del dominio (conceptos, instancias, atributos, relaciones entre conceptos,
etc.). Sus descripciones serán en lenguaje natural y soportarán
la creación de una taxonomía de conceptos.
c)
Elaboración de diccionario de conceptos. En esta etapa se elaborará
el diccionario en el cual son descritos los conceptos, las instancias/individuos,
los atributos de las clases, los atributos de las instancias/individuos y relaciones.
d) Elaboración
de la taxonomía o jerarquía terminográfica. Luego de
obtener la relación de conceptos del dominio debe realizarse una taxonomía
que establezca niveles de jerarquía entre los conceptos identificados.
e)
Establecimiento de las relaciones de cardinalidad entre los conceptos. El
objetivo de este diagrama es establecer las relaciones entre los conceptos de
una o más taxonomías de conceptos. Para cada relación binaria
se deberá especificar: nombre, conceptos fuente y destino, cardinalidad
y relación inversa.
f) Descripción de reglas/axiomas
y sus condicionantes. En este paso se deben considerar las reglas y axiomas
definidos en el diccionario de conceptos. Para cada definición de axioma
formal de debe especificar: nombre, descripción, expresión lógica
que formalmente lo describe, los conceptos, atributos y relaciones binarias
a las cuales el axioma hace referencia y las variables utilizadas. Para cada
regla se debe especificar: nombre, descripción, expresión que
formalmente la describe, los conceptos, los atributos y las relaciones a los
que hace referencia, y las variables usadas en la expresión. Para la
especificación de las reglas se sugiere la forma: Si <condiciones>
entonces <consecuencias o acciones>.
IV. Formalización.
Uno
de los mayores inconvenientes a la hora de desarrollar una ontología
es la selección del lenguaje de representación, el cual debe ser
el más adecuado para el usuario final de la ontología. Para esto
han sido desarrolladas herramientas como editores de ontologías en un
determinado lenguaje. Estas herramientas proporcionan un núcleo de servicios
relacionados con ontologías y se pueden extender fácilmente con
otros módulos. En la etapa de formalización se selecciona la herramienta
que contendrá o modelará cada uno de los elementos que se tuvieron
en cuenta en el diseño de la estructura ontológica:
a)
Selección de una herramienta para formalizar la ontología.
En este paso el experto en ontologías o ingeniero ontológico establecerá
la formalización del proceso a partir del uso de una herramienta que
permita formalizar los resultados obtenidos de los procesos anteriores.
b) Representación de los conceptos,
relaciones, instancias/individuos y reglas/axiomas identificados. A partir
de la herramienta seleccionada en este paso quedan representados en la herramienta
los conceptos, relaciones, instancias/individuos y reglas/axiomas identificados
en el diccionario de conceptos.
e) Resultados de la ontología
como base de conocimiento. En este paso serán presentadas las propuestas
de ontologías obtenidos a partir de la herramienta seleccionada a través
de la cual se pueda mostrar su validez.
V. Interfaz de usuario.
Un sistema de recuperación de información, en su forma más simple, puede verse como una "caja negra" que acepta inputs y produce outputs.34 Durante este proceso realiza actividades que incluyen: el reconocimiento de la estrategia de búsqueda planteada, la aplicación de diferentes algoritmos de recuperación y de ordenación de los resultados según su relevancia o utilidad probable para el usuario, la selección de items de información (documentos o su representación), etc. Intentan localizarlos y recuperarlos tan veloz y económicamente como sea posible, por lo que su valor depende de su capacidad para identificar rápida y correctamente la información útil, de su facilidad para rechazar los items extraños o irrelevantes y de la versatilidad de los métodos que emplea Salton.35 De esto trata la interfaz de usuario, la cual es la que permite realizar las consultas en tiempo real al SIBO.
Las
ontologías presentan como limitantes la interfaz de usuario, ya que el
usuario final que hará uso de la ontología como sistema de recuperación
de información para la toma de decisiones, no tiene por qué conocer
el lenguaje de consulta que contiene el editor de ontologías usado por
el ingeniero ontológico para editar la ontología. En este caso,
sería para un usuario más avanzado. Por estas razones, en el modelo
se ha tenido en cuenta un paso para el diseño de la interfaz de usuario.
El usuario final que hará uso de la información en este caso para
la toma de decisiones en Gestión de Proyectos será un gestor de
proyectos, un experto o cualquier otro miembro de la organización para
la cual será desarrollado el sistema. Para esto se propone la implementación
de un sistema de información basado en ontologías, a través
del cual se pueda obtener una interfaz de usuario amigable que permita hacer
consultas a la ontología en lenguaje natural:
a) Representación de la arquitectura del sistema. La representación de la arquitectura del sistema tendrá que ver con la descripción del funcionamiento interno de la ontología, vista como sistema de información. Los diseñadores de los SIBO frecuentemente se enfrentan a un conjunto de obstáculos. La ontología representa el conocimiento de un dominio, generalmente dinámico y cambiante. No solo deben lograr la integración y la interoperabilidad, sino también lograr que estos sean extensibles y adaptables a los dominios de aplicación.16 Por esta razón, los autores de esta investigación consideraron que debe existir un enlace entre la ontología y una base de datos de un sistema perteneciente al dominio representado que los conecte entre sí. Esto permitirá que la ontología se nutra de esos individuos que están en constante actualización, dar respuestas más actualizadas y agregar además contenido semántico a los datos del dominio representado en la base de datos. Atendiendo a los criterios de Barchini,16 las ontologías en los SIBO pueden verse de dos formas desde el punto de vista estructural: la ontología como parte de cada uno de los componentes estructurales y la ontología como un componente más del SI que coopera con los otros componentes para lograr los propósitos del sistema. En dependencia del criterio que se siga, se diseñará entonces la estructura interna del sistema. Dado que la ontología que se obtendrá no responderá directamente a las consultas del usuario en lenguaje natural, sino en el lenguaje que soporte la herramienta que se use para su diagramación y representación, se propone que se cree un nexo o conector entre la ontología y la interfaz de usuario. En este caso los autores propusieron que se diseñe un traductor, que interfiera como programa de aplicación entre la ontología y el usuario del sistema. Este sistema de traducción interno llevará las consultas de lenguaje natural a lenguaje ontológico y viceversa. De esta manera, las ontologías soportan la comunicación con los usuarios, y representan explícitamente la comprensión que ellos tienen de la funcionalidad del sistema y de los datos. Siguiendo esta postura a consideración de los autores, la arquitectura interna del sistema pudiera quedar representada como se muestra en la figura 2.
b)
Selección de la metodología de desarrollo de software.
En este paso el equipo de desarrollo del sistema selecciona la más adecuada
a partir del estudio de las metodologías de software existentes. Deben
quedar claramente evidenciadas y fundamentadas las ventajas que ofrece la metodología
seleccionada.
c) Selección de las tecnologías
para el desarrollo del Sistema. Al igual que en el paso anterior, el equipo
de desarrollo del sistema deberá seleccionar las tecnologías adecuadas.
Quedará fundamentado por qué se seleccionan estas tecnologías
y no otras.
d) Diseño de la interfaz de usuario.
En este paso se debe diseñar la interfaz de usuario que constituirá
la sección de trabajo que le permitirá a este interactuar con
el sistema. La interfaz de usuario deberá estar representada por un área
destinada a introducir las prescripciones de búsquedas requeridas por
el usuario, a través de una caja de texto y un botón con el nombre
de "buscar", a través del cual se ejecuta la búsqueda. Una vez
ejecutada esta acción, el usuario obtendrá la respuesta. Se debe
tener en cuenta si la interfaz del usuario permite realizar múltiples
tareas que a su vez implemente correctamente las tareas del usuario. También
podrá contar con opciones de "búsqueda simple" y "búsqueda
avanzada", esta última aprovechando las ventajas que ofrecen las ontologías,
ya que la interfaz incluirá una verificación de las restricciones
contenidas implícitamente en las clases, relaciones y axiomas de la ontología.
Además podrá incluir una etiqueta con el nombre "Lo más
buscado" o "Lo más relevante", la cual se refiere a un listado de preguntas
que ya han sido introducidas por otros usuarios en un período de tiempo.
El sistema en este caso puede disponer de un contador que mida a partir de la
frecuencia de aparición de términos, cuáles han sido los
más consultados dentro de un período de tiempo determinado. Las
consultas se organizarán en forma de lista y la cantidad que se mostrará
visible en la interfaz de usuario estará en dependencia de los criterios
del desarrollador del sistema. No obstante,
los autores consideraron que la interfaz de usuario deberá ser diseñada
a partir de los requerimientos referidos por los usuarios e identificados en
la primera fase de concepción del sistema, y por un arquitecto de información
que organice, estructure y represente la información que será
mostrada al usuario final. En dependencia de esto, podrá considerarse
el diseño de una aplicación web o una aplicación de escritorio.
e) Implementación del sistema. En este paso se desarrollará el sistema a partir de la metodología y de tecnologías seleccionadas previamente.
VALIDACIÓN DEL MODELO
Para la validación del modelo propuesto se tuvo en cuenta la opinión de un grupo de profesionales con experiencia en la temática de Gestión de Proyectos. La propuesta se sometió a evaluación a través del criterio de expertos. Para eso se aplicó un cuestionario, y a partir de los pasos propuestos en el modelo se midieron los siguientes indicadores: muy importante, bastante importante, importante, poco importante, no importante, los cuales fueron evaluados para obtener un total según valores añadidos por cada indicador, y se obtuvieron los siguientes resultados:
De los 9 expertos encuestados, el 88 % coincidió en que el paso 1 (análisis de dominio) era muy importante y solo el 11 % lo consideró bastante importante. Así para el paso 2 (extracción de datos), el 77 % muy importante y el 22 % bastante importante. Para el paso 3 (conceptualización) el 99 % estuvo de acuerdo con que era un paso muy importante y el 1 % bastante importante. El paso 4 (formalización) el 66 % se refirió como muy importante, el 22 % bastante importante y el 11 % como importante y, por último, en el paso 5, definido como interfaz de usuario, el 100 % alegó que era muy importante. De estos resultados se puede evidenciar que, de una forma u otra, todos los pasos establecidos a través del modelo son importantes, ya que la mayoría de los encuestados estuvieron a favor y en ningún caso se correspondió con que los pasos eran poco importantes o no importantes (Fig. 3)
CONCLUSIONES
El uso de ontologías se ha incrementado en varias áreas de la Informática, y existe en la actualidad un interés creciente sobre su uso en el diseño y en el desarrollo de los sistemas de organización del conocimiento.La disponibilidad del conocimiento almacenado en ontologías puede proveer los mecanismos necesarios para organizar, almacenar y acceder a la información de ítems que incluyen esquemas de bases de datos, objetos de interfaz de usuario y programas de aplicación.
El uso de ontologías en el desarrollo de los sistemas de recuperación de información permitirá establecer correspondencia y relaciones entre los diferentes dominios de entidades de información.Los servicios de ontologías a partir de la terminología de un dominio ofrecerán ventajas para elaborar otros modelos de sistemas de recuperación de información, prestar servicios y gestionar el conocimiento del dominio que se represente.La elaboración y la construcción de una ontología debe tener en cuenta su relación con la arquitectura del Sistema de información en el que va a estar inmersa, sin olvidar la importancia que se deriva de formular teorías del conocimiento sobre un dominio determinado.
Las metodologías para el diseño de ontologías todavía hoy son objeto de búsqueda y en general ninguna cubre todas las alternativas posibles en cada paso, aunque se plantea que las metodologías, a pesar de sus diferencias, poseen algunos componentes básicos, en particular: especificación, conceptualización, formalización, implementación y mantenimiento. Las ontologías y los SIBO están desarrollándose y aplicándose en una variedad de áreas de aplicación emergentes tales como modelización de empresas, diagnósticos, toma de decisión, planeamiento y adaptación, modelado de procesos y sistemas.
El
modelo propuesto permitirá la obtención de nuevos conocimientos
respecto a un dominio del conocimiento a través de sus características,
propiedades, relaciones esenciales y funcionales. Su construcción teórica
facilitará interpretar, diseñar y reproducir de forma simplificada
la realidad que representa a partir de una necesidad concreta. El diseño
del modelo permitirá diseñar y construir sistemas de información
basados en ontologías de dominio para la recuperación de información,
que faciliten la gestión del conocimiento y la toma de decisiones.
REFERENCIAS BIBLIOGRÁFICAS
1. Hjørland B. Theories of knowledge organization-theories of knowledge: 13th Meeting of the German ISKO in Potsdam. Knowledge organization. 2013;40(3):169-81.
2. Hjørland
B, Albrechtsen H. Toward a new horizon in information science: domain-analysis.
J Amer Soc Inf Sci. 1995;46(6):400-25.
3. Hjørland B. Epistemologic fundamentals and paradigms of research in knowledge organization. In: Frías JA Travieso C. Tendencias de Investigación en Organización del Conocimiento: Edición Universidad de Salamanca; 2010.
4. Dalhberg K. Knowledge organization: A new science? El profesional de la información. 2012;21(3):225-7.
5. López-Huertas MJ. Some current research questions in the field of knowledge organization. Knowledge organization. 2008;35(2):113-36.
6. Rodríguez‐Bárcenas G, López‐Huertas MJ. Saaty's analytic hierarchies method for knowledge organization in decision-making. J Amer Soc Info Scie Techn. 2013;64(7):54-67.
7. Gnoli C. A new relationship for multidisciplinary knowledge organization systems: dependence. VIII Congreso ISKO. 2010 [citado 10 de mayo de 2014]. Disponible en: http://www.iskoi.org/ilc/dependence.rdf
8. Rivero D. Análisis, diseño e implantación de aplicación LIMS para la automatización de la gestión de los laboratorios de INTEVEP. Escuela de Ingeniería de Sistemas. Universidad de Los Andes; 2008.
9. Albacete R. Influencia de las prácticas de gestión de la calidad sobre la gestión del conocimiento y la innovación en los servicios: el caso de las empresas hoteleras [Tesis doctoral]. Granada: Universidad de Granada; 2010.
10. Anass E, Berrada I. Xplor: the competitive intelligence system based on a multidimensional analysis model. Paper presented in Information System & Economic Intelligence SIIE; 2011.
11. Andersen J. Ascribing cognitive authority to scholarly document on the (possible) role of knowledge organization in scholarly comunication. Paper presented in Proceedings of the Seventh International ISKO Conference; 2004.
12. Finardi R. Migración y salud en zonas fronterizas: informe comparativo sobre cinco fronteras seleccionadas. CEPAL; 2010.
13. Ramírez Z. Las ontologías como herramienta en la gestión del conocimiento. Departamento de Bibliotecología y Ciencia de la Información. Universidad de La Habana; 2011.
14. Hjørland B. Information science and its core concepts: Levels of disagreement. Theories of information, communication and knowledge. Springer Netherlands; 2014:205-35.
15. Barité M. El control de vocabulario en la era digital: revisión conceptual. Rev Scire. 2014;20(1):2.
16. Barchini A, Álvarez-Herrera M. Dimensiones e indicadores de la calidad de una Ontología. Rev Av Sist Inform. 2011;7(1):29-38.
17. Gruber T. Principles for the design of ontologies used for knowledge sharing. Available as Technical Report KSL 93-04. Knowledge Systems Laboratory, Stanford University. 1993 [citado 12 de marzo de 2015]. Disponible en: http://citeseer.ist.psu.edu/gruber93toward.html
18. Pedraza-Jiménez R. Tesauros y ontologías en sistemas de información documental. El Profesional de la Información. 2011;20(5):555-63.
19.
Ramos E, Núñez H. Ontologías: componentes, metodologías,
lenguajes y aplicaciones. RT 2007-12. Centro de Ingeniería de Software
y Sistemas (YSYS) Laboratorio de Inteligencia Artificial (LIA) Universidad Central
de Venezuela. ISSN 1316-6239. 2012 [citado 20 de febrero de 2015].
Disponible en: http://www.ciens.ucv.ve/escueladecomputacion/documentos/archivo/51
20. Leiva A. An automat for the semantic processing of structured information. Paper presented at the International Conference on Intelligent Systems Design and Applications; 2009.
21. Chlsholm R. Realistic Theory of Categories An Essay on Ontology. Cambridge University Press; 1996.
22. Milton S, Kazmierczak E. Enriching the Ontological Foundations of Modelling in Information Systems. Macquarie University; 2000.
23. Milton S, Kazmierczak E. An ontological study of data modelling languages using Chisholm's Ontology. Maribor: 11th European-Japanese Conference Information Modelling and Knowledge bases; 2001.
24. Bunge M. Treatise on Basic Philosophy: Ontology II. Reidel; 1979.
25.
Wand Y, Weber R. An ontological model of an information system. IEEE transactions
on software engineering; 1990:82-92.
26. Rijsbergen V. Information retrieval: uncertainty and logics: advanced models for the representation and retrieval of information. Springer Science & Business Media; 2012.
27. Baeza Y, Ribeiro N. Modern Information Retrieval: ACM Press Books & Addison-Wesley; 1999.
28. Lenat D. Building large knowledge-based systems: representation and inference in the Cyc Project. Boston, Massachusetts: Addison-Wesley: 1990.
29. Lenat D, Guha RV. Reinforcing math knowledge by immersing students in a simulated learning-by-teaching experience. Internat J Artif Intellig Educ; 2014:24(3):216-50.
30. Corcho O, Fernández-López M, Gómez-Pérez A, Juristo N. Methontology: from ontological art towards ontological engineering. Spring Symposium on Ontological Engineering of AAAI. California: Stanford University; 1997. p. 33-40.
31. Uschold M, King M. Towards a methodology for building ontologies. In: Skuce D (eds) IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing; 1995.
32. Grüninger M, Fox M. Methodology for the design and evaluation of ontologies. In: Skuce D (ed) IJCAI'95 Workshop on Basic Ontological Issues in Knowledge Sharing; 1995.
33. Gómez-Pérez A, Juristo N, Montes C, Pazos J. Ingeniería del Conocimiento: Diseño y Construcción de Sistemas Expertos. Madrid: 1998.
34. Guzmán L. Metodologías y métodos para la construcción de ontologías. Rev Cien Tec. 2012 [citado 3 de abril de 2015];2(50). Disponible en: http://revistas.utp.edu.co/index.php/revistaciencia/article/view/6693
35. Hertz R. Introduction: reflexivity and voice. London: Sage Publications, Inc.; 1997.
36.
Salton G. A vector space model for automatic indexing. Communications of the
ACM. 1983;18(11):613-20.
37. Guarino N. Ontologies and knowledge bases: towards a terminological clarification. Roma: Laboratory for Applied Ontology. 2005 [citado 3 abril 2015]. Disponible en: http://www.loa-cnr.it/Papers/KBKS95.pdf
Recibido: 13 de
marzo de 2015.
Aprobado: 24 de agosto de 2015.
Anisleiby Fernández Hernández. Universidad de las Ciencias Informáticas. La Habana, Cuba. Correo electrónico: ani@uci.cu