Buscador Semántico
-
Upload
flor-cuenca -
Category
Education
-
view
1.552 -
download
2
description
Transcript of Buscador Semántico
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA
Sistemas Basados en El Conocimiento
Temas del Proyecto
“Buscador Semántico de Libros”
Elaborado por: Flor Cuenca Luis Sancho
Docente: Ing. Priscila Valdivieso
Ciclo: 10
Sistemas Basados en el Conocimiento
DOMINIO DEL PROYECTO
Contar con un buscador que facilite encontrar recursos de una manera mucho más precisa es un objetivo bastante ansiado por los internautas de hoy, sin embargo es de mucha utilidad contar con un buscador que nos faciliten las búsquedas de catálogo de recursos digitales dentro de una biblioteca, razón por la cual este proyecto va enfocado en aquello que es de mucha utilidad al momento de buscar información acerca de un tema en específico, generando al usuario la posibilidad de asignarle una valoración sobre su contenido para así mejorar los resultados presentados.
El eje principal de este proyecto va enfocado en la búsqueda de recursos educativos que traten sobre un tema en específico, brindándole al usuario los metadatos del recurso que le será de utilidad para lo que está buscando.
Cabe recalcar que el buscador que se pretende desarrollar se limitará únicamente a realizar búsquedas de recursos que pertenezcan al área técnica y que estén dentro de las categorías que posteriormente serán definidas.
Para concluir lo que se busca con este aplicativo es inferir el conocimiento almacenado en una ontología o en una base de datos e ir alimentado a la base del conocimiento con nueva información (rating) y con ello obtener un resultado muchos más acorde a lo que estamos buscando, siendo como agente activo el usuario con sus aportaciones para contribuir a la Base de Conocimientos.
ALCANCE
Nuestro proyecto tiene como objetivo permitir realizar las siguientes actividades dentro del buscador de catálogos para una determinada biblioteca.
1. Metadatos.- Ésta información se refiere a los datos que describirán un recurso y contendrá los siguientes campos:
* Titulo: Titulo del recurso.
* Autor: Autor o autores
* Año: Año de publicación del recurso
* Edición: Número o año de edición
* Descripción: Información que permitirá al buscador inferir a que categoría pertenece, será de mucha utilidad al momento de buscar resultados para el usuario.
* Editorial: Editorial que se encarga de la distribución de los ejemplares.
2. Buscador.- El buscador únicamente obtendrá información de la base de conocimiento que se encuentra almacenada en la ontología y en una base de datos que será alimentada con información
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
que el usuario ingrese acerca de un determinado libro, siendo el recurso priorizado en la siguiente búsqueda que realice un usuario.
3. Opciones de usuario.- El usuario podrá catalogar a un recurso dentro de una escala de valoración entre 1 y 10 de acuerdo a su utilidad, dicha información será almacenada en la BD para ser tomada en cuenta en las próximas búsquedas.
4. Recursos.- La información que se presentará al usuario es únicamente lo que se describe en los metadatos, no existirá la posibilidad de descargar el material en ningún formato, simplemente serán de solo lectura.
5. Opciones de búsqueda.- El buscador presentara resultados únicamente para aquellos recursos que se encuentren dentro del área técnica, por lo tanto si se utiliza terminología que no pertenece a dicha área no arrojará ningún resultado.
6.-Terminología a utilizar.- Para realizar una búsqueda se puede utilizar vocabulario que se encuentre únicamente dentro de los recursos que pertenecen al área técnica.
“Ejemplo: Si estamos buscando información que hable acerca de logaritmos, el buscador automáticamente sabrá que el usuario está buscando un recurso que pertenece al área técnica y por ende presentará en orden de prioridad todos aquellos recursos que pertenecen a dicha área.”
7. Prioridad de resultados.- En caso de que dos o más recursos tenga el mismo nivel de aceptación en base a lo que el usuario busca, se tomará en cuenta el rating (número de aceptaciones dadas por los usuarios) que contiene el recurso y se presentaran en forma descendente.
HERRAMIENTAS A USAR
Para el desarrollo del proyecto “Buscador Semántico” se usaron las siguientes herramientas:
CmapTools Coe: nos permitirá describir las relaciones que existen en cada una de las clases con los objetos.
SPARQL: lenguaje estandarizado para la consulta de grafos RDF, tecnología clave en el desarrollo de la Web Semántica.
Jena: es un framework Java para la creación de la Web Semántica aplicaciones. Proporciona un entorno de programación para RDF , RDFS y de OWL , SPARQL e incluye una base del motor de inferencia de la regla.
Richfaces: es una librería de componentes visuales para JSF, escrita en su origen por Exadel y adquirida por Jboss. Además, RichFaces posee un framework avanzado para la integración de funcionalidades Ajax en dichos componentes visuales, mediante el soporte de la librería Ajax4JSF.
Mysql: es un sistema de gestión de base de datos relacional, multi-hilo y multiusuario con más de seis millones de instalaciones.
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
Protege: es una de código abierto plataforma gratuita que proporciona una creciente comunidad de usuarios con un conjunto de herramientas para construir modelos de dominio y aplicaciones basadas en el conocimiento con ontologías.
Java: lenguaje de programación y la primera plataforma informática creada por Sun Microsystems en 1995.
CATEGORÍAS
Las principales categorías que se manejaran serán:
Matemáticas Proyectos Electrónica InteligenciaArtificial Redes Física Web Software
OBJETOS
1.- Recurso
- Titulo
- Autor
- Área a la que pertenece.
- Año de publicación
2.- Usuario
PROPIEDADES
- Username
- Nombre
- Apellido
- Dirección
- Nacionalidad
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
- Edad
TAREA 1: CONSTRUCCIÓN DEL GLOSARIO DE TÉRMINOS
Nombre Sinónimo Acrónimo Descripción TipoAccesibilidad -- Se refiere a la accesibilidad
que tendrá un determinado recurso.
Propiedad de clase
Agentes -- Término más usado en IA hacer referencia a robots que hacen el trabajo manual de los humanos los mismos está programados.
Propiedad de clase
Año de edición Anio_edicion Hace referencia al año de edición de un determinado libro.
Propiedad de clase
Antenas -- Dispositivo de formas muy diversas que, en los emisores y receptores de ondas electromagnéticas, sirve para emitirlas o recibirlas
Propiedad de clase
Aplicaciones -- Cada uno de los programas que, una vez ejecutados, permiten trabajar con el ordenador
Propiedad de clase
Are -- Dícese de que un objeto que es parte de una categoría o clase.
Relación
Artificial -- Algo no natural. Propiedad de claseAutor -- Persona que realiza, causa u
origina algo.Propiedad de clase
Cableado -- Conjunto de cables que forman parte de un aparato o sistema eléctrico.
Propiedad de clase
can be -- Dícese de que un objeto que puede ser parte de una categoría o clase.
Relación
Capas -- Cada una de las partes superpuestas que forman un todo en un cableado o estructura.
Propiedad de clase
Circuitos -- Conjunto de conductores que recorre una corriente
Propiedad de clase
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
eléctrica.Codigo -- Serie de líneas y números
asociados para generar nuevas aplicaciones.
Propiedad de clase
Compuertas -- Se refiere a las compuertas dentro de los circuitos electrónicos.
Propiedad de clase
Contenido -- Se refiere al contenido de un recurso.
Propiedad de clase
Contiene -- Dícese de que una clase que contiene un objeto.
relación
Control -- Una de las etapas de la elaboración de un proyecto.
Propiedad de clase
Direccion -- Una de las etapas de la elaboración de un proyecto.
Propiedad de clase
Disenio -- Estructura de un proyecto, como se verá para el usuario final.
Propiedad de clase
Ecuaciones -- Igualdad que contiene una o más funciones.
Propiedad de clase
Edicion -- Conjunto de ejemplares de una obra de una sola.
Propiedad de clase
Editorial -- Empresa que se dedica a imprimir recursos.
Propiedad de clase
Electronica -- Rama de la física que estudia los fenómenos basados en la influencia de campos electromagnéticos sobre el movimiento de los electrones libres en el vacío, en gases o en semiconductores
Clase
Encriptacion -- Forma de seguridad para acceso a un sitio, se usan algoritmos.
Propiedad de clase
Energia -- Calor, combustible, carburante, electricidad, petróleo, gas
Propiedad de clase
Estandares -- Tipo, modelo, patrón Propiedad de claseFisica -- Ciencia, mecánica, acústica,
termodinámica, electricidad, radiactividad, óptica
Clase
--Formulas -- Enunciado, expresión, ley,
término, formulaciónPropiedad de clase
Funciones -- Diferentes tareas que se han Propiedad de claseBuscador Semántico
[email protected]@gmail.com
Sistemas Basados en el Conocimiento
especificado y que se deben llevar a cabo.
Gestion -- Dirección, gobierno, administración
Propiedad de clase
Humana -- Hombre, persona, ser, individuo, ente, sujeto
Propiedad de clase
Informacion -- Aviso, reportaje, testimonio, comunicación, aclaración, advertencia, asesoría, averiguación, indagación
Propiedad de clase
Inteligencia -- Intelecto, mente, pensamiento, imaginación, comprensión, conocimiento, entendimiento, razonamiento, juicio, razón
Propiedad de clase
Inteligencia Artificial -- Esta expresión se usa para referirse a la disciplina de la informática
Clase
Leyes -- En la física se refiere a peso, medida, proporción, porcentaje.
Propiedad de clase
Libro -- Ejemplar, tomo, volumen, obra, texto, manual.
Clase
Logaritmos -- Dícese del exponente, base. Propiedad de claseLogica -- Dícese de la dialéctica,
razonamiento, métodoPropiedad de clase
Logicas -- Dícese de la dialéctica, razonamiento, método
Propiedad de clase
Maquetacion -- Distribución de elementos en el diseño gráfico.
Propiedad de clase
Masa -- En física, es la cantidad de materia de un cuerpo.
Propiedad de clase
Matematicas -- Ciencia que, partiendo de axiomas y siguiendo el razonamiento lógico, estudia las propiedades y relaciones cuantitativas entre los entes abstractos.
Clase
Metodologias -- Hace referencia al conjunto de procedimientos basados en principios lógicos, utilizados para alcanzar una gama de objetivos que rigen en una investigación científica o en una exposición doctrinal.
Propiedad de clase
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
must be -- Dícese de que un objeto puede ser parte de una categoría o clase.
Relación
Nombre -- Es la designación o denominación verbal.
Propiedad de clase
Numeros -- Es una entidad abstracta que representa una cantidad (de una magnitud).
Propiedad de clase
Operadores -- Símbolo matemático que indica que debe ser llevada a cabo una operación especificada sobre un cierto número de operandos
Propiedad de clase
Orden -- Propiedad de claseOwl -- Extensión de los archivos que
se trabajan en Protégé.Propiedad de clase
Paginas -- Cantidad de hojas de un libro o revista.
Propiedad de clase
PaginaWeb -- Sitio en el cual se encuentran varios recursos.
Clase
Paper -- Recurso digital de una investigación.
Clase
Peso -- Cantidad de medida. Propiedad de clasePlanificacion -- Una de las tareas dentro del
proceso de desarrollo de un proyecto.
Propiedad de clase
Primero -- Haciendo referencia a ecuaciones de primer grado, es aquella que después de simplificada tiene la forma ax + b = c o sea una sola variable y con exponente 1
Propiedad de clase
Procesos -- Pasos que deben ejecutarse para la elaboración de un proyecto.
Propiedad de clase
Programacion -- Acción y efecto de programar. Propiedad de claseProtocolos -- Las vías por donde cierto tipo
de información va a circular.Propiedad de clase
Proyecto -- Tarea la cual concierne diferentes factores.
Clase
Radiactividad -- Propiedad de los isótopos que son "inestables".
Propiedad de clase
Recurso -- La palabra recurso se emplea en diversos ámbitos, pero siempre con el significado de ser medio para el logro de
Clase
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
fines.Redes -- Hace referencia a un conjunto
de entidades (objetos, personas, etc.) conectadas entre sí.
Clase
Resultados -- Efectos que se obtienen luego de aplicar alguna metodología de trabajo.
Propiedad de clase
Revista -- Recurso en el cual se publica temas de interés.
Clase
Robótica -- Rama de la Electrónica. Propiedad de claseSe clasifican en -- Se define así para determinar
la clasificación de varios objetos.
Relación
Segundo -- Hacer referencia a la igualdad que se nos forma al sustituir la " y " de una función cuadrática por 0, en una ecuación de segundo grado.
Propiedad de clase
Seguridad -- Conjunto de medidas tomadas para protegerse contra robos, ataques tanto físicos como lógicos.
Propiedad de clase
Semantica -- Estudio del significado de los signos lingüísticos; esto es, palabras, expresiones y oraciones.
Propiedad de clase
Software -- Conjunto de programas que tiene un PC.
Clase
Son definidos como -- Se lo define así para hacer referencia a un conjunto de objetos.
Relación
Telecomunicaciones -- Sistema de Conmutación, Interconexión y finalmente subsistema de Soporte
Propiedad de clase
Tiene -- RelaciónTitulo -- Dícese del nombre de un
recurso, libro o revista.Propiedad de clase
Transporte -- En redes se dice de la capa que ayuda a transferir datos.
Propiedad de clase
Trigonometria -- Parte de la matemática que se encarga del cálculo de los elementos de los triángulos.
Propiedad de clase
url -- Consiste en una secuencia de caracteres que identifica de forma única a algún recurso
Propiedad de clase
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
de Internet sea una imagen, una página o cualquier otro recurso
Usuarios -- Clientes finales que se benefician de un resultado o proyecto.
Propiedad de clase
Vectores -- Es todo segmento de recta dirigido en el espacio.
Propiedad de clase
Vulnerabilidades -- Se dice de las desventajas de un programa o proyecto tanto a nivel físico o lógico.
Propiedad de clase
Web -- Sistema de distribución de información basado en hipertexto o hipermedias enlazadas y accesibles a través de Internet.
Clase
TAREA 2: CONSTRUCCIÓN DE LA TAXONOMÍA
Para tener una mejor idea de las diversas relaciones entre las propiedades se creó una taxonomía en CmapTools Coe.
Buscador Semá[email protected]
TAREA 3: CONSTRUCCIÓN DE LAS RELACIONES BINARIAS
Sistemas Basados en el Conocimiento
IMPLEMENTACIÓN
Para la implementación de la funcionalidad del proyecto se realizaron las siguientes actividades:
Se seleccionó el framework Jena, el cual nos permite trabajar una ontología con una base de datos relacional utilizando para ello consultas sparql que son procesadas por dicho framework para posteriormente extraer los datos de la BD.
Se presenta un formulario donde se solicita al usuario que ingrese un tema en específico que quiere buscar.
En base al criterio ingresado por el usuario, se arma la consulta sparql que posteriormente será ejecutada por Jena para extraer los datos desde la BD.
Una vez que obtenemos los resultados de la consulta, estos son presentados al usuario dándole la posibilidad de seleccionar cualquiera de ellos y ver más detalle del libro.
EN NUESTRO PROYECTO SE PUEDE APRECIAR LAS SIGUIENTES
CLASES:
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
Área, Autor, Categoría, Editorial, Idioma, Libro, PaginaWeb, País.
A continuación tenemos los objetos que van a relacionar las clases:
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
Libro, país, idioma, area, paginaweb, autor, editorial, categoría, hasidioma, hascategoria, hasarea.
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
A continuación tenemos los atributos de las clases:
Y AHORA LAS PROPIEDADES EXTRÍNSECAS E INTRÍNSECAS
IDENTIFICADAS DE CADA CLASE.
Extrínsecas(heredadas) Intrínsecas(propias)ÁREA libroAUTOR Dirección , nombreCATEGORÍA LibroIDIOMA InstanciasLIBRO Año de publicación, apellido. Dirección, url, descripción,
volumen, nombre, titulo.PAGINAWEB InstanciasPAÍS país Idioma
Buscador Semá[email protected]
Sistemas Basados en el Conocimiento
CONCLUSIONES
Para el desarrollo de este proyecto se delimito acerca del entorno de trabajo en el que va a interactuar de manera que se pueda lograr el objetivo deseado.
Con la ayuda de herramientas como CmapTools Coe se puede diseñar las relaciones entre las clases de manera fácil.
Con la ayuda de Protégé se puede modelar la estructura que se diseñó en CmapTools Coe y en la cual se puede agregar diferentes características que ayudan a entender mejor la problemática con la que se está trabajando.
RECOMENDACIONES
Se debe definir bien el alcance de manera que la Ontología no se expanda mucho y así se pueda tener resultados óptimos.
BIBLIOGRAFÍA
Consultado abril del 2010, Sinbad Sistemas de Información y Base de datos: http://sinbad.dit.upm.es/docencia/doctorado/curso0809/curso0809.html
Consultado abril del 2010, RichFaces Developer Guide:
http://docs.jboss.org/richfaces/latest_3_3_X/en/devguide/html_single/
Consultado abril, mayo del 2010, Protégé:
http://protege.stanford.edu/
Buscador Semá[email protected]