Technology Spain , Salamanca, Monday, May 18 of 2015, 17:19
INESPO II

La UPSA explora las posibilidades de los datos abiertos en internet

La unión de los datos enlazados de la web semántica y los datos abiertos crea el campo del Open Linked Data y la Universidad Pontificia de Salamanca desarrolla proyectos como aplicaciones para el turismo

José Pichel Andrés/DICYT La Facultad de Informática de la Universidad Pontificia de Salamanca (UPSA) investiga en el campo del Open Linked Data, el término inglés que designa los datos abiertos y enlazados. Las posibilidades que hoy en día ofrece internet podrían multiplicarse en los próximos años con el desarrollo de estas tecnologías, que enriquecen la búsqueda de datos y hacen posible la nueva web semántica, que ofrece información adicional y conecta datos de forma inteligente.

 

Ana Fermoso, al frente del grupo de investigación Tecnologías y Servicios de Movilidad Web, explica algunos detalles sobre la web semántica. “Dota de significado a la información a través de ciertas etiquetas que permiten, por ejemplo, que las búsquedas sean más inteligentes”, comenta en declaraciones a DiCYT. Los datos enlazados o Linked Data son una parte de esa web semántica, una forma de vincular datos distribuidos por la web, igual que se hace entre dos páginas mediante enlaces.

 

Por otra parte, otra tendencia en internet son los datos abiertos u Open Data. Especialmente las administraciones públicas por la creciente exigencia de transparencia, pero también organismos privados, publican datos libres de derechos de autor para que puedan ser utilizados por terceros. “El objetivo es que esa información sirva para crear servicios para los ciudadanos a través de la tecnología”, señala la experta. El formato en el que se publican esos datos es muy importante para poder reutilizarlos y el ideal es el denominado RDF (del inglés Resource Description Framework o marco de descripción de recursos).

 

Al mezclar los conceptos de datos enlazados y datos abiertos surge el Open Linked Data. “La idea de que los datos abiertos se puedan vincular con otros datos que existan en la web semántica tiene un enorme potencial”, afirma Ana Fermoso. “Es una manera de inferir conocimientos sin trabajo añadido, simplemente enlazando, y para ello el único requisito es que la información esté publicada en el formato RDF.

 

Por ejemplo, el proyecto DBPedia es la traducción de la información que existe en la conocida enciclopedia Wikipedia al formato semántico. Al estar en RDF, se puede enlazar esta información en la web semántica, mientras que otros formatos similares sirven para otras funciones, como la geolocalización.

 

En el lenguaje de programación HTML, que se utiliza habitualmente en las páginas web, “sólo el ser humano es capaz de filtrar si la información es adecuada”, pero gracias a las etiquetas semánticas que añade RDF “una máquina puede razonar por el significado” y asociar nuevos contenidos valiosos.

 

Desarrollar este campo es un gran proyecto mundial que se va construyendo poco a poco sin invalidar lo que ya existe. Los investigadores de la Facultad de Informática de la UPSA realizan sus aportaciones a través de pequeños proyectos que ayudan a probar el potencial que tiene.

 

Por ejemplo, la BBC, la radiotelevisión pública británica, ya ofrece en formato de web semántica datos sobre música o programas. Al trabajar con sus bases de datos, se puede generar automáticamente mucha más información sobre los contenidos que ofrecen, por ejemplo, sobre un músico en particular. En esta línea, la UPSA desarrolló un proyecto con Telefónica relacionado con BBC Programmes.

 

Datos abiertos para el turismo

 

Más tarde, ante el lanzamiento del Portal de Datos Abiertos de la Junta de Castilla y León, el equipo de Ana Fermoso comenzó a realizar proyectos específicos relacionados con la región y, en particular, con el turismo. El primero fue una aplicación para móvil y web denominada Quédate en Castilla y León, que permitía buscar establecimientos relacionados con el alojamiento y la hostelería, como hoteles, cafeterías o albergues. “Al viajar por la comunidad e interrelacionar este tipo de datos, la información se puede multiplicar”, señala la investigadora. Por ejemplo, “si en DBPedia hay información sobre un lugar determinado, se puede enlazar automáticamente sin que el programador de la aplicación la tenga que agregar”.

 

En la misma línea nació otro proyecto que formó parte de la pasada edición del Club Universitario de Innovación, iniciativa con la que la UPSA involucra a sus alumnos en la investigación. Era una aplicación para dispositivos Android denominada Smart Tourism y centrada en el turismo de Salamanca, aunque el mismo modelo podría ser útil para cualquier ciudad. Desde el punto de vista del usuario, la app ofrece una guía de monumentos y lugares de interés, mostrando su posición en un mapa respecto al usuario y con fichas sobre características, horarios, precios y una galería de imágenes.

 

Sin embargo, desde el punto de vista técnico resulta muy novedoso porque usa la tecnología Open Linked Data para conseguir esos elementos a través de diferentes fuentes de internet, como los datos publicados por la Junta, la DBPedia o Flickr, a la vez que favorece una participación activa del usuario, que pueden incorporar nuevas fotografías.

 

“Las posibilidades de los datos abiertos en internet son infinitas”, comenta Ana Fermoso, “todo depende de la imaginación, de pensar cómo puedes sacarle partido a los datos, de los datos que se vayan publicando y de que cada vez contenga más conjuntos de datos enlazados”.