10 de marzo de 2005

La Web Semántica

Todas las posibilidades que Internet ofrece hoy quedan aproximadamente a la mitad del camino que Tim Berners-Lee y sus colegas plantearon en los cimientos de la World Wide Web. Lo que tenemos es mucho: unos sistemas de publicación y comunicación que nos permiten informar, dialogar y colaborar. Lo que está previsto pero aún no tenemos es... mucho más. El horizonte hacia el que se dirige este camino es la web semántica por la que está apostando el W3C y los principales actores de la evolución de Internet.
Consultamos webs y buzones desde muchos lugares, conectados y ahora también sin cables. El audio y el vídeo se abren espacio en una WWW ya no limitada a la transmisión de textos, imágenes y toscas animaciones. Las traducciones automáticas y el reconocimiento de escritura manual y voz avanzan. Teléfonos, agendas, consolas de videojuegos, televisores, cámaras, reproductores de música y una lista cada vez más larga de dispositivos domésticos, ofimáticos e industriales incorporan chips y saltan a la red. Las aplicaciones informáticas se democratizan y cada vez más gente puede montar su base online con múltiples posibilidades, en pocos minutos y sin tocar una línea de código. Convertir un ordenador en un servidor temporal es tan sencillo como instalar un programa y ofrecer tus archivos.
Todo esto ya está aquí e irá mejorando.
Las páginas que en tal navegador no se abren, el plugin a instalar, el driver que falta, el virus adjunto, el spam persistente, los buscadores con 34.324 resultados, el programa que no se entiende, la web que no ayuda... Las soluciones a estos problemas están planificadas, acordadas, en muchos casos desarrolladas y en creciente implantación. Se basan en estándares, compatibilidad, calidad, buenas prácticas, profesionalidad y sentido común. Estos criterios se pueden y deben aplicar a proyectos en cualquier escala, empezando por los que llevas entre manos.

Las capas de la web semántica. Fuente W3C.

Las principales líneas de avance hacia la implantación de la web semántica son:

• La universalización del juego de caracteres Unicode [4], tanto para los contenidos como para los lenguajes de programación que hay tras ellos. Es estándar existe y se trata de irlo implementando. Esto evitará los problemas a todos los niveles que continúan habiendo cuando diversos juegos de caracteres chocan: contraseñas con eñe o acentos, direcciones y dominios tipo begoña@cañizares.org, buscadores que no encuentran “pasión” si escribes “pasion”, y ni hablemos de las incompatibilidades con las que se encuentran chinos, árabes y todo ese porcentaje mayoritario de la Humanidad que utiliza grafías no latinas en su vida offline.

• Un lenguaje común de publicación que permita la compatibilidad para todo tipo de dispositivos y programas. El XML (eXtensible Markup Language) [5] está especificado y recibe el apoyo de quienes deciden en qué formatos se soportan los contenidos digitales. Este lenguaje permite ya la publicación web basada en estilos (CSS - Cascade Style Sheets) [6], separando diseño de contenido y abriendo la puerta a sistemas de personalización y rediseño muchos más simples y flexibles que los basados en HTML. •Un etiquetado de información semántico que permita a los dispositivos no sólo transmitir datos sino también entenderlos, para así comunicarlos mejor a otros dispositivos y a las personas. Es la diferencia entre repetir lo que dice un ruso o entender y saber hablar ruso. La RDF (Resource Description Framework) [7] tiene la fase de experimentación muy avanzada y su implantación revolucionará la manera en que buscamos (¡y encontramos!) información, nos permitirá navegar por espacios especializados (como la gastronomía o la astrofísica) o mantener lejos temáticas que deseemos evitar (como el fútbol o la pornografía).

• Un sistema generalizado de firma y encriptación que permita definir la autoría de contenidos, fechas de modificación, quién puede acceder a ellos, quién puede modificarlos, quien puede modificar las reglas de acceso, etc. El protocolo DSig (Digital Signature) [8] combinado con las especificaciones PICS (Platform for Internet Content Selection) [9] ofrecerán soluciones a los adultos que tutelan a hijos y alumnos usuarios de Internet. La combinación de DSig con XML y RDF permitirá a los buscadores y navegadores (cada vez más enlazados) descartar páginas caducadas y remitir a sus versiones actualizadas, controlar y guardar cambios en versiones [10], localizar traducciones oficiales, buscar contenidos firmados por un mismo autor, etc. Todo esto implica unas estructuras de confianza y unos mecanismos de comprobación que de momento se encuentran en fase de definición, aunque la base tecnológica de firma y encriptación está ya desarrollada [11].

• Una comunicación fluida no sólo entre personas sino también entre personas y dispositivos y (todo un terreno por explorar) entre los propios dispositivos. SOAP (Simple Object Access Protocol) [12] es la propuesta del W3C sobre la cual aplicaciones y dispositivos de todo tipo aprendan a colaborar entre ellos. Esta es la pasarela hacia una nueva generación de servicios web automatizados que entenderán nuestras necesidades. Los niños de hoy se reirán en su juventud de los servicios online que actualmente consideramos rápidos y eficaces.

Tú también te reirás, antes de lo que crees. Todo esto puede parecer lejano pero también lo parecía meter cien canciones bajadas de Internet en algo así como un mechero, enviar fotos sacadas con un móvil en plena montaña o clicar Aceptar en la declaración de la renta que Hacienda te ha preparado y mostrado en su web.
Y ya ves, lo que era secreto a voces, informes para expertos y ciencia ficción está ya en los escaparates. Falta menos para el día en que la web semántica abrace este artículo, esos gadgets y hasta los propios escaparates.

1 comentario:

David Ruiz dijo...
Este comentario ha sido eliminado por el autor.