El spam matará (está matando) a la Web semántica

Leo con enorme interés una entrevista a Héctor García porque en el titular aparece el témino Web semántica. En primer lugar, extractaré los fragmentos que más me han llamado la atención:

"El tiempo que transcurre entre que un blog publica un contenido hasta que lo muestra Technorati es mucho menor que en los buscadores tradicionales, y además ahora estamos intentando ordenar la información por criterios adicionales al temporal, tener en cuenta la relevancia o autoridad de quien escribe". Y dos respuestas después: "El valor que tiene cada página es el mismo, siempre que sea un blog, el que la página se publique bajo el dominio de Internet de una empresa famosa no hace que para Technorati esa web tenga más relevancia". Estoy seguro de que es posible combinar ambos criterios, pero se me hace difícil creer que cuando hablan de relevancia o autoridad personal no se deslicen sigilosamente hacia la relevancia o autoridad de dominio o marca...

Su opinión sobre la web semántica, en cambio, sí me da que pensar:

"Yo siempre digo que la web semántica supone pasar el marrón a los demás, a los usuarios y creadores de contenidos. Actualmente, Internet es un desastre en cuanto a organización de la información, y los buscadores no hemos sido capaces de clasificarla, técnicamente hablando cada uno actúa por su cuenta y pocos creadores de páginas las marcan con herramientas que describan sus contenidos. Los buscadores acudimos a ellas y recopilamos información, palabras clave, enlaces, etc, pero sin tener mucha información real sobre el contenido. La web semántica pide a los creadores de contenidos que los marquen especificando de qué va cada página, con sistemas que luego se pueden leer automáticamente. Es una forma de pasarles la pelota a ellos y a quienes desarrollan herramientas para la creación de páginas, pero luego el trabajo volverá a los buscadores, que tendrían que ser capaces de leer toda esa información".

En primer lugar, la inexactitud del titular que afirma que la web semántica traslada el marrón al usuario: el mismo García lo diagnostica adecuadamente en el texto al señalar que son los proveedores de contenido quienes deben asumir la labor de identificar y etiquetar correctamente sus páginas, y también que los buscadores deben ser modificados (y eso supone un importante trabajo) para poder "leer" las etiquetas semánticas de cada web. Pero bueno, cada cambio tecnológico supone una tarea ingente para ambas partes. En todo caso el usuario/consumidor de a pie deberá aprender a ser más exacto en el tecleo de sus búsquedas, lo cual no me parece mal porque supondría un avance respecto al actual "free sex download".

Eso sí, debo admitir mi error matizando y revisando mi (hasta ahora) fe inquebrantable en la Web semántica, porque me doy cuenta de que la idea de que los navegadores y otras aplicaciones de la web puedan discernir significados polisémicos y ser más "humanas" en su trabajo se basa en una premisa utópica: que todo el mundo será tan honrado como para etiquetar semánticamente y sin desviarse de la verdad el contenido de sus páginas. La, a pesar de todo, eficacia del spam, la necesidad de visibilidad en los resultados de búsquedas, el cobro por posicionamiento, el reto tecnológico y la notoriedad que implica, los francotiradores del comercio electrónico y de la pornografía... Todo esto distorsiona y distorsionará la universalización de la web semántica. Si acaso, ésta podrá ser factible en determinadas webs, y quedar así delimitada como en esos barrios que se diseñan ex-novo en las ciudades, ofreciendo de serie lo que en el resto de zonas es un añadido posterior (o simplemente un lujo): cableado de fibra, iluminación ecológica, recogida neumática de basura... Pues la Web semántica igual: ofrecerá de serie lo que para el resto será un accesorio (caro) de implantar. Fuera de la "zona semántica" el caos absoluto (sobre el que Google reina porque sabe interpretarlo muy bien) seguirá siendo la pauta generalizada.

Soy un ingenuo y la Web semántica es un proyecto al estilo ilustrado, y precisamente por eso está parcialmente condenada al fracaso: porque supone que todos somos racionales y aceptamos unas reglas del juego idénticas para todos. El spam es la pauta realmente existente en Internet, la distorsión primera y más importante que impide ordenar mínimamente toda la información que contiene; así que más vale quitar el IVA a la Web semántica y profundizar, de momento, en la mejora de los actuales algoritmos de indexación, que tenemos Google para rato...

Comentarios

Entradas populares de este blog

La adolescente mano que mece la literatura (Antichrista)

¿Existe la literatura de anticipación informática?

Patologías conceptuales de la Generación X