March 29, 2024

Innovación y Barbarie (Cápsula 3.5) Watson is the new black?

Author: Alejandro Piscitelli
Go to Source

¿Qué es un vestido cognitivo? Enfoquémonos en cinco emociones humanas: alegría, pasión, excitación, curiosidad y ánimo. Tomemos algunos tejidos signados por el peso, la luminosidad y la flexibilidad. Una modelo desfila sobre la pasarela y el vestido cambia de color según los sentimientos sociales que el público vierte en Twitter a medida que las conversaciones públicas lo van abrazando.

Este es uno de los ejemplos más llamativos y menos significativos del poder de Watson (IBM) para interferir en  nuestras percepciones y valoraciones, que ya descolla en la predicción del tiempo, como asistente educativo en las formas de chatbot, en la industria farmacéutica, biológica y editorial.

Desde la enciclopedia de Diderot y D’Alembert hasta la Enciclopedia Británica, los humanos estamos obsesionados buscando encapsular al conocimiento y clasificarlo. Incluso en nuestro afán por manuvimos guerras de religión sobre taxonomías y sistemas de catalogación (Otlet, 2014; Day, 2014).

Durante siglos la batuta estuvo en manos de los expertos, pero con la creación de la Wikipedia en 2001, Jimmy Wales se convirtió en el Prometeo que arrebataría el fuego de los dioses de la curiosidad humana y lo dispersó entre la gente común. Sin embargo, a pesar de las 100 millones de horas invertidas en la invención de la Wikipedia, los mecanismos de creación, filtrado y curaduría siguen siendo humanos, con las ventajas y desventajas que esto supone (Lih, 2009; Jemielniak, 2014).

La aparición de plataformas de inteligencia artificial como Wolfram Alpha, Watson, etc. implica una nueva fase en el diseño de interacciones con la información. Nuevas interfaces, y la inmersión (sumergiéndonos en la información en vez de confrontarla) nos permitirán alcanzar mejores estadíos en su acceso, legibilidad y distribución. Y si bien aún estamos lejos de concretarlo en formatos efectivos, por ahora podemos contentarnos con modelos que nos permiten proyectar a nivel pequeño para luego, como siempre sucede, buscar lo más difícil: la escalabilidad.

3.5.1 Categorizaciones, taxonomías y organización del conocimiento

El sueño de capturar y organizar el conocimiento es tan antiguo como la historia. Desde los archivos de la antigua Sumeria y la Biblioteca de Alejandría hasta la Biblioteca del Congreso y Wikipedia, la humanidad ha luchado buscando el mejor aprovechamiento posible de su producción intelectual. La búsqueda eterna de la sabiduría está cada vez más sesgada hacia el almacenamiento y la recuperación (automatizada) de información que por el genio creativo, cada vez más diluido en los terremotos de la producción colaborativa.

Son innumerables los autores a lo largo de la historia que han descollado (generalmente infructuosamente) en ese intento. Desde fines del siglo XIX, Paul Otlet, bibliotecario de formación, trabajó en la expansión del potencial de la tarjeta de catálogo, el primer chip de información del mundo (Wright, 2014).

Internet tuvo muchos pioneros que dieron forma y contenido a su entidad, pero pocos como Paul Otlet, quien vió antes que muchos las posibilidades que esta podría ofrecer. Principalmente porque su trabajo de clasificación junto a La Fontaine (UDC, 1904) dividió el conocimiento en nueve categorías conocidas hasta hoy en día como “Lingüística, Matemática, Ciencias Naturales…” y que luego se subdividirían en 70.000 elementos, un nivel de detalle importante para esa época.

La propuesta era sencilla: organización y acceso. El objetivo de la vida de Otlet fue la construcción del Mundaneum, un cerebro colectivo mecánico que albergaría y difundiría todo lo que alguna vez se haya comprometido en el papel. Lleno de máquinas analógicas como telégrafos y clasificadores, el Mundaneum, lo que algunos han llamado una “versión Steampunk del hipertexto”, fue la encarnación de las ambiciones de Otlet.

De allí en adelante advinieron bibliotecas y museos universales, conectando su Bélgica natal con el mundo a través de una vasta empresa intelectual que intentó organizar y codificar todo lo publicado hasta ese momento. Cuarenta años antes de la primera computadora personal y cincuenta años antes del primer navegador -casi contemporáneo del nunca construido Memex de Vannevar Bush (Zachary, 1997), Otlet imaginó una red de “telescopios eléctricos” que permitiría a las personas de todo el mundo buscar en libros, periódicos, fotografías y grabaciones, todo unido en lo que él denominó, en 1934, un réseau mondial – esencialmente, una web mundial.

Su sueño fue de corta duración. Cuando los nazis, que estaban robando bibliotecas en toda Europa para recopilar información que consideraban útil, se llevaron la colección de Otlet en 1940, el sueño había terminado. Roto, Otlet murió en 1944. Pero sus ideas, propuestas y deseos continuaron, son la base que nos permiten pensar la red de redes hoy.

3.5.2 Internet antes de Internet.

Los arquitectos han sido claves en la definición de la red. Si bien a nivel popular podemos asimilarlos al personaje de The Matrix o a una persona que “solamente” hace edificios o casas, las decisiones que toman en cada una de las construcciones nos permite pensar en las posibilidades que tendrá ese espacio (Un ejemplo sublime es el Atlas Mnemosyne de Aby Warburg, 2010) como bien lo ejemplifican desde Rosan Bosch a Juan Carlos Baumgartner.

Retomando la obra de Otlet, en su “Tratado sobre la documentación, el libro sobre el libro“, el autor imaginaba un servicio para su Mundaneum, donde las personas pudieran comunicarse a través de “telescopios eléctricos” y buscar toda la información necesaria, a partir de una estructura que para la fecha ni siquiera existía en términos físicos. Si bien hoy podríamos categorizar a su propuesta en términos de una red centralizada, no es muy distinta de cómo usamos Internet cuando acudimos a Google en busca de preguntas y respuestas.

Por otra parte, la novedad de la propuesta de Otlet está en su apología de los hipervínculos, corazón de la Internet actual. Su visión anticipó, cuando se envía un documento particular o un conjunto de ellos, si éstos estaban en desacuerdo o acuerdo entre sí, es decir, conformando una galaxia de metadatos.

Vamos así mucho más allá del famoso esfuerzo de la Enciclopedia universal del siglo XVIII desarrollada por Denis Diderot y Jean Le Rond d’Alembert, junto con una estructura de clasificación, que pretendía alcanzar el “sistema figurativo del conocimiento humano” (Blom, 2010). Su esquema de clasificación fue harto controvertido. Clasificó las religiones del mundo según las ideas de la Ilustración, mostrando que la definición de la organización del conocimiento puede tener efectos en el mundo real. A pesar de las objeciones, la Enciclopedia se publicó entre 1751 y 1772 en 28 volúmenes con material complementario, para una lista de suscripción de 4000 nombres.

Cualquier esperanza de compactar todo lo que conocemos hoy en 100.000 libros, o 28 volúmenes enciclopédicos, se ha perdido para siempre. La Biblioteca del Congreso de Estados Unidos tiene 36 millones de libros y materiales impresos, y muchas bibliotecas universitarias también mantienen millones de libros.

En 2010, el Proyecto de la Biblioteca de Google Books examinó los principales catálogos y bases de datos de bibliotecas del mundo. El proyecto, que escanea libros impresos en formato digital, estima que existen 130 millones de títulos individuales. Para 2013, Google había digitalizado 20 millones de ellos. E inclusohabnía desarollado una podersa herramienta para leerlos (sin entenderlos) el Ngam Viewer.

Ahora, ¿cómo se organiza o quién organiza todo esta información?

3.5.3 ¿Wikipedia?, ¿Watson?, ¿Google?

Algunas charlas TED son mejores que otras, siendo nostálgicos, podemos pensar que la edición Global del 2005 fue una de las mejores no sólo en términos de expositores, sino también por sus contenidos. Yochai Benkler, Steven Pinker, Barry Schwartz, Richard Dawkins, Clay Shirky, Nick Bostrom y finalmente, Jimmy Wales. De la lista anterior, mencionamos a varios que han aparecido en este libro, pero ahora nos requiere un espacio el creador de Wikipedia.

En su charla acerca cde los orígenes de la Wikipedika, dónde referencia al nacimiento de la Enciclopedia libre con una idea sumamente radical para la época (teniendo en cuenta los años que contaba en ese entonces la Enciclopedia Británica), en el imntento de darle acceso gratuito a todas las personas, al acumulado del conocimiento humano. Todo escrito por voluntarios. Todo regulado por la comunidad. Todo en términos de darle a cada ciudadano, con acceso a internet, la posibilidad de tener una herramienta para tomar mejores decisiones, pero una herramienta que ellos mismos pudieran mejorar.

La vinculación entre Google y Wikipedia es casi simbiótica, mayor cantidad de enlaces o indexaciones que refiere el sitio, mayor relevancia en los resultados de búsqueda. Por esa razón nos encontramos con Wikipedia siempre entre las primeros diez resultados, pero el motor de búsqueda de la ahora empresa Alphabet, aún no ha logrado desarrollar la posibilidad de entender o combinar varios elementos de búsqueda. Es decir, lo suyo es la referencia directa, aunque su programa basado en inteligencia artificial ya comienza a buscar inferencias con su “Quizá quisiste decir?”.

En ese sentido Watson, el invento superador de Big Blue para la empresa IBM, nos posiciona en una búsqueda que nos permite vincular elementos en una posible respuesta de cuál arma es a la vez un disco de Los Beatles. Los resultados en Google nos llevan a Abbey Road o discografías de la mítica banda, pero sólo Watson nos diría que la respuesta es: Revolver (Pinggers, 2011).

Este tipo de habilidades han permitido a Watson llegar a ganar el juego de preguntas y respuestas más famoso de Estados Unidos, el Jeopardy. De la misma manera, Google desarrolló su sistema Alpha Go, que/quién logró ganarle cuatro partidas de cinco al campeón mundial de Go (una especie de ajedrez mucho más complejo) de origen coreano Lee Sedol. Incluso el programa Libratus logró ganarle partidas a los mejores del póker, donde gran parte del proceso fue que no le enseñaron jugadas, solamente las reglas y con ello logró aprender jugando contra sí misma (Muro, 2017)

Estos ejemplos no buscan polemizar sobre la supremacía de las máquinas sobre el humano, algo que retomaremos en Trabajo Centauro (capítulo 6), si no que permiten visualizar posibles futuros hacia donde los dispositivos nos permiten agilizar, pero también controlar, nuestras búsquedas.

3.5.4 Del Memex…

Vannevar Bush introdujo el concepto del Memex, que imaginó como una forma de aumento de la memoria (¿y de la inteligencia?) conformado por un dispositivo basado en microfilm en el cual un individuo almacena todos sus libros, registros y comunicaciones, y que está mecanizado para que pueda ser consultado con una velocidad y flexibilidad superiores durante la “morosa” década de 1930. Es un complemento íntimo y ampliado de su memoria”. (Nyce & Kahn, 1991; Bush, 1945).

Quería que el Memex emulara la forma en que el cerebro vincula los datos por asociación en lugar de índices y paradigmas de almacenamiento jerárquicos tradicionales y que fuera de fácil acceso. En palabras del autor: “un futuro dispositivo para uso individual (…) una especie de biblioteca y archivo privado mecanizado en forma de escritorio“. A su vez, el Memex también fue pensado como una herramienta para estudiar al propio cerebro.

Después de imaginar el potencial de la memoria aumentada durante varios años, Bush expuso sus pensamientos en detalle en “¿Cómo podemos pensar?” (1945) prediciendo que “aparecerán formas completamente nuevas de enciclopedias, listas con una malla de senderos asociativos que las recorren, listo para ser colocado en el Memex y allí amplificado“. Unos meses más tarde, la revista Life publicó una versión condensada de “Cómo podemos pensar”, acompañada de varias ilustraciones que muestran la posible aparición de una máquina Memex y sus dispositivos complementarios.

Poco después de que se publicara su ensayo, Douglas Engelbart lo leyó, y con la visión de Bush en mente, comenzó una tarea que más tarde conduciría a la invención del ratón, las ventanas, la pantalla gráfica y casi todos lo que hoy asociamos a la interacción multimedia en tiempos real. Ted Nelson, quien acuñó los términos “hipertexto” e “hipermedia”, también estuvo muy influenciado por el ensayo de Bush.

Pero una cosa es la clasificación taxonómica de la información, cuyo modelo más excelso es el mapa conceptual, y otra muy diferente es tener que lidiar diariamente con una miríada de opciones o árboles de opciones para tomar las decisiones más pedestres llegando ser entre 70 y 100 diarias.

Como bien sugiere Sebastian Thrun, autor del mas célebre MOOC de la historia en I.A. y ex jefe de los laboratorios de investigación de Google X: “Ojalá tuviera que pensar en comprar un boleto de avión, y no tener que pasar por este largo diálogo para explicárselo a otra persona. Eventualmente, me encantaría tener un sistema inteligente en mi cerebro y resolver estos problemas casi automáticamente“. ¿Esto significa que estamos yendo hacia un cerebro único y universal?

3.5.5 …a Siri, Alexa, Cortana y coetáneos.

Integrados en algunos de los dispositivos y servicios de Internet más utilizados, Siri (Apple), Cortana (Microsoft), Alexa (Amazon) y Allo (Google) están diseñados para responder al lenguaje común y anticipar qué es probable que los usuarios necesiten en el próximo momento o realizar tareas básicas.

Si el cerebro humano no puede soportar la tensión, están allí para asumir parte de la carga del procesamiento de la información. El objetivo es proporcionar respuestas directas a las preguntas orales, advertencias cuando los problemas de tráfico nos retrasan en una reunión, o programar citas automáticamente en nuestro calendario: hacer que la existencia digital sea una tarea menos complicada.

Las máquinas de I.A. con sonido humano como Hal en 2001: Una odisea del espacio y el avatar con atractivo sexual en Ella, sobre una historia de amor con una asistente parecida a Siri, han hecho que la idea de un ayudante digital omnisciente parezca engañosamente simple. Es que la cultura masiva pone un nivel alto, que para los técnicamente adeptos, los asistentes digitales todavía se quedan cortos en formas importantes. Quizá parte del problema radica en las altas expectativas que se generan. Por citar un ejemplo, el capítulo de Black Mirror lanzado a finales del 2018 “Bandersnatch” tardó dos años en realizarse, llegando a tener que desarrollar necesitando incluso de un software propio para la toma de decisiones de los usuarios. Si bien está lejos de una inteligencia artificial, bien cabe recordar la complejidad en la realización del proceso.

Sea que la innovación tecnológica se acelere, sea que los modelos de procesamiento de lenguaje natural mejoren incrementalmente, sea que el uso de Big Data y procesadores cada vez más rápidos jueguen a favor de los asistentes personales, lo cierto es que el sueño de Leibniz y de Otlet, de Vannevar Bush y de la Enciclopedia y hasta de la Wikipedia de Jimmy Wales, parecen estar más cerca que nunca, y ya no solo en los ámbitos taxonómicos y estructurados, sino también en los muchos más complejos e indeterminados, como son las interacciones en la vida cotidiana y al acceso instantáneo a insumos para mejorar la calidad y la oportunidad de nuestras decisiones.

Referencias

Aiden, Erez & Michel, Jean-Baptiste Uncharted: Big Data as a Lens on Human Culture. Riverhead Books; 2013.
Batelle, John The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture. Portfolio, 2006.
Blom, Philipp Encyclopédie El triunfo de la razón en tiempos irracionales. Barcelona, Anagrama, 2010.
Bush, Vannevar . «Como podríamos pensar (As We May Think)». The Atlantic 310 (4): 74 (1945)
Jemielniak, Dariusz Common Knowledge?: An Ethnography of Wikipedia. Stanford University Press 2014.
Lih, Andrew The Wikipedia Revolution: How a Bunch of Nobodies Created the World’s Greatest Encyclopedia. Hyperion, 2009.
Muro, Valentin
Nyce, James M. & Kahn, Paul From Memex To Hypertext: Vannevar Bush and the Mind’s Machine. Academic Press, 1991.
Perkowitz, Sidney The Internet Before the Internet: Paul Otlet’s Mundaneum.
Pinggers, 2011.
Ronald E. Day Indexing It All: The Subject in the Age of Documentation, Information, and Data. The MIT Press, 2014.
Warburg, Aby Atlas Mnemosyne. Madrid, Akal, 2010.
Wright, Alex Cataloging the World: Paul Otlet and the Birth of the Information Age Oxford University Press, 2014
Zachary, G. Pascal (1997). Endless Frontier: Vannevar Bush, engineer of the American century. New York: The Free Press.