Implantar el lenguaje natural

Implanting natural language. Since the work of Chomsky “Syntactic Structure”(1957) Computational Linguistics has become an area of interest in Artificial Intelligence. It Deals with the modelling of human language useage, and the problems it handles are studied within very different disciplines.

¿Nos podemos imaginar una tertulia donde humanos y robots discuten sobre algún tema del entorno en que se desenvuelven? ¡Claro que eso es sólo ficción! ¡Y no ciencia ficción! Pero siendo como es ficción, se trata de un objetivo atractivo que está mereciendo atención en el campo de la inteligencia artificial.

El problema se centra en el procesamiento de lenguajes naturales y a él se hace referencia en general en términos de “lingüística computacional”. Nace por motivos militares con miras al desciframiento de los mensajes captados de los ejércitos enemigos y se centra en el problema de la traducción automática.

La aparición de las gramáticas generativas catapulta el interés por este quehacer de muchos investigadores pertenecientes a ámbitos de la ciencia muy diversos. De modo que hoy es un problema multidisciplinar del que pueden ocuparse –y se ocupan– la lingüística, la lógica, la psicología cognitiva, la ingeniería, la matemática, la epistemología, etc.

Sin ningún género de dudas el tratamiento de textos es una sección de la lingüística computacional con la que todos nos encontramos muy familiarizados. Se trata en este caso del lenguaje escrito. Y no pasa éste de ser tratado más que como un banco de datos que ha de ser implantado en el ordenador de forma que sea posible un intercambio de acciones con el usuario dirigido a la creación e impresión de documentos del lenguaje natural. Este banco de datos de documentos lingüísticos precisa de una organización que facilite su manipulación para permitir al ser humano el diseño, por ejemplo, de capítulos, la inserción de los textos parciales en los lugares adecuados, el diseño estético de la organización del escrito, la supresión, el transporte de fragmentos o la inserción de segmentos de otros textos o ilustraciones para acabar en su impresión material.

En fin, el desarrollo permite hoy disponer de una interfaz tal que podemos tener en pantalla un fiel anticipo de lo que tendremos impreso, con el aliciente de que aún no tiene por qué ser el documento definitivo. Por su parte el lanzamiento de nuevos medios de comunicación con intervención de los ordenadores ha favorecido la implantación de mecanismos en los que el lenguaje natural –expresiones del lenguaje natural– desempeña un papel determinante en la materialización de la comunicación entre humanos. La incorporación del lenguaje oral al tratamiento de textos es un objetivo a alcanzar. Las investigaciones fonológicas posibilitarán en breve un mejor y más cómodo acceso a los medios informáticos a sectores con serias dificultades para recurrir a tales medios. Ello sucederá cuando la interfaz permita al ordenador oír y hablar, como los humanos.

«Será difícil que alguien dude de que se puede diseñar una herramienta que permita a un escritor, cuando escribe una frase, examinar las variantes que le presente el ordenador con términos equivalentes»

Estando como están en esta empresa implicados muchos problemas no hay, sin embargo, lugar para el escéptico; será difícil que alguien dude de que se puede diseñar una herramienta que permita a un escritor, cuando escribe una frase, examinar variantes de la misma que le presente el ordenador con términos equivalentes apoyándose en un diccionario de sinónimos para que decida si mantiene la fórmula original o prefiere alguna de las otras; por ejemplo, por la simple razón de que un determinado vocablo está siendo ya prolijamente utilizado en el texto que le precede según recuento que el programa puede ir realizando.

Las dificultades que a este nivel –el nivel del tratamiento de textos– encontremos se incorporan, por supuesto, a otros niveles en los que, por así decir, se halla involucrada la inteligencia en un grado mayor. Un caso de ellos sería el de la traducción de textos de una lengua a otra. Aunque tediosa, es tarea posible la confección de los diccionarios de una y otra. Incluso el establecimiento de la eventual correspondencia entre los términos. Pero una frase, como todos sabemos, no se reduce a una colección de términos. Tiene además una estructura que no resulta evidente, al tiempo que es posible que lenguajes diferentes no compartan estructuras.

Es corriente que en una lengua un término tenga acepciones diferentes. Puede pertenecer a categorías gramaticales distintas (“ruedo” es un sustantivo, pero también un verbo). Lo que implica que un fragmento lingüístico puede ser interpretado bajo estructuras gramaticales diferentes (lo cual sería un inconveniente menor si la lengua receptora contara para dicho término con otro en exactamente las mismas circunstancias). E incluso es también posible que una frase con una estructura determinada pueda responder a estructuras profundas diferentes (“Estoy preparado para la operación”, ¿médico o paciente?).

Está claro que en las expresiones mismas no se contienen los elementos necesarios para decidirse en un sentido o en otro. Y deberíamos preguntarnos cómo resuelve el ser humano estas ambigüedades cuando surgen en la comunicación con sus congéneres. En ocasiones por el contexto en que se producen; otras veces por el conocimiento que el receptor tiene del entorno social del emisor o del ámbito a que se refiere la información. Es notorio que en estos casos, en menor o en mayor grado, estamos haciendo referencia al conocimiento que el receptor tenga, a partir del cual habrá de inferir o deducir cuál es la estructura profunda más probable que corresponda a la emisión.

Resulta evidente que estos criterios exceden los límites en los que usualmente trabaja el lingüista. Tendríamos tal vez que recurrir a modelos de psicología cognitiva. Pero estos modelos que describen el funcionamiento del conocimiento humano en lo que al lenguaje se refiere ¿dónde están? Han de ser modelos diseñados con precisión para que puedan ser computados, aunque sean, eso sí, modelos estadísticos y probabilísticos, borrosos.

«Hay conductas lingüísticas que pueden ser simuladas. Parcelas del lenguaje en que puede intervenir la máquina en auxilio del hombre»

Pudiera ser que nos encontremos entre quienes no ven razón alguna para que en un futuro el ordenador no “comprenda” el lenguaje natural como un humano. Y es factible que seamos detractores de tal idea. Pero en lo que sí creo yo que estaríamos todos de acuerdo es en que hay conductas lingüísticas que pueden ser simuladas. Parcelas del lenguaje en las que puede intervenir la máquina en auxilio del hombre. Y si los modelos formales de la conducta humana a imitar aún no existen, el desafío resulta ser una invitación tentadora para el psicólogo cognitivista y para el ingeniero del conocimiento, que no pueden dejar de lado las propuestas lingüísticas especializadas.

Pero volvamos a nuestras palabras iniciales. Nuestra ficción pretende que el robot, además de recibir los inputs y almacenarlos en un banco de datos, sea capaz de elaborar información, transmitirla y ampliar la información que ya haya sido elaborada. Dicho así parece simple. Pero existen muchos problemas. Por ejemplo, de índole filosófica. ¿Dónde comienza el conocimiento? ¿En los sentidos o en la mente? ¿Está la experiencia impregnada de teoría? Habrá que determinar, además, cuáles son o pueden ser los mecanismos que hacen que un sistema con capacidad de conocimiento conozca; esto es, se decida a conocer.

Por supuesto, se trata de un problema prescindible. Podemos ser los humanos, beneficiarios de dicha conducta, los que impulsemos que ésta tenga lugar. Y en vez de diseñar instrumentos dirigidos al conocimiento en general los diseñaremos con fines específicos.

Dotar de sensores a los ordenadores es un problema de ingeniería. Pero será preciso también diseñar un sistema de categorías en las que se distribuyan los inputs y experimenten una primera organización. ¿A quién o quiénes corresponde hacerlo? Además habremos de diseñar sistemas de representación que el propio sistema inteligente (no nosotros) sea capaz de conocer y sobre el que pueda actuar. Pues no se pretende (por el momento al menos) construir sistemas inteligentes que se autoorganicen, sino sistemas que simulen conducta inteligente humana. En este caso, conducta lingüística.

En segundo lugar, se deberá implantar el léxico del lenguaje ordinario en cuestión (o lenguajes), las reglas gramaticales de su construcción y los sistemas de parsing (búsqueda de estructuras apropiadas para una cadena lingüística dada) para poder proceder a su semantización. Será a su vez necesario diseñar estrategias de eliminación de las ambigüedades, posiblemente investigando el modo de resolverlas el humano. En buena medida habremos de recurrir a conocimiento ya adquirido, a partir del cual infiramos conocimiento nuevo. Son problemas de conocimiento en los que se embarcan equipos de investigadores lógicos. No sólo razonamiento deductivo, sino también probabilístico. O técnicas como la circunscripción o la abducción para la generación de hipótesis a partir de datos no conectados en una teoría.

La situación en la computación del lenguaje no es nada halagüeña. Dista mucho de ser satisfactoria. El problema más grave es que aún no sabemos cómo es que hablamos y entendemos lo que hablamos. Urge crear modelos formales que hipotéticamente respondan a los mecanismos naturales del hablante. Su implantación en un ordenador permite testar dichas hipótesis, corregir y mejorarlas e incluso descubrir mediante analogías formales estructuras no advertidas ni sospechadas en el ejercicio del habla.

Si el habla es una conducta inteligente, deben estudiarse sus aspectos computacionales. Si es una función del sistema hablante, surgen en ella problemas que escapan a los estudios en que tradicionalmente trabajan los lingüistas. Sin que ello necesariamente signifique negar competencia en los mismos a estos especialistas, hay que reconocer que también estudiosos de otros ámbitos se ocupan de ellos.

En el habla hay problemas de representación de la información, de memoria o almacenamiento y de creación de nueva información. ¿No pueden ser explotables los resultados habidos a este respecto en biología? Hay problemas de comunicación y de reconocimiento de la información que transporta el habla. No sólo hay lenguaje. Su computación también comporta dificultades en las que se habrán de tomar decisiones con criterios probabilísticos sobre bases estadísticas, habrá que diseñar modelos formales y matemáticos que darán lugar a modelos que puedan ser implantados en el ordenador mediante programas que hay que crear. No deben ni filósofos, ni lingüistas, ni matemáticos, ni psicólogos, ni ingenieros, ni lógicos, ni biólogos, ni, en general, quienes vean en los actos de habla participación de la disciplina en la que trabajan renunciar a su cometido en este ámbito de investigación. Uno de los atractivos de este campo debe ser precisamente su carácter multidisciplinario.

Las investigaciones aisladas en cada sector deben ser, por descontado, muy importantes. Pero no hay que olvidar que pretenden ser incardinadas en un único cometido. Por lo que difícilmente los aspectos involucrados resisten análisis independientes de los demás. Cada problema resuelto, sin embargo, en cualquiera de ellos tendrá aplicación inmediata casi con toda seguridad en beneficio de los usuarios. Pero, sin duda, una resolución conjunta de un aspecto en lo que concierne a todas sus dimensiones constituirá un estudio más fino y fructífero de lo que podrían serlo las soluciones individuales relativas a sus dimensiones aisladas.

© Mètode 2003 - 39. Del grito a la palabra - Disponible solo en versión digital. Otoño 2003

Departamento de Lógica y Filosofía de la Ciencia, Universitat de València.