Google pone a disposición herramientas de comprensión del lenguaje natural

Google ha colocado a disposición del público interesado dos herramientas de comprensión del lenguaje natural como código abierto, sin costo alguno. Estas herramientas permiten a las máquinas leer y comprender texto en inglés (como el texto que colocas en el buscador de Google).

SyntaxNet es un “parser sintáctico” –permite a las máquinas analizar gramaticalmente oraciones e identificar su significado. El programa Parsey McParseface implementa SyntaxNet en idioma inglés (se ha capacitado utilizando una vieja colección de noticias conocida como The Penn Treebank Project).

A continuación tienes un ejemplo de como se analiza gramaticalmente una oración en inglés:

Por medio del uso de redes neurales profundas, SyntaxNet es implementado utilizando TensorFlow de Google

Por medio del uso de redes neurales profundas, SyntaxNet es implementado utilizando TensorFlow de Google

¿Qué tan bien funciona?

Tomando como punto de referencia oraciones tomadas al azar de noticias en inglés (Penn Treebank), Parsey McParseface recupera relaciones individuales entre las palabras con una exactitud mayor al 94%, indicó Google. “Los lingüistas capacitados para esta tarea logran de un 96 a 97% de los casos”. Esto sugiere que nos estamos acercando a un nivel de ejecución humano –pero sólo en lo referente a texto bien formado.

“Ya que Parsey McParseface es el modelo más exacto existente, creemos que será de utilidad para desarrolladores e investigadores interesados en la extracción automática de información, traducción y otras aplicaciones de NLU (Natural Language Understanding), indicó Google”.

Más información en: http://arxiv.org/abs/1603.06042

Aquí encuentras más información sobre el sistema de aprendizaje de máquina TensorFlow de Google: https://www.tensorflow.org/