Luis von Ahn: Colaboración masiva en línea

[stextbox id="warning"]El Dr. Luis von Ahn, nacido en la Ciudad de Guatemala en 1979, es empresario y profesor asociado en el Departamento de Ciencia de la Computación en Cargenie Mellon University. Es conocido como uno de los pioneros de la idea crowdsourcing. Es fundador de la empresa reCAPTCHA, que compró Google en el 2009. Su proyecto llamado Duolingo tiene como objetivo la traducción completa de la web para que sea realmente mundial. Luis von Ahn construye sistemas que involucran tanto humanos como computadoras para solucionar problemas de larga escala que no podrían solucionarse de otra manera.[/stextbox]

Luis von Ahn

Fuente: Wikipedia

 

¿Cuántos han tenido que llenar un formulario web e ingresar unas letras distorsionadas como estas? ¿Cuántos odian hacerlo? Excelente. Bueno, eso lo inventé yo. (Risas) Participé en el invento.

Eso se llama captcha y sirve para asegurar que quien llena el formulario es un humano y no un programa informático diseñado para enviar el formulario millones de millones de veces. Y funciona porque los humanos, salvo los discapacitados visuales, pueden leer estos caracteres distorsionados pero los programas informáticos no pueden. Por ejemplo, en el caso de Ticketmaster hay que ingresar estos caracteres distorsionados para evitar que los revendedores escriban un programa que compre millones de entradas, dos a la vez.

Los captchas se extienden por Internet. Y dado que se usan tan a menudo muchas veces la secuencia de letras escogidas al azar es un poco desafortunada. Por ejemplo, esto viene de Yahoo. Las letras escogidas totalmente al azar fueron WAIT que en inglés significa «esperar». Pero lo mejor es el mensaje que, unos 20 minutos después, recibió Yahoo de este usuario. (Texto: “¡Ayuda! Hace 20 minutos que espero y no pasa nada”) (Risas) Esta persona pensó que tenía que esperar. Claro, no es tan malo como éste. (Texto: REINICIAR)

(Risas)

El proyecto CAPTCHA fue concebido aquí Carnegie Mellon hace 10 años, y se usa en todos lados. Les contaré de un proyecto de hace unos años que es una evolución de captcha. Es un proyecto que se llama reCAPTCHA. Algo que iniciamos aquí en Carnegie Mellon, y que luego convertimos en empresa. Y hace cosa de año y medio fue adquirida por Google.

Les contaré el origen de este proyecto. Este proyecto surgió al darnos cuenta de que cada día la gente de todo el mundo ingresa unos 200 millones de captchas. Al principio sentí orgullo de esto. Pensé, mira el impacto que ha tenido mi trabajo. Pero después empecé a sentirme mal. Y es que cada vez que ingresamos un captcha perdemos unos 10 segundos de nuestro tiempo. Y si multiplicamos eso por 200 millones llegamos a que la humanidad en su conjunto pierde unas 500 mil horas diarias ingresando captchas en la Web. Eso me hizo sentir mal.

(Risas)

Pero después pensé que no podemos deshacernos de los captchas porque de eso depende en parte la seguridad de la red. Y me pregunté si habría alguna forma de usar este esfuerzo en algo de utilidad para la humanidad. La cosa es así: en esos 10 segundos que ingresamos un captcha los cerebros están haciendo algo genial. Están haciendo algo imposible para las computadoras. ¿Podemos hacerles hacer algo beneficioso en esos 10 segundos? Dicho de otro modo, ¿existe algún problema gigantesco que las computadoras aún no puedan resolver pero que podamos dividir en pedacitos de 10 segundos de modo que cada vez que alguien resuelva un captcha resuelva un pedacito de ese problema? La respuesta es “sí” y eso es lo que hacemos.

Hoy en día, si alguien ingresa un captcha, lo que tal vez no saben es que no sólo verifican que son humanos sino que además nos ayudan a digitalizar libros. Les explicaré como funciona. Hay varios proyectos de digitalización de libros. Hay uno de Google, otro de The Internet Archive. Amazon tiene otro con el Kindle. Básicamente, eso funciona así. Se empieza con esas cosas físicas. ¿Las han visto, verdad? (Risas) Empezamos con un libro y luego lo escaneamos.

Escanear un libro es tomar una foto digital a cada página. Eso nos da una imagen que contiene el texto de cada página. En el paso siguiente un programa informático convierte a texto todas las palabras de la imagen. Esta tecnología se llama ROC, reconocimiento óptico de caracteres, y consiste en tomar una imagen del texto e intentar averiguar el texto que contiene. Pero el problema es que el ROC no es perfecto. En particular en los libros antiguos de páginas amarillentas, en los que la tinta se ha desvanecido hay muchas palabras que el OCR no reconoce. Por ejemplo, en obras escritas hace más de 50 años, hay un 30% de palabras que la computadora no reconoce. Por eso ahora tomamos todas esas palabras que la computadora no descifra y hacemos que las personas las reconozcan mientras introducen un captcha en la Web.

O sea que la próxima vez que llenen un captcha, esas palabras ingresadas son palabras que vienen de libros que han sido digitalizados y que la computadora no pudo reconocer. La razón por la que hoy tenemos dos palabras en vez de una es que el sistema toma una palabra desconocida de un libro y la pone frente a ustedes. Pero dado que no conoce la respuesta, no puede puntuarlos. Entonces ponemos otra palabra conocida por el sistema. No decimos cuál es cuál; pedimos que ingresen ambas. Y si ingresan la palabra correcta, para la cual el sistema ya sabe la respuesta, suponemos que es un humano y eso da cierta confianza de que se ingresó la otra palabra correctamente. Si repetimos el proceso con diez personas diferentes y todos están de acuerdo en la nueva palabra entonces tenemos una nueva palabra digitalizada con precisión.

Así funciona el sistema. Y como lo lanzamos hace tres o cuatro años muchos sitios web pasaron del viejo captcha en el que la gente perdía el tiempo al nuevo captcha en el que la gente ayuda a digitalizar libros. Un ejemplo es Ticketmaster. Cada vez que compramos entradas en Ticketmaster, ayudamos a digitalizar un libro. Facebook: cada vez que añadimos un amigo o tocamos a alguien ayudamos a digitalizar un libro. Twitter y otros 350 mil sitios usan recaptcha. De hecho, la cantidad de sitios que usan recaptcha es tan alta que digitalizamos diariamente una cantidad muy grande de palabras. Son unas 100 millones al día que es el equivalente a unos 2 millones y medio de libros al año. Y todo se hace palabra a palabra por cada vez con el ingreso de captchas por Internet.

(Aplausos)

Ahora, claro, como procesamos tantas palabras al día suceden cosas divertidas. Y esto es particularmente cierto dado que ahora ponemos dos palabras al azar, una al lado de la otra. Por eso ocurren cosas divertidas. Por ejemplo, presentamos esta palabra. Es la palabra “cristianos”; no tiene nada de malo. Pero si se la presenta con otra palabra elegida al azar pueden pasar cosas malas como esta. (Texto: malos cristianos) Pero es aún peor porque el sitio en el que apareció se llama La Embajada del Reino de Dios. (Risas) ¡Uy! (Risas) Aquí hay otro tremendo. JohnEdwards.com (Texto: maldito liberal) (Risas) Y seguimos insultando gente de izquierdas y de derechas.

Pero no sólo son insultos. Así, como presentamos pares de palabras elegidas al azar ocurren cosas interesantes. Eso ha dado lugar a un gran meme de Internet en el que han participado decenas de miles de personas que se llama arte de captchas. Estoy seguro de que muchos de Uds. lo han oído. Funciona así. Imaginen que están usando Internet y ven un captcha que les parece interesante. Como éste. (Texto: tostadora invisible) La idea es que capturen la pantalla. Después tienen que ingresar el captcha porque así nos ayudan a digitalizar libros. Y después dibujan algo basado en este captcha. (Risas) Así funciona. Hay decenas de miles de ejemplos. Algunos son muy tiernos. (Texto: ¡Gané!) (Risas) Otros son más divertidos. (Texto: fundadores drogados) (Risas) Y algunos como el shvisle paleontológico tienen a Snoop Dogg.

(Risas)

Este es mi número favorito de recaptcha. Esto es lo que más me gusta de todo el proyecto. Es la cantidad de personas distintas que nos han ayudado a digitalizar al menos una palabra de un libro con captchas: 750 millones, poco más del 10% de la población mundial nos ha ayudado a digitalizar el conocimiento humano. Y son números como estos los que motivan mi programa de investigación. La pregunta que motiva mi investigación es la siguiente: si miramos los grandes logros de la humanidad, esos megaproyectos que la humanidad ha hecho históricamente como las pirámides de Egipto, el Canal de Panamá, o llevar a un hombre a la Luna; hay algo curioso en ello y es que todos se realizaron con más o menos la misma cantidad de personas. Es raro, pero todos se hicieron con cerca de 100 mil personas. Y la razón es que, antes de Internet, coordinar a más de 100 mil personas aparte de pagarles, era esencialmente imposible. Pero ahora con Internet les acabo de enseñar un proyecto donde hemos coordinado a 750 millones de personas para digitalizar conocimiento. Entonces la pregunta que motiva mi trabajo es si podemos poner a un hombre en la Luna con 100 mil personas, ¿Qué podemos hacer con 100 millones?

Y basados en esa pregunta hemos trabajado en varios proyectos. Quiero explicar uno que me tiene entusiasmado. Llevamos cerca de un año y medio trabajando silenciosamente en este proyecto. Todavía no lo lanzamos. Se llama Duolingo. Silencio, por favor, que aún no lo lanzamos. (Risas) Confío en que guardarán silencio. Este es el proyecto. Así es como empezó. Todo empezó con una pregunta a mi estudiante de postgrado, Severin Hacker. Ese es Severin Hacker. Le planteé una pregunta a mi estudiante. Por cierto, oyeron bien: su apellido es Hacker. Le planteé esta pregunta: ¿Cómo podemos hacer que 100 millones de personas traduzcan la Web a los principales idiomas, gratis?

Hay varias cosas que decir acerca de esta pregunta. La primera es traducir la Web. Como todos sabemos, la Web está fragmentada en varios idiomas. Una gran parte está en inglés. Si alguien no sabe inglés no puede acceder. Y hay gran cantidad de contenido en otros idiomas pero si alguien no sabe esos idiomas tampoco los puede consultar. Yo quisiera traducir toda la Web a los principales idiomas. Eso es lo que yo quisiera hacer.

Mucha gente me podría decir por qué no usamos computadoras para hacerlo. ¿Por qué no usar traducción automática? Últimamente las computadoras están traduciendo algunas oraciones aquí y allá. ¿Por qué no usar eso para traducir toda la Web? Las computadoras no son muy buenas para traducir. Y no van a ser muy buenas en los próximos 20 o 30 años. Cometen muchos errores. Incluso cuando no se comete un error, dado hay muchos errores, no se sabe si confiar o no en el resultado.

Les mostraré un ejemplo de una traducción automática. En realidad era el mensaje de un foro. Era alguien que preguntaba algo de programación y fue traducido del japonés al inglés. Quiero que lean esto. La persona empieza disculpándose por tratarse de una traducción automática. Aquí viene el preámbulo de la pregunta. Está explicando algo. Recuerden. Esto es una pregunta de programación. (Texto: A menudo, la cabra durante la instalación de un error es vomitar) (Risas) Después viene la primera parte de la pregunta. (Texto: ¿Cuántas veces como el viento, un poste, y el dragón?) (Risas) Después viene mi parte favorita de la pregunta. (Texto: ¿Este insulto a las piedras de mi padre?) (Risas) Y después viene mi parte favorita de todo el mensaje. (Texto: Por favor, pedir disculpas por su estupidez. Hay muchos gracias) (Risas) O sea, las traducciones automáticas no son muy buenas aún. Volviendo a la pregunta.

Necesitamos humanos para traducir la Web. Entonces la pregunta sería ¿por qué no le pagamos a alguien para que lo haga? Le podríamos pagar a traductores profesionales. Podríamos hacerlo. Por desgracia, sería extremadamente caro. Por ejemplo, traducir una fracción muy, muy pequeña de toda la Web, la Wikipedia, a otro idioma como el español, Wikipedia existe en español pero es muy pequeña respecto de la versión en inglés; es de un 20% del tamaño de la versión en inglés. Si quisiéramos traducir el otro 80% al español costaría al menos US$ 50 millones. Y esto incluso con la mayoría de recursos subcontratados en países explotados. Sería muy caro. Entonces queremos que 100 millones de personas traduzcan la Web a los principales idiomas gratis.

Si queremos hacerlo nos damos cuenta de que hay dos grandes obstáculos para lograrlo. El primero es la falta de personas bilingües. No sé si existen 100 millones de personas que usan la Web lo suficientemente bilingües para ayudarnos a traducir. Ese es un gran problema. El segundo problema es la falta de motivación. ¿Cómo hacer para motivar a las personas para que traduzcan en forma gratuita? Por lo general este trabajo se paga. ¿Cómo motivar a las personas para que lo hagan gratis? Después de pensar en esos dos problemas durante varios meses, nos dimos cuenta que había una manera de resolver ambos problemas con la misma solución. Es decir, matar dos pájaros de un tiro. Y la manera es transformar la traducción de idiomas en algo que millones de personas quieran hacer y que además ayude con el problema de falta de personas bilingües. Y eso es el aprendizaje de otros idiomas.

Resulta ser que hoy en día hay 1.200 millones de personas aprendiendo otro idioma. La gente quiere aprender nuevos idiomas. Y no sólo porque los obliguen a hacerlo en el colegio. En EEUU, por ejemplo, hay más de 5 millones de personas que han pagado más de US$ 500 por programas para aprender nuevos idiomas. La gente quiere aprender nuevos idiomas. En el último año y medio hemos trabajado en un nuevo sitio web llamado Duolingo en el que la gente puede aprender un nuevo idioma, 100% gratis, y al mismo tiempo, mientras aprenden, traducen la Web. O sea, aprenden traduciendo.

Más precisamente cuando empiecen les daremos oraciones muy sencillas de la Web. Les daremos oraciones muy, muy sencillas y les diremos qué significa cada palabra. Y después verán cómo otras personas traducen la misma oración y van a ir aprendiendo cómo se traduce. Y después que usen el sitio les vamos a ir dando oraciones más y más complejas. Pero en todo momento aprenden traduciendo.

Lo increíble de este método es que realmente funciona. En primer lugar la gente aprende idiomas. Ya casi terminamos de construirlo y ahora lo estamos probando. Las personas aprenden idiomas muy bien. Tan bien como con cualquier otro método informático de enseñanza de idiomas. Realmente la gente aprende idiomas. Pero no sólo aprenden bien sino que es más interesante. Porque con Duolingo las personas aprenden con contenido real. En vez de aprender con oraciones inventadas las personas aprenden con contenido real, que es de por sí interesante. Por eso la gente aprende los idiomas.

Pero quizá aún más increíble, las traducciones que realiza la gente, incluso los principiantes, son muy buenas. Tan buenas como las traducciones profesionales. Muy sorprendente. Les mostraré un ejemplo. Esta es una oración traducida del alemán al inglés. La parte superior está en alemán. En el centro hay una traducción al inglés hecha por un traductor profesional al que le pagamos 20 centavos por palabra. En la parte inferior hay una traducción de usuarios de Duolingo; ninguno sabía alemán antes de empezar a usar el sitio. Como ven, es casi perfecta. Claro, hay un truco en esto para lograr traducciones tan buenas como las profesionales. Combinamos las traducciones de varios principiantes para obtener la calidad un traductor profesional.

Además de combinar las traducciones, en el sitio podemos traducir realmente bastante rápido. Les mostraré una estimación de la velocidad con la que podríamos traducir la Wikipedia del inglés al español. Recuerden que esta traducción vale costaría al menos US$ 50 millones. Si quisiéramos traducir la Wikipedia al español con 100 mil usuarios podríamos hacerlo en 5 semanas. Y si tuviéramos un millón de usuarios podríamos hacerlo en 80 horas. Y ya que todos mis proyectos hasta la fecha han logrado tener millones de usuarios esperamos poder traducir extremadamente rápido con este proyecto.

Lo que más me entusiasma de Duolingo es que creo que brinda un buen modelo de negocio para la enseñanza de idiomas. Hoy es así: en el modelo de negocio de la enseñanza de idiomas el estudiante paga en particular, paga costaría al menos US$ 500 por Rosetta Stone. (Risas) Ese es el modelo de negocio actual. El problema con este modelo de negocio es que el 95% de la población del mundo no tiene US$ 500. Esto es muy injusto para con los pobres. Y totalmente orientado hacia los ricos. En Duolingo dado que uno aprende se crea valor, uno traduce material y, por ejemplo, podríamos cobrar por las traducciones. Así podríamos obtener beneficios económicos. Como las personas crean valor mientras aprenden no tienen que pagar con dinero, pagan con su tiempo. Pero lo mágico es que están pagando con su tiempo, un tiempo que de todos modos habrían pasado aprendiendo el idioma. Por eso lo bueno de Duolingo es que creo que es un modelo de negocio justo que no discrimina a los pobres.

Este es el sitio. Gracias. (Aplausos) Este es el sitio. Todavía no lo lanzamos pero si van al sitio pueden entrar a la versión beta privada que se presentará en unas tres o cuatro semanas. Todavía no hemos lanzado Duolingo.

Por cierto, yo soy la cara visible pero Duolingo es obra de un equipo impresionante y estos son algunos integrantes. Gracias.

(Aplausos)

Tomado íntegro de TED, ideas que vale la pena difundir.

Palabras más populares:

  • luis von ahn biografia
  • luis
  • biografia de luis von ahn

2 Comentarios

  1. kusy

    interesante ehhhh ))) me gusta muchoo  lo k ha echo este pais y mas a los inventores de guatemala XD XD XD )))

  2. Nos alegra tu orgullo, nos alegra. Latinoamérica es tierra de inventores, precursores en muchos campos. Un saludo cordial.

Deja un Comentario