La Inteligencia Artificial de Facebook que copia la letra de alguien a partir de una sola palabra

Facebook ha desarrollado un nuevo tipo de mecanismo basado en Inteligencia Artificial (IA) que es capaz de, solo con una palabra escrita a mano, imitar el estilo de caligrafía de una persona o el texto que aparece en una fotografía del entorno. Las imágenes generadas por IA han avanzado a una velocidad vertiginosa, capaces de…

la-inteligencia-artificial-de-facebook-que-copia-la-letra-de-alguien-a-partir-de-una-sola-palabra

Facebook ha desarrollado un nuevo tipo de mecanismo basado en Inteligencia Artificial (IA) que es capaz de, solo con una palabra escrita a mano, imitar el estilo de caligrafía de una persona o el texto que aparece en una fotografía del entorno.

Las imágenes generadas por IA han avanzado a una velocidad vertiginosa, capaces de reconstruir sintéticamente escenas históricas o cambiar una foto para que se parezca al estilo de Van Gogh o Renoir.

TextStyleBrush, como se conoce al sistema, es el primer algoritmo de IA autosupervisado capaz de sustituir texto tanto de imágenes del mundo real como de escritura a mano, utilizando como muestra solamente una palabra, como ha destacado Facebook a través de un comunicado.

“Para entrenar a la IA directamente con imágenes del mundo real, adoptamos un enfoque diferente que es de naturaleza auto-supervisada en términos de estilos de aprendizaje y segmentación. No asumimos ninguna forma de supervisión disponible sobre cómo se representan los estilos o la disponibilidad de etiquetas de texto segmentadas”, explican de la compañía.


El sistema puede reconocer tipografías y trasladar el texto a otro idioma. Facebook.

El sistema desarrollado por la firma estadounidense funciona de forma similar a las herramientas de procesamiento de palabras, pero se aplican también a la estética de la caligrafía y el texto.

“Es un proyecto de investigación de IA que puede copiar el estilo del texto en una foto usando solo una palabra. Con este modelo de IA, puede editar y reemplazar texto en imágenes”, señalan.

A diferencia de los mecanismos anteriores, que definen parámetros muy específicos, TextStyleBrush emplea un enfoque diferente que desvincula el contenido del texto de todos los aspectos de apariencia.

Sistema flexible

“Si bien la mayoría de los sistemas de IA pueden hacer esto para tareas especializadas bien definidas, construir un sistema de estas características, que sea lo suficientemente flexible como para comprender los matices tanto del texto en escenas del mundo real como de la escritura a mano es un desafío de inteligencia artificial mucho más difícil”, indican.


TextStyleBrush muestra resultados de transferencia de estilo a nivel de palabra.

Lo que implica que es capaz de interpretar estilos de texto ilimitados no solo para diferentes tipografías y caligrafía, sino también para transformaciones, como rotaciones, texto curvo y deformaciones que ocurren entre el papel y el lápiz al escribir a mano, desorden de fondo y ruido de imagen.

Debido a estas complejidades, no es posible segmentar claramente el texto de su fondo, ni es razonable crear ejemplos anotados para cada apariencia posible de todo el alfabeto, así como los dígitos.

La tecnología de Facebook se ha publicado con el objetivo de facilitar la investigación sobre el texto alterado mediante técnicas de manipulación profunda o deepfake, de la misma manera que actualmente se estudian los contenidos en los que se modifica la apariencia del rostro de personas.

“Si los investigadores y profesionales de la IA pueden adelantarse a los adversarios en la construcción de esta tecnología, podemos aprender a detectar mejor este nuevo estilo de deepfakes y construir sistemas robustos para combatirlos”, apunta en el blog de Facebook.

Aunque se trata de un proyecto de investigación, algún día podría desbloquear un nuevo potencial para la autoexpresión creativa, como mensajes y subtítulos personalizados.

Otra posible aplicación de la tecnología es el desarrollo de nuevos sistemas de traductores a través de la cámara del móvil en los que no solo se traduzca el texto sino que también se mantenga el estilo de escritura, adecuados también para la realidad aumentada (AR).

SL

TEMAS QUE APARECEN EN ESTA NOTA