En ocasiones, un aprendizaje en «negativo» es bastante útil. Conocer los motivos por los que no usaríamos determinada herramienta, nos ayuda a aprender a distinguir entre una excesiva cantidad de recursos que se ponen a nuestra disposición.
Incluso para mí, es realmente complicado (por no decir imposible) seguir el ritmo de aplicaciones, utilidades y ventajas que van apareciendo en escena.
Aquí te hago una intro algo más directa:
Es cierto que una gran mayoría de herramientas son simples máscaras de aplicaciones de código abierto bastante complejas de manejar. Es maravilloso que así sea, sobre todo para quien no se desenvuelve con este tipo de paquetes de código, pero hay que tener cuidado: nuestro dinero, nuestro tiempo y, sobre todo, nuestra adaptación hacia una evolución tecnológica, están en juego.
Quiero explicarte muy bien, que las aplicaciones que yo voy indicando en este artículo no son adecuadas según mi punto de vista. Probablemente haya quien les saque partido, y seguro que se pueden lograr resultados increíbles con ellas, pero la experiencia en mi caso no ha sido así. La quiero compartir por si te sirve de ayuda.
Iré actualizando este listado, por lo que este artículo está «vivo». Te recomiendo que lo guardes en favoritos. No puedo ir haciendo un registro de todas, será solo una muestra, pero sin duda te servirá par entender por qué a mí no me ha resultado útil.
Espero que te ayude.
(nota: aunque cada aplicación está en orden alfabético, si buscas alguna en concreto te recomiendo usar el campo de «buscar» de la barra lateral)
Aragon.ai
Tal y como se definen en su web, son un «generador de retratos realistas». Es decir, si subes varias imágenes tuyas (de buena calidad), te entregan un paquete con retratos tuyos y en distintos fondos. Es como si te hicieras una sesión de fotos en varios lugares, pero sin moverte de casa.
Es cierto que, por un módico precio de 35 – 79 Euros, tienes un book de fotos privado.
Al final, lo que estamos creando es un engaño digital. Bien sea para utilizarlo en redes, en un CV o en tu perfil de Linkedin, lo que estamos intentando es engañar a la realidad. Una cosa es hacerse un avatar, y otra muy distinta simular un look&feel muy americano, simulando que estás en Manhattan o en una maravillosa oficina, mientras vistes un traje de oficina impecable.
Para mí este tipo de soluciones, aunque técnicamente puedan funcionar más o menos bien, no son para lo que se debe utilizar la Inteligencia Artificial. Por eso incluyo esta aplicación en «desmontando la IA». LA tecnología nos debe ayudar a llegar hacia un mundo más natural, ético y sincero.
¿Quieres probarlo tú y opinar? Aquí tienes la página de Aragon.ai
Deep Dream Generator
Este es un claro ejemplo de máscara sobre Stable Diffusion, una de las aplicaciones de código abierto más potentes del mercado de la inteligencia artificial generativa de imágenes. Lo malo con este tipo de entornos, es que te cobran por utilizar comandos excesivamente básicos y poco eficaces.
He intentado obtener algún resultado partiendo de esta imagen de Charles Chaplin. Esta imagen la irás viendo en algunos test.
Con la intención de hacer a Chaplin algo más feliz, Deep Dream me ha dado esto:
No quiero dedicarle más tiempo, sobre todo porque conozco cómo funciona Stable Diffusion y sé la cantidad de opciones que ofrece (aunque es cierto que es una de las herramientas más complejas – y por tanto completas – de manejar).
¿Quieres probarlo tú? Aquí tienes la página de Deep Dream Generator
Ideogram
Era la aplicación que prometía trabajar bien la tipografía. Una de los mayores retos de la Inteligencia Artificial generadora de imágenes a través de texto, son las palabras (les suele costar tanto como generar manos y ojos)
Con ideogram he intentado hacer un ejercicio muy simple: pedirle mi nombre y mi primer apellido. Y este ha sido el resultado:
Como podemos ver, a veces se queda muy cerca pero aún no lo consigue. Las letras sí están conseguidas, pero el resultado es demasiado aleatorio. Para evaluar el uso de texto, recomiendo utilizar prompts muy sencillos, y evitar fondos complejos. Por el momento, es preferible intentar buscar fondos planos, y posteriormente editarlos en postproducción. En mi caso, ha sido la propia aplicación la que ha llenado de contenido el resultado. He intentado darle la información más básica posible, pero por el momento no me sirve.
¿Quieres probarlo tú? Aquí tienes la página de Ideogram.
Imagine Art
Para hacer la prueba con esta aplicación, le he pedido a Bard de Google que me ayude:
«Hey Bard! I´d like to work on a prompt that helps me get a picture that sums up what happiness is. This image should be universal, and it has to be centered on a person of about 46 years of age, where starting to age means experience and search for serenity»
(ESP) «¡Hola Bard!Me gustaría trabajar sobre un prompt que me ayude a conseguir una imagen que resuma lo que es la felicidad. Esta imagen debe ser universal, y tiene que estar centrada en una persona de unos 46 años, donde empezar a envejecer significa experiencia y búsqueda de serenidad».
Bard me sugiere que le pregunte a Imagine Art:
«A 46-year-old person is sitting on a bench in a park, surrounded by nature. They are smiling and have a peaceful expression on their face. They are wearing comfortable clothes and their hair is blowing in the breeze. The sun is shining and the birds are singing».
Y me da unos consejos:
La persona está sentada en un banco de un parque, pero ¿qué tipo de parque es? ¿Es un exuberante espacio verde en la ciudad, un prado de flores silvestres en el campo o un sereno jardín japonés? ¿Cómo es el entorno de la persona? ¿Está rodeada de árboles, flores y otras plantas, o se encuentra en un entorno más urbano? ¿Cómo va vestida la persona? ¿Su ropa es informal, cómoda o más formal? ¿Cómo es la expresión facial de la persona? ¿Está sonriendo, riendo o simplemente parece tranquila y contenta? ¿Cuál es el estado de ánimo de la imagen? ¿Es alegre, pacífica o reflexiva?
Es el momento de introducir el prompt en Imagine Art y se genera una imagen con dos personas, tres pies, iluminación tradicional, sin reconocer el concepto «sin género» y, lo que es peor, los personajes rozan casi la tercera edad:
Conclusión: esta aplicación parece un modelo pre-entrenado que te ofrece distintos estilos base, pero poco más. Es muy intuitiva, pero considero que este tipo de plataformas no deben ser de pago ya que se nutren de un contenido «open source» y no invierten en resultados realmente impactantes.
¿Quieres probarla tú? Aquí tienes la página de Imagine Art.
Photoleap y Videoleap
Os tengo que reconocer que en este caso he sido más exigente que con las anteriores, porque su campaña de marketing y la estética de su web – interfaz me invitaban a ello.
Para probar ambas aplicaciones, he tomado como referencia una imagen y un vídeo de Charles Chaplin. Este personaje (y el actor que se escondía tras él) siempre me ha resultado muy enigmático y especial, así que le utilizo para «testear» distintas aplicaciones, así puedo comparar resultados.
Lo primero, comentarte que ambas aplicaciones se tienen que manejar desde un dispositivo móvil (Android o Iphone).
Aunque tienen multitud de filtros y opciones, he probado con una imagen estática y un vídeo muy breve. Para la opción de vídeo solamente nos permite fragmentos que no superen los 5 segundos.
Estos son los recursos originales, sin editar. Verás que la calidad no es muy buena
Tomando la primera imagen de referencia, puedes notar cómo la colorea:
También puedes ver cómo le aplica efectos generados por Inteligencia Artificial (la aplicación nos permite escribir un prompt o aceptar uno aleatorio). En este caso, la aplicación lo único que hace es un “inpainting” (rellenar – inventar donde marco con el pincel), y además se combina con un proceso similar a ControlNet de Stable Diffusion, donde se respeta la pose:
Este tipo de herramientas, están pensadas para un público más juvenil, y nos ofrece unos resultados de una calidad media – baja.
A continuación, te muestro las modificaciones en vídeo.
Realmente, los resultados no están muy logrados. Algunos son simpáticos, pero no te puedes olvidar de que somos profesionales. Estas aplicaciones están más orientadas al entretenimiento y a resultados más fantasiosos. Quizás tengan mejores efectos y transiciones que un editor de vídeo tipo CapCut (el editor de TikTok), pero en mi opinión no merece la pena invertir en ella. Es cierto que, con mucha dedicación, hay quien puede lograr excelentes resultados. Pero hay que contar previamente con archivos de fotografía y vídeo de buena calidad, y acordes con el estilo que ofrecen Videoleap y Photoleap.
¿Quieres probarlo tú? Aquí tienes la página de Photoleap.
Photosonic
Photosonic es la versión generadora de imágenes de Writesonic. Como estaba preparando un artículo sobre los abogados y el metaverso, he pensado en lograr una imagen para mi artículo a través de este prompt:
«A render of an avatar as a lawyer, redhead beard, shaved head, and yellow glasses, render, 8k, realistic, the background is white, full body», y le he pedido a la IA generadora de texto de Google (Bard) que me lo mejore, con este resultado:
«A highly realistic full-body render of a lawyer avatar with a redhead beard, shaved head, and yellow glasses, on a white background, in 8K.»
Tampoco es que Bard se haya esforzado demasiado. Aún así, me he ido a Photosonic y me ha generado estas dos imágenes:
Como no me han servido estos resultados, me he dado cuenta que la aplicación tiene una opción «enhanced» para mejorar lo obtenido anteriormente, y me ha convertido el prompt en esto:
«Réalisation d’un rendu complet extrêmement réaliste d’un avatar d’avocat avec une barbe rousse, une tête rasée et des lunettes jaunes, sur fond blanc, en 8K. Rendu photoréaliste, mise en évidence des détails du visage et des vêtements, composition centrée, éclairage doux et naturel, aspect professionnel et élégant, rendu tridimensionnel, Blender 3D, 8K resolution, modèle humain hautement détaillé.»
Curiosamente, se ha auto-traducido al francés, ignoro por qué. Y me ha facilitado estas imágenes:
Quiero pensar que si le dedico horas trabajar bien el texto, probablemente obtenga un resultado digno. Pero en estos casos lo que pruebo es que un interfaz de pago sea potente, ágil y rentable en cuanto a resultados/tiempo. Por este motivo, no te recomiendo esta aplicación.
¿Quieres probarlo tú? Aquí tienes la página de Photosonic. ¡Ojalá tengas más suerte!