Texto a imagen: nuevas y mejores imágenes con IA

Estamos encantados de anunciar que hemos mejorado nuestra tecnología de generación de imágenes con IA.

Actualmente, nuestro generador de texto a imagen está creando un millón de imágenes cada día (en enero se generaron 26 500 000 imágenes), lo que lo convierte en uno de los productos de Freepik más populares que se lanzaron el año pasado. Nos encanta que te encante, por lo que te traemos buenas noticias. Hemos actualizado la tecnología que utilizamos para la generación de imágenes con IA y, por lo tanto, hemos mejorado el generador.

¿Qué significa esto en concreto?

Simplemente, todo es mejor

La calidad de las imágenes generadas con nuestra herramienta de texto a imagen ha mejorado en gran medida. Básicamente, cada aspecto de una imagen que puedas imaginar ahora será mucho mejor. Debido a la actualización, todos los detalles tendrán un mejor aspecto y las fotos ahora parecerán más realistas que antes. Veamos algunos ejemplos, comparando el antes y el después, y comprobemos las diferencias usando el mismo prompt.

Podrás observar que todos los aspectos mencionados a continuación han cambiado visiblemente en todas las imágenes. A la izquierda, tenemos las imágenes que se obtenían con el generador de texto a imagen «antiguo». A la derecha están las imágenes generadas después de la actualización. El prompt utilizado para generar las dos imágenes de cada par es el mismo.

Texturas

Las texturas en los objetos y las superficies se asemejan más a la realidad, lo que proporciona una mayor profundidad al resultado final. Los poros de la piel, las vetas de la madera o el pelaje de los animales ahora tienen un aspecto más realista.

Observa también la iluminación de las imágenes y no te centres solo en la piel y en las pestañas o el párpado. Si te fijas bien, notarás que se ve un reflejo en el ojo de la derecha.

«Photography of a brown female eye»

Sí, ambos son buenos chicos. Sin embargo, hay que destacar que, en la imagen de la derecha, se aprecia una mejor iluminación, los colores son más suaves y el pelaje cuenta con mucho más detalle.

«A beautiful and fluffy border collie»

Rasgos de las personas

La representación de las personas en las imágenes es ahora más precisa y realista. Por ejemplo, las caras, las extremidades o las manos se asemejan más a la realidad que antes. Aunque la IA todavía puede generar de vez en cuando algún «dedo extraño», la posibilidad de que esto suceda se ha reducido notablemente.
La diferencia entre ambas imágenes es enorme. Todo, desde la iluminación a los rasgos humanos y el paisaje, luce más natural. El resultado que vemos a la derecha aprovecha el estilo vintage y bohemio que se indica en el prompt, mientras que en la imagen de la izquierda parece que ni se ha tenido en cuenta.

«Portrait supermodel with wild flowers in the mountains bohemian sunlight minolta vintage»

El tono ligeramente rosado de las nubes hacen que la imagen de la izquierda no parezca del todo realista. La luz del sol en la imagen de la derecha parece natural, como si viniera desde un lateral a través de una ventana, con unos tonos amarillos más realistas.

A cinematic still frame of lana del rey barely awake light streaks dust in the air indoor photography
Las sombras en la cara de la modelo se ven más realistas, al igual que la piel. En la imagen de la izquierda, la piel tenía un aspecto demasiado liso y reluciente, con un matiz azulado, lo que hace que parezca más una muñeca de plástico que un ser humano.

«A woman with a futuristic binary dot matrix over her face metallic minimalist glitch effect»

«Ahora, hasta los bosques dentro de la mente parecen más reales. ¡Fijate!»

«Create a green surreal double exposure photo of a silhouette and a forest. Nothing outside the image, The background should be minimalistic»

Colores e iluminación

Una iluminación correcta es esencial para lograr imágenes realistas. La orientación, la intensidad y el color de las fuentes de luz ahora generan juegos de luces y sombras con unos resultados más satisfactorios. Esto da lugar a una paleta de colores equilibrada y armoniosa, lo que se traduce en una imagen más estética.
En la imagen de la izquierda, los colores parecen sacados de una película futurista o incluso dan la sensación de que se han editado a conciencia. Por otra parte, la imagen de la derecha es más del tipo «saqué esta foto de camino al trabajo».

«Blank empty billboard mockup at the bus stop in the middle of New York street»

Nos encanta el estilo ciberpunk y, con nuestra tecnología mejorada, tú también empezarás a apreciarlo. Mira qué bien quedan las luces de neón en una calle oscura.

«A tiny robot in the streets of a cyberpunk city volumetric light detailed octane render»

La imagen de la izquierda parece tomada en un estudio delante de un croma. La taza parece de plástico y hay demasiadas fuentes de luz. Si no supiéramos que es una imagen generada por la IA, nos creeríamos totalmente que alguien está sentado en su casita de campo a punto de disfrutar de un café mañanero.

«A warm and cozy coffee mug at sunrise»

Ilustraciones mejores

Al igual que con las fotos, las ilustraciones también contienen ahora más detalle y unos colores más agradables. Los resultados son, por consiguiente, de mayor calidad, con más profundidad, carácter y equilibrio. Los ejemplos hablan por sí mismos.
A las chicas de la derecha se las ve más felices que a las de la izquierda, en nuestra opinión. La ilustración representa muy bien las luces y las sombras de la hoguera.

«Poster in a tender animation style of a group of three girls happily holding a bonfire by a river in a park in the evening delicate face lawn tent street lights picnic cartoon illustration»

Una vez más, volvemos a tener más detalle y unos mejores colores, pero lo que realmente destaca es la composición en la imagen de la derecha.

«Postmodernist collage about futuristic technology and artificial intelligence historical illustrations modern magazine cutouts newspaper»

En la imagen de la izquierda, observarás que las sombras no se corresponden con las piernas, algo que sí se ha conseguido en la imagen de la derecha.

«An illustration of a man staring at the stars, saturated turquoise colors, by Chelsey Bonestell, by syd mead»

Podríamos estar aquí todo el día mostrando ejemplo tras ejemplo, pero nuestra recomendación es que hagas la prueba por tu cuenta. Genera unas cuantas obras maestras con el generador mejorado.

Prueba la herramienta de texto a imagen

Un saludo al equipo de HuggingFace

En Freepik, empleamos una conocida biblioteca de código abierto de HuggingFace llamada Diffusers, que forma parte del proceso de generación de imágenes. Nos dimos cuenta de que la biblioteca de HuggingFace generaba imágenes con fallos. Comunicamos este problema a su equipo con todo detalle y YiYi Xu asumió la responsabilidad e identificó el error. Posteriormente, lideraron la creación de una nueva versión de la biblioteca que ya incluía la solución. Queremos expresar nuestro agradecimiento a YiYi Xu y al equipo de HuggingFace por allanar el camino en la IA de código abierto.