Los memes text-to-speech y el mejor lado de los deepfakes
Obama, como me robes los 3 stacks de diamantes te las verás conmigo.
Mira, el otro día me crucé con este tweet.
Para empezar: no entiendo que digan que las IA NO están cambiando el mundo en 2023. O sea, hola??? SI ESTOS MEMES A MI ME ESTÁN CAMBIANDO LA VIDA.
Como habéis podido comprobar, naturalmente se trata de una discusión entre Joe Rogan, Elon Musk, el Joker, y Jordan Peterson mientras buscan diamantes en Minecraft. Ojalá esta situación existiera de verdad, pero sabemos que formarían la peor gaming squad de la historia, y lamentablemente no ocurrirá. En cualquier caso, gracias a las nuevas IA podemos recrearla con suma exactitud y yo puedo morir tranquilísimo.
De los creadores de Weird AI Generations, la tendencia en la que pedías imágenes generadas por IA con descripciones raras af, han llegado los deepfakes de famosos discutiendo mientras juegan a videojuegos.
Estos últimos días están siendo una locura en TikTok y otras redes sociales con este nuevo trend. Algunos de mis favs:
Joe Rogan, Jordan Peterson y Ben Shapiro flipando con Tame Impala.
Obama, Trump y Biden en Minecraft haciendo trampas, insultándose y buscando diamantes.
La squad definitiva: MrBeast, Elon Musk, Joe Rogan, Jordan Peterson, y LS jugando al LoL.
Biden y Trump recreando fielmente una partida ranked en Overwatch.
Dua Lipa y Andrew Garfield intentan apaciguar una discusión presidencial en Valorant.
Asesinato en Among Us. Trump, Biden, Rogan y Musk intentan encontrar al responsable.
Lo mejor de los dos mundos
¿Cuál es la gracia? Bueno, a parte de lo evidente (escuchar a gente famosa discutiendo dentro de un videojuego como si fueran colegas) para mí lo más gracioso son dos cosas: que a los famosos les están atribuyendo comportamientos dentro del juego según como son ellos en la vida real; y que hablan de temas súper técnicos como si fueran muy frikis del juego. Por ejemplo:
En Minecraft, Joe Biden es el típico amigo que se pierde por el mundo y no sabe dónde está su casa porque no se entera de nada. O se pone a jugar a Halo cuando el resto de sus amigos están jugando a Call of Duty.
Donald Trump quiere construir un muro para protegerse de los monstruos en Minecraft. En Valorant es el tóxico del equipo que culpa a los demás.
En League of Legends, George Bush escoge un personaje que se dedica a tirar bombas y usar explosivos. (lmao)
Elon Musk se sabe todos los trucos de Minecraft y se ha leído la wiki para saber a qué profundidad excavar y tener la mayor probabilidad de encontrar diamantes. También amenaza con comprar Riot Games (la desarrolladora de League of Legends) con tal de banear a sus compañeros, con los que está discutiendo.
Se nota que estos memes están hechos por jugadores y que van dirigidos a los mismos usuarios de esos videojuegos. Por lo que si entiendes las referencias internas porque también lo has jugado, lo hace muchísimo más divertido. Yo me lo estoy gozando.
La democratización de la herramienta
Algunos modelos de síntesis de voz por IA ya llevaban un tiempo pululando por ahí desde hace años. Pero con la refinación de estos sistemas y la apertura gratis al gran público, por fin se han visto sometidos al ingenio del pueblo para crear memes.
Existen varias maneras de conseguir voces generadas por IA, tanto online como con aplicaciones de escritorio. Aquí por ejemplo tenemos VoxBox, una plataforma gratuita que te permite sintetizar voces de personajes ficticios de series o películas, y con una opción premium que te permite emular a personas reales.
Precisamente este modelo de negocio Freemium le encaja muy bien a este servicio. Emular la voz de personas reales o crear deepfakes; especialmente si son de presidentes de gobierno, influencers o famosos en general, es un debate ético que tiene que estar sobre la mesa y del cual no hay nada regulado aún. De hecho, ya hemos visto por ahí algunos problemillas de suplantación de identidad con Joe Rogan. Por eso, ofrecer voces de personas reales solo en el servicio de pago, sin ser una solución permanente o suficiente, es una primera barrera de entrada y una herramienta de regulación y rastreo.
Como Janira Planes comentó en el último Tardeo, “las plataformas serán las que tendrán que encargarse de regular este tipo de contenido, e idealmente el gobierno también, aunque como muchas otras decisiones legales referentes a la tecnología; seguramente lleguen tarde y mal”.
De todas formas, hay otras plataformas como fakeyou.com que sí que ofrecen cualquier voz de manera gratuita, incluso te permiten entrenar a la IA para que genere tu propia voz. Lo que pasa es que no suelen ser tan convincentes ni ofrecen opciones tan precisas como crear pausas, cambiar la velocidad del habla, o incluso poner énfasis en ciertas palabras de una frase.
El salto cualitativo
Si alguien se pregunta por qué se están emulando especialmente a presidentes del gobierno o a tertulianos famosos en internet (como Ben Shapiro, Jordan Peterson, o Joe Rogan) a parte de por lo famosos que son; es porque sus voces aparecen en volúmenes de cientos e incluso miles de horas en videos de internet. Por lo que los usuarios y empresas lo tienen más fácil para entrenar a sus IA con esas personas.
No solamente hace falta que su voz suene clara, con entonaciones variadas y durante muchas horas. Para entrenar correctamente a estas IA se necesita un texto (en este caso los subtítulos de YouTube o las transcripciones de los discursos de los presidentes son perfectos) que acompañen a cada una de las palabras dichas, para que el sistema entienda qué relación hay entre texto y habla. Así, cuando tú le ofrezcas un texto, podrá hacer “ingeniería inversa” y sacar una voz que diga lo mismo.
Por lo tanto, que se escojan a estas personas no es casualidad. A parte de que sea gracioso que un personaje serio o intelectual diga tonterías, se han utilizado estas voces porque son las que suenan mejor, ya que están mejor entrenadas.
Encima ahora ya están sacando la versión mejorada con deepfakes para simularles la cara. Esto es un no parar.
¡Gracias por leerme! Si os ha gustado dadle a like y compartidlooo chaoooooo
Los memes text-to-speech y el mejor lado de los deepfakes
Ya esperaba recibir este mail en mi inbox!!! Fan <3