Sora de OpenAI, ElevenLabs y el fin de los medios de vídeo tal como los conocemos

hace 8 meses

A Cameraman shooting, filming process in a studio film set

La evolución del entretenimiento en vídeo y audio nos llevó desde los bardos y artistas itinerantes hasta obras fijas complementadas con teatro radiofónico.

Ése era nuestro principal entretenimiento nocturno hasta que apareció la televisión, primero en blanco y negro y luego, en gran medida gracias a “El maravilloso mundo de color de Disney”, los televisores en blanco y negro fueron reemplazados por los televisores en color.

La televisión luego pasó de la tecnología basada en CRT y la definición estándar con tamaños de hasta 25 pulgadas a los televisores de pantalla plana actuales que en su mayoría son 4K y esperan una posible ola 8K a finales de esta década.

El contenido de la televisión evolucionó, desde programas en vivo en su mayoría hasta programas grabados y desde sets a imágenes generadas por computadora (CGI). Sin embargo, algunos, como la próxima secuela de la película "Beetlejuice", todavía prefieren usar sets para crear una imagen más cruda.

Cada etapa de la evolución dio lugar a cambios en las habilidades a medida que las cámaras y la tecnología evolucionaban hacia distintos niveles de automatización. Pero el cambio más significativo que anticipamos es el paso a contenido generado por IA. Este mes, surgieron dos tecnologías en versión beta: Sora de OpenAI, que crea videos hermosos y realistas que actualmente carecen de sonido, y el generador de voz de IA de ElevenLabs, que podría proporcionar sonido realista.

Sora de OpenAI, junto con el audio de ElevenLabs, nos permite producir contenido de video con calidad de producción en pocos años. Echa un vistazo a estos videoclips combinados creados por IA y producidos sin actores, guionistas, camarógrafos, artistas gráficos y la mayor parte del equipo de producción existente que normalmente está vinculado a un programa de televisión o una película.

Si bien espero que inicialmente esta tecnología sea utilizada principalmente por individuos y estudios emergentes y se concentre mayormente en los pilotos, con el tiempo, así será como se produzca la mayor parte del contenido.

Hablemos del mundo del entretenimiento post-IA tal como será en la segunda mitad de la década, en particular después de que expiren los contratos de los actores y escritores más recientes. Terminaremos con mi Producto de la Semana, la computadora portátil Acer Swift Edge 16, que tiene un equilibrio casi perfecto entre tecnología y precio.

El mundo del contenido impulsado por el usuario

Si miras YouTube, gran parte del contenido no lo crean empresas, sino individuos, algunos con presupuestos de producción decentes.

La IA nos permitirá crear contenidos aún más potentes a un coste menor y permitirá a los usuarios crear contenidos que les resulten especialmente interesantes. Hasta que los organismos reguladores se pongan al día y la aplicación de la ley sea adecuada, sin duda tendremos más contenidos falsos que parezcan reales. Aun así, el dinero real estará en la creación de contenidos que disfruten muchas personas y que estén diseñados para que quienes los vean los modifiquen.

El resultado sería similar a #Owlkitty, donde se agrega un gato al contenido de una película existente, pero donde se puede reemplazar a cualquiera de los personajes por cualquier otra persona que se desee (por ejemplo, los hijos). Sin embargo, esto es solo la primera ola. Después de eso, veo que los esfuerzos se dividirán entre aquellos a quienes les gusta modificar el contenido creado por otros y aquellos que quieren producir el contenido que será alterado.

Si bien no tengo dudas de que los profesionales que ya están molestos con estos avances no estarán contentos con este cambio, en realidad no es diferente a cuando pasamos a cualquier otra forma de automatización. Aquellos que realizaban el trabajo que se estaba automatizando estaban molestos porque sus trabajos estaban cambiando drásticamente o desapareciendo.

El resultado debería ser un cambio del contenido estático al contenido que se puede modificar infinitamente. Si no te gusta el final de una película, puedes cambiarlo o, en el futuro, el servicio de streaming sabrá qué prefieres de una película y creará o modificará películas para optimizarlas automáticamente según tus intereses.


Sin embargo, aunque esto funcionará con los cascos de realidad aumentada y realmente beneficiará a productos como el Apple Vision Pro, no funcionará bien para grupos de personas con diferentes intereses. En ese caso, el servicio buscará puntos en común en el grupo y luego creará contenido que tenga más probabilidades de atraer a la mayor cantidad de personas en un grupo o a aquellos que tienen voz y voto en el asunto, como los padres y los hijos.

Este enfoque podría generar una dinámica familiar interesante o potencialmente resultar en un mayor aislamiento entre los miembros de la familia ya que, al igual que las tabletas y los teléfonos inteligentes de hoy, se sumergen en su propia pantalla y contenido, y mirar en grupo cualquier cosa que no sean deportes se convierte en algo del pasado.

Sin duda, recibiremos muchas más críticas de personas que intentan y fracasan en aprender cómo dirigir a las IA para crear el contenido que ellas, o cualquier otra persona, desean.

De manera similar a cómo Apple intenta descubrir cómo licenciar música digital, el ganador probablemente será la empresa (y los creadores de contenido relacionado) que descubra cómo licenciar contenido de video que pueda modificarse y cobrar adecuadamente por ello.

Creo que YouTube es el que tiene más posibilidades de hacerlo, pero Facebook e incluso Microsoft también están en la carrera. Steve Jobs podría haberlo descubierto, pero creo que Tim Cook es demasiado rígido en sus puntos de vista y que hacerlo bien requeriría mucha creatividad. Por lo tanto, aunque Apple podría hacerlo, dudo que sea el primero y es más probable que siga el ejemplo de alguien más.

Más opciones para productores y consumidores de contenidos

En 1966, Woody Allen estrenó una película titulada "¿Qué pasa, Tiger Lily?". Era una película de espías seria que Allen reimaginó como comedia. Aquí hay un clip.

La nueva tecnología de inteligencia artificial no solo facilitará la creación de películas como Tiger Lily, sino que también permitirá modificar las imágenes de los actores para que sus acciones y movimientos estén más en línea con el nuevo diálogo. Se podría cambiar por completo una película con solo seguir las instrucciones en lugar de tener que volver a filmarla. Supongo que el contenido creado por inteligencia artificial, sin actores reales, será más fácil de alterar que el contenido más tradicional, dada la naturaleza digital de la fuente.


Esto desdibujaría las fronteras entre contenidos como los videojuegos, en los que el usuario accede al contenido y puede interactuar con él, y los contenidos de vídeo tradicionales, que normalmente se ven como público. ¿Recuerdas la película “Hardcore Henry”, que fue la primera película filmada en primera persona y parecía interesante? Aunque, aunque te situabas en la cabeza del protagonista, no podías alterar el resultado.

Imaginemos un Hardcore Henry en el que se pudieran alterar los resultados; ¿no sería eso un videojuego? Deberíamos poder crear contenido que se pueda ver y jugar, desdibujando irremediablemente las fronteras entre los videojuegos y el contenido de vídeo. De hecho, puede convertirse en un escenario en el que, cuando veamos la película, decidamos si queremos ver o participar en el proyecto de vídeo.

De los sueños lúcidos a la creación de películas

Un desarrollo interesante y esperado es la combinación de tecnología para ayudar a las personas a crear sueños lúcidos y luego traducirlos en contenido de video impulsado por IA. Imagine poder compartir sus sueños con otras personas, o simplemente volver atrás y experimentar el sueño nuevamente y completarlo.

Cuando tengo un sueño lúcido, a menudo me despierto antes de que la historia que estoy soñando esté completa o debido a algún evento en el sueño que me obliga a despertar. Es frustrante. Me acuesto en la cama e intento terminar el sueño en mi cabeza. Ahora imagina poder hacer que la IA termine los sueños por ti para que no solo los recuerdes, sino que sean mucho menos frustrantes porque están completos.

Una vez escribí un cuento sobre una categoría laboral que llamé “Tejedor de sueños”. Se trataba de personas que podían soñar películas completas y luego, trabajando a través de un editor, convertir esas creaciones en contenido comercializable.

Ese concepto será posible a medida que combinemos estas tecnologías de IA con esfuerzos para ayudar a las personas a dirigir y recordar sueños lúcidos.

Terminando

Las próximas tecnologías que crearán contenido de video y sonido a partir de historias que nosotros o una IA escribamos nos brindarán muchas más opciones de contenido que las que tenemos hoy y abrirán la creación de buen contenido a una audiencia cada vez más amplia de creadores.

Espero que a quienes aprendan a usar bien estas herramientas para crear marcos en los que los usuarios puedan jugar les vaya muy bien. También preveo que esa fase será transitoria, ya que las IA evolucionarán para anticipar mejor nuestras necesidades únicas a medida que evolucionamos hacia la singularidad que se avecina.

Se harán esfuerzos importantes para frenar el avance de esta tecnología, pero dudo que sean muy eficaces, lo que sugiere que el mundo de los contenidos del futuro se parecerá más a una versión futura de YouTube y menos aún a los estudios y las redes que nos rodean hoy.

Como ocurre con todos los cambios, quienes sepan cómo adaptarse a ellos y sacarles provecho económico tendrán éxito. Quienes se opongan, probablemente no tanto.

Producto tecnológico de la semana

Portátil Acer Swift Edge 16 OLED

Conectividad de la vista lateral del portátil Acer Swift Edge de 16 pulgadas

(Crédito de la imagen: Acer)

Si bien las empresas piden cada vez más a las personas que regresen a la oficina, muchas, si no la mayoría, aún permiten que se trabaje desde casa. Eso significa que las computadoras portátiles con pantallas más grandes deberían ser la opción para quienes trabajan desde casa principalmente o con regularidad, porque mover monitores grandes por la casa puede volverse aburrido y porque cuando estamos en casa, a menudo sentimos la necesidad de vigilar a nuestros hijos o animales para mantenerlos fuera de problemas.

Una computadora portátil de 16 pulgadas es el tamaño perfecto para usarla en la oficina, en casa o en la escuela. Es lo suficientemente pequeña y liviana como para ser portátil, pero la pantalla de 16 pulgadas ofrece suficiente espacio, por lo que no te sentirás tan limitado como con una pantalla más pequeña.

De las computadoras portátiles de 16 pulgadas, la más interesante que he visto es la Acer Swift Edge 16, que tiene una de las primeras NPU (anticipando la IA de escritorio) junto con capacidades decentes de CPU y GPU, todo de AMD, que ha tenido un desempeño impresionante últimamente.

La computadora portátil tiene una pantalla OLED con más de mil millones de colores, negros increíblemente profundos y una frecuencia de actualización de 120 Hz, que es lo suficientemente buena para la mayoría de los juegos y ciertamente excelente para contenido de video (creado por IA o no).

Vista frontal del portátil Acer Swift Edge de 16 pulgadas

(Crédito de la imagen: Acer)

Con menos de 3 libras, es liviano para un equipo de este tamaño y es uno de los primeros portátiles con Wi-Fi 7. Incorpora el chip de seguridad Microsoft Pluton, que proporciona un nivel de protección más alto que la mayoría de los portátiles actuales. Completamente configurado, el Swift Edge 16 todavía cuesta menos de $1,500.

Una desventaja es que solo tiene alrededor de seis horas de duración de batería, pero para una computadora portátil de estación a estación (que es lo que necesitas cuando trabajas en la oficina o en casa donde tienes enchufes) está bien.

La Acer Swift Edge 16 puede ser la portátil perfecta para quienes trabajan desde la oficina y el hogar, y es mi Producto de la Semana.

Si quieres conocer otros artículos parecidos a Sora de OpenAI, ElevenLabs y el fin de los medios de vídeo tal como los conocemos puedes visitar la categoría Tecnología.

Otras noticias que te pueden interesar

Subir