Su primer asistente gemelo digital y el futuro del entretenimiento de video
hace 2 años

La velocidad a la que AI parece avanzar es increíble. Antes de finales del año pasado, la mayoría de nosotros pensamos que la IA no sería útil individualmente durante algunos años todavía. Luego, ChatGPT HIT, respaldado por la tecnología GPT-3, seguido rápidamente por GPT-4, y de repente, estamos rodeados de inteligencia artificial que puede mejorar nuestra productividad.
Uno de los más interesantes es el modelo de síntesis de AI de Video de Deepbrain Ai, que puede crear un gemelo digital que funcione de un humano que puede asumir cada vez más tareas que el humano que refleja típicamente tendría que hacer.
Charlemos sobre la aparición del útil gemelo digital humano esta semana. Cerraremos con mi producto de la semana, Motorola Thinkphone de Lenovo, un teléfono inteligente que aborda uno de los errores más grandes de la industria informática en su respuesta al iPhone de Apple.
Modelos de AI de síntesis de video
Inicialmente enfocado en el talento del anclaje de noticias, la IA de Deepbrain es el primer gemelo digital humano que he visto que puede realizar tareas indistinguiblemente de cómo los humanos los habría hecho.
El gemelo digital se crea al permitirle aprender de una gran cantidad de videos de noticias para crear una base de datos de conocimiento sobre el comportamiento, las peculiaridades, el habla y los movimientos del presentador humano.
El gemelo digital resultante puede alimentarse con un guión, y a partir de ese script, funcionará como lo haría el presentador de noticias. El gemelo digital no reemplaza el talento humano, y en general, el talento se compensa cada vez que el servicio de noticias usa este avatar, principalmente para irrumpir o burlas de formatos cortos para la próxima programación en vivo.
A veces, los servicios de noticias notarán que la audiencia está viendo un avatar generado por IA. Donde esta tecnología ya está en uso, la audiencia de noticias y el talento lo ha aceptado.
La razón por la que el talento de las noticias está de acuerdo con esto es que se compensan cuando se usa el avatar, y usar el avatar significa que el talento no tiene que conducir a un estudio para grabar o grabar segmentos, actualizaciones o anuncios que generalmente requieren que regresen a un estudio.
Entonces, el Avatar no perjudica sus ingresos, y complementa el trabajo de los humanos al reducir su carga y agravación relacionada, todo lo cual debería mejorar la satisfacción laboral.
Casos de uso de avatar
Si bien la mayoría de los casos de uso iniciales para esta tecnología son para programas de noticias de video donde el avatar y el periódico son indistinguibles (ejemplo en Asia), otros usos incluyen:
- Quioscos virtuales en bancos donde parece que estás hablando con un humano, pero estás charlando con una IA
- Videos de capacitación unidireccional que trabajan desde un guión escrito
- Un conserje virtual en un hotel que puede ayudar con cosas como reservas de restaurantes o boletos para mostrar
- Videos interactivos donde, de nuevo, parece que estás hablando con una persona en vivo
https://www.youtube.com/watch?v=TZXQ9UHH3MQ
Algunos de estos avatares nunca fueron personas reales; Eran imágenes generadas por computadora y altamente realistas.
Las ventajas de costos son significativas, ya que generalmente cuesta alrededor de $ 4,000 para crear parte de este contenido de forma corta con una persona en vivo, pero solo cuesta alrededor de $ 100 para hacer lo mismo con un avatar generado por computadora.
El Avatar no requiere ensayo y funcionará desde el guión escrito sin distracciones como enfermedad o cualquiera de los conflictos o problemas de comportamiento típicamente asociados con el talento en vivo.
Dado que el Avatar funciona desde el texto, puede ser controlado por otras IA como Chatgpt o Watson de IBM, que creó un nivel de contenido interactivo humano que podría engañar a muchas personas para que piensen que están hablando con una persona viva.
Otro uso que ha sido explorado es la defensa de las celebridades:
https://www.youtube.com/watch?v=xysg60xvicu
Las celebridades no escala bien porque si los usas como defensores, la capacidad de las personas para charlar con ellas es casi inexistente. Sin embargo, un avatar de una celebridad podría interactuar con los fanáticos a escala, además de los clientes actuales o futuros del cliente.
Como se señaló, esta tecnología puede escanear personas reales y personajes creados artísticamente, lo que podría resolver algunos de los problemas que compañías como McDonald's (Ronald McDonald), Kentucky Fried Chicken y Jack in the Box tenían con el uso de personas vivas, donde todos cambiarían regularmente Actores para que el actor no estaba tan bien atado al personaje que no podían ser reemplazados.
Con un avatar creado digitalmente, la empresa es dueña del actor virtual, y los problemas de origen humano se evaporan una vez que eliminas a los humanos de la mezcla.
Gemelos digitales humanos y virtuales: lo que se avecina
El enfoque actual de Deepbrain está en mejorar, no reemplazar, a las personas en su mayor parte. Sin embargo, su uso de avatares totalmente sintetizados que no tienen conexión con ningún humano es más un reemplazo que un modelo de mejora. Si bien se centran inicialmente en el contenido de forma corta, nada impide que la tecnología finalmente se mueva a producciones de forma larga como programas de televisión y películas.
La naturaleza hiperrealista de los avatares mejorará con capacitación adicional y a medida que avanza la tecnología, incluso en forma larga. Los actores virtuales se volverán indistinguibles de las personas reales a pesar de que son amalgamas de esas personas, al igual que productos como Dalle-E construyen arte a partir de amalgamas de imágenes.
Dadas las ventajas masivas de costos del uso de contenido prácticamente creado sobre la acción en vivo, el potencial de tecnología como esta para interrumpir la industria de los medios es significativo. Mirando hacia el futuro, no es solo el costo del talento que se evita. El costo total del estudio donde el talento actuaría de otro modo también podría ser eliminado.
Dado que GPT-4 ya está haciendo un trabajo interesante con guiones e historias, puede poner esto en la hoja de ruta a tener películas fotorrealistas completas y programas de televisión creados completamente por AIS basados dinámicamente en las preferencias del usuario.
Al final, en lugar de ver el mismo programa de televisión y película que todos los demás, esta tecnología, combinada con IA generativa, podría crear videos personalizados a escala y potencialmente ponerlo a usted y a su familia como los principales actores (con su permiso, por supuesto, ).
De acuerdo, podría compartir esos videos a través de las redes sociales con aquellos interesados en ver lo que otros crean, potencialmente creando grandes cantidades de contenido único que los servicios necesitarían analizar y presentar a un mundo de clientes potenciales.
Concluir
Ser capaz de crear a su gemelo para hacer parte de su trabajo, que es donde se enfoca actualmente la IA de Deepbrain, es cambiar el juego. Pero cuando podemos tomar imágenes sintetizadas y hacer lo mismo, particularmente para el contenido de forma larga, interrumpirá masivamente todas las formas de entretenimiento. La industria de la pornografía, por ejemplo, ya está en todo esto. El contenido de Reddit ha estado haciendo esto por un tiempo, y la mayoría de los usuarios no parecen importarle.
Todo, desde personajes no jugadores en el juego (NPC) que se presentan como si fueran personas reales, hasta poder construir equipos deportivos virtuales completos con representaciones precisas de jugadores reales, imaginados o incluso muertos están potencialmente sobre la mesa, todos Lo que sugiere un nivel de interrupción que solo estamos comenzando a ver.
En resumen, ya es difícil saber qué es real y lo que no es, y esa dificultad solo crecerá. Cuando se trata de entretenimiento, esto puede ser algo bueno, pero cuando se trata de nuestra capacidad para ver la verdad, puede tener un impacto mucho más problemático. No estamos listos para eso.
Lenovo Thinkphone de Motorola
Uno de los mayores errores que cometió la industria informática fue girar completamente al iPhone. La ironía era que la industria inicialmente no creía en un teléfono inteligente centrado en el consumidor. Luego, en lugar de luchar contra esa tendencia en sus méritos, intentó pivotar en el iPhone para convertir a Apple de un seguidor tardío en un líder del mercado aparentemente durante la noche.
Esta no fue la primera vez que sucedió. Unas décadas antes, IBM intentó pivotar a la computación del cliente/servidor y casi abandonó el mainframe, llevándolo del claro líder del mercado a casi fuera de negocios en un corto número de años.
Hoy, hay un mercado desatendido con respecto a los teléfonos inteligentes centrados en los negocios. Una vez hablé con el entonces CEO de Bank of America, que no quería que su gente usara teléfonos de consumo. Quería algo seguro y centrado en el negocio como la BlackBerry una vez, pero estaba frustrado de que nadie hubiera construido tal dispositivo.
Bueno, Lenovo lo solucionó con su icónico Thinkphone.
El Lenovo Thinkphone de Motorola (crédito de imagen: Lenovo)
Al construir la marca muy centrada en el negocio del ThinkPad que se originó con IBM, The Thinkphone tiene dimensiones similares a un iPhone, pero está envuelto con varias características únicas centradas en el negocio.
Estas características incluyen:
- Instant Connect: Teléfono y PC descubren sin problemas cuando esté cerca y conéctese sobre Wi-Fi.
- Portapapeles unificados: Transfiera sin problemas el texto copiado o las fotos recientes, los documentos escaneados y los videos entre dispositivos pegándolos a cualquier aplicación en el dispositivo de destino.
- Notificaciones unificadas: Las notificaciones del teléfono aparecen instantáneamente en el Windows Action Center. Haga clic en una notificación Auto-Lays-Lays la aplicación del teléfono correspondiente en la pantalla de la PC.
- Fleja de archivo: Arrastre y suelte fácilmente los archivos entre ThinkPhone y PC.
- Transmisión de aplicaciones: Abra cualquier aplicación de Android directamente en una PC.
- Webcam avanzada: Aproveche las potentes cámaras de Thinkphone y las capacidades de IA, utilizándolo sin problemas como su cámara web para todas sus videollamadas. ¿Por qué comprar una cámara web separada cuando ya tiene una mejor cámara en su teléfono inteligente?
- Punto de acceso instantáneo: Conéctese a Internet a través de un clic directamente desde la PC para aprovechar la conectividad 5G de ThinkPhone. Esto es enorme y potencialmente mitiga la necesidad y el costo de la capacidad de WAN en su PC.
Al igual que el ThinkPad, Thinkphone está envuelto con seguridad y se prueba al estándar militar 810H (MIL-STD-810H) debido a su uso de fibra de aramida (utilizado en chalecos a prueba de balas), aluminio de calidad de la aeronave y la solución más robusta por Gorilla Glass.
Thinkphone es impermeable hasta una profundidad de 1,5 metros durante hasta 30 minutos. Incluso tiene un botón rojo para iniciar una aplicación crítica. Por lo general, elijo la cámara, ya que eso es lo que más a menudo necesito acceder rápidamente. Otros podrían usarlo para reimplegar la presentación para hablar para la policía, la seguridad y otros usos donde la comunicación instantánea es crítica (esto es compatible con la aplicación Microsoft Teams Walkie Talkie).
Diseñado para adoptar la administración remota, Thinkphone se puede configurar y administrar centralmente para garantizar la seguridad del dispositivo y que no se usa de manera inapropiada, un requisito típico para un dispositivo informático orientado a las empresas. Thinkphone tiene un procesador único llamado Moto Secure que aísla los pines, las contraseñas y las claves criptográficas, manteniéndolas en un entorno resistente a los tamperios, por lo que los malos actores no pueden acceder a ellos.
Thinkphone viene con un cargador universal de 68W único y muy pequeño que cargará el teléfono en minutos y también es lo suficientemente fuerte como para alimentar a la mayoría de las computadoras portátiles centradas en el negocio u otros dispositivos USB-C, aunque no las máquinas o estaciones de trabajo.
Finalmente, el teléfono luce una cámara de 50 MP de alta calidad que debería cubrir la mayoría de las necesidades de fotos, ya sea para capturar un evento personal o para un investigador de seguros o otra persona que necesite crear un registro de alta calidad.
The Thinkphone llena el vacío en los teléfonos comerciales que existían desde que Blackberry y Palm salieron del mercado, y es mi producto de la semana.
Si quieres conocer otros artículos parecidos a Su primer asistente gemelo digital y el futuro del entretenimiento de video puedes visitar la categoría Tecnología.
Otras noticias que te pueden interesar