OpenAI lanza motor de audio que recrea la voz humana

En primer lugar, OpenAI ofrece herramientas que facilitan a las personas la creación de imágenes digitales. Describiendo lo que quieren ver. Luego creó una tecnología similar que crea videos en movimiento completo como las películas de Hollywood. Ahora, ha lanzado una tecnología que puede recrear la voz de alguien. Una conocida startup de inteligencia artificial, High Level, dijo el viernes que un grupo de pequeñas empresas está probando un nuevo OpenAI Voice. Sistema de motor que puede reconstruir la voz de una persona a partir de una grabación de 15 segundos si subes tu propia grabación y un párrafo de texto. El texto se puede leer usando una voz sintética que suena como la tuya. El texto no tiene que estar en su idioma nativo. Puede generar su voz en español, francés, chino o muchos otros idiomas. OpenAI no comparte su tecnología de manera más amplia porque todavía está tratando de comprender los peligros potenciales. Lo mismo ocurre con los creadores de imágenes y vídeos. Los generadores de tonos pueden ayudar a difundir desinformación en las redes sociales. También podría permitir a los delincuentes hacerse pasar por alguien en línea o durante una llamada telefónica. La compañía dijo que está particularmente preocupada de que este tipo de tecnología pueda usarse para socavar los sistemas de autenticación de voz que controlan el acceso a cuentas bancarias en línea y otras aplicaciones personales. . Y es importante hacerlo bien”, dijo en una entrevista Jeff Harris, gerente de producto de OpenAI. La compañía está explorando formas de agregar marcas de voz sintéticas o controles que impidan que las personas utilicen la tecnología con las voces de políticos o otras personas importantes El mes pasado, OpenAI adoptó un enfoque similar cuando lanzó su programa de creación de videos Sora. Mostró la tecnología pero no la hizo pública. OpenAI es una de varias compañías que han desarrollado una nueva generación de tecnología de inteligencia artificial que puede crear rápidamente videos sintéticos. suena y fácilmente Incluyen gigantes tecnológicos como Google y nuevas empresas con sede en Nueva York como ElevenLabs (The New York Times ha demandado a OpenAI y su socio, Microsoft). (Para violaciones de derechos de autor que involucran sistemas de inteligencia artificial que generan texto), las empresas pueden utilizar estas tecnologías para crear audiolibros. Dar voz a los chatbots online O incluso crear un DJ de estación de radio automatizado. Desde el año pasado, OpenAI ha estado utilizando la tecnología para impulsar una versión parlante de ChatGPT. Y tiene una larga trayectoria comercial ofreciendo muchos sonidos que se pueden utilizar con aplicaciones similares. Todos se crean a partir de clips proporcionados por actores de voz, pero la compañía aún tiene que ofrecer herramientas públicas que permitan a individuos y empresas crear audio a partir de clips cortos como lo hace Voice Engine. Harris dijo que esto es lo que hace que esta tecnología sea peligrosa. La tecnología podría ser especialmente peligrosa en un año electoral, dijo en enero. Los residentes de New Hampshire recibieron un mensaje de llamada automática que les prohibía votar en el estado primario con una voz que probablemente fue creada artificialmente para sonar como la del presidente Biden. Posteriormente, la Comisión Federal de Comunicaciones prohibió las llamadas y Harris dijo que OpenAI no tiene planes inmediatos para monetizar la tecnología. Dijo que la herramienta podría ser especialmente útil para las personas que han perdido la voz debido a una enfermedad o un accidente. Demuestra cómo se puede utilizar esta tecnología para reconstruir la voz de una mujer después de que un cáncer cerebral la destruya. Ahora ella puede hablar dijo después de grabar una breve presentación. que solía hacer cuando era estudiante de secundaria

Source link