Voicemod, la startup española que da a 'gamers' y 'streamers' el poder de cambiar su voz en tiempo real: "Queremos que elijas cómo quieres sonar en espacios virtuales"

Los hermanos Bosch, fundadores de Voicemod: Fernando (izquierda), Jaime (centro) y Juan (derecha).
Los hermanos Bosch, fundadores de Voicemod: Fernando (izquierda), Jaime (centro) y Juan (derecha).
Voicemod 2
  • La eclosión de los creadores de contenido ha generado nuevas necesidades en el mundo del gaming. Startups como la española Voicemod han nacido para satisfacer esas demandas.
  • Voicemod es un modulador que altera la voz del gamer o del streamer en tiempo real. Su uso más allá de los videojuegos consiguió que la tecnología despegara internacionalmente.
  • En julio de 2020, Voicemod cerró una ronda de financiación de 7,1 millones de euros liderada por Bitkraft Ventures, especialista en eSports.
  • Descubre más historias en Business Insider España.

Desde hace ya un tiempo, las startups españolas centradas en el mundo del gaming han ampliado horizontes para ser algo más que desarrolladoras de videojuegos. Este perfil sigue y seguirá presente, pero en paralelo se está gestando un tipo de startup que se centra en ofrecer servicios a nuevos participantes.

Una figura reciente en el sector del gaming es el creador de contenido, que normalmente es un streamer que utiliza redes sociales o plataformas como Twitch o Youtube para entretener a sus usuarios probando videojuegos divertidos o recientes. En muchas ocasiones, los fans valoran más los comentarios o la personalidad del streamer que la partida en sí.

Ibai Llanos se ha convertido en un ejemplo paradigmático. Además, su progreso profesional demuestra cómo, poco a poco, estos streamers que empezaron como especialistas de videojuegos están evolucionando hacia un mundo más amplio: el del entretenimiento.

Tanto los streamers como sus fans tienen nuevas necesidades. Los streamers quieren monetizar al máximo sus retransmisiones, y la clave para ello consiste en encontrar formas de fidelización más efectivas u originales. Y los usuarios siempre quieren más herramientas que les permitan interactuar con el streaming, tener un impacto en la partida.

Hasta ahora, existían pocas tecnologías que consiguieran juntar aún más a los creadores de contenido con sus seguidores.

Entra a escena Voicemod, un servicio de modulador de voz para gamers y streamers que el año pasado protagonizó titulares tras cerrar una ronda de financiación de 8 millones de dólares liderada por la alemana Bitkraft Ventures. Desde su lanzamiento, la app acumula más de 25 millones de descargas (solo en PC), y ha calado especialmente en la audiencia estadounidense.

Lo que a primera vista parece una simple app para hablar como Papá Noel o como si te hubieras tragado un globo de helio, esconde una empresa valenciana que ha llamado la atención a nivel internacional porque ha sabido escalar un servicio inicialmente pensado para gamers hacia nuevos sectores, clientes y necesidades.

Qué es Voicemod

Voicemod
Voicemod

Voicemod es un software que modifica en tiempo real la voz de los usuarios. Funciona con la mayoría de los juegos online más populares (Fortnite, Valorant, Call of Duty Warzone, Minecraft, Roblox, GTA 5...) y es compatible con las aplicaciones más utilizadas por los gamers como Twitch, Skype o Streamlabs OBS.

Si por ejemplo estás jugando a un título de estrategia, y acabas de enviar a tu ejército a enfrentarse al batallón de un rival, puedes usar Voicemod y activar el efecto de sonido Chorus para que tu voz se multiplique por 1000. Así tu amigo realmente tendrá la impresión de que encarnas a un montón de soldados a la vez.

El servicio permite cambiar la voz de 3 formas diferentes. Puedes escoger una modulación predefinida, personalizar tu propia voz digital jugando con diferentes filtros o bien puedes descargar uno de los soundboards que incluyen efectos de sonido.

A mediados de 2020, Voicemod tenía 2,5 millones de usuarios activos mensuales, la mayoría de ellos estadounidenses. Aunque tiene versión para PC, el 80% de los usuarios prefieren descargar la app para móviles. Fue precisamente en julio de ese año cuando Bitkraft Ventures, inversora especializada en el mundo de los eSports, lideró la ronda de inversión de 7,1 millones de euros.

Detrás de Voicemod hay 3 fundadores (Jaime, Juan y Fernando) que tienen muchas cosas en común. Los 3 son de Valencia, son músicos y, como detalle final, son hermanos (los Bosch). 

"Empezamos con la idea de Voicemod hace 10 años y nadie salvo aquellos que eran gamers entendían lo que estábamos planeando", explica para Business Insider España uno de los hermanos fundadores, y CEO de la compañía, Jaime Bosch.

La historia de Voicemod es un desfile de ensayo y error, de descubrimiento orgánico hasta que, en 2017, surgió la primera versión del servicio actual. Bosch apunta que en aquel entonces se apostó por satisfacer principalmente a los jugadores porque estos aceptarían rápidamente el objetivo detrás de la tecnología: ofrecer una identidad sonora. 

"Que la gente pueda ser escuchada de la forma que quiere ser escuchada: ese es nuestro lema interno", explica Bosch.

La búsqueda de la identidad online

Los juegos especialmente de rol permiten personalizar el avatar con mucha libertad, como el caso de 'Cyberpunk 2077' (imagen).
Los juegos especialmente de rol permiten personalizar el avatar con mucha libertad, como el caso de 'Cyberpunk 2077' (imagen).
CD Projekt

El auge de los juegos online a finales de los 90 trajo consigo un nuevo elemento: el avatar, la representación digital de un jugador dentro del entorno virtual. Aunque algunos quieren que su héroe o heroína se parezca mucho a su cuerpo real, la gran mayoría aprovecha las opciones de personalizar el avatar para convertirse temporalmente en la persona que siempre han deseado ser.

"El mundo del gaming tiene pocas barreras en comparación con otros sectores", explica el cofundador de Voicemod. "Gracias a las opciones de personalización, en los universos digitales se generan posibilidades casi infinitas en lo que respecta a quién podemos ser. Por eso en los videojuegos hay más inclusión e igualdad".

Pero aunque los gamers durante años han podido crear un nuevo aspecto, sus voces seguían siendo las de siempre. La voz real puede romper en ocasiones la identidad virtual que se ha creado.

"Con Voicemod atacamos un problema muy fundamental del ser humano: quién eres. Hasta ahora, la tecnología ha permitido que decidas cómo quieres ser, cómo quieres que los otros te vean. Nosotros complementamos dejándote libertad para crear tu identidad sonora, para que elijas cómo quieres sonar".

Como el gaming online llevaba años enfrentándose al problema de la identidad, los hermanos Bosch no dudaron ni un momento que los primeros usuarios que apreciarían el objetivo de Voicemod serían los gamers.

Más allá de los videojuegos

Ibai Llanos es un ejemplo de un nuevo tipo de profesional, el creador de contenidos.
Ibai Llanos es un ejemplo de un nuevo tipo de profesional, el creador de contenidos.

La Sexta

Otra ventaja de contar con los jugones como clientes iniciales es que estos son, según Bosch, los early adopters tecnológicos por excelencia. El cofundador de Voicemod lo explica usando su propia experiencia como jugador.

"Hace 10 años mi padre no entendía que me conectara a un chat online como IRC para jugar online al Counter-Strike con amigos de Alemania. Tampoco entendía que nos comunicásemos con emojis o con GIFs. Hoy en día, mi padre se comunica conmigo con un chat online como WhatsApp, y es el primero en preferir ponerme un emoji en lugar de escribirme".

La tecnología abrazada por los gamers a la larga acaba siendo adoptada por la audiencia mainstream. Por ello desde Voicemod ya se anticipaba que, poco a poco, la modificación de voz iría más allá del mundo de los videojuegos. En la actualidad, gran parte de los clientes son creadores de contenido, especialmente de Twitch.

Al principio, los creadores usaban Voicemod para sus gameplays. "Es una herramienta perfecta para rolear", explica Bosch. Las partidas de rol son la nueva moda en Twitch. Ganar la partida se deja de lado para priorizar representar de forma divertida y fiel a un personaje virtual. La tecnología de modulación de voz atiende perfectamente a la necesidad de encarnar un papel digital.

Un ejemplo muy típico es añadir eco a la voz para simular que se está explorando una caverna oscura y misteriosa, como el personaje del videojuego que se está retransmitiendo. Otro caso muy común es alterar la voz para que suene a personaje de anime en el caso de que el juego esté centrado en la audiencia otaku.

Además de usar el modulador para sus retransmisiones de videojuegos, los creadores de contenido han descubierto el potencial de Voicemod para mejorar la interacción en sus retransmisiones de entretenimiento puro y duro, como las charlas con los seguidores.

Ante esta nueva situación, Voicemod creó una extensión para Twitch llamada Bits. Permite a los seguidores de un streaming cambiar en cualquier momento la voz del presentador o creador de contenido. Es este el tipo de impacto directo que los usuarios de Twitch y similares suelen apreciar.

La extensión también es útil para los creadores. Permite una mayor interacción con los fans y es una fuente de ingresos adicional, ya que el usuario debe pagar con bits, la divisa virtual de Twitch, si quiere alterar la voz del streamer.

Es precisamente la fácil escalabilidad de Voicemod lo que atrajo la atención de Bitkraft Ventures. "Voicemod va más allá de los videojuegos", explica Malte Barth, socio fundador de Bitkraft, para Business Insider España. "Está cambiando cómo interaccionamos socialmente en plataformas digitales. Su potencial aún ha alcanzado la cima".

Iteraciones impulsadas por los propios usuarios y por nuevas tendencias

Voicemod Bits es la nueva extensión de Voicemod que permite a los usuarios controlar la voz de los 'streamers'.
Voicemod Bits es la nueva extensión de Voicemod que permite a los usuarios controlar la voz de los 'streamers'.
Voicemod

Bosch reconoce que Voicemod añade nuevas voces, estilos y funcionalidades gracias al feedback constante de sus clientes, sean gamers o creadores.

"Destacamos con respecto a la competencia porque tenemos a un equipo dedicado a estar siempre en contacto con los usuarios".

Los gamers son un arma de doble filo, por eso, y hay que saber usarlos correctamente. "Un gamer es un usuario muy exigente y a la vez muy cualificado. Sabe muy bien lo que quiere, sabe muy bien lo que hace y a veces hasta saber mejor que tú por qué algo no le funciona".

Satisfacer a un cliente así requiere de estar itinerando constantemente. "Tenemos a otro grupo de ingenieros de sonido centrado en crear nuevas voces o funciones muy específicas, como cumplir las nuevas demandas de los clientes". Bosch reconoce que la gran mayoría de añadidos de Voicemod son ideas de sus usuarios.

Otras funcionalidades surgen como resultado de analizar las tendencias. Es el caso de los conciertos virtuales recientes que se están organizando en el popular Fortnite. "Estamos creando una tecnología que permitirá a los usuarios cantar con la misma voz o autotune que sus artistas preferidos. También lo vamos a ofrecer a creadores de contenido".

En este sentido, Bosch compara Voicemod con Netflix: "Tenemos que iterar y añadir novedades constantemente porque ya no somos solo un servicio. Somos un catálogo, como Netflix y compañía. ¿Y qué harías si entras en Disney+, Amazon Prime o HBO y no ves novedades en un mes? Pues que te irías".

Cambio de paradigma: crear una nueva voz de la nada

Redes neuronales
Getty

Hasta ahora, este servicio distorsiona las voces mediante procesamiento de señales digitales. Bosch lo compara a alterar el sonido de una guitarra mediante un pedal: se altera la voz original con reverberación, ecos...

Pero Bosch ya considera esta tecnología primitiva y explica que su empresa apuesta por las redes neuronales. "Esto nos permitirá romper la voz de nuestros usuarios para crear una voz nueva de la nada. Es algo rompedor porque la voz original deja de ser la fuente. Será todo un cambio de paradigma". 

Hay elementos que las redes neuronales no pueden alterar, como la cadencia de la voz, su velocidad y, evidentemente, el mensaje. Pero el tono, el timbre... todo eso se puede moldear para crear una identidad sonora más personalizada que nunca.

La expansión de Voicemod

Entrar en el mercado asiático implica adaptarse en una región donde los vtubers, 'youtubers' y 'streamers' virtuales, pueden convertirse también en clientes.
Entrar en el mercado asiático implica adaptarse en una región donde los vtubers, 'youtubers' y 'streamers' virtuales, pueden convertirse también en clientes.
Youtube

Pero Voicemod no solo se amplía en el ámbito tecnológico. El servicio aterrizó recientemente con éxito en Japón. Esta llegada forma parte de los planes actuales para expandirse en países asiáticos.

"Es un reto", reconoce Bosch. "Asia utiliza redes sociales diferentes. Además, a nivel cultural, de humor, imaginario... todo es diferente. Hemos tenido que adaptar contenido y servicios".

Además de amoldarse a la cultura nipona, Voicemod llegó a un acuerdo de colaboración con un distribuidor local para que el aterrizaje fuera lo más suave posible. El éxito ha animado a la compañía a adentrarse próximamente en 2 países asiáticos más siguiendo la misma estrategia de adaptación y colaboración.

Pese a la expansión asiática, Bosch no se plantea crear sedes fuera de Valencia. Aunque al cofundador de Voicemod no le gusta hablar de regiones porque se ha adaptado el trabajo remoto durante la pandemia, y una vez pase la situación global, se adoptará un modelo de trabajo híbrido. 

"Por ahora vamos a seguir siendo una empresa 100% teletrabajo, pero cuando tengamos las oficinas reformadas los trabajadores que vivan en Valencia serán libres de venir o quedarse en casa".

En este sentido, adaptarse a los tiempos de pandemia no fue fácil porque Voicemod se amplió precisamente en pleno COVID-19: "Antes del confinamiento éramos 33 trabajadores y ahora somos 127. Ha sido difícil porque hemos tenido que crear sobre la marcha procesos que, cuando éramos pocos, no necesitábamos".

El cofundador de Voicemod explica que 127 trabajadores no será la cifra definitiva para este año. "Nos encontramos en fase de contratación. Buscamos ingenieros, product managers, diseñadores... Crecemos en todos los sentidos".

Pero el crecimiento más destacado está enfocado en el negocio. "Buscamos muchas personas especializadas en desarrollo de negocio porque estamos empezando a comercializar nuestros productos, tecnología y servicios".

En concreto, Voicemod quiere superar el obstáculo de la incompatibilidad tecnológica. Es un problema muy habitual en el espacio online. Los usuarios de este modulador ahora tienen el inconveniente de que las voces que se han creado no pueden usarse en aplicaciones de terceros. Eso ya está cambiando.

"El plan es que otras apps puedan instalar nuestra tecnología para que nuestros usuarios puedan consumir nuestros productos en cualquier sitio".

Otros artículos interesantes:

Estos 14 emprendedores españoles han creado al menos 2 startups de éxito con 35 años o menos

12 startups españolas del mundo del 'gaming' que los fondos y expertos tienen en su radar en 2021

16 startups europeas de finanzas integradas llamadas a revolucionar el sector fintech, según los inversores

Te recomendamos

Y además