O alto custo de produção de audiolivros (antes da voz da IA)
Tempo e dinheiro estão entre as maiores barreiras para autores e criadores gravarem e produzirem seus próprios audiolivros. Por isso, a maioria dos autores hoje em dia não possui audiolivros produzidos profissionalmente.
- Narração: Se você contratar um dublador profissional, o valor cobrado pode variar de US$ 100 a US$ 500 por hora finalizada (PFH) ou mais. Esses valores por hora dependem da experiência e da demanda do narrador. Em vez disso, se você puder clonar sua voz de alta qualidade e usá-la para narrar o livro, o custo será uma fração do que você paga por um narrador.
- Edição e Pós-produção: Após a narração, seu áudio precisará ser editado e masterizado. Serviços profissionais de edição de áudio cobram de US$ 50 a US$ 100 por hora.
Não entraremos em detalhes sobre custos adicionais, como design de capa e esforços contínuos de marketing para promover seu audiolivro. Além disso, quando seu audiolivro for finalmente publicado, plataformas de distribuição como a ACX ficam com 40% a 60% de cada venda.
Nem preciso dizer que o cronograma para finalizar um audiolivro pode facilmente levar meses! A maioria dos autores que conheço teria que abrir mão de outros projetos só para poder viajar para os estúdios de gravação e trabalhar com os editores de forma consistente para concluí-lo. Se uma pessoa está doente, seja o autor, o narrador ou o editor, o projeto inevitavelmente atrasa.
Por mais que criadores e autores fiquem animados com o lançamento de seus audiolivros, o longo caminho até lá pode realmente esgotar você emocionalmente e financeiramente.
A boa notícia é que existe uma maneira melhor!
O que é ElevenLabs?
O ElevenLabs é um software de IA generativa para voz que explora a tecnologia "mais avançada de conversão de texto em fala e clonagem de voz". Qualquer pessoa que consiga se comunicar por meio da fala pode usar o ElevenLabs para criar locuções realistas usando suas próprias vozes. Em 2023, o ElevenLabs aprimorou ainda mais seus recursos de clonagem de voz e lançou o Professional Voice Cloning (PVC) para criar a réplica digital perfeita da sua voz usando a IA de clonagem de voz mais avançada, disponível por meio da assinatura Creator. Acreditamos que esta seja a melhor configuração para criar seu audiolivro. Mais sobre isso em breve.
Mas primeiro, precisamos questionar por que deveríamos criar audiolivros com a ElevenLabs, em vez de usar uma voz de IA pré-fabricada.
Tutorial em vídeo
Por que criar audiolivros com a ElevenLabs
Atualmente, existem muitas opções para criar audiolivros com vozes de IA. Aliás, a maioria dos softwares de voz generativa de IA oferece vozes de IA pré-criadas, e o mesmo acontece com a ElevenLabs! Você pode ver no menu suspenso "Síntese de Fala" que é opcional clonar sua própria voz.

No entanto, é infinitamente melhor e mais interessante narrar seu audiolivro usando sua própria voz! Todos sabemos disso, mas encontrar o software de voz com IA generativa certo é o primeiro e mais importante passo.
As pessoas não ouvem e não ouvirão seu audiolivro se a voz da IA for ruim.
Precisamos encarar o fato de que vozes de IA de baixa qualidade não só dificultarão o projeto como também afastarão ouvintes interessados em seu livro, que podem nunca mais ouvir outro audiolivro seu.
Por vozes de IA de baixa qualidade, queremos dizer:
- Falta de expressão emocional
- Pouca variedade vocal
- Nenhuma adaptação contextual
E mais! Vozes de IA ruins ou de baixa qualidade arruinarão a experiência para você e seus ouvintes de audiolivros. O áudio soará monótono, sem emoção, desconectado e, alguns até dizem, simplesmente irritante.
É exatamente isso que queremos evitar ao usar um software de qualidade como o ElevenLabs . Se você está lendo isso porque está prestes a abandonar as vozes de IA, experimente o ElevenLabs no seu próximo projeto.
Não está convencido? Veja este exemplo de Seth Godin
Nosso professor de marketing favorito, Seth Godin, gravou este episódio ("A dança com IA, realidade e identidade") do seu podcast Akimbo usando o ElevenLabs. Ele nos contou no final do episódio, mas nós, ouvintes, demoramos um pouco para descobrir quando ele começou e parou de usar a voz da IA no episódio. Ficamos impressionados com os resultados.
Etapas para criar audiolivros com ElevenLabs
Etapa 1. Crie uma conta ElevenLabs
Você precisa criar uma conta no ElevenLabs , mas pode experimentar o ElevenLabs gratuitamente primeiro. Para gravar seu audiolivro, recomendamos a assinatura Creator (US$ 22/mês), pois ela foi desenvolvida para "criadores de conteúdo que buscam narração envolvente para seus conteúdos e acesso à Clonagem de Voz Profissional (CVP)".
Etapa 2. Use “Adicionar voz” para clonagem
Clique em “Síntese de Fala” e depois em “+Adicionar Voz” para começar a clonar sua voz!

Você será levado ao VoiceLab, onde poderá acessar seus perfis de voz clonados existentes ou adicionar um novo clicando em “Adicionar voz generativa ou clonada”.

Você poderá escolher um "Tipo de voz a ser criado". Novamente, recomendamos "Clonagem de Voz Profissional", que requer uma assinatura do Creator.

Após assinar a versão Creator, você notará que o limite de caracteres é de 110.000. O tamanho médio de um livro tem cerca de 50.000 palavras. Cada palavra tem cerca de 5 caracteres. Portanto, o tamanho médio de um livro é de cerca de 250.000 caracteres . Com a versão Creator, você tem a opção de "Ativar cobrança com base no uso (acima de 110.000 caracteres)". Você pode ativar a opção.
Etapa 3. Entenda a cobrança baseada no uso para concluir seu livro
Você tem 110.000 caracteres incluídos na sua assinatura atual. Para cada 1.000 caracteres acima desse valor, você será cobrado em US$ 0,3 (30 centavos). A ElevenLabs cobrará na sua forma de pagamento sempre que sua conta atingir US$ 44.
Portanto, para um livro médio de 250.000 caracteres, você está olhando para um custo total de cerca de US$ 66, ou seja, US$ 22 (custo de assinatura) + US$ 42 (custo de personagem adicional).
Etapa 4. Gere seu livro usando o recurso de projeto
Assim que sua voz estiver clonada e pronta para uso, você poderá começar a gerar seu livro! Sua voz não estará pronta imediatamente se você estiver usando a Clonagem de Voz Profissional (que levará cerca de 4 semanas a partir do outono de 2023). Se precisar gravar seu livro imediatamente, você pode optar pela Clonagem de Voz Instantânea.
- Para acessar o recurso do projeto, clique em “ Projetos ” na parte superior e, em seguida, clique em “+ Criar novo projeto”.

2. Prefiro usar “Criar um projeto vazio” porque isso me permite criar os capítulos sozinho.

3. Comece a construir seus capítulos no lado direito! Você também pode incluir seções como "Introdução" ou qualquer outra coisa que venha antes do Capítulo 1, Capítulo 2, etc.

4. Quando terminar, clique em “Converter”.
E quanto às configurações de voz?

As Configurações de Voz são exibidas como um dos menus suspensos. Por padrão, a Estabilidade é definida em 65%, o Aprimoramento de Clareza e Similaridade é definido em 72% e a Exageração de Estilo é definida em 0%. Essa configuração padrão geralmente funciona bem. Mas para garantir que você goste da configuração, recomendamos que você teste primeiro com apenas alguns parágrafos do seu livro. Se você for alterar a configuração padrão e, eventualmente, encontrar uma que melhor se adapte à sua voz, LEMBRE-SE de anotar as configurações em porcentagem (como elas são configuradas), para que você possa replicar a configuração novamente no futuro.
Veja o que cada configuração significa:
Estabilidade
- Mais variável: O aumento da variabilidade pode tornar a fala mais expressiva, com a produção variando entre as regenerações. Também pode levar a instabilidades.
- Mais estável: Aumentar a estabilidade tornará a voz mais consistente entre as regenerações, mas também pode torná-la um pouco monótona. Em fragmentos de texto mais longos, recomendamos diminuir esse valor.
Esclarecimento e aprimoramento de similaridade
- Baixo: Valores baixos são recomendados se houver artefatos de fundo na fala gerada.
- Alto: O realce alto aumenta a clareza geral da voz e a similaridade com o locutor-alvo. Valores muito altos podem causar artefatos, portanto, é recomendável ajustar esta configuração para encontrar o valor ideal.
Exagero de estilo
- Nenhum: sem exagero de estilo
- Alto: Valores altos são recomendados caso o estilo da fala seja exagerado em comparação com o áudio enviado. Valores mais altos podem levar a mais instabilidade na fala gerada. Definir como 0,0 aumentará significativamente a velocidade de geração e é a configuração padrão.
Aumento de volume do alto-falante
- Aumente a similaridade da fala sintetizada e da voz ao custo de alguma velocidade de geração.
Passo 5. Costurando os áudios juntos
Embora existam várias maneiras de unir áudio, recomendo que você considere usar um editor de áudio nesta etapa final. Não levará muito tempo e o custo não será significativo. Isso garantirá que a qualidade e as transições entre as seções sejam suaves e profissionais. Se quiser nos consultar sobre esta etapa, entre em contato conosco aqui .
Como alternativa, você também pode concluir esta etapa sozinho. Há duas maneiras principais de unir áudio: usando uma estação de trabalho de áudio digital (DAW) ou um programa de junção de áudio online.
Usando uma DAW:
- Abra sua DAW e importe os arquivos de áudio que você deseja unir.
- Organize os arquivos de áudio na ordem em que você deseja que eles sejam reproduzidos.
- Use as ferramentas de edição do DAW para aparar e esmaecer os arquivos de áudio para que a transição entre eles seja suave.
- Exporte o arquivo de áudio final costurado.
DAWs que amamos incluem:
- Podcastle
- GarageBand (grátis no Mac)
- Audacity (grátis para Mac e PC)
- Adobe Audition
Usando um integrador de áudio online:
- Acesse um site de junção de áudio on-line, como Clideo ou Audio Joiner.
- Carregue os arquivos de áudio que você deseja juntar.
- Organize os arquivos de áudio na ordem em que você deseja que eles sejam reproduzidos.
- Clique no botão “Costurar” para unir os arquivos de áudio.
- Baixe o arquivo de áudio final costurado.
O método escolhido dependerá das suas preferências e necessidades pessoais. Se você se sentir confortável usando uma DAW, isso lhe dará mais controle sobre o processo de junção. No entanto, se você não estiver familiarizado com DAWs, usar um unidor de áudio online é uma maneira rápida e fácil de unir áudio.
Como funciona a clonagem de voz profissional (PVC)?
A Clonagem Profissional de Voz (CVP), diferentemente da Clonagem Instantânea de Voz (CIV), que permite clonar vozes com amostras muito curtas quase instantaneamente, permite treinar um modelo hiper-realista de voz. Isso é possível treinando um modelo dedicado em um grande conjunto de dados de voz para produzir um modelo indistinguível da voz original.
Veja o que você deve saber sobre o processo, cronograma e práticas recomendadas do ElevenLab para alcançar resultados ideais.
Como os modelos personalizados exigem ajustes e treinamento, levará algum tempo até que você possa usar seu clone de voz. Fornecer uma estimativa é desafiador, pois depende do número de pessoas na fila antes de você e de alguns outros fatores. No entanto, recomendamos estimar entre ~4 semanas até você receber seu clone de voz. Esperamos que isso seja feito mais rápido, mas esta ainda é uma estimativa aproximada.
🎙️ Equipamento de gravação profissional: Use equipamento de gravação de alta qualidade para obter os melhores resultados, pois a IA clonará tudo relacionado ao áudio. Entrada de alta qualidade = saída de alta qualidade. Qualquer microfone funcionará, mas recomendamos um microfone XLR conectado a uma interface de áudio dedicada. Algumas recomendações gerais para equipamentos de baixo custo seriam algo como um Audio Technica AT2020 ou um Rode NT1 conectado a uma interface Focusrite ou similar.
🗣️ Use um filtro pop: use um filtro pop ao gravar. Isso minimizará as oclusivas durante a gravação.
📏 Distância do microfone: posicione-se à distância correta do microfone – recomenda-se aproximadamente 60 cm de distância do microfone, mas isso também depende do tipo de gravação que você deseja.
💥 Gravação sem ruído: certifique-se de que a entrada de áudio não tenha nenhuma interferência, como música de fundo ou ruído. A clonagem por IA funciona melhor com áudio limpo e organizado.
🎧 Acústica do Ambiente: De preferência, grave em um ambiente com tratamento acústico. Isso reduz ecos e ruídos de fundo indesejados, resultando em uma entrada de áudio mais nítida para a IA. Você pode criar algo temporário usando um edredom ou colcha grossa para amortecer o espaço de gravação.
⚙️ Pré-processamento de áudio: considere editar seu áudio com antecedência se você deseja uma saída de som específica. Por exemplo, se você deseja uma saída com qualidade semelhante à de um podcast, pré-processe seu áudio para corresponder a essa qualidade, ou se houver pausas longas ou muitos "uhm" e "ahm" entre as palavras, pois a IA também os imitará.
🎚️ Controle de volume: Mantenha um volume consistente, alto o suficiente para ser nítido, mas não tão alto a ponto de causar distorção. O objetivo é atingir um nível de áudio equilibrado e estável. O ideal seria entre -23 dB e -18 dB RMS, com um pico real de -3 dB.
🔊 Duração de áudio suficiente: Forneça pelo menos 30 minutos de áudio de alta qualidade que siga as diretrizes acima para obter melhores resultados – de preferência, algo em torno de 3 horas de áudio. Quanto mais dados de qualidade você puder inserir na IA, melhor será o clone de voz. O número de amostras é irrelevante; o tempo total de execução é o que importa. No entanto, se você planeja enviar várias horas de áudio, é melhor dividi-lo em várias amostras de aproximadamente 30 minutos. Isso facilita o envio.
📁 Upload: Após clicar em upload, você não poderá fazer nenhuma alteração no clone e ele será bloqueado. Certifique-se de ter carregado as amostras corretas que deseja.
✅ Verifique sua voz: Depois que tudo estiver gravado e carregado, você será solicitado a verificar sua voz. Para garantir uma experiência tranquila, tente verificar sua voz usando o mesmo equipamento ou um equipamento similar ao usado para gravar as amostras, com um tom e uma entrega semelhantes aos presentes nas amostras. Se você não tiver acesso ao mesmo equipamento, tente verificar da melhor forma possível. Se não conseguir, entre em contato com o suporte.
Lembre-se de que tudo isso depende do resultado desejado. A IA tentará clonar tudo no áudio, mas para que funcione de forma otimizada e previsível, sugerimos seguir as diretrizes mencionadas acima.
Observação: se o PVC parecer complicado e levar muito tempo para treinar, você ainda pode usar a Clonagem de Voz Instantânea do ElevenLab para gravar e clonar sua voz e, então, produzir seu audiolivro de IA.
Vozes ACX e IA
No entanto, há uma barreira à acessibilidade de audiolivros com tecnologia TTS. De acordo com sua política atual, a ACX/ Audible não permite a publicação de audiolivros narrados por vozes de IA. No entanto, audiolivros narrados automaticamente com vozes de IA são aceitos em outras plataformas.
Onde publicar seus audiolivros de voz de IA
No momento em que este artigo foi escrito, o ACX/ Audible não permite audiolivros de IA, mas existem outras plataformas que incluem os principais players, como:
- Google Play Livros
- Maçã
- Kobo
- OverDrive
- Scribd
- Spotify
- Storytel
- BooxAI
- Editora de livros AI
Além de plataformas de publicação como:
- Vozes Findaway
- Kobo Writing Life
- República dos Autores
- Publicar unidade
- Em termos de som
Preços para ElevenLabs
Você pode começar a usar o ElevenLabs gratuitamente. Eles oferecem pacotes adicionais, incluindo:
- Inicial (US$ 5/mês)
- Criador (US$ 22/mês)
- Editora independente (US$ 99/mês)
- Negócios em crescimento (US$ 330/mês)

Limitações em audiolivros gerados por voz de IA
Como mencionado anteriormente, audiolivros gerados por voz por IA têm limitações, e isso inclui o Elevenlabs. Comece com alguns testes. Por exemplo, gere o áudio para o primeiro ou segundo capítulo antes de se comprometer com o livro inteiro usando uma plataforma de IA. Em seguida, realize a verificação humana e certifique-se de que você ou outra pessoa ouça todo o áudio gerado pela IA. Ouça e revise sem fones de ouvido, pois esses artefatos podem ser desorientadores e barulhentos.
Aviso: você pode notar artefatos estranhos gerados de tempos em tempos como parte de um capítulo que, de outra forma, seria perfeito. Isso pode ser frustrante, mas é algo que você quer descobrir o quanto antes . Ao encontrar problemas técnicos como esse, você pode entrar em contato proativamente com as equipes de atendimento ao cliente e suporte técnico da plataforma de IA para fornecer feedback e verificar se elas podem fornecer informações adicionais.
Embora uma fonte/voz de treinamento de alta qualidade possa certamente ajudar a melhorar o resultado, não há garantia de que a IA possa fornecer imediatamente audiolivros perfeitamente gerados, prontos para serem carregados na plataforma mencionada acima. A verificação humana não é recomendada, mas necessária.
Coisas legais, de conformidade e não tão divertidas que você deveria saber
Há uma série de questões legais e de conformidade a serem consideradas ao produzir e distribuir audiolivros de IA. Entre elas:
- Direitos autorais: audiolivros com IA provavelmente são protegidos por direitos autorais, assim como audiolivros tradicionais. Isso significa que você precisará obter a permissão do detentor dos direitos autorais antes de produzir ou distribuir um audiolivro com IA. Em suma, concentre-se em audiolivros com IA para livros escritos por você, não por outra pessoa.
- Propriedade intelectual: Se você estiver usando IA para gerar o conteúdo do audiolivro, precisará considerar os direitos de propriedade intelectual do sistema de IA. A ElevenLabs deixa bem claro que você deve clonar apenas a sua própria voz e não a voz de outra pessoa. Para mais informações, consulte os Termos de Uso da ElevenLab.
- Precisão: Audiolivros com IA podem ser muito precisos, mas é importante garantir que o conteúdo seja preciso antes de distribuí-lo. Isso é especialmente importante para audiolivros relacionados a conformidade, que podem conter informações jurídicas e regulatórias complexas.
- Atribuição: Se você estiver usando IA para gerar o conteúdo do audiolivro, atribua o conteúdo ao sistema de IA. Isso é importante para a transparência e para evitar alegações de plágio.
Melhores práticas para voz de IA em audiolivros
- Use um sistema de IA confiável. Ao escolher um sistema de IA para gerar o conteúdo do seu audiolivro, certifique-se de usar um sistema confiável de uma empresa renomada. Isso ajudará a garantir que o sistema de IA seja preciso e confiável. Para isso, a ElevenLabs provou ser uma plataforma confiável para muitos criadores e leva a privacidade e os termos de uso a sério.
- Tenha seus audiolivros revisados por um humano. Antes de distribuir seus audiolivros de IA, tenha-os revisados por um humano para garantir que o conteúdo seja preciso e apropriado. Isso é especialmente importante para audiolivros relacionados a conformidade.
- Use uma linguagem clara e concisa. Ao escrever o conteúdo para seus audiolivros com IA, use uma linguagem clara e concisa, que seja fácil de entender. Isso ajudará a evitar confusões ou mal-entendidos. Se o livro for escrito e revisado por humanos, o conteúdo provavelmente terá maior qualidade e será mais relevante para seus leitores. No entanto, se você estiver criando o livro inteiramente com IA generativa, é essencial que ele seja revisado por você ou por um editor humano.
- Mantenha-se atualizado com as leis e regulamentações mais recentes. As leis e regulamentações relacionadas à IA estão em constante evolução, por isso é importante acompanhar os últimos desenvolvimentos. Isso ajudará você a garantir que seus audiolivros de IA estejam sempre em conformidade.
Conclusão: Grave uma voz de IA treinada por você no ElevenLabs
Então vale a pena gastar tempo e dinheiro (menos de US$ 100) para criar seu audiolivro com sua voz?
A resposta é SIM se o alto custo e a logística complexa de gravar um audiolivro impedem que você crie um para o seu livro. O ElevenLabs é uma alternativa maravilhosa que ajuda a tornar os audiolivros acessíveis não apenas para você, como criador, mas também para seus ouvintes, que preferem audiolivros a outros formatos do seu livro.
Se você é um autor autopublicado e possui os direitos do seu livro, a clonagem de voz por IA e a distribuição do seu livro em plataformas de audiolivros de IA costumam ser mais fáceis.
No entanto, se você estiver trabalhando com uma editora que detém os direitos do seu livro, será necessário consultá-la antes de gravar um audiolivro com ou sem IA.
A IA generativa está em constante mudança, assim como a indústria editorial, incluindo a produção e distribuição de audiolivros. Espero que este artigo esclareça criadores e autores que desejam contar suas histórias e expandir seus negócios alcançando um público maior.
Imposto de Renda Simplificado
- IR de Ações, Fundos Imobiliários, BDRs e ETFs
- IR de Stocks, REITs e ETFs (EUA)
- IR de Criptomoedas
Gere as guias de pagamento com rapidez.
Acompanhe mês a mês quando você está dentro da faixa de isenção.
Gere um arquivo pronto para importar direto no programa da Receita Federal. Apenas alguns cliques e sua declaração está pronta!
Radar de Dividendos Inteligente
Planeje seus investimentos com nosso sistema inteligente de projeção de pagamento de dividendos e potencialize seus ganhos.

versão Pró
Nenhum comentário:
Postar um comentário