Sinceramente?
Eu ajustaria o volume direto no programa de edição de vídeo, usando a ferramenta Envelope. Assim ficaria mais fácil: quando o personagem for falar, vc diminui o volume da trilha; quando ninguém estiver falando, você a deixa um pouco mais alta. 
Já tentou fuçar nessa ferramenta? Tente, ela é extremamente útil nesses casos. 
Abraços,
Então, mas mesmo usando envelope... qual a proporção de volume ideal para uma trilha sonora em relação ao áudio principal num podcast, por exemplo? A idéia é que a voz fique alta e clara, mas que mesmo assim seja possível identificar a música de fundo. Existem medidas padrão pra esse ajuste de volume, ou é no "feeling" mesmo?