revista Fronteiras – estudos midiáticos
16(1):20-27, janeiro/abril 2014
© 2014 by Unisinos – doi: 10.4013/fem.2014.161.03
O pixel da voz
The pixel of the voice
Thiago Soares1
RESUMO
Diante dos processos de digitalização da voz na produção musical contemporânea, com sintetizadores e programas de áudio em
computadores que são “corretores” de imperfeições vocais, questionamos que corpos emergem dessas materialidades sonoras. Partimos
de um debate sobre as práticas de produção das canções para tentar compreender as formas de escuta e engajamento presentes nas
matrizes sonoras digitalizadas. O conceito de “grão da voz”, proposto por Roland Barthes, é apontado como “baliza” conceitual para
a discussão em torno do que chamamos de “pixel da voz”: a visualização não apenas de um corpo que emerge da performance vocal,
mas um sistema de produção de sentido que envolve a figura do produtor musical, lógicas de metamorfose presentes na cultura digital
e a capacidade atual de se gerar matrizes vocais que são emprestadas a corpos que não as cantaram.
Palavras-chave: cultura musical, voz, performance.
ABSTRACT
Voice digitization in contemporary music production, with synthesizers and audio programs in computers that “correct” vocal
imperfections, is the starting point to question which bodies emerge from these sound materialities. We start a discussion about the
practices in song production trying to understand how listening is affected in the contemporary music culture. The concept of “grain
of the voice”, proposed by Roland Barthes, guides us as a “beacon” for the discussion around of what we call “pixel of the voice”: the
perception not only of a body emerging from the vocal performance, but a production system of meaning that includes the music
producer, the metamorphosis logics in current digital era and the ability to generate voices for bodies that have not even sung.
Keywords: music culture, voice, performance.
Não, o autotune não basta pra fazer o canto andar
pelos caminhos que levam à grande beleza (Gal Gosta).
A canção toca. Eu ouço uma cantora brasileira. Sua
voz é límpida, encorpada – qualquer adjetivo soa impreciso
para descrever o que ouço. Talvez “encorpada” defina a
sensação que tenho ao escutar aquela voz. É que percebo
que o vocal se sobrepõe aos outros instrumentos musicais
do arranjo. A voz está adensada, arrisco dizer que visualizo
alguém, numa mesa de som (um produtor musical, um
técnico de som), “regulando” a gravação – aumentando
o “volume” da voz e, suavemente, destacando-a. Então,
ponho-me diante de uma problemática. Ao ouvir essa
canção, estou diante de um duplo: consigo ouvir aquele
corpo que se apresenta no que ouço (a respiração, o grito,
o sussurro, os tons mais graves e os mais agudos, chego a
inferir a possibilidade de visualizar a boca mais ou menos
aberta, os pulmões plenos diante de um momento dramático da faixa musical cantada), mas passo a visualizar
também uma outra camada, para além do corpo que se
Universidade Federal da Paraíba. Centro de Comunicação, Turismo e Artes (CCTA). Av. Castelo Branco, s/n, 58051-900, Cidade
Universitária, Cabo Branco, João Pessoa, PB, Brasil. E-mail: thikos@gmail.com
1
O pixel da voz
apresenta performatizado (Zumthor, 2000) pela sonoridade, a de alguém, num estúdio de gravação, “trabalhando”
a voz, “limpando-a”, “processando-a” em softwares, num
registro de gravação, dando a essa voz, digamos, um “tratamento” (e quero aqui destacar o mesmo uso da palavra
“tratamento” para som e para imagem2) com o intuito de
acentuar particularidades no cantar, na relação entre a
voz e os instrumentais, no processo de produção de uma
faixa musical.
O trabalho de produção musical3 que se esconde/
revela “por trás” do meu ouvir, articula noções ligadas
aos gêneros musicais. Na MPB, por exemplo, por uma
necessidade de se ouvir-a-letra da canção, sabe-se do
intento da produção musical destacar a voz diante do
arranjo; em outros gêneros, como o punk, a produção
musical pode, deliberadamente, “soterrar” a voz em meio
a sonoridades de guitarras e baterias, uma vez que estamos diante de diferentes formas de fruição do material
sonoro. Mudam as formas de fruição (o volume daquilo
que é ouvido, os ambientes em que se ouvem, as circunstâncias), mudam também os valores – o bom, o ruim,
sobre uma voz numa canção, aquilo que é construído
como “uma bela voz”, “um mal cantar”. No heavy metal,
por exemplo, a voz gutural4 de um cantor ligado a esse
gênero musical dificilmente se “adequaria” às regras do
“bem cantar” de um reality show musical como The Voice,
The X Factor ou American Idol – exibidos nas emissoras
televisivas e com aparatos de valoração construídos sob
a égide de gêneros musicais consagrados, como o pop,
o sertanejo, o rock, entre outros. Estou aqui tentando
construir pontos de coesão – e de fuga – a respeito da(s)
forma(s) com que somos agenciados pela voz gravada
na canção, com o intuito de debater as particularidades
do atual estatuto da voz na cultura musical. Apesar de
meu intuito ser o de pensar duas dimensões de produção
de sentido – a voz e a cultura –, tentarei debater essa
questão a partir daquilo que Roland Barthes chama de
grão: o grão da voz.
Ou, como dou título a este texto, o pixel da voz.
Algumas considerações
sobre o grão
O grão como uma unidade mínima. Uma metonímia na constituição do solo. Na fotografia, a unidade
formadora. O grão de prata da imagem que é “queimado” e
faz gerar a imagem fotográfica. Em seu texto, “O Grão da
Voz”, escrito em 1972, Roland Barthes conduz a metáfora
do grão para debater a música, mais especificamente, a
voz na música. Essa relação entre metáforas fotográficas
e musicais na obra de Barthes parece sublinhar uma constante inquietação do autor em debater os códigos culturais
a partir de movimentos que atravessem os textos, passem
de uma dimensão material e tátil para uma outra que se
constitui a partir desse texto mas o atravessa, constitui-o
para outrem, cria outro senso de pertencimento e vinculação. Foi assim com a noção fotográfica de “punctum”
em “A Câmara Clara” (Barthes, 1984, p. 26) e também
com a “musicalidade” do “grão” em “O Grão da Voz”.
Nos dois conceitos, é possível visualizar o Roland Barthes
pós-estruturalista, tentando dar conta dos desafios do
entendimento das estruturas textuais, mas reconhecendo
que o material investigado conduz a algo – um corpo? uma
sensibilidade? – que pode derivar das inscrições previstas
no texto. O “punctum” está na fotografia, mas parece querer
traí-la. É, antes, um amálgama, um fantasma, uma inquietação que não nos liberta de olhar a imagem. O “grão” é a
materialidade da voz, aquilo que podemos “tocar” na voz.
O seu volume, o seu gênero (masculino ou feminino), o seu
corpo. Mas é, sobretudo, o que profana a minha audição:
o corpo de alguém que convoca a minha história, a minha
biografia, o momento em que eu ouvi aquela canção, as
lágrimas que eu posso derramar ao ouvi-la.
Como advertiu Martin Grisel, “Barthes é, paradoxalmente, um escritor que, de maneira bastante
racional, escreve ‘contra’ o significado”5 (Grisel, 2000,
p. 264). Quero pontuar que já se formatou uma espé-
2
Com a popularização de programas como o Adobe Photoshop, popularizou-se a expressão “tratamento de imagem”, como a ação
de corrigir “ruídos” da imagem, ressaltar contrastes, fazer pequenos (ou grandes) “ajustes”. Usa-se o mesmo termo, “tratamento”, em
operações análogas com sons.
3
Faço aqui o uso do termo “produção musical” de forma genérica, sem me ater mais detidamente sobre as funções que envolvem tais
atividades, como o produtor musical, o profissional de mixagem, o técnico de som, entre outras. Meu interesse não é cartografar as
atividades da produção musical, mas reconhecer uma instância de ingerência sobre aquilo que se ouve.
4
O vocal gutural produz um som rouco, grave, que se obtém na relação entre a garganta e o diafragma, juntamente com distorções
no som produzido nas pregas vocais e na laringe. Caracterizada como “agressiva”, a voz gutural é muito usada por cantores de bandas
derivadas do heavy metal, como o death metal, deathcore, thrash metal, entre outros (Walser, 1992, p. 268).
5
Tradução nossa para: “Barthes, paradoxically, a writer who, in a very rational manner, writes ‘against’ meaning” (Grisel, 2000, p. 264).
Vol. 16 Nº 1 - janeiro/abril 2014
revista Fronteiras - estudos midiáticos
21
Thiago Soares
cie de senso comum de a crítica acadêmica se referir a
Roland Barthes como um autor que escreve “contra” o
significado – herança, possivelmente, herdada em função
de seus textos ensaísticos e questionadores das máximas
estruturalistas. Acrescento ao debate do Roland Barthes
“contra” o significado (essas máximas fizeram parte do
legado barthesiano, basta lembrarmos de seu “A Morte
do Autor” ou “O Prazer do Texto”, entre tantos outros)
a premissa de que o interesse de Barthes não era o de ir
“contra o significado” (Barthes, 1985, p. 42) – pelo menos
não como Susan Sontag abertamente foi em seu texto
“Contra a Interpretação” – mas o fato de que o francês
talvez estivesse falando em profanações (Agamben,
2012): profanações do(s) texto(s) em derivas não previstas. Uma materialidade que, ao acaso de fruidores e
contextos, vai de encontro ao que, supostamente, estaria
na sua “partitura”.
Tanto o “punctum” fotográfico quanto o “grão” da
voz são profanações do estatuto material que os gerou.
Naquilo que não nos liberta da imagem fotográfica, o
“punctum” parece ir de encontro à própria noção de congelamento da imagem, do que nos é dado, entregue como
constituinte do fotográfico, sendo uma espécie de memória/invenção sempre atualizada do que é visto. O “grão”,
em seu senso definidor de um corpo, também parece se
rebelar contra esse corpo na medida em que nos agencia
memórias/invenções que atualizam nossa escuta e vai de
encontro ou acrescenta novas biografias (as nossas, as
coletivas, as que supomos serem de outros) a essas vozes/
corpos. “Eu sou o que meus fãs inventam sobre mim, eu
não existo”, disse a cantora Lady Gaga em seu show “Born
This Way Ball” em São Paulo, também indo “contra” o seu
próprio corpo: o que é Lady Gaga senão a profanação de
seu “grão”, de sua voz, daquilo que materialmente se ouve
dela em suas canções?
Quero seguir debatendo a noção de “grão” – deixarei o debate sobre “punctum” para outra ocasião – na
medida em que tentarei rascunhar aquilo que chamo
de “pixel da voz” ou algumas questões que não estavam
previstas por Barthes na constituição de seu conceito de
“grão da voz”, sobretudo, em função da atual popularização
de aparatos de tratamento de áudio, como o Autotune,
e diante das lógicas digitais nos processos de produção
musical. Antes de arregimentar questões sobre o “pixel
da voz”, tenho necessidade de pensar o estatuto da voz
digital na cultura contemporânea, a consagração de um
modo de escuta que leva em consideração um processo de
tratamento da voz e que noção de corpo debate-se diante
das vozes digitais.
22
Vol. 16 Nº 1 - janeiro/abril 2014
O grão da voz digital
O “grão”, como atesta Barthes, é o corpo na voz:
como esse corpo canta, a mão que escreveu a letra cantada,
os membros corporais como executam a música (boca,
braços, pernas). Numa faixa instrumental, por exemplo,
o “grão” da música estaria na corporificação dos dedos de
um músico sobre o instrumento musical. O toque. Uma
relação tátil e, como Michael Szekely (2013) prefere
chamar, erótica. Um certo “erotismo” musical proposto
por Barthes, escreve Szekely. Perceber o “grão” em uma
canção é o reconhecimento da noção de texto na análise
ou a criação de um sistema de avaliação que será individual
(“estou ouvindo a minha relação com o corpo do homem
ou da mulher cantando/tocando” nos diz Barthes), mas
circunscrito numa cultura (“A avaliação será feita além
do valor escondido atrás de ‘eu gosto’ ou ‘eu não gosto’”
ou “há um movimento progressivo da língua para o poema, do poema para a música e para a música para sua
performance” pontua ele). No momento em que pensa o
“grão” como uma unidade de tentativa de entendimento
de uma voz que nos afeta, Barthes trata, sutilmente, de
uma efemeridade no ato de análise (o prazer pode não
reforçar o “entendimento do assunto”, mas, ao contrário,
perdê-lo e apontar outras questões – já que estamos diante
da dicotomia “prazer e jouissance” proposta pelo autor).
Quero aqui pontuar diferenças entre as noções de
prazer e jouissance na obra de Roland Barthes, sobretudo,
porque sabemos que o ato de fruição musical articula
diferentes engajamentos. Talvez, debater as instâncias de
prazer e jouissance possa ser um artefato interessante para
discutir aspectos ligados à permanência e à efemeridade
nas formas de escuta (Barthes, 1987, p. 22). São inúmeras
traduções para os termos “plaisir” (prazer) e “jouissance”
(gozo) dentro das obras barthesianas, no entanto, o que
parece premente de ser debatido, sobretudo, em “O Prazer
do Texto”, é um aspecto, digamos, musical dos termos
investigados: a noção de “prazer”, como proposta por
Barthes em “O Prazer do Texto”, possivelmente, trate da
continuidade de um engajamento, na permanência de um
sensível que envolve o fruidor na instância enunciativa,
uma vez que a ideia de “jouissance” estaria na ordem da
dissipação, do gozo, mas, sobretudo, tratando de análises textuais (a mecânica proposta por Barthes em seu
“O Prazer do Texto”), da descontinuidade, do acaso, de
um engajamento intenso, porém efêmero na enunciação.
Essas questões rascunham pressupostos que são levados
em consideração nas dinâmicas de produção da música.
revista Fronteiras - estudos midiáticos
O pixel da voz
Parece sintomático, portanto, pensarmos em novas
– nem tão novas, é verdade – formas de produção e escuta
da voz para debatermos o “grão” nessas vozes digitalizadas. Os processos de digitalização da voz foram possíveis
graças a instrumentais de captação de áudio de natureza
elétrica. Não cabe aqui historiografar esses artefatos, mas
quero destacar três deles, como agentes fundamentais
da compreensão de um estatuto particular do “grão” da
voz digital: (i) o microfone; (ii) os sintetizadores; e (iii)
o Autotune.
Como lembra Simon Frith (1996), o microfone
elétrico tornou possível ouvintes perceberem algumas
sonoridades até então não identificáveis em atos performáticos ao vivo. “O microfone nos permitiu ouvir pessoas
numa maneira que, normalmente, implicava em alguma
intimidade com elas: o sussurro, o murmúrio” (Frith, 1996,
p. 187) Essa disposição apresentada por Frith parece evocar aquilo que Barthes chama de um certo “erotismo” no
ouvir, a presença de um corpo que se faz na performance.
Além disso, foi o microfone na gravação que transformou
a voz numa disposição digital: uma matéria-prima bruta
pronta para ser “lapidada” no estúdio.
Uma vez captada ao microfone, a voz, para ser
digitalizada, precisava de um artefato capaz de sintetizála. Chamados, genericamente, de “sintetizadores de voz”,
esses dispositivos adentraram a seara da música vindos
das telecomunicações, na herança de transmissão de
dados através da voz sintética. Entre os sintetizadores,
os “vocalizadores” tinham como finalidade codificar a
voz para transmissão eletrônica de rádio segura e foram
incorporados pelos produtores musicais, sobretudo, nos
anos 1970, durante o período da “disco music” – em que,
de alguma forma, havia ecos de uma estética futurista,
eletrônica, ligada ao imaginário tecnológico da pista de
dança (Echols, 2010, p. 12). Um sintetizador de voz ficou
famoso pelas formas com as quais foi usado na indústria
fonográfica: o Moog, que trazia o nome de seu criador
Robert Arthur Moog. Entre os diversos modelos de sintetizadores de voz (Moog Music Inc., usado, por exemplo,
na trilha sonora de “Laranja Mecânica”; o Moog Taurus,
sintetizador para ser “tocado” com os pés; o PolyMoog,
que vinha com sons pré-gravados para serem articulados
a outras gravações), quero destacar aqui o Vocoder, que
era ligado a um microfone, permitia alteração de voz e
constituía uma estética semelhante a de alguém falando
ao telefone.
Para além do Vocoder, um dos mais populares softwares de processamento e síntese vocal foi o Autotune (do
inglês “auto afinar”) e, ao contrário do Vocoder, que previa
Vol. 16 Nº 1 - janeiro/abril 2014
um “distanciamento” de uma certa sonoridade natural da
voz através de efeitos semelhantes a falas em alto-falantes
ou radioamadores, o Autotune era um “corretor” de voz,
cuja principal função, quando de seu uso na indústria
fonográfica, foi o de atenuar supostas “falhas” vocais ou
“desafinadas”. Trata-se de um processador de áudio criado pela empresa Antares Audio Technologies em 1994,
que usa uma matriz sonora para corrigir as performances
no vocal e instrumental. O Autotune também pôde ser
“aplicado” como um efeito deliberadamente preparado
para distorcer a voz humana. O “efeito” Autotune está,
ainda hoje, disponível tanto como um “plug-in” para profissionais de áudio utilizarem em estúdios quanto para o
processamento ao vivo, em shows e espetáculos musicais.
Os três artefatos elencados aqui – o microfone,
o sintetizador vocal Vocoder e o Autotune – foram/são
usados no sistema de produção musical, articulando premissas ligadas aos horizontes de expectativas dos gêneros
musicais, aos corpos cantantes performatizando canções e
os ambientes de circulação dessas músicas. Tentar compreender o grão da voz digital significa ir em busca dos corpos
gerados por estas sonoridades digitalizadas, as bocas que
entoaram os versos, os pulmões que inflaram e tiveram a
respiração corrigida como uma suposta “falha” do “bem
cantar”, os olhos fechados diante de um momento estridente da canção, aquilo que nos leva a crer na existência
de um corpo cantante, mas, também, em que medida, esse
corpo tenta ser “corrigido”, “adequado”, constituído dentro
de modelos hegemônicos de vocalização da canção em
ambientes midiáticos.
O grão da voz digital tenta romper com a premissa
de que existiria uma voz “natural” e outra “processada”,
uma vez que a constituição de uma voz “natural” é possível
dentro de padrões e efeitos também em softwares. Ou seja,
quando interrogamos o grão da voz digital, visualizamos
corpos notadamente alterados pelos programas de distorção de som, mas, não nos esqueçamos, também, de
enxergarmos os corpos que tentam emular a naturalidade
do usual, os “robôs-humanos”, com pouquíssimas – e muitas vezes imperceptíveis – diferenças do homem comum.
Pensemos que todos os processos de produção musical são
atravessados por softwares que “trabalham” e “corrigem”
a voz. Cabe questionar que efeito se almeja dentro das
lógicas específicas de cada canção entoada, álbum lançado.
Para migrarmos dessa dimensão micro – do grão da voz
– em direção a uma lógica macro – uma cultura musical –
investigamos, a seguir, o grão da voz digital num momento
específico: quando a cantora Donna Summer teve seu
sussurro processado por sintetizadores na canção “I Feel
revista Fronteiras - estudos midiáticos
23
Thiago Soares
Love” (1977), um dos momentos emblemáticos de um
gênero musical chamado “disco music”. Essa experiência
se configura naquilo que se chama de “mito fundador” ou
fenômenos que iniciam fenômenos que serão incorporados como hegemônicos posteriormente6. “I Feel Love”
traz uma relação peculiar entre os usos de microfones e
sintetizadores no processo de produção da faixa que gera
aquilo que chamamos de uma corporificação erótico-robô,
em seguida, largamente utilizada por outros artistas da
indústria da música.
O grão da voz digital de
Donna Summer
A alteração da voz sintetizada durante o período da
“disco music” quase sempre pendia para uma sonoridade
que se assemelhasse àquilo que imaginávamos ser a voz de
um robô, uma espécie de utopia futurista ligada à retórica
dos espaços das pistas de dança: globos luminosos, luzes
estroboscópicas, corpos-robôs bailantes (Echols, 2010,
p. 72). Um dos momentos mais emblemáticos da gênese
de estética futurista se deu na canção “I Feel Love”, da
cantora Donna Summer, lançada em seu álbum conceitual
“Remember Yesterday”, de 1977. O disco tentava traduzir
sonoridades de épocas específicas: a canção “I Remember
Yesterday” representaria a década de 40; “Love’s Unkind”,
a década de 50; “Back in Love Again” seria a faixa da sonoridade dos anos 60 e o álbum é encerrado com a faixa
“I Feel Love”, que seria “o som do futuro”.
Até então, grande parte das gravações da “disco
music” eram apoiadas por guitarra, baixo e bateria, uma
formatação, digamos, de produção de música “orgânica”7.
“I Feel Love”, produzida por Giorgio Moroder, foi gravada
com acompanhamento inteiramente feito por sintetizadores: todos os sons foram processados eletronicamente,
inclusive a voz de Donna Summer (Echols, 2010, p. 34).
No entanto, o uso dos sintetizadores, na canção, tem a
função de criar uma ambiência futurista que não perpassa a
voz de Donna Summer. Ou seja, escutamos um arranjo que
apela para ambiências futuristas, mas, em contrapartida,
a voz de Donna Summer surge “humana”, sem variações
vocais que descaracterizem a sua “naturalidade”.
Ouvimos em “I Feel Love” os sussurros de Donna
Summer em simulações a gemidos de prazer. De fundo,
o arranjo é futurista, com nuances de batidas eletrônicas
e farto uso de texturas sonoras graves. A constituição do
sentido se dá no atrito entre este ambiente sonoro futurista
gerado na canção e a voz humana e “natural” de Donna
Summer. O que significa perceber o grão da voz de Donna
Summer em “I Feel Love”? Talvez, estejamos diante de
uma boa metáfora para pensar o imaginário de grande
parte da música pop dançante: a relação entre homens
e máquinas. Mas o grão em “I Feel Love” é o corpo de
Donna Summer que emerge de sua voz: sussurrado, manso,
tateante. Esse corpo que se esconde entre as penumbras
do som futurista é fugidio e nos direciona a visualizarmos a cena de uma mulher sentindo prazer entre robôs e
cenários futuristas.
Como moldura pensada por Roland Barthes, a
noção de grão da voz nos interpela sobre a materialidade
que emerge da performance inscrita na canção, aquilo que
deliberadamente nos faz constituir uma certa tatilidade
no que ouvimos, de uma biografia, um corpo, alguém que
nos diz algo, nos sussurra, nos afeta. Mas, o que o conceito
de grão da voz não parece discutir é a própria construção
de um senso vocal que não está na instância do cantor/
performer, mas sim, na dinâmica da produção musical.
As vozes que ouvimos nas canções são construídas em
estúdios de gravação, moldadas por volumes, texturas,
corretores, ou seja, dispositivos que as alteram ou tentam
emular o que seria uma voz “correta” ou “original”. Estou
tentando aqui construir uma argumentação que leve em
conta a ideia de que, de fato, a noção de grão da voz é um
importante aporte conceitual para pensar os estatutos
biográficos, retóricos e estéticos da música popular, e
tento rascunhar uma instância não prevista nos escritos
barthesianos: a da produção musical e seu fundamental
papel na produção de sentido daquilo que ouvimos nas
canções, refletindo também sobre os gêneros musicais e
as dinâmicas performáticas oriundas desses fenômenos.
Voltando à faixa “I Feel Love”, que tem a voz de
Donna Summer nos guiando pelos itinerários da canção,
A experiência de Donna Summer usando sua voz com sintetizadores está longe de ser o marco inicial desse uso na indústria fonográfica. O grupo de música eletrônica Kraftwerk, por exemplo, já no início dos anos 1970, adotou vocais “sintetizados”, simulando
robôs, em suas canções. No entanto, foi com a “disco music” que esses efeitos passaram a se popularizar.
7
O termo era corrente à época e opunha a ideia de música orgânica, como aquela produzida com instrumentos musicais como guitarra, baixo, violão e bateria, à de música sintética, como a que construía suas sonoridades diante de sons oriundos de instrumentos
eletrônicos e programas de computador.
6
24
Vol. 16 Nº 1 - janeiro/abril 2014
revista Fronteiras - estudos midiáticos
O pixel da voz
há que se lançar luz sobre o corpo que emerge da voz, este
grão material a que Roland Barthes se refere, mas não se
pode descolar que esta voz que ouvimos na canção integra
uma engrenagem guiada pela figura do produtor musical,
no caso dessa faixa, Giorgio Moroder. Ou seja, pensar o
grão da voz de Donna Summer em “I Feel Love” significa
também visualizar o que Giorgio Moroder, o produtor,
deliberadamente, fez com a voz dela: a escolha por tirar
efeitos que pudessem deixar a textura vocal robotizada, a
mão do produtor sobre uma mesa de som testando texturas
vocais, a discussão sobre que volume de voz ser disposto
na faixa (um volume mais “baixo” misturando-se ao arranjo ou uma voz que se sobressaia do instrumental, por
exemplo), enfim, quero pontuar aqui um outro corpo que
se materializa na dinâmica de produção de sentido de uma
canção: o do produtor. O grão da voz digital é, portanto,
aquilo que ouvimos de um cantor/performer mas também
as formas com que o produtor “trata” aquela voz. Estamos
diante de algo que estaria na ordem da execução, da busca
por uma perfeição, uma verdade, uma idiossincrasia, a voz
do cantor que está no estúdio, no palco, executando o
exercício de cantar, notas que tentam traduzir algo fugidio
e impreciso que chamamos tão apressadamente de emoção,
enfim, um corpo dionisíaco por natureza; mas junto a esta
premissa dionisíaca, emerge uma outra, apolínea, centrada
na figura do produtor, na racionalidade, na tentativa de
construir um sentido para o texto musical, integrá-lo a
um sistema classificatório, a um gênero musical, deliberadamente “moldar” este texto sonoro, fazer com que ele
circule, ambiente-se em outros contextos.
A noção de grão da voz digital me ajuda a pensar
a canção “I Feel Love”, de Donna Summer, como uma
espécie de “mito fundador” de uma estética musical ligada
à cultura dançante, das boates, dos clubes noturnos: de um
corpo que emerge daquele material sonoro (um tipo específico de cantar, “movimentos vocais”, expressões, vocabulários de uma língua), as configurações vocais que estão
circunscritas a gêneros musicais (neste caso, em específico,
a “disco music”, mas em consequência, uma série de outros
gêneros musicais que trazem resíduos sonoros/imagéticos
da “era disco”, como as formas classificatórias chamadas
de “dance music”, “música eletrônica”, “europop”, entre
tantas outras), as lógicas de produção agenciadas pelos
horizontes de expectativas dos gêneros musicais e também
das disposições econômicas e de ordens mercadológicas.
Ou seja, pensar o grão da voz digital significa estar diante
de um complexo quadro que tem a voz como uma espécie
de “emblema” de questões ligadas a uma forma de fazer
música no contexto da cultura musical contemporânea.
Vol. 16 Nº 1 - janeiro/abril 2014
Quero agregar uma metáfora à de “grão” empreendida
por Roland Barthes e tentar arregimentar alguns questionamentos sobre o novo estatuto do “grão da voz”. Ou
quando o “grão” passa a ser chamado de “pixel da voz”.
Do grão ao pixel da voz
Diante de um quadro de digitalização dos processos de captação e produção vocais, quero rascunhar
algumas premissas que levem a debater o pixel da voz.
Mais uma vez, voltamo-nos às metáforas fotográficas: a
noção de grão como uma espécie de técnica ótica de formação da imagem, ligada a uma cultura analógica, passa
a conviver com o pixel, o processo de formação de pontos
de imagem de forma digital, através de combinações
numéricas dentro da cultura digital. O pixel da voz lança
luz sobre um sistema de produção vocal que está atrelado
ao computador e aos programas de ajuste, correção ou
distorções vocais, gerando aparatos que tangenciem noções prévias de original-e-cópia e turvando premissas que
indiquem uma relação binária de causa-e-consequência
para o processo de vocalização digital. Na medida em que
a voz, nos sistemas de produção musical, desde a sua captação, já se transforma num arquivo de áudio pronto para
ser modulado e processado, emerge uma questão ligada
à própria dinâmica de simulação existente nos meios de
produção digital (Campanelli, 2010).
Debater o pixel da voz significa discutir o sistema
de produção musical que tenta enxergar a convivência de
variadas experiências vocais na cultura contemporânea:
desde a ideia idílica dos trovadores, cantadores populares,
que se apresentam nas feiras livres, não usam microfones,
cantam a plenos pulmões; passando pelas apresentações ao
vivo, com dispositivos elétricos, microfones, instrumentos
musicais, nos shows de rock, de música pop, etc; chegando
às experiências nos estúdios musicais, nos computadores
caseiros, nos programas baixados na internet que “mixam”
vozes, nos aplicativos baixados em celulares que “brincam”
com a digitalização das vozes. A ideia de pixel da voz tenta
dar conta do fato de que, quando se trata de um artefato
construído digitalmente, as formas de agenciamento,
correção, distorção se dão na matriz numérica gerada de
um arquivo, ou seja, tem-se a clara ideia de ubiquidade,
de uma lógica calcada na manipulação como uma práxis.
O pixel da voz nos permite perceber que é possível
testar diversos modelos vocais a partir da multiplicação dos
revista Fronteiras - estudos midiáticos
25
Thiago Soares
arquivos de voz. Ou seja, estamos diante de um substrato
simbólico passível de experimentos, de simulações e de variações de parâmetros previamente previstos. A voz passa a
ser metonímia de um corpo, mas, sobretudo, metamorfose
desse corpo na medida em que ela não mais se refere apenas àquela boca cantante, mas a um processo que leva em
consideração o corpo em lógicas dispersivas, autônomas,
não-previstas – apresentando-se numa espécie de ideal de
autonomia do resultado final com o corpo-origem. O pixel
da voz prevê ideias ligadas à remixagem, à bricolagem,
ao sampleamento, ou seja, a junção de texturas de outras
vozes junto a uma matriz vocal que está sendo “trabalhada”. Outros corpos são agregados a uma matriz, gerando
o que podemos chamar de matrizes vocais sincréticas – e
que não se pode sequer elencar que vozes foram usadas
na formatação de um determinado manancial. A possibilidade de trocas de arquivos na internet, a disponibilidade
de vocais em ambientes de compartilhamentos de som,
entre outras dinâmicas, agem sobre as formas de produção
de vocais de corpos que cantaram, mas, também, foram
remixados a outros vocais. Dentro do sistema de produção
musical, o conceito de pixel da voz tenta arregimentar,
portanto, a ideia de que, hoje, diante do farto aparato de
arquivos de som, talvez seja mais complexo enxergar uma
relação tão linear entre voz e corpo, como a proposta por
Roland Barthes em seu “O Grão da Voz”. Poderíamos
estar ouvindo hoje a voz de um corpo que, na verdade, é a
bricolagem de outras vozes, outros corpos, centrados num
modelo que vai ser “acoplado” a um performer.
Pensar o pixel da voz parece nos ser útil para
discutir que, diante dos aparatos de produção musical, é
possível “dar a voz” a alguém e não simplesmente captar
essa voz. Cria-se uma voz e se diz que essa voz pertence
a um corpo. Vou me servir de uma metáfora bastante
simples para tentar traduzir essa máxima: a do ventríloquo.
As vozes que ouvimos hoje nas canções, no rádio, nos
nossos aparelhos de MP3 podem não ser as vozes dos
artistas que as cantaram, mas sim, simulações construídas
em estúdio, geradas dentro de parâmetros consagrados pela
indústria fonográfica e do audiovisual e cujos cantores
passam a apenas “dublar” as “suas” vozes. Há obviamente
uma relação tensa de valores dentro da cultura da música
e toda uma gama de discursos ligados a noções de autenticidade e sinceridade de artistas que “cantam ao vivo”,
“não dublam”, “são verdadeiros artistas da música e não
invenção de gravadoras e de produtores”, entre outros
argumentos largamente disseminados pela crítica – seja
ela profissional em veículos jornalísticos ou na internet,
em fóruns e redes sociais.
26
Vol. 16 Nº 1 - janeiro/abril 2014
Em suma, o que tentamos discutir neste texto são
rascunhos sobre os processos de digitalização do “grão”
da voz a algumas premissas sobre o pixel da voz como
um conceito capaz de dar conta de processos complexos
de produção, execução e escuta musical. Reconhecemos
assim, como nas premissas barthesianas, que há uma
reconfiguração do ethos da música e dos processos de
significação – que são constituídos historicamente.
Voltando a Barthes, seguimos na ânsia de tratar a voz
como um dispositivo de linguagem, sempre a partir
de uma dinâmica dual. Ele nos diz: “o que vou tentar
dizer do “grão” é apenas o lado aparentemente abstrato,
a conta impossível de uma emoção individual que eu
sempre experimento em ouvir alguém cantar” (Barthes,
1977, p. 185).
Parafraseando: o que vou dizer do pixel é apenas o
lado metamorfoseante da voz na cultura digital, a síntese
de uma emoção que experimento ao ouvir alguém cantar
e a incerteza de não saber a origem daquela voz, daquele
corpo-ventríloquo que eu escuto, não sei de onde vem a
voz, mas, ainda assim, me toca e me afeta.
Referências
AGAMBEN, G. 2012. Profanações. São Paulo, Boitempo, 95 p.
BARTHES, R. 1977. The Grain of the Voice. In: R. BARTHES,
Image, Music, Text. New York, Hill and Wang, p. 180-187.
BARTHES, R. 1984. A Câmara Clara. Rio de Janeiro, Nova
Fronteira, 192 p.
BARTHES, R. 1985. Cy Twombly: Works on Paper. In: R.
BARTHES, The Responsibility of Forms. Berkeley, University
of California Press, p. 160-171.
BARTHES, R. 1987. O Prazer do Texto. São Paulo, Perspectiva,
86 p.
CAMPANELLI, V. 2010. Web Aesthetics. Rotterdam, Nai Publishers/Institute of Network Cultures, 276 p.
ECHOLS, A. 2010. Hot Stuff: Disco and The Remaking of American Culture. New York/London, W.W. Norton & Company,
368 p.
FRITH, S. 1996. Performing Rites: On The Value of Popular Music.
Cambridge, Harvard University Press, 326 p.
GRISEL, M. 2000. Writing the Imaginary: Remarks on Music
According to Roland Barthes. In: D. KNIGHT, Critical Writings
on Roland Barthes. New York, G.K. Hall, p. 264-278.
SZEKELY, M.D. 2013. Gesture, Pulsion, Grain: Barthes’
Musical Semiology. Contemporary Aesthetics, 4. Disponível em:
revista Fronteiras - estudos midiáticos
O pixel da voz
http://www.contempaesthetics.org/newvolume/pages/article.
php?articleID=409. Acesso em: 03/01/2013.
WALSER, R. 1992. Eruptions: Heavy Metal Appropriations of
Classical Virtuosity. Popular Music, 11(3):263-308.
http://dx.doi.org/10.1017/S0261143000005158
Vol. 16 Nº 1 - janeiro/abril 2014
ZUMTHOR, P. 2000. Performance, Recepção, Leitura. São Paulo,
Educ, 128 p.
revista Fronteiras - estudos midiáticos
Submetido: 04/08/2013
Aceito: 07/10/2013
27