A psicoacústica é o estudo da percepção auditiva e da maneira como o cérebro interpreta os sons. Ela combina princípios da psicologia e da acústica para entender como os seres humanos percebem e interpretam diferentes características dos sons, como intensidade, frequência, duração e padrões sonoros complexos. Isso inclui estudos sobre limiares de audição, curvas de equalização, mascaramento auditivo (quando um som interfere na percepção de outro), localização espacial do som, efeitos de reverberação e muito mais.
Esse campo de estudo é essencial para várias aplicações práticas, como o monitoramento de ruído ambiental, desenvolvimento de tecnologias de áudio, compressão de áudio (como o formato MP3), design de salas de concerto e estúdios de gravação, sistemas de som surround, melhoria da qualidade sonora em fones de ouvido e alto-falantes, além de otimização da experiência auditiva em várias áreas da indústria de entretenimento e comunicação.
Uma onda sonora é uma variação de pressão que se propaga através de um meio, como o ar, resultante de vibrações de fontes sonoras. Quando uma fonte sonora vibra, ela cria variações de pressão no meio circundante, gerando compressões e rarefações sucessivas das moléculas de ar. Essas variações de pressão se propagam em forma de ondas, e quando alcançam o ouvido humano, são captadas pelo canal auditivo externo e chegam ao tímpano.
O tímpano vibra em resposta à onda sonora e transmite essas vibrações aos ossículos no ouvido médio (martelo, bigorna e estribo). Os ossículos amplificam a vibração e a conduzem até a cóclea, uma estrutura em forma de espiral no ouvido interno. Dentro da cóclea, as vibrações fazem com que as células ciliadas, que são estruturas sensoriais, se dobrem e gerem sinais elétricos.
Esses sinais elétricos, representando diferentes frequências de som, são então transmitidos pelo nervo auditivo para o cérebro, onde são interpretados como sons familiares, completando assim o processo de transformação de ondas sonoras em impulsos elétricos compreensíveis.
Nível de pressão Sonora
A Lei de Weber-Fechner é uma teoria da psicofísica que descreve a relação entre a magnitude de um estímulo físico e a percepção subjetiva dessa magnitude por um observador. Ela foi formulada por dois pesquisadores: Ernst Heinrich Weber e Gustav Theodor Fechner.
Ernst Heinrich Weber (1795-1878) foi um fisiologista alemão que é conhecido por suas contribuições para a área da sensação e percepção. Ele realizou uma série de experimentos para investigar a percepção de diferenças mínimas de estímulo em diferentes modalidades sensoriais, incluindo o tato e a audição. Seu trabalho pioneiro estabeleceu a base para a Lei de Weber.
Gustav Theodor Fechner (1801-1887) era um filósofo e físico alemão que levou adiante as ideias de Weber e desenvolveu a Lei de Weber-Fechner em sua forma mais conhecida. Fechner formulou a relação matemática que descreve como a percepção de uma diferença no estímulo físico é proporcional à magnitude do próprio estímulo. Essa relação ficou conhecida como a Lei de Weber-Fechner e foi um avanço significativo no entendimento da relação entre os estímulos físicos e as sensações percebidas.
A Lei de Weber-Fechner é frequentemente expressa em termos de uma constante chamada de constante de Weber (k) ou constante de Fechner (c). Ela afirma que a variação perceptível em um estímulo é proporcional à magnitude do estímulo original. Em outras palavras, pequenas mudanças em estímulos de baixa intensidade são mais perceptíveis do que em estímulos de alta intensidade.
Uma das primeiras consequências dessa Lei foi a introdução do decibel para definir a grandeza do estímulo, no caso a pressão sonora ou intensidade sonora, que é conhecida através do Nível de Pressão Sonora — NPS:
\(NPS = 10 log \frac{I}{I_0} = 10 log \frac{p^2}{P^2_0} dB\)
onde p é o valor RMS e \(p_0 = 2.10^{-5} N/m^2\) a pressão de referência (limiar de audibilidade). Outro fator que contribuiu para o uso do log no estímulo foi a faixa de variação da pressão sonora (\(2.10^2 N/m^2\) a \(10 N/m^2\)).
No contexto da psicoacústica e da análise de sinais de áudio, o valor RMS (Root Mean Square, em inglês) é uma medida que representa a amplitude média de um sinal de forma mais precisa do que o valor de pico. Ele é frequentemente usado para avaliar a intensidade de um sinal sonoro. Basicamente, o valor RMS de um sinal é calculado elevando ao quadrado todos os valores do sinal, calculando sua média e extraindo a raiz quadrada.
O valor RMS fornece uma estimativa da intensidade eficaz do sinal, levando em consideração tanto os picos quanto as partes mais suaves do sinal. Isso é particularmente útil em aplicações de áudio, onde é importante capturar uma noção mais precisa da energia total do som. Comparado ao valor de pico, que representa apenas o valor máximo absoluto do sinal, o valor RMS considera todas as variações ao longo do tempo.
Na psicoacústica, o valor RMS é relevante ao estudar a percepção do volume ou da intensidade sonora pelos ouvintes, pois ele está mais alinhado com a forma como os seres humanos percebem o som em termos de sua sensação de intensidade. Muitos equipamentos de áudio e sistemas de medição utilizam o valor RMS para caracterizar e ajustar a amplitude dos sinais de áudio de maneira mais adequada às percepções humanas.
Escala logarítimica de decibéis (dB)
Do ponto de vista de sensação, a unidade introduzida à imagem do dB em 1000 Hz foi o phon: a primeira unidade destinada a mensurar a magnitude subjetiva na Psicoacústica, de característica eminentemente logarítmica a luz da lei de Weber-Fechner.
Sobre escala logarítmica, ela em si é uma maneira especial de representar números muito pequenos e muito grandes em um mesmo no gráfico de uma forma mais fácil de entender. Nela, os números não são colocados em intervalos iguais como em uma escala normal. Em vez disso, os números são colocados em intervalos que crescem (ou diminuem) de acordo com uma base específica. Por exemplo, em uma escala logarítmica base 10, os números seriam distribuídos como 1, 10, 100, 1000, 10000. Além disso, a distância entre 1 e 10 é a mesma que entre 10 e 100, e assim por diante.
Voltando ao conceito de phon, ele foi chamado de Nível de Loudness, com as seguintes características:
“Nível de Loudness (Audibilidade) é o nível de pressão sonora necessário para que um ouvido jovem, são e médio, escute um tom qualquer com a mesma ‘magnitude’ que um de 1000Hz. A unidade do Nível de Loudness é o phon, e equivale ao decibel a 1000Hz.”
Na década de 1930, Harvey Fletcher (1884-1981) e Wilden A. Munson (1899-1966), procurando estabelecer relações quantitativas segundo a lei de Weber-Fechner, apresentaram uma série de curvas envolvendo pressão sonora (estimulo) e sensação sonora (Loudness), calcados no dB e no phon. Essas curvas para tons puros foram denominadas de isofônicas (vide figura 1).
Mais adiante com o conceito de bandas críticas bem estabelecido (por exemplo por Eberhard Zwicker (1899-1984) e Manfred Schroeder (1926-2009)) e a aproximação das mesmas por filtros de largura de banda percentualmente constantes, tais quais terços de oitavas e oitavas, pesquisadores (como Robinson & Datson e Robinson & Whittle) determinaram curvas isofônicas para níveis de pressão sonora em terços de oitavas e oitavas.
No contexto de frequências sonoras, uma oitava é uma relação de frequência que é o dobro ou metade de outra frequência. Por exemplo, se uma frequência é 100 Hz, uma oitava acima seria 200 Hz, e uma oitava abaixo seria 50 Hz. Assim, o termo “1/3 de oitava” refere-se a uma divisão mais refinada das oitavas. Ao invés de dividir a frequência em oitavas completas (onde há uma diferença de fator 2 entre cada banda de frequência), a divisão em 1/3 de oitava é mais detalhada, dividindo cada oitava em três partes iguais. Isso é feito para melhor caracterizar e analisar as diferentes frequências presentes em um sinal sonoro complexo. Cada filtro de 1/3 de oitava é sintonizado para uma faixa específica de frequência, permitindo avaliar quais componentes de frequência estão contribuindo para o som total – como certos tipos de ruídos industriais.
Normas internacionais
Na década de 1950, não havia um método adequado para medições de sons complexos. A unidade que imperava era o phon, que era bastante conhecido, mas limitado a tons puros. Métodos tentativos eram utilizados, sem critérios comuns. A falta de métodos bem como de normas afetava o relacionamento econômico ao nível de importação e exportação bem como trazia grandes problemas na construção de equipamentos acústicos.
A comunidade internacional solicitou a ISO (International Standartization Organization) que esclarecesse a situação. A ISO tinha em mente padronizar um método que não fosse somente prático, mas pudesse indicar valores corretos e adequados. Isso demandaria alguns anos e dependeria da aprovação de membros de muitos países. O mercado não poderia aceitar esses prazos e a ISO foi obrigada a adotar uma solução rápida.
A ISO abordou a solução do problema de medição de ruído em duas etapas. O primeiro passo seria o estabelecimento de um método simples que seria facilmente implementado com as técnicas disponíveis e poderia ser usado no mundo todo sem muitas despesas e investimentos.
A partir das curvas isofônicas foram criadas simplificações com o alisamento das mesmas, nos níveis de 40 phons, 70 phons e 100 phons, dando origem às curvas de ponderação A, B e C (vide figura 2). Em algumas situações, posteriormente usava-se a ponderação D, criada especialmente para aeronaves e aeroportos, enfatizando a faixa de frequência no entorno de 4000Hz (região de máxima sensibilidade do ouvido, devido à ressonância do ouvido externo na forma de um duto aberto/fechado, e bastante crítica na perda da audição do ser humano).
A escolha preferencial recaiu no nível de pressão sonora ponderado pela curva A, dando origem ao dB(A) de características obviamente ainda logarítmicas. Seria um método inicial que com certeza provocaria resultados inadequados e mal interpretados no controle de ruído. Por outro lado, teria a vantagem de satisfazer o mercado internacional por ser um método uniforme. Nesse passo inicial, dB(A) foi incorporado em muitas regulamentações.
O segundo passo proposto pela ISO, seria não tão simples como o dB(A), mas julgava-se mais preciso nos valores relacionados à sensação humana devido ao estímulo da pressão sonora. Poucos anos após, os pesquisadores Stevens e Zwicker, de maneira independente, desenvolveram métodos distintos para o cálculo do Loudness, que foram normalizados através da ISO 532. Esse segundo passo, cálculo do Loudness, recebeu menos atenção porque o mercado estava satisfeito com o dB(A), muito mais pelo uso uniforme, do que pelos resultados.
Exemplo de norma brasileira
A NBR 10151 é uma norma técnica brasileira que estabelece critérios e parâmetros para a avaliação do ruído em ambientes urbanos. Ela fornece diretrizes para a medição, avaliação e classificação do ruído ambiental em áreas habitadas, com o objetivo de proteger a qualidade de vida das pessoas e prevenir problemas de saúde relacionados ao excesso de ruído.
Essa norma define procedimentos para a realização de medições de ruído em diferentes situações, como áreas residenciais, comerciais, industriais e de lazer. Ela estabelece limites de ruído permitidos em diferentes horários do dia e da noite, levando em consideração o uso e a sensibilidade das áreas afetadas. A NBR 10151 também fornece orientações sobre como realizar medições precisas e como interpretar os resultados para determinar se uma área está em conformidade com os limites estabelecidos.
A instrumentação mencionada nessa norma é o Sonômetro, um medidor integrador de nível sonoro ou sistema de medição de nível de predição sonora, ele deve atender a determinados critérios. Em medições em ambientes externos ao ar livre, é obrigatório utilizar o protetor de vento acoplado ao microfone, e recomenda-se executar a correção por ele provocada.
Ao falar de uma medida “integrada em um intervalo de tempo” é no sentido de considerar todas as medidas registradas durante esse período. Ao deixar o equipamento ligado por um certo tempo, ele coleta uma amostra significativa estatísticamente para ser representativa do ambiente. Quanto maior esse intervalo, mais registros e melhor a resolução dessa grandeza física.