Pular para o conteúdo principal

A importância da Quantização Vetorial na compressão de Sinais.


A quantidade de informação transmitida e armazenada (como imagens, voz e vídeo) cresce com os avanços tecnológicos e popularização de produtos, tais como celulares, tablets e computadores. Portanto, os requisitos de largura de faixa e/ou capacidade de armazenamento das redes de comunicações precisam ser minimizados. Diante disto, os sinais precisam ser codificados de modo eficiente para que se adequem às limitações dos canais de transmissão e às limitações de memória de armazenamento. Neste cenário, a quantização vetorial (QV) apresenta-se como um técnica adequada e bastante utilizada em diversos sistemas de codificação de sinais.
A QV [1,2], que pode ser vista como uma extensão da quantização escalar em um espaço multidimensional, encontrando-se fundamentada na Teoria da Distorção Versus Taxa [3], formulada por Shannon, segundo a qual um melhor desempenho é obtido codificando blocos de amostras (isto é, vetores) em vez de amostras individuais (isto é, escalares) [4].
A quantização é um técnica relevante em sistemas de compressão de sinais [5]. Seu alvo é a digitalização dos valores de amostras de um sinal. Há duas classes gerais de quantização: escalar e vetorial. A primeira consiste em um mapeamento Q:RàC, em que C é um subconjunto do espaço Euclidiano unidimensional R. O número de elementos de C é denominado número de níveis do quantizador, denotado por L. Ao final do processo de quantização, cada amostra poderá ser codificada, por exemplo, em uma palavra-binária l, de log2 L bits. A QV, por sua vez, consiste em um mapeamento Q : RNà W, em que W = { ; i = 1, 2, ..., K} é denominado dicionário, N é a dimensão do quantizador vetorial e K é o tamanho do dicionário (número de vetores-código). A taxa de codificação vetorial é dada por , expressa em bits por amostra em codificação de forma de onda de voz e em bits por pixel (bpp) em codificação de imagem.
A Figura 1.1 ilustra a QV de imagem, realizada no domínio dos pixels (domínio original, isto é, sem uso de transformadas). Observa-se que a imagem é dividida em blocos de pixels. No exemplo, são usados blocos de 4 × 4 pixels (dimensão N = 16) e um dicionário de tamanho K = 32. O processo de quantização consiste em substituir cada bloco de pixels da imagem original pelo vetor-código (bloco de pixels) mais próximo (segundo um critério de distância) dentre os 32 vetores-código do dicionário. A qualidade da imagem quantizada depende do dicionário utilizado.


Figura 1.1: Exemplo de QV da imagem.

Dentre os desafios existentes em QV, podem ser citados: o projeto de dicionários [6], a complexidade computacional [7] e a sensibilidade da técnica aos erros de transmissão [8].
O projeto de dicionários possui um papel importante para o bom desempenho de sistemas de processamento de sinais baseados em QV [1,2]. Em codificação de voz e imagem baseada em QV [9,10], a qualidade dos sinais reconstruídos depende dos dicionários projetados. Em sistemas de identificação de locutor que utilizam QV paramétrica, as taxas de identificação dependem dos dicionários de padrões acústicos de referência projetados para cada locutor cadastrado pelo sistema.
Como técnicas para projeto de dicionários, podem ser citadas: algoritmo LBG (Linde-Buzo-Gray) [11]; algoritmo auto-organizativo de Kohonen [12]; relaxamento estocástico [13]; algoritmos Fuzzy [14] e algoritmos genéticos [15]. Em se tratando de QV de imagem, o alvo das técnicas é minimizar a distorção introduzida no processo de substituição dos blocos de pixels originais pelos respectivos vetores-código. No que diz respeito à QV de sinais unidimensionais, como é o caso dos sinais de voz, o alvo é minimizar a distorção introduzida ao se substituírem os blocos de amostras originais pelos respectivos vetores-código. Estudos recentes apontam para o bom desempenho de algoritmos inteligentes [16,17].

Bibliografia

[1] A. Gersho and R. M. Gray. Vector Quantization and Signal Compression. Kluwer Academic Publishers, Boston, MA, 1992.
[2] R. M. Gray. Vector quantization. IEEE ASSP Magazine, pages 4–29, April 1984.
[3] T. Berger. Rate Distortion Theory: A Mathematical Basis for Data Compression. Prentice-Hall, Englewood Cliffs, NJ, 1971.
[4] R. M. Gray and D. L. Neuhoff. Quantization. IEEE Transactions on Information Theory, 44(6):2325–2383, October 1998.
[5] F. Madeiro, e W. T. A. Lopes. Introdução à Compressão de Sinais. Revista de Tecnologia da Informação e Comunicação, vol. 1, no. 1, pp. 33–40, Outubro 2011.
[6] C. R. B. Azevedo, E. L. B. Junior, T. A. E. Ferreira, F.Madeiro and M. S. Alencar. An Evolutionary Approach for Vector Quantization Codebook Optimization. Lecture Notes in Computer Science, vol. 5263, pp. 452–461, 2008.
[7] F. Madeiro, W. T. A. Lopes, M. S. Alencar, e B. G. Aguiar Neto. Construção de Dicionários Voltados para a Redução da Complexidade Computacional da Etapa de Codificação da Quantização Vetorial.  In Anais do VI Congresso Brasileiro de Redes Neurais (CBRN’2003), pp. 439–444, São Paulo, SP, Brasil, Junho 2003.
[8] E. A. Lima, G. G. M. Melo, W. T. A. Lopes, M. S. Alencar, e F. Madeiro. Um Novo Algoritmo para Atribuição de Índices: Avaliação em Quantização Vetorial de Imagem. TEMA: Tendências em matemática Aplicada e Computacional, vol. 10, pp. 167–177, 2009.
[9] A. Gersho and V. Cuperman. Vector quantization: A pattern-matching technique for speech coding. IEEE Communications Magazine, pages 15–20, December 1983.
[10] B. Ramamurthi and A. Gersho. Classified vector quantization of images. IEEE Transactions on Communications, 34(11):1105–1115, November 1986.
[11] Y. Linde, A. Buzo and R. M. Gray. An Algorithm for Vector Quantizer Design. IEEE Transactions on Communications, vol. 28, no. 1, pp. 84–95, January 1980.
[12] T. Kohonen. The Self-Organizing Map. Proceedings of the IEEE, vol. 78, no. 9, pp. 1464–1480, September 1990.
[13] K. Zeger, J. Vaisey and A. Gersho. Globally Optimal Vector Quantizer Design by Stochastic Relaxation. IEEE Transactions on Signal Processing, vol. 40, no. 2, pp. 310–322, February 1992.
[14] N. B. Karayiannis and P.-I. Pai. Fuzzy Vector Quantization Algorithms and Their Applications in Image Compression. IEEE Transactions on Image Processing, vol. 4, no. 9, pp. 1193–1201, September 1995.
[15] J. S. Pan, F. R. McInnes and M. A. Jack,. VQ Codebook Design Using Genetic Algorithms. Electronics Letters, vol. 31, no. 17, pp. 1418–1419, 17th August 1995.
[16] F. Madeiro, W. T. A. Lopes, M. S. Alencar, and B. G. Aguiar Neto. Aprendizagem Competitiva com Consciência Aplicada ao Projeto de Dicionários para Quantização Vetorial de Voz. Anais do Congresso Brasileiro de Redes Neurais, 2005.
[17] P. H. E. S. Lima, R. C Albuquerque, D. C. Cunha, and F. Madeiro. On Frequency Sensitive Competitive Learning for VQ Codebook Design. Proceedings of the Brazilian Symposium on Neural Networks, 2008.

Comentários

  1. Eu estava fazendo uma pesquisa sobre QV na Net e me deparei com este seu artigo, que além de muito bom tecnicamente ainda faz referência a uma literatura bem interessante. Estas informações me serão muito úteis. Parabéns pela iniciativa de promover a divulgação do conhecimento. by Marcelo Blanco.

    ResponderExcluir

Postar um comentário

Postagens mais visitadas deste blog

Blog apoiado pela Siemens discute os principais desafios das grandes cidades

Fonte: Assessoria de imprensa da Siemens - 28.09.2009 Brasil - As mudanças globais apontadas pelo estudo "Desafios das Megacidades", desenvolvido pelas consultorias GlobeScan e MRC McLean Hazel, abriram espaço para a discussão de soluções para problemas como consumo de energia, transporte, moradia e emprego. O blog www.odesafiodasmegacidades.com.br , apoiado pela Siemens, discute temas como energias renováveis, eficiência energética, urbanização, crescimento sustentável e outras problemáticas presentes no crescimento das metrópoles e mostra como o desenvolvimento de novas tecnologias podem ajudar a solucionar os obstáculos do dia a dia de quem vive nas grandes cidades.

Veja como a Seleção Natural e Genética influenciam a Inteligência Artificial.

Rodrigo Regis Dentre várias técnicas de Inteligência Artificial existentes, hoje, vamos falar do Algoritmo Genético. O  Algoritmo Genético  ( AG ) é uma  t écnica  de busca utilizada na ciência da computação para achar soluções aproximadas para problemas de otimização e busca, inspirados nos mecanismos de seleção natural (Teoria da Evolução) e genética.  Eles combinam um mecanismo de valorização dos “melhores” indivíduos, ou dos mais adaptados ao objetivo em questão, com uma estrutura para combinar e “reproduzir” aleatoriamente estes indivíduos, criando uma nova população. Assim, a cada geração, um conjunto de novos indivíduos é criado utilizando-se informações contidas na geração passada. Os Algoritmos genéticos são implementados  em computadores em que uma população são representações abstratas de uma problema e os melhores indivíduos, dessa população, são selecionados para cruzamento. A evolução geralmente se inicia a partir...

Curso de Básico de Eficiência Energética - Cap.5 Lâmpadas fluorescentes e reatores eletrônicos eficientes

Vamos agora listar uma série de dicas para economizar energia reduzindo a potência e o tempo de funcionamento. Hoje existem no mercado lâmpadas fluorescentes de menor potência e que iluminam da mesma maneira que as tradicionais. Por exemplo: Se você tem uma lâmpada fluorescente de 40W, substitua por uma de 32W ou de 28W (neste caso será necessário substituir a luminária); Se você tem uma lâmpada fluorescente de 20W substitua por uma de 16 W ou de 14W (neste caso será necessário substituir a luminária); Em qualquer situação faz-se necessário um cálculo luminotécnico, com um engenheiro eletricista ou técnico graduado para cumprir com as exigências da Norma ABNT 5413 - Iluminação de Interiores. Essas lâmpadas necessitam, para seu funcionamento, um equipamento denominado reatore. Existem 2 tipos: Convencionais que consomem em torno de 15 W para cada duas lâmpadas fluorescentes de 40W; Eletrônicos que consomem 2W para a mesma situa...