Pular para o conteúdo principal

A importância da Quantização Vetorial na compressão de Sinais.


A quantidade de informação transmitida e armazenada (como imagens, voz e vídeo) cresce com os avanços tecnológicos e popularização de produtos, tais como celulares, tablets e computadores. Portanto, os requisitos de largura de faixa e/ou capacidade de armazenamento das redes de comunicações precisam ser minimizados. Diante disto, os sinais precisam ser codificados de modo eficiente para que se adequem às limitações dos canais de transmissão e às limitações de memória de armazenamento. Neste cenário, a quantização vetorial (QV) apresenta-se como um técnica adequada e bastante utilizada em diversos sistemas de codificação de sinais.
A QV [1,2], que pode ser vista como uma extensão da quantização escalar em um espaço multidimensional, encontrando-se fundamentada na Teoria da Distorção Versus Taxa [3], formulada por Shannon, segundo a qual um melhor desempenho é obtido codificando blocos de amostras (isto é, vetores) em vez de amostras individuais (isto é, escalares) [4].
A quantização é um técnica relevante em sistemas de compressão de sinais [5]. Seu alvo é a digitalização dos valores de amostras de um sinal. Há duas classes gerais de quantização: escalar e vetorial. A primeira consiste em um mapeamento Q:RàC, em que C é um subconjunto do espaço Euclidiano unidimensional R. O número de elementos de C é denominado número de níveis do quantizador, denotado por L. Ao final do processo de quantização, cada amostra poderá ser codificada, por exemplo, em uma palavra-binária l, de log2 L bits. A QV, por sua vez, consiste em um mapeamento Q : RNà W, em que W = { ; i = 1, 2, ..., K} é denominado dicionário, N é a dimensão do quantizador vetorial e K é o tamanho do dicionário (número de vetores-código). A taxa de codificação vetorial é dada por , expressa em bits por amostra em codificação de forma de onda de voz e em bits por pixel (bpp) em codificação de imagem.
A Figura 1.1 ilustra a QV de imagem, realizada no domínio dos pixels (domínio original, isto é, sem uso de transformadas). Observa-se que a imagem é dividida em blocos de pixels. No exemplo, são usados blocos de 4 × 4 pixels (dimensão N = 16) e um dicionário de tamanho K = 32. O processo de quantização consiste em substituir cada bloco de pixels da imagem original pelo vetor-código (bloco de pixels) mais próximo (segundo um critério de distância) dentre os 32 vetores-código do dicionário. A qualidade da imagem quantizada depende do dicionário utilizado.


Figura 1.1: Exemplo de QV da imagem.

Dentre os desafios existentes em QV, podem ser citados: o projeto de dicionários [6], a complexidade computacional [7] e a sensibilidade da técnica aos erros de transmissão [8].
O projeto de dicionários possui um papel importante para o bom desempenho de sistemas de processamento de sinais baseados em QV [1,2]. Em codificação de voz e imagem baseada em QV [9,10], a qualidade dos sinais reconstruídos depende dos dicionários projetados. Em sistemas de identificação de locutor que utilizam QV paramétrica, as taxas de identificação dependem dos dicionários de padrões acústicos de referência projetados para cada locutor cadastrado pelo sistema.
Como técnicas para projeto de dicionários, podem ser citadas: algoritmo LBG (Linde-Buzo-Gray) [11]; algoritmo auto-organizativo de Kohonen [12]; relaxamento estocástico [13]; algoritmos Fuzzy [14] e algoritmos genéticos [15]. Em se tratando de QV de imagem, o alvo das técnicas é minimizar a distorção introduzida no processo de substituição dos blocos de pixels originais pelos respectivos vetores-código. No que diz respeito à QV de sinais unidimensionais, como é o caso dos sinais de voz, o alvo é minimizar a distorção introduzida ao se substituírem os blocos de amostras originais pelos respectivos vetores-código. Estudos recentes apontam para o bom desempenho de algoritmos inteligentes [16,17].

Bibliografia

[1] A. Gersho and R. M. Gray. Vector Quantization and Signal Compression. Kluwer Academic Publishers, Boston, MA, 1992.
[2] R. M. Gray. Vector quantization. IEEE ASSP Magazine, pages 4–29, April 1984.
[3] T. Berger. Rate Distortion Theory: A Mathematical Basis for Data Compression. Prentice-Hall, Englewood Cliffs, NJ, 1971.
[4] R. M. Gray and D. L. Neuhoff. Quantization. IEEE Transactions on Information Theory, 44(6):2325–2383, October 1998.
[5] F. Madeiro, e W. T. A. Lopes. Introdução à Compressão de Sinais. Revista de Tecnologia da Informação e Comunicação, vol. 1, no. 1, pp. 33–40, Outubro 2011.
[6] C. R. B. Azevedo, E. L. B. Junior, T. A. E. Ferreira, F.Madeiro and M. S. Alencar. An Evolutionary Approach for Vector Quantization Codebook Optimization. Lecture Notes in Computer Science, vol. 5263, pp. 452–461, 2008.
[7] F. Madeiro, W. T. A. Lopes, M. S. Alencar, e B. G. Aguiar Neto. Construção de Dicionários Voltados para a Redução da Complexidade Computacional da Etapa de Codificação da Quantização Vetorial.  In Anais do VI Congresso Brasileiro de Redes Neurais (CBRN’2003), pp. 439–444, São Paulo, SP, Brasil, Junho 2003.
[8] E. A. Lima, G. G. M. Melo, W. T. A. Lopes, M. S. Alencar, e F. Madeiro. Um Novo Algoritmo para Atribuição de Índices: Avaliação em Quantização Vetorial de Imagem. TEMA: Tendências em matemática Aplicada e Computacional, vol. 10, pp. 167–177, 2009.
[9] A. Gersho and V. Cuperman. Vector quantization: A pattern-matching technique for speech coding. IEEE Communications Magazine, pages 15–20, December 1983.
[10] B. Ramamurthi and A. Gersho. Classified vector quantization of images. IEEE Transactions on Communications, 34(11):1105–1115, November 1986.
[11] Y. Linde, A. Buzo and R. M. Gray. An Algorithm for Vector Quantizer Design. IEEE Transactions on Communications, vol. 28, no. 1, pp. 84–95, January 1980.
[12] T. Kohonen. The Self-Organizing Map. Proceedings of the IEEE, vol. 78, no. 9, pp. 1464–1480, September 1990.
[13] K. Zeger, J. Vaisey and A. Gersho. Globally Optimal Vector Quantizer Design by Stochastic Relaxation. IEEE Transactions on Signal Processing, vol. 40, no. 2, pp. 310–322, February 1992.
[14] N. B. Karayiannis and P.-I. Pai. Fuzzy Vector Quantization Algorithms and Their Applications in Image Compression. IEEE Transactions on Image Processing, vol. 4, no. 9, pp. 1193–1201, September 1995.
[15] J. S. Pan, F. R. McInnes and M. A. Jack,. VQ Codebook Design Using Genetic Algorithms. Electronics Letters, vol. 31, no. 17, pp. 1418–1419, 17th August 1995.
[16] F. Madeiro, W. T. A. Lopes, M. S. Alencar, and B. G. Aguiar Neto. Aprendizagem Competitiva com Consciência Aplicada ao Projeto de Dicionários para Quantização Vetorial de Voz. Anais do Congresso Brasileiro de Redes Neurais, 2005.
[17] P. H. E. S. Lima, R. C Albuquerque, D. C. Cunha, and F. Madeiro. On Frequency Sensitive Competitive Learning for VQ Codebook Design. Proceedings of the Brazilian Symposium on Neural Networks, 2008.

Comentários

  1. Eu estava fazendo uma pesquisa sobre QV na Net e me deparei com este seu artigo, que além de muito bom tecnicamente ainda faz referência a uma literatura bem interessante. Estas informações me serão muito úteis. Parabéns pela iniciativa de promover a divulgação do conhecimento. by Marcelo Blanco.

    ResponderExcluir

Postar um comentário

Postagens mais visitadas deste blog

Blog apoiado pela Siemens discute os principais desafios das grandes cidades

Fonte: Assessoria de imprensa da Siemens - 28.09.2009 Brasil - As mudanças globais apontadas pelo estudo "Desafios das Megacidades", desenvolvido pelas consultorias GlobeScan e MRC McLean Hazel, abriram espaço para a discussão de soluções para problemas como consumo de energia, transporte, moradia e emprego. O blog www.odesafiodasmegacidades.com.br , apoiado pela Siemens, discute temas como energias renováveis, eficiência energética, urbanização, crescimento sustentável e outras problemáticas presentes no crescimento das metrópoles e mostra como o desenvolvimento de novas tecnologias podem ajudar a solucionar os obstáculos do dia a dia de quem vive nas grandes cidades.

Veja como a Seleção Natural e Genética influenciam a Inteligência Artificial.

Rodrigo Regis Dentre várias técnicas de Inteligência Artificial existentes, hoje, vamos falar do Algoritmo Genético. O  Algoritmo Genético  ( AG ) é uma  t écnica  de busca utilizada na ciência da computação para achar soluções aproximadas para problemas de otimização e busca, inspirados nos mecanismos de seleção natural (Teoria da Evolução) e genética.  Eles combinam um mecanismo de valorização dos “melhores” indivíduos, ou dos mais adaptados ao objetivo em questão, com uma estrutura para combinar e “reproduzir” aleatoriamente estes indivíduos, criando uma nova população. Assim, a cada geração, um conjunto de novos indivíduos é criado utilizando-se informações contidas na geração passada. Os Algoritmos genéticos são implementados  em computadores em que uma população são representações abstratas de uma problema e os melhores indivíduos, dessa população, são selecionados para cruzamento. A evolução geralmente se inicia a partir de um conjunto de soluções criado aleatoriamente

Somos a média das pessoas que mais convivemos. O Homem é produto do meio?

Muitos filósofos e sociólogos já falaram estudaram de certa forma esse tema, mas [dentro de minha memória, que diga-se de passagem anda falhando ultimamente] me recordo de dois. O primeiro, Jean-Jacques Rousseau um grande influenciador do Iluminismo, bem como da Revolução Francesa. Este suíço influenciou Kant, Adam Smith [Pai do liberalismo], Nietzsche, entre outros. Para ele, “ o ser humano é melhor quando está mais próximo da natureza ” e continua “ quanto mais distante o ser humano se encontra da natureza, mais corrompido ele fica ”, isto é, o meio corrompe o homem, logo ela é produto do meio. O segundo, Karl Marx [ este, pelo menos, de nome muito conhecido],  dizia    " A existência precede a essência "; nenhum ser humano nasce pronto, mas o homem é, em sua essência, produto do meio em que vive, que é construído a partir de suas relações sociais em que cada pessoa se encontra.  Lembro-me de debates homéricos na escola, mas isso não vem ao caso. Já fui perguntado muitas v