A quantidade
de informação transmitida e armazenada (como imagens, voz e vídeo) cresce com os
avanços tecnológicos e popularização de produtos, tais como celulares, tablets e computadores. Portanto, os requisitos
de largura de faixa e/ou capacidade de armazenamento das redes de comunicações
precisam ser minimizados. Diante disto, os sinais precisam ser codificados de modo
eficiente para que se adequem às limitações dos canais de transmissão e às limitações
de memória de armazenamento. Neste cenário, a quantização vetorial (QV) apresenta-se
como um técnica adequada e bastante utilizada em diversos sistemas de codificação
de sinais.
A QV [1,2],
que pode ser vista como uma extensão da quantização escalar em um espaço multidimensional,
encontrando-se fundamentada na Teoria da Distorção Versus Taxa [3], formulada por
Shannon, segundo a qual um melhor desempenho é obtido codificando blocos de amostras
(isto é, vetores) em vez de amostras individuais (isto é, escalares) [4].
A quantização é um técnica relevante em
sistemas de compressão de sinais [5]. Seu alvo é a digitalização dos valores de
amostras de um sinal. Há duas classes gerais de quantização: escalar e vetorial.
A primeira consiste em um mapeamento Q:RàC, em que C é um subconjunto do espaço Euclidiano unidimensional
R.
O número de elementos de C é denominado
número de níveis do quantizador, denotado por L. Ao final do processo de quantização, cada amostra poderá ser codificada,
por exemplo, em uma palavra-binária l, de
log2 L bits. A QV, por sua vez, consiste em um mapeamento Q : RNà W, em que W = {
; i = 1, 2, ..., K} é denominado dicionário,
N é a dimensão do quantizador vetorial
e K é o tamanho do dicionário (número
de vetores-código). A taxa de codificação vetorial é dada por
, expressa
em bits por amostra em codificação de forma de onda de voz e em bits por pixel (bpp) em codificação de imagem.
A Figura 1.1 ilustra
a QV de imagem, realizada no domínio dos pixels (domínio original, isto é,
sem uso de transformadas). Observa-se que a imagem é dividida em blocos de pixels.
No exemplo, são usados blocos de 4 × 4 pixels (dimensão N = 16) e um dicionário de tamanho K = 32. O processo de quantização consiste em
substituir cada bloco de pixels da imagem original pelo vetor-código (bloco
de pixels) mais próximo (segundo um critério de distância) dentre os 32 vetores-código
do dicionário. A qualidade da imagem quantizada depende do dicionário utilizado.
Figura 1.1: Exemplo de QV da imagem.
Dentre os desafios
existentes em QV, podem ser citados: o projeto de dicionários [6], a complexidade
computacional [7] e a sensibilidade da técnica aos erros de transmissão [8].
O projeto de
dicionários possui um papel importante para o bom desempenho de sistemas de processamento
de sinais baseados em QV [1,2]. Em codificação de voz e imagem baseada em QV [9,10],
a qualidade dos sinais reconstruídos depende dos dicionários projetados. Em sistemas
de identificação de locutor que utilizam QV paramétrica, as taxas de identificação
dependem dos dicionários de padrões acústicos de referência projetados para cada
locutor cadastrado pelo sistema.
Como técnicas
para projeto de dicionários, podem ser citadas: algoritmo LBG (Linde-Buzo-Gray)
[11]; algoritmo auto-organizativo de Kohonen [12]; relaxamento estocástico [13]; algoritmos Fuzzy [14]
e algoritmos genéticos [15]. Em se tratando de QV de imagem, o alvo das técnicas
é minimizar a distorção introduzida no processo de substituição dos blocos de pixels originais pelos respectivos vetores-código.
No que diz respeito à QV de sinais unidimensionais, como é o caso dos sinais de
voz, o alvo é minimizar a distorção introduzida ao se substituírem os blocos de
amostras originais pelos respectivos vetores-código. Estudos recentes apontam para
o bom desempenho de algoritmos inteligentes [16,17].
Bibliografia
[1] A. Gersho and R. M. Gray. Vector Quantization and Signal
Compression. Kluwer Academic Publishers, Boston, MA, 1992.
[2] R. M. Gray. Vector
quantization. IEEE ASSP Magazine, pages
4–29, April 1984.
[3] T. Berger. Rate Distortion
Theory: A Mathematical Basis for Data Compression. Prentice-Hall, Englewood Cliffs,
NJ, 1971.
[4] R. M. Gray and D. L.
Neuhoff. Quantization. IEEE Transactions on Information Theory, 44(6):2325–2383,
October 1998.
[5] F. Madeiro, e W. T. A. Lopes. Introdução
à Compressão de Sinais. Revista de Tecnologia da Informação e Comunicação,
vol. 1, no. 1, pp. 33–40, Outubro 2011.
[6] C. R. B. Azevedo, E. L. B. Junior,
T. A. E. Ferreira, F.Madeiro and M. S. Alencar. An Evolutionary Approach for Vector Quantization Codebook Optimization. Lecture
Notes in Computer Science, vol. 5263, pp. 452–461, 2008.
[7] F. Madeiro, W. T. A. Lopes, M.
S. Alencar, e B. G. Aguiar Neto. Construção de Dicionários Voltados para a Redução
da Complexidade Computacional da Etapa de Codificação da Quantização Vetorial. In Anais do VI Congresso Brasileiro de Redes
Neurais (CBRN’2003), pp. 439–444, São Paulo, SP, Brasil, Junho 2003.
[8] E. A. Lima, G. G. M. Melo, W. T.
A. Lopes, M. S. Alencar, e F. Madeiro. Um Novo Algoritmo para Atribuição de Índices:
Avaliação em Quantização Vetorial de Imagem. TEMA: Tendências em matemática Aplicada
e Computacional, vol. 10, pp. 167–177, 2009.
[9] A. Gersho and V. Cuperman. Vector quantization: A pattern-matching technique for
speech coding. IEEE Communications
Magazine, pages 15–20, December 1983.
[10] B. Ramamurthi and A. Gersho. Classified vector quantization of images.
IEEE Transactions on Communications, 34(11):1105–1115,
November 1986.
[11] Y. Linde, A. Buzo and R. M. Gray. An Algorithm for Vector Quantizer
Design. IEEE Transactions on Communications, vol. 28, no. 1, pp. 84–95, January 1980.
[12] T. Kohonen. The Self-Organizing Map. Proceedings of the IEEE,
vol. 78, no. 9, pp. 1464–1480, September 1990.
[13] K. Zeger, J. Vaisey and A. Gersho. Globally Optimal Vector Quantizer
Design by Stochastic Relaxation. IEEE Transactions on Signal Processing,
vol. 40, no. 2, pp. 310–322, February 1992.
[14] N. B. Karayiannis and P.-I. Pai. Fuzzy Vector Quantization Algorithms
and Their Applications in Image Compression. IEEE Transactions on Image Processing,
vol. 4, no. 9, pp. 1193–1201, September 1995.
[15] J. S. Pan, F. R. McInnes and M. A. Jack,. VQ Codebook Design Using Genetic
Algorithms. Electronics Letters, vol. 31, no. 17, pp. 1418–1419, 17th August
1995.
[16] F. Madeiro, W. T. A. Lopes, M. S. Alencar, and B. G. Aguiar Neto. Aprendizagem
Competitiva com Consciência Aplicada ao Projeto de Dicionários para Quantização
Vetorial de Voz. Anais do Congresso
Brasileiro de Redes Neurais, 2005.
[17] P. H. E. S. Lima, R. C Albuquerque,
D. C. Cunha, and F. Madeiro. On Frequency
Sensitive Competitive Learning for VQ Codebook Design. Proceedings of the Brazilian Symposium on Neural Networks, 2008.
Eu estava fazendo uma pesquisa sobre QV na Net e me deparei com este seu artigo, que além de muito bom tecnicamente ainda faz referência a uma literatura bem interessante. Estas informações me serão muito úteis. Parabéns pela iniciativa de promover a divulgação do conhecimento. by Marcelo Blanco.
ResponderExcluirUalurgeo-he Curtis Bethea https://wakelet.com/wake/W6CUVBJXCQJLATAM5tPIR
ResponderExcluirscisoggata