La comunicación de voz es analógica, mientras que la red de datos es digital. El proceso de convertir ondas analógicas a información digital se hace con un codificador-decodificador (el CODEC). Hay muchas maneras de transformar una señal de voz analógica, todas ellas gobernadas por varios estándares. El proceso de la conversión es complejo. Es suficiente decir que la mayoría de las conversiones se basan en la modulación codificada mediante pulsos (PCM) o variaciones.
Además de la ejecución de la
conversión de analógico a digital, el CODEC
comprime la secuencia de datos, y proporciona la cancelación
del eco. La compresión de la forma de onda
representada puede permitir el ahorro del ancho de banda.
Esto es especialmente interesante en los enlaces de poca capacidad
y permite tener un mayor numero de conexiones de VoIP simultaneamente.
Otra manera de ahorrar ancho de banda es el uso de
la supresión del silencio, que es el proceso de no
enviar los paquetes de la voz entre silencios en conversaciones
humanas.
A continuación se muestra una tabla resumen con los
códecs más utilizados actualmente:
- El Bit Rate indica la cantidad de información que
se manda por segundo.
- El Sampling Rate indica la frecuencia de muestreo de la
señal vocal.(cada cuanto se toma una muestra de la
señal analógica)
- El Frame size indica cada cuantos milisegundos se envia
un paquete con la información sonora.
- El MOS indica la calidad general del códec (valor
de 1 a 5)
Para entender mejor la formación de un codec y los
parametros expresados en la tabla recomendamos leer el apartado
funcionamiento
de un codec donde se puede aprender como funciona detallamente
el codec G.711 y que significan en su caso los parametros
de la tabla.
| Nombre |
Estandarizado |
Descripción |
Bit rate (kb/s) |
Sampling rate (kHz) |
Frame size (ms) |
Observaciones
| MOS (Mean Opinion Score)
|
| G.711 * |
ITU-T |
Pulse code modulation (PCM) |
64 |
8 |
Muestreada |
Tiene dos versiones u-law (US, Japan) y a-law (Europa) para muestrear la señal |
4.1
|
| G.721 |
ITU-T |
Adaptive differential pulse code modulation (ADPCM) |
32 |
8 |
Muestreada |
Obsoleta. S e ha transformado en la G.726. |
|
| G.722 |
ITU-T |
7 kHz audio-coding within 64 kbit/s |
64 |
16 |
Muestreada |
Divide los 16 Khz en dos bandas cada una usando ADPCM |
|
| G.722.1 |
ITU-T |
Codificación a 24 y 32 kbit/s para sistemas sin manos con baja perdida de paquetes |
24/32 |
16 |
20 |
|
|
| G.723 |
ITU-T |
Extensión de la norma G.721 a 24 y 40 kbit/s para aplicaciones en circuitos digitales. |
24/40 |
8 |
Muestreada |
Obsoleta por G.726. Es totalmente diferente de G.723.1. |
|
| G.723.1 |
ITU-T |
Dual rate speech coder for multimedia communications transmitting at
5.3 and 6.3 kbit/s |
5.6/6.3 |
8 |
30 |
Parte de H.324 video conferencing. Codifica la señal usando linear predictive
analysis-by-synthesis coding. Para el codificador de high rate utiliza Multipulse Maximum Likelihood Quantization (MP-MLQ) y para el de low-rate usa Algebraic-Code-Excited Linear-Prediction (ACELP). |
3.8-3.9 |
| G.726 |
ITU-T |
40, 32, 24, 16 kbit/s adaptive differential pulse code modulation
(ADPCM) |
16/24/32/40 |
8 |
Muestreada |
ADPCM; reemplaza a G.721 y G.723. |
3.85 |
| G.727 |
ITU-T |
5-, 4-, 3- and 2-bit/sample embedded adaptive differential pulse
code modulation
(ADPCM) |
var. |
|
Muestreada |
ADPCM. Relacionada con G.726. |
|
| G.728 |
ITU-T |
Coding of speech at 16 kbit/s using low-delay code excited linear prediction |
16 |
8 |
2.5 |
CELP. |
3.61 |
| G.729 ** |
ITU-T |
Coding of speech at 8 kbit/s using conjugate-structure
algebraic-code-excited linear-prediction (CS-ACELP) |
8 |
8 |
10 |
Bajo retardo (15 ms) |
3.92 |
| GSM 06.10 |
ETSI |
RegularPulse Excitation LongTerm Predictor (RPE-LTP) |
13 |
8 |
22.5
| Usado por la tecnología celular GSM |
|
| LPC10 |
Gobierno de USA |
Linear-predictive codec |
2.4 |
8 |
22.5 |
10 coeficientes.La voz suena un poco "robotica" |
|
| Speex |
|
|
8, 16, 32 |
2.15-24.6 (NB)
4-44.2 (WB) |
30 ( NB )
34 ( WB ) |
|
|
| iLBC |
|
|
8 |
13.3 |
30 |
|
|
| DoD CELP |
American Department of Defense (DoD) Gobierno de USA |
|
4.8 |
|
30 |
|
|
| EVRC |
3GPP2 |
Enhanced Variable Rate CODEC |
9.6/4.8/1.2 |
8 |
20 |
Se usa en redes CDMA |
|
| DVI |
Interactive Multimedia Association (IMA) |
DVI4 uses an adaptive delta pulse code modulation (ADPCM) |
32 |
Variable |
Muestreada |
|
|
| L16 |
|
Uncompressed audio data samples |
128 |
Variable |
Muestreada |
|
|