La comunicación de voz es analógica, mientras que la red de datos es digital. El proceso de convertir ondas analógicas a información digital se hace con un codificador-decodificador (el CODEC). Hay muchas maneras de transformar una señal de voz analógica, todas ellas gobernadas por varios estándares. El proceso de la conversión es complejo. Es suficiente decir que la mayoría de las conversiones se basan en la modulación codificada mediante pulsos (PCM) o variaciones.
Además de la ejecución de la conversión de analógico a digital, el CODEC comprime la secuencia de datos, y proporciona la cancelación del eco. La compresión de la forma de onda representada puede permitir el ahorro del ancho de banda. Esto es especialmente interesante en los enlaces de poca capacidad y permite tener un mayor numero de conexiones de VoIP simultaneamente. Otra manera de ahorrar ancho de banda es el uso de la supresión del silencio, que es el proceso de no enviar los paquetes de la voz entre silencios en conversaciones humanas.
A continuación se muestra una tabla resumen con los códecs más utilizados actualmente:
- El Bit Rate indica la cantidad de información que se manda por segundo.
- El Sampling Rate indica la frecuencia de muestreo de la señal vocal.(cada cuanto se toma una muestra de la señal analógica)
- El Frame size indica cada cuantos milisegundos se envia un paquete con la información sonora.
- El MOS indica la calidad general del códec (valor de 1 a 5)
Para entender mejor la formación de un codec y los parametros expresados en la tabla recomendamos leer el apartado funcionamiento de un codec donde se puede aprender como funciona detallamente el codec G.711 y que significan en su caso los parametros de la tabla.
| Nombre |
Estandarizado |
Descripción |
Bit rate (kb/s) |
Sampling rate (kHz) |
Frame size (ms) |
Observaciones
| MOS (Mean Opinion Score) |
| G.711 * |
ITU-T |
Pulse code modulation (PCM) |
64 |
8 |
Muestreada |
Tiene dos versiones u-law (US, Japan) y a-law (Europa) para muestrear la señal |
4.1 |
| G.721 |
ITU-T |
Adaptive differential pulse code modulation (ADPCM) |
32 |
8 |
Muestreada |
Obsoleta. S e ha transformado en la G.726. |
|
| G.722 |
ITU-T |
7 kHz audio-coding within 64 kbit/s |
64 |
16 |
Muestreada |
Divide los 16 Khz en dos bandas cada una usando ADPCM |
|
| G.722.1 |
ITU-T |
Codificación a 24 y 32 kbit/s para sistemas sin manos con baja perdida de paquetes |
24/32 |
16 |
20 |
|
|
| G.723 |
ITU-T |
Extensión de la norma G.721 a 24 y 40 kbit/s para aplicaciones en circuitos digitales. |
24/40 |
8 |
Muestreada |
Obsoleta por G.726. Es totalmente diferente de G.723.1. |
|
| G.723.1 |
ITU-T |
Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s |
5.6/6.3 |
8 |
30 |
Parte de H.324 video conferencing. Codifica la señal usando linear predictive analysis-by-synthesis coding. Para el codificador de high rate utiliza Multipulse Maximum Likelihood Quantization (MP-MLQ) y para el de low-rate usa Algebraic-Code-Excited Linear-Prediction (ACELP). |
3.8-3.9 |
| G.726 |
ITU-T |
40, 32, 24, 16 kbit/s adaptive differential pulse code modulation (ADPCM) |
16/24/32/40 |
8 |
Muestreada |
ADPCM; reemplaza a G.721 y G.723. |
3.85 |
| G.727 |
ITU-T |
5-, 4-, 3- and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM) |
var. |
|
Muestreada |
ADPCM. Relacionada con G.726. |
|
| G.728 |
ITU-T |
Coding of speech at 16 kbit/s using low-delay code excited linear prediction |
16 |
8 |
2.5 |
CELP. |
3.61 |
| G.729 ** |
ITU-T |
Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP) |
8 |
8 |
10 |
Bajo retardo (15 ms) |
3.92 |
| GSM 06.10 |
ETSI |
RegularPulse Excitation LongTerm Predictor (RPE-LTP) |
13 |
8 |
22.5
| Usado por la tecnología celular GSM |
|
| LPC10 |
Gobierno de USA |
Linear-predictive codec |
2.4 |
8 |
22.5 |
10 coeficientes.La voz suena un poco "robotica" |
|
| Speex |
|
|
8, 16, 32 |
2.15-24.6 (NB)
4-44.2 (WB) |
30 ( NB )
34 ( WB ) |
|
|
| iLBC |
|
|
8 |
13.3 |
30 |
|
|
| DoD CELP |
American Department of Defense (DoD) Gobierno de USA |
|
4.8 |
|
30 |
|
|
| EVRC |
3GPP2 |
Enhanced Variable Rate CODEC |
9.6/4.8/1.2 |
8 |
20 |
Se usa en redes CDMA |
|
| DVI |
Interactive Multimedia Association (IMA) |
DVI4 uses an adaptive delta pulse code modulation (ADPCM) |
32 |
Variable |
Muestreada |
|
|
| L16 |
|
Uncompressed audio data samples |
128 |
Variable |
Muestreada |
|
|