Soundstream

residual vector quantization (RVQ):余值向量/残差向量 量化

分两类:waveform codecs and parametric codecs

波形:时域转换为频域,在中高频域有好的表现

全卷积编码器(encoder)接收时域波形作为输入,并以较低的采样率产生一系列嵌入,该嵌入序列被剩余矢量量化器(RVQ)量化。完全卷积译码器(decoder)接收量化的嵌入并重构原始波形的近似值。