logo好方法网

编码装置、解码装置、摩擦音判定装置、它们的方法以及程序


技术摘要:
一种编码装置,包括通过对低域侧优先分配比特的编码处理进行编码而得到频谱码的编码部(14),编码装置还包括:摩擦音判定部(12),判定音信号是否是摩擦音性的音;以及摩擦音调整部(13),在摩擦音判定部(12)判定为是摩擦音性的音的情况下,得到将音信号的频谱序列中的与  全部
背景技术:
在将音信号压缩编码时,为了提高其压缩效率,历来进行将音信号以频谱串来表 现,对于该频谱串进行考虑了听觉的重要度的比特分配而进行编码。考虑了听觉的重要度 的比特分配通过对频谱串中的与低频率对应的样本优先分配比特等来进行。其结果,频谱 串中的与高频率对应的样本被分配的比特变少,或者完全没有被分配比特。在完全没有被 分配比特的情况下,关于与高频率对应的样本串的直接的信息在编码装置中完全没有进行 编码,所以在对应的解码装置中将频谱串中的与高频率对应的样本值设为0而得到解码声 音。即,进行限制了频带的编码、解码。这是基于人在收听音时,对于高频率的灵敏度低,即 使不被再生有时也不会注意的情况。通过将在高频带中节约的比特数分配给低频带,能够 高精度地表现对于人的听觉特性来说更重要的信息。这样,音信号的编码方式大多被设计 为对低频率的频谱分配更多的比特数。 作为这样的历来的技术,有非专利文献1的技术。非专利文献1的编码装置的要部 如在图15中表示的那样,包括频域变换部31和编码部32。 在频域变换部31中输入被输入到编码装置的时域的音信号。频域变换部31以规定 的时间长度的帧单位,将入力的时域的音信号变换为频域的频谱序列后输出。 在编码部32中被输入频谱序列。编码部32以规定的时间长度的帧单位,对于频谱 序列中包含的各样本进行考虑了听觉的重要度的比特分配,将频谱序列中包含的各样本以 被分配的比特数进行编码,得到并输出码。这时,编码部32无法得到与没有被分配比特的样 本对应的码。 非专利文献1的解码装置的要部如图16表示的那样,包含解码部41和时域变换部 42。 在解码部41中输入被输入到解码装置的码。解码部41以规定的时间长度的帧单 位,将码解码而得到频谱序列的各样本的解码值。这时,由于与在编码装置中没有被分配比 特的样本对应的码不存在,所以解码部41将该样本的解码值设为0。解码部41将各样本的解 码值的序列作为解码频谱序列输出。 在时域变换部42中输入解码频谱序列。时域变换部42以规定的时间长度的帧单 位,将输入的解码频谱序列变换为时域的音信号(解码音信号)后输出。 【现有技术文献】 【非专利文献】 【非专利文献1】J.D.Johnston“, Estimation  of  perceptual  entropy  using  noise  masking  criteria”,International  Conference  on  Acoustics ,Speech ,and  Signal  Processing,pp.2524-2527,vol.5,1988. 5 CN 111602196 A 说 明 书 2/24 页
技术实现要素:
发明要解决的课题 按照非专利文献1的编码装置和解码装置,对于自然音中的大多数音可以得到听 觉品质的劣化少的解码音。但是,在自然音中还存在人的说话语音中的摩擦音那样能量集 中在高频率而在低频率中基本上没有能量那样的音。若对于那样的音信号进行上述那样的 比特数的分配,特别是在比特率低的条件下,则得到在该音的主要的频率分量较大失真的 解码音,存在解码音在听觉上也劣化的课题。 因此,本发明的目的是提供用于进行编码及解码的编码装置及解码装置、用于编 码装置的摩擦音判定装置、它们的方法及程序,以使不较大地变更编码装置的结构,摩擦音 等音信号的听觉上的劣化就会变少。 用于解决课题的手段 本发明的一方式的编码装置包括编码部,所述编码部通过对低域侧优先分配比特 的编码处理,将与规定的时间区间的帧单位的音信号对应的频域的样本串编码而得到频谱 码,编码装置还包括:摩擦音判定部,判定音信号是否是摩擦音性的音;以及摩擦音调整部, 在摩擦音判定部判定为是摩擦音性的音的情况下,得到将音信号的频谱序列中的与规定的 频率相比位于低域侧的低域侧频谱序列的全部或者一部分、和与其相同数目的、频谱序列 中的与规定的频率相比位于高域侧的高域侧频谱序列的全部或者一部分进行了调换后的 结果,作为已调整频谱序列,在上述以外的情况下,得到与音信号对应的频谱序列直接作为 已调整频谱序列,编码部将摩擦音调整部得到的已调整频谱序列作为与音信号对应的频域 的样本串进行编码,得到频谱码。 本发明的一方式的编码装置将规定的时间区间的帧单位的音信号的频谱序列编 码,得到频谱码,编码装置包括:摩擦音判定部,判定音信号是否为摩擦音性的音;以及摩擦 音对应编码部,在摩擦音判定部判定为是摩擦音性的音的情况下,通过对高域侧优先分配 比特的编码处理将频谱序列编码而得到频谱码,在上述以外的情况下,通过对低域侧优先 分配比特的编码处理将所述频谱序列编码而得到频谱码。 本发明的一方式的解码装置包括解码部,所述解码部将规定的时间区间的帧单位 的频谱码且为对低域侧优先分配比特的频谱码解码,得到与解码音信号对应的频域的样本 串,解码装置还包括:摩擦音调整解除部,在表示是否是被输入的摩擦音性的音的信息表示 是摩擦音性的音的情况下,得到将解码部得到的频域的样本串中的与规定的频率相比位于 低域侧的低域侧频率样本串的全部或者一部分、和与其相同数目的、解码部得到的频域的 样本串中的与规定的频率相比位于高域侧的高域侧频率样本串的全部或者一部分进行了 调换后的结果,作为解码音信号的频谱序列,在上述以外的情况下,得到解码部得到的频域 的样本串直接作为解码音信号的频谱序列。 本发明的一方式的解码装置将规定的时间区间的帧单位的频谱码解码,得到解码 音信号的频谱序列,解码装置还包括:摩擦音对应解码部,在表示是否是被输入的摩擦音性 的音的信息表示是摩擦音性的音的情况下,设在频谱码中对高域侧优先分配比特,将频谱 码解码而得到频谱序列,在上述以外的情况下,设在频谱码中对低域侧优先分配比特,将频 谱码解码而得到频谱序列。 本发明的一方式的摩擦音判定装置以规定的时间区间的帧单位判定音信号是否 6 CN 111602196 A 说 明 书 3/24 页 为摩擦音性的声音,摩擦音判定装置包括:摩擦音判定部,在包含该帧的多个帧中,音信号 的频谱序列中的高域侧的频谱的平均能量对于低域侧的频谱的平均能量的比越大则值越 大的指标大于预先决定的阈值或者为阈值以上的帧数多于并非如此的帧数或者为并非如 此的帧数以上的情况下,对该帧判定为音信号是摩擦音性的声音。 发明的效果 例如根据编码装置以及解码装置,能够进行编码以及解码,使得摩擦音等音信号 在听觉上的劣化变少。 附图说明 图1是表示第一实施方式的编码装置的例子的方框图。 图2是表示第一实施方式的编码方法的例子的流程图。 图3是表示第一实施方式的解码装置的例子的方框图。 图4是表示第一实施方式的解码方法的例子的流程图。 图5是用于说明摩擦音调整处理的例子的图。 图6是用于说明摩擦音调整处理的例子的图。 图7是用于说明摩擦音调整处理的例子的图。 图8是用于说明摩擦音调整处理的例子的图。 图9是表示第二实施方式的编码装置的例子的方框图。 图10是表示第二实施方式的编码方法的例子的流程图。 图11是表示第二实施方式的解码装置的例子的方框图。 图12是表示第二实施方式的解码方法的例子的流程图。 图13是用于说明频带扩展处理以及摩擦音调整解除处理的例子的图。 图14是用于说明频带扩展处理以及摩擦音调整解除处理的例子的图。 图15是表示现有技术的编码装置的例子的方框图。 图16是表示现有技术的解码装置的例子的方框图。
分享到:
收藏