JP5653050B2 - Speech decoding switching device, speech decoding switching system, and speech decoding switching method used therefor - Google Patents
Speech decoding switching device, speech decoding switching system, and speech decoding switching method used therefor Download PDFInfo
- Publication number
- JP5653050B2 JP5653050B2 JP2010046025A JP2010046025A JP5653050B2 JP 5653050 B2 JP5653050 B2 JP 5653050B2 JP 2010046025 A JP2010046025 A JP 2010046025A JP 2010046025 A JP2010046025 A JP 2010046025A JP 5653050 B2 JP5653050 B2 JP 5653050B2
- Authority
- JP
- Japan
- Prior art keywords
- switching
- speech
- speech decoding
- decoding
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 38
- 230000005540 biological transmission Effects 0.000 claims description 63
- 230000015654 memory Effects 0.000 claims description 28
- 230000002123 temporal effect Effects 0.000 claims description 17
- 230000007704 transition Effects 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 description 14
- 238000005259 measurement Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000001629 suppression Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は音声復号化切替え装置、音声復号化切替えシステム及びそれらに用いる音声復号化切替え方法に関し、特に有音の音声信号を復号化する復号回路の切替えに関する。 The present invention relates to a speech decoding switching device, a speech decoding switching system, and a speech decoding switching method used therefor, and more particularly to switching of a decoding circuit that decodes a speech signal.
本発明に関連する音声復号化切替えシステムの構成例を図5に示し、その動作を図6に示す。これら図5及び図6を参照して本発明に関連する音声復号化切替えシステムの動作について説明する。ここで、音声復号回路A11及び音声復号回路B13は、異なる復号化方式に用いられる回路であり、スイッチ15は復号化動作制御回路31からの切替え指示を音声復号回路A11または音声復号回路B13に出力し、スイッチ16は復号化動作制御回路31からの切替え指示にしたがって音声復号回路A11からの出力信号または音声復号回路B13からの出力信号を音声信号出力端子18に出力する。
A configuration example of a speech decoding switching system related to the present invention is shown in FIG. 5, and its operation is shown in FIG. The operation of the speech decoding switching system relating to the present invention will be described with reference to FIGS. Here, the speech decoding circuit A11 and the speech decoding circuit B13 are circuits used for different decoding systems, and the
復号化方式の切替え前の復号回路、例として音声復号回路A11は、音声符号A入力端子12から入力した音声符号Aを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する(図6ステップS31)。
The decoding circuit before switching the decoding system, for example, the speech decoding circuit A11, decodes the speech code A input from the speech code
復号化動作制御回路31は、符号化方式切替区間情報入力端子17から入力した符号化方式切替区間情報に基づき、符号化方式切替え区間内のいずれかのタイミングで、スイッチ15及びスイッチ16を切替える(図6ステップS32)。当該システムにおいて、スイッチを切替えるタイミングについては特に言及しない。
The decoding operation control circuit 31 switches the
スイッチ15及びスイッチ16が切替わった後、復号化方式切替え後の復号回路、例として音声復号回路B13は、音声符号B入力端子14から入力した音声符号Bを復号化し、スイッチ16経由で出力音声抑圧回路32に出力する(図6ステップS33)。
After the
出力音声抑圧回路32は、復号化動作制御回路31からの制御に従い、スイッチ16から入力した音声信号を必要に応じて抑圧し、音声信号出力端子18から出力する(図6ステップS34)。具体的には、復号化動作制御回路31が、符号化方式切替区間の間、復号回路の切替えに伴う音声信号の不連続感を軽減するため、スイッチ16からの出力音声信号を抑圧してから音声信号出力端子18に出力するように出力音声抑圧回路32を制御する。
The output
このように、本発明に関連する音声復号化切替えシステムでは、音声符号の復号化方式が切替わる際に出力音声の不連続感を軽減するため、復号回路の切替え時点を含むある一定期間の間、出力信号を単純に抑圧するだけである。尚、符号化回路の切替えにおいて、符号化回路からの出力信号を単純に抑圧する例が、下記の特許文献1に記載されている。
As described above, in the speech decoding switching system related to the present invention, in order to reduce the discontinuity of the output speech when the speech code decoding method is switched, a certain period including the switching time of the decoding circuit is reduced. The output signal is simply suppressed. An example of simply suppressing the output signal from the encoding circuit when switching the encoding circuit is described in
しかしながら、本発明に関連する音声復号化切替えシステムでは、実際に人が話している最中にその音声信号を抑圧すると、有音の音声信号が抑圧されるため、かえって不連続感を伴う可能性がある。 However, in the speech decoding switching system related to the present invention, if the speech signal is suppressed while the person is actually speaking, the voiced speech signal is suppressed. There is.
そこで、本発明の目的は上記の問題点を解消し、不連続感を伴うことなく、音声復号化方式が切替わる際の音声復号回路の切替えを実施することができる音声復号化切替え装置、音声復号化切替えシステム及びそれらに用いる音声復号化切替え方法を提供することにある。 Accordingly, an object of the present invention is to solve the above-described problems and to perform a speech decoding switching device and speech that can perform switching of a speech decoding circuit when a speech decoding method is switched without accompanying discontinuity. It is an object to provide a decoding switching system and a speech decoding switching method used for them.
本発明による音声復号化切替え装置は、複数種類の音声復号回路を有する音声復号化切替え装置であって、
送信音声のレベルと受信音声のレベルとを比較する比較手段と、
前記比較手段の比較結果に基づいて現在使用中の音声復号回路から他の音声復号回路への切替えに適したタイミングにて当該切替えの指示を行う復号化動作切替え手段とを備えている。
A speech decoding switching device according to the present invention is a speech decoding switching device having a plurality of types of speech decoding circuits,
A comparison means for comparing the level of the transmitted voice and the level of the received voice;
Decoding operation switching means for instructing the switching at a timing suitable for switching from the currently used speech decoding circuit to another speech decoding circuit based on the comparison result of the comparing means.
本発明による他の音声復号化切替え装置は、複数種類の音声復号回路を有する音声復号化切替え装置であって、
送信音声のレベルの時間的な推移を保存する第1のメモリと、
受信音声のレベルの時間的な推移を保存する第2のメモリと、
前記第1のメモリに保存された前記送信音声のレベルの時間的な推移と前記第2のメモリに保存された受信音声のレベルの時間的な推移とを分析する分析手段と、
前記分析手段の分析結果に基づいて現在使用中の音声復号回路から他の音声復号回路への切替えに適したタイミングにて当該切替えの指示を行う復号化動作切替え手段とを備えている。
Another speech decoding switching device according to the present invention is a speech decoding switching device having a plurality of types of speech decoding circuits,
A first memory for storing a temporal transition of a transmission voice level;
A second memory for storing the temporal transition of the received voice level;
Analyzing means for analyzing the temporal transition of the level of the transmission voice stored in the first memory and the temporal transition of the level of the reception voice stored in the second memory;
Decoding operation switching means for instructing switching at a timing suitable for switching from the currently used speech decoding circuit to another speech decoding circuit based on the analysis result of the analyzing means.
本発明による音声復号化切替えシステムは、上記の音声復号化切替え装置を含むことを特徴とする。 A speech decoding switching system according to the present invention includes the speech decoding switching device described above.
本発明による音声復号化切替え方法は、複数種類の音声復号回路を有する音声復号化切替え装置に用いる音声復号化切替え方法であって、
前記音声復号化切替え装置が、送信音声のレベルと受信音声のレベルとを比較する比較処理と、前記比較処理の比較結果に基づいて現在使用中の音声復号回路から他の音声復号回路への切替えに適したタイミングにて当該切替えの指示を行う復号化動作切替え処理とを実行している。
A speech decoding switching method according to the present invention is a speech decoding switching method used for a speech decoding switching device having a plurality of types of speech decoding circuits,
The speech decoding switching device compares the transmission speech level with the received speech level, and switches from the speech decoding circuit currently in use to another speech decoding circuit based on the comparison result of the comparison processing. And a decoding operation switching process for instructing the switching at a timing suitable for the above.
本発明による他の音声復号化切替え方法は、複数種類の音声復号回路を有する音声復号化切替え装置に用いる音声復号化切替え方法であって、
前記音声復号化切替え装置が、送信音声のレベルの時間的な推移を第1のメモリに保存する処理と、受信音声のレベルの時間的な推移を第2のメモリに保存する処理と、前記第1のメモリに保存された前記送信音声のレベルの時間的な推移と前記第2のメモリに保存された受信音声のレベルの時間的な推移とを分析する分析処理と、前記分析処理の分析結果に基づいて現在使用中の音声復号回路から他の音声復号回路への切替えに適したタイミングにて当該切替えの指示を行う復号化動作切替え処理とを実行している。
Another speech decoding switching method according to the present invention is a speech decoding switching method used for a speech decoding switching device having a plurality of types of speech decoding circuits,
The speech decoding switching device includes a process of storing a temporal transition of a transmission voice level in a first memory, a process of storing a temporal transition of a received voice level in a second memory, and the first An analysis process for analyzing a temporal transition of the level of the transmission voice stored in the first memory and a temporal transition of the level of the reception voice stored in the second memory, and an analysis result of the analysis process And a decoding operation switching process for instructing the switching at a timing suitable for switching from the currently used speech decoding circuit to another speech decoding circuit.
本発明は、上記のような構成及び動作とすることで、不連続感を伴うことなく、音声復号化方式が切替わる際の音声復号回路の切替えを実施することができるという効果が得られる。 By adopting the above-described configuration and operation, the present invention can achieve an effect that the speech decoding circuit can be switched when the speech decoding method is switched without a sense of discontinuity.
次に、本発明の実施の形態について図面を参照して説明する。まず、本発明による音声復号化切替え装置の概要について説明する。本発明による音声復号化切替え装置は、音声復号化方式が切替わる際に、送受信の音声レベルを比較または分析することにより、不連続感を伴うことなく、音声復号回路を切替えるようにしている。 Next, embodiments of the present invention will be described with reference to the drawings. First, the outline of the speech decoding switching apparatus according to the present invention will be described. The speech decoding switching device according to the present invention is configured to switch speech decoding circuits without a sense of discontinuity by comparing or analyzing transmitted and received speech levels when the speech decoding method is switched.
本発明において、受信側音声レベル測定回路は、第2のスイッチ経由で出力される音声信号のレベルを測定し、測定した音声信号のレベルを、受信側音声レベル情報として送受信音声レベル比較回路に入力する。送信側音声レベル情報入力端子経由で入力された送信側音声レベル情報は、そのまま送受信音声レベル比較回路へ入力される。 In the present invention, the reception-side audio level measurement circuit measures the level of the audio signal output via the second switch, and inputs the measured audio signal level to the transmission / reception audio level comparison circuit as reception-side audio level information. To do. The transmission side audio level information input via the transmission side audio level information input terminal is input to the transmission / reception audio level comparison circuit as it is.
送受信音声レベル比較回路は、受信側音声レベル測定回路から入力した受信側音声レベル情報と送信側音声レベル情報入力端子から入力した送信側音声レベル情報とを比較し、その比較結果を復号化動作切替回路に出力する。 The transmission / reception audio level comparison circuit compares the reception side audio level information input from the reception side audio level measurement circuit with the transmission side audio level information input from the transmission side audio level information input terminal, and switches the comparison result to the decoding operation switching Output to the circuit.
復号化動作切替回路は、符号化方式切替区間情報入力端子から入力した符号化方式切替区間情報と送受信音声レベル比較回路から入力した送受信音声レベル比較結果とに基づき、第1のスイッチ及び第2のスイッチをそれぞれ切替える。 The decoding operation switching circuit includes the first switch and the second switch based on the coding scheme switching section information input from the coding scheme switching section information input terminal and the transmission / reception voice level comparison result input from the transmission / reception voice level comparison circuit. Switch each switch.
つまり、本発明による音声復号化切替え装置では、送受信の音声レベルを比較または分析し、音声復号回路の切替え動作に適したタイミングを検出することにより、不連続感を伴うことなく、音声復号化方式が切替わる際の音声復号回路の切替えを実施することを可能としている。 That is, in the speech decoding switching device according to the present invention, the speech decoding method is performed without a sense of discontinuity by comparing or analyzing the speech levels of transmission and reception and detecting the timing suitable for the switching operation of the speech decoding circuit. It is possible to perform switching of the speech decoding circuit at the time of switching.
図1は本発明の第1の実施の形態による音声復号化切替え装置の構成例を示すブロック図である。図1において、本発明の第1の実施の形態による音声復号化切替え装置は、音声復号回路A11と、音声符号A入力端子12と、音声復号回路B13と、音声符号B入力端子14と、スイッチ15,16と、符号化方式切替区間情報入力端子17と、音声信号出力端子18と、復号化動作切替回路19と、受信側音声レベル測定回路20と、送信側音声レベル情報入力端子21と、送受信音声レベル比較回路22とから構成されている。
FIG. 1 is a block diagram showing a configuration example of a speech decoding switching apparatus according to the first embodiment of the present invention. In FIG. 1, a speech decoding switching device according to the first embodiment of the present invention includes a speech decoding circuit A11, a speech code
尚、本発明の第1の実施の形態による音声復号化切替え装置は、音声復号化方式が切替わる毎に、対応する音声復号回路への切替えを行っており、このような動作を行う音声復号化切替えシステムにも適用可能である。 Note that the speech decoding switching device according to the first embodiment of the present invention switches to the corresponding speech decoding circuit every time the speech decoding method is switched, and the speech decoding that performs such an operation. It can also be applied to a switching system.
音声復号回路A11は、音声符号A入力端子12から入力した音声符号Aを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する。
The speech decoding circuit A11 decodes the speech code A input from the speech code
音声復号回路B13は、音声符号B入力端子14から入力した音声符号Bを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する。
The speech
受信側音声レベル測定回路20は、スイッチ16経由で出力される音声信号のレベルを測定し、測定した音声信号のレベルを受信側音声レベル情報として送受信音声レベル比較回路22に入力する。送信側音声レベル情報入力端子21経由で入力された送信側音声レベル情報は、そのまま送受信音声レベル比較回路22へ入力される。
The reception-side audio
送受信音声レベル比較回路22は、受信側音声レベル測定回路20から入力した受信側音声レベル情報と、送信側音声レベル情報入力端子21から入力した送信側音声レベル情報とを比較し、その比較結果を復号化動作切替回路19に出力する。
The transmission / reception audio
復号化動作切替回路19は、符号化方式切替区間情報入力端子17から入力した通信相手からの符号化方式切替区間情報と、送受信音声レベル比較回路22から入力した送受信音声レベル比較結果とに基づき、スイッチ15及びスイッチ16を切替える。
The decoding
ここで、音声復号回路A11及び音声復号回路B13は、異なる復号化方式に用いられる回路であり、スイッチ15は復号化動作切替回路19からの切替え指示を音声復号回路A11または音声復号回路B13に出力し、スイッチ16は復号化動作切替回路19からの切替え指示にしたがって音声復号回路A11からの出力信号または音声復号回路B13からの出力信号を音声信号出力端子18に出力する。
Here, the speech decoding circuit A11 and the speech decoding circuit B13 are circuits used for different decoding systems, and the
図2は本発明の第1の実施の形態による音声復号化切替え装置の動作例を示すフローチャートである。これら図1及び図2を参照して本発明の第1の実施の形態による音声復号化切替え装置の動作について説明する。 FIG. 2 is a flowchart showing an operation example of the speech decoding switching apparatus according to the first embodiment of the present invention. The operation of the speech decoding switching apparatus according to the first embodiment of the present invention will be described with reference to FIG. 1 and FIG.
尚、図2に示す処理動作は、図示せぬ音声復号化切替え装置のCPU(中央処理装置)がプログラムを実行することでも実現可能である。以下、例として、音声復号回路A11から音声復号回路B12へ切替える場合についての動作について説明する。 The processing operation shown in FIG. 2 can also be realized by executing a program by a CPU (central processing unit) of a speech decoding switching device (not shown). Hereinafter, as an example, the operation in the case of switching from the speech decoding circuit A11 to the speech decoding circuit B12 will be described.
復号化方式の切替え前の復号回路、すなわち音声復号回路A11は、音声符号A入力端子12から入力した音声符号Aを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する(図2ステップS1)。
The decoding circuit before switching of the decoding system, that is, the speech decoding circuit A11 decodes the speech code A input from the speech code
受信側音声レベル測定回路20は、スイッチ16経由で出力される音声信号のレベルを測定し、測定した音声信号のレベルを受信側音声レベル情報として送受信音声レベル比較回路22に入力する(図2ステップS2)。ここで言う受信側音声レベル情報とは、一般的な音声通話において、相手から受信した音声符号を復号化した音声信号のレベルに相当する。
The reception-side audio
送信側音声レベル情報入力端子21経由で入力された送信側音声レベル情報は、そのまま送受信音声レベル比較回路22へ入力される(図2ステップS3)。ここで言う送信側音声レベル情報とは、一般的な音声通話において、自分から相手に送信する音声信号のレベルに相当する。
The transmission side audio level information input via the transmission side audio level
送受信音声レベル比較回路22は、受信側音声レベル測定回路20から入力した受信側音声レベル情報と、送信側音声レベル情報入力端子21から入力した送信側音声レベル情報とを比較し、その比較結果を復号化動作切替回路19に出力する(図2ステップS4)。
The transmission / reception audio
以下、ステップS4の処理動作について具体的に説明する。送信側音声レベル情報入力端子21経由で入力される送信側音声レベル情報は、一般的な音声通話において自分から相手に送信する方向の声の大きさ、すなわち自分の声の大きさに相当し、受信側音声レベル測定回路20が測定する受信側音声レベル情報は、相手から自分が受信する方向の声の大きさ、すなわち相手の声の大きさに相当する。
Hereinafter, the processing operation of step S4 will be specifically described. The transmission-side audio level information input via the transmission-side audio level
一般的な会話においては、話者は自分または相手のどちらか一方となるため、これら2つの音声レベル情報を比較するということは、自分の声の大きさと相手の声の大きさとを比較する、すなわち、自分と相手のどちらが話しているかを見極めるということになる。 In a general conversation, the speaker is either one of you or the other, so comparing these two audio level informations compares the volume of your voice with that of the other party. In other words, it will be determined whether you or the other person is speaking.
つまり、送信側音声レベル情報が受信側音声レベル情報より大きい場合は、自分が話をしており、相手は話を聞いていると考えられる。また、送信側音声レベル情報が受信側音声レベル情報より小さい場合は、自分は相手の話を聞いており、相手が話していると考えられる。このようにして、送受信の音声レベルを比較することは、音声通話における話者を特定する動作に相当する。 That is, when the transmission side audio level information is larger than the reception side audio level information, it is considered that the user is talking and the other party is listening. If the transmission side audio level information is smaller than the reception side audio level information, it is considered that the user is listening to the other party and the other party is speaking. Thus, comparing the voice levels of transmission and reception corresponds to an operation of specifying a speaker in a voice call.
復号化動作切替回路19は、符号化方式切替区間情報入力端子17から入力した符号化方式切替区間情報と、送受信音声レベル比較回路22から入力した送受信音声レベル比較結果とに基づき、スイッチ15及びスイッチ16を切替える(図2ステップS5)。
The decoding
以下、ステップS5の処理動作について具体的に説明する。符号化方式切替区間情報入力端子17からは、符号化方式の切替区間を示す情報が入力されるものとする。符号化方式切替区間の間は、音声符号A入力端子12及び音声符号B入力端子14の両方から音声符号が入力されており、復号回路の切替え動作は符号化方式切替区間の間に行うものとする。
符号化方式切替区間内において、復号化動作切替回路19は、送受信音声レベル比較回路22から入力した送受信音声レベル比較結果を参照し、復号回路の切替えに適したタイミングであるかどうかを判断して復号回路の切替えを行う。
Hereinafter, the processing operation of step S5 will be specifically described. It is assumed that information indicating a coding system switching section is input from the coding system switching section
In the coding system switching section, the decoding
具体的には、符号化方式切替区間内において、送信側音声レベル情報が受信側音声レベル情報よりも大きい場合に、スイッチ15及びスイッチ16を切替え、復号回路を音声復号回路A11から音声復号回路B13へ切替える。
Specifically, when the transmission side audio level information is larger than the reception side audio level information within the coding scheme switching section, the
この場合、送信側音声レベル情報が受信側音声レベル情報よりも大きいため、話者は自分であり、相手は自分の話を聞いている、すなわち、話をしていないと考えられる。相手が話をしていないということは、すなわち、相手から受信する音声符号には、相手の音声は含まれておらず、周囲の背景雑音のみが含まれていると考えられる。 In this case, since the transmission side audio level information is larger than the reception side audio level information, it is considered that the speaker is himself and the other party is listening to his own story, that is, not talking. That the other party is not speaking, that is, it is considered that the voice code received from the other party does not include the other party's voice but only the surrounding background noise.
一般的に背景雑音は人間が話している時の音声信号と比較して信号レベルも小さいため、復号回路の切替えに伴う不連続感や違和感等も軽減でき、結果的にごく自然に復号回路の切替えを行うことができる。 In general, the background noise is low in signal level compared to the voice signal when a human is speaking, so it is possible to reduce the discontinuity and incongruity caused by switching of the decoding circuit. Switching can be performed.
切替え後の復号回路、すなわち音声復号回路B13は、音声符号B入力端子14から入力した音声符号Bを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する(図2ステップS6)。
The switched decoding circuit, that is, the speech decoding circuit B13 decodes the speech code B input from the speech code B input terminal 14 and outputs the decoded signal from the speech
このように、本実施の形態では、相手からの受信信号に有音の音声信号が含まれていない等、復号回路の切替え動作に適したタイミングを見計らって復号回路を切替えるため、復号回路の切替え時に発生する音声信号の不連続感や違和感等を軽減することができるという効果がある。 As described above, in the present embodiment, the switching of the decoding circuit is performed in order to switch the decoding circuit in anticipation of a timing suitable for the switching operation of the decoding circuit, for example, the reception signal from the other party does not include a voice signal. There is an effect that it is possible to reduce the discontinuity or discomfort of the audio signal that sometimes occurs.
図3は本発明の第2の実施の形態による音声復号化切替え装置の構成例を示すブロック図である。図3において、本発明の第2の実施の形態による音声復号化切替え装置は、受信側音声レベル情報保存メモリ24と、送信側音声レベル情報保存メモリ25とを追加し、送受信音声レベル比較回路22を送受信音声レベル分析回路23に置き換えた以外は、図1に示す本発明の第1の実施の形態による音声復号化切替え装置と同様の構成となっており、同一構成要素には同一符号を付してある。
FIG. 3 is a block diagram showing a configuration example of a speech decoding switching apparatus according to the second embodiment of the present invention. In FIG. 3, the speech decoding switching device according to the second embodiment of the present invention adds a reception-side speech level
図4は本発明の第2の実施の形態による音声復号化切替え装置の動作例を示すフローチャートである。これら図3及び図4を参照して本発明の第2の実施の形態による音声復号化切替え装置の動作について説明する。 FIG. 4 is a flowchart showing an operation example of the speech decoding switching apparatus according to the second embodiment of the present invention. The operation of the speech decoding switching apparatus according to the second embodiment of the present invention will be described with reference to FIG. 3 and FIG.
尚、図4に示す処理動作は、音声復号化切替え装置のCPU(中央処理装置)(図示せず)がプログラムを実行することでも実現可能である。以下、例として、音声復号回路A11から音声復号回路B12へ切替える場合についての動作について説明する。 The processing operation shown in FIG. 4 can also be realized by executing a program by a CPU (Central Processing Unit) (not shown) of the speech decoding switching device. Hereinafter, as an example, the operation in the case of switching from the speech decoding circuit A11 to the speech decoding circuit B12 will be described.
復号化方式の切替え前の復号回路、すなわち音声復号回路A11は、音声符号A入力端子12から入力した音声符号Aを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する(図4ステップS11)。
The decoding circuit before switching of the decoding system, that is, the speech decoding circuit A11 decodes the speech code A input from the speech code
受信側音声レベル測定回路20は、スイッチ16経由で出力される音声信号のレベルを測定し、測定した音声信号のレベルを受信側音声レベル情報として受信側音声レベル情報保存メモリ24に保存する(図4ステップS12)。受信側音声レベル情報保存メモリ24は、過去に受信側音声レベル測定回路20から出力された受信側音声レベル情報を複数個保存することができるものとする。
The reception-side audio
送信側音声レベル情報入力端子21経由で入力された送信側音声レベル情報は、そのまま送信側音声レベル情報保存メモリ25へ入力される(図4ステップS13)。送信側音声レベル情報保存メモリ25は、過去に送信側音声レベル入力端子21から入力した送信側音声レベル情報を複数個保存することができるものとする。
The transmission side audio level information input via the transmission side audio level
送受信音声レベル分析回路23は、受信側音声レベル情報保存メモリ24から入力した複数個の受信側音声レベル情報及び送信側音声レベル情報保存メモリ25から入力した複数個の送信側音声レベル情報を分析し、その分析結果を復号化動作切替回路19に出力する(図4ステップS14)。
The transmission / reception audio
以下、ステップS14の処理動作について具体的に説明する。本実施の形態と上述した本発明の第1の実施の形態との違いは、送信側音声レベル情報保存メモリ25に保存されている複数個の送信側音声レベル情報及び受信側音声レベル情報保存メモリ24に保存されている複数個の受信側音声レベル情報を参照することにより、送信側の音声レベル及び受信側の音声レベルそれぞれの過去の時間的推移を分析することが可能となり、その結果、復号化方式の切替えにさらに適したタイミングを判断することが可能な点にある。
Hereinafter, the processing operation of step S14 will be specifically described. The difference between the present embodiment and the first embodiment of the present invention described above is that a plurality of transmission-side audio level information and reception-side audio level information storage memories stored in the transmission-side audio level
例えば、送信側音声レベルが受信側音声レベルより大きい状態が過去一定の期間に渡って継続しており、かつ、送信側音声レベルが時間とともにだんだん大きくなっているような場合は、自分が話をしており、相手は話を聞いているという状態である可能性が極めて高いと判断できる。送受信音声レベル分析回路23は、このようにして分析した最適なタイミングの情報を分析結果として復号化動作切替回路19に出力する。
For example, if the transmitter audio level is higher than the receiver audio level for a certain period in the past and the transmitter audio level gradually increases with time, Therefore, it can be determined that there is a high possibility that the other party is listening to the story. The transmission / reception voice
復号化動作切替回路19は、符号化方式切替区間情報入力端子17から入力した符号化方式切替区間情報と、送受信音声レベル分析回路23から入力した送受信音声レベル分析結果とに基づき、スイッチ15及びスイッチ16を切替える(図4ステップS15)。
The decoding
切替え後の復号回路、すなわち音声復号回路B13は、音声符号B入力端子14から入力した音声符号Bを復号化し、復号化した信号をスイッチ16経由で音声信号出力端子18から出力する(図4ステップS16)。
The switched decoding circuit, that is, the speech decoding circuit B13 decodes the speech code B input from the speech code B input terminal 14 and outputs the decoded signal from the speech
このように、本実施の形態では、送受信音声レベル分析回路23から入力される分析結果を基に復号回路の切替えを行うため、上述した本発明の第1の実施の形態と比較して、より適切なタイミングでの復号回路の切替えが可能になる。
Thus, in the present embodiment, since the decoding circuit is switched based on the analysis result input from the transmission / reception voice
本発明は、複数種類の音声復号回路を有する音声復号化装置やシステムにおいて、特に音声通話中に複数種類の音声復号回路を切替える場合がある音声復号化切替え装置やシステムに適用可能である。 INDUSTRIAL APPLICABILITY The present invention can be applied to a speech decoding apparatus or system having a plurality of types of speech decoding circuits, particularly a speech decoding switching apparatus or system that may switch between a plurality of types of speech decoding circuits during a voice call.
11 音声復号回路A
12 音声符号A入力端子
13 音声復号回路B
14 音声符号B入力端子
15,16 スイッチ
17 符号化方式切替区間情報入力端子
18 音声信号出力端子
19 復号化動作切替回路
20 受信側音声レベル測定回路
21 送信側音声レベル情報入力端子
22 送受信音声レベル比較回路
23 送受信音声レベル分析回路
24 受信側音声レベル情報保存メモリ
25 送信側音声レベル情報保存メモリ
11 Speech decoding circuit A
12 Voice code
DESCRIPTION OF SYMBOLS 14 Voice code
Claims (5)
送信音声のレベルと受信音声のレベルとを比較する比較手段と、
現在使用中の前記音声復号回路から他の前記音声復号回路への切替えの指示を行う復号化動作切替え手段と、
通信相手からの、前記受信音声の音声符号と前記送信音声の音声符号の両方が入力されている区間である符号化方式切替区間に関する情報である符号化方式切替区間情報を前記復号化動作切替え手段に入力する入力端子と、
を有し、
前記復号化動作切替え手段は、前記符号化方式切替区間情報に示される前記符号化方式切替区間において、前記比較手段の比較結果に基づいて、現在使用中の前記音声復号回路から他の前記音声復号回路への切替えに適したタイミングを判断し、前記タイミングにおいて、前記音声復号回路の切替えの指示を行うことを特徴とする音声復号化切替え装置。 A speech decoding switching device having a plurality of types of speech decoding circuits,
A comparison means for comparing the level of the transmitted voice and the level of the received voice;
Switching instruction and decoding operation switching means performs the from the speech decoding circuit currently in use to another of said speech decoding circuit,
Coding method switching section information, which is information related to a coding system switching section, which is a section in which both the voice code of the received voice and the voice code of the transmission voice from the communication partner are input Input terminal to input to,
Have,
The decoding operation switching means, in the coding scheme switching section indicated in the coding scheme switching section information, based on the comparison result of the comparing means, from the currently used speech decoding circuit to the other speech decoding circuit A speech decoding switching device characterized by determining a timing suitable for switching to a circuit and instructing switching of the speech decoding circuit at the timing .
送信音声のレベルの時間的な推移を保存する第1のメモリと、A first memory for storing a temporal transition of a transmission voice level;
受信音声のレベルの時間的な推移を保存する第2のメモリと、A second memory for storing the temporal transition of the received voice level;
前記第1のメモリに保存された前記送信音声のレベルの時間的な推移と前記第2のメモリに保存された前記受信音声のレベルの時間的な推移とを分析する分析手段と、Analyzing means for analyzing the temporal transition of the level of the transmission voice stored in the first memory and the temporal transition of the level of the reception voice stored in the second memory;
現在使用中の前記音声復号回路から他の前記音声復号回路への切替えの指示を行う復号化動作切替え手段と、Decoding operation switching means for instructing switching from the speech decoding circuit currently in use to the other speech decoding circuit;
通信相手からの、前記受信音声の音声符号と前記送信音声の音声符号の両方が入力されている区間である符号化方式切替区間に関する情報である符号化方式切替区間情報を前記復号化動作切替え手段に入力する入力端子と、Coding method switching section information, which is information related to a coding system switching section, which is a section in which both the speech code of the received speech and the speech code of the transmission speech from the communication partner are input, is the decoding operation switching means. Input terminal to input to,
を有し、Have
前記復号化動作切替え手段は、前記符号化方式切替区間情報に示される前記符号化方式切替区間において、前記分析手段の分析結果に基づいて、現在使用中の前記音声復号回路から他の前記音声復号回路への切替えに適したタイミングを判断し、前記タイミングにおいて、前記音声復号回路の切替えの指示を行うことを特徴とする音声復号化切替え装置。The decoding operation switching means, in the coding scheme switching section indicated by the coding scheme switching section information, based on the analysis result of the analyzing means, from the speech decoding circuit currently in use to the other speech decoding circuit A speech decoding switching device characterized by determining a timing suitable for switching to a circuit and instructing switching of the speech decoding circuit at the timing.
前記音声復号化切替え装置が、The speech decoding switching device is
送信音声のレベルと受信音声のレベルとを比較する比較処理と、A comparison process that compares the level of the transmitted voice with the level of the received voice;
現在使用中の前記音声復号回路から他の前記音声復号回路への切替えの指示を行う復号化動作切替え処理と、を実行し、A decoding operation switching process for instructing switching from the speech decoding circuit currently in use to another speech decoding circuit;
前記音声復号化切替え装置には、通信相手から、前記受信音声の音声符号と前記送信音声の音声符号の両方が入力されている区間である符号化方式切替区間に関する情報である符号化方式切替区間情報が入力され、In the speech decoding switching device, a coding scheme switching section which is information on a coding scheme switching section, which is a section in which both the speech code of the received speech and the speech code of the transmission speech are input from the communication partner. Information is entered,
前記復号化動作切替え処理において、前記音声復号化切替え装置は、前記符号化方式切替区間情報に示される前記符号化方式切替区間において、前記比較処理の比較結果に基づいて、現在使用中の前記音声復号回路から他の前記音声復号回路への切替えに適したタイミングを判断し、前記タイミングにおいて、前記音声復号回路の切替えの指示を行うことを特徴とする音声復号化切替え方法。In the decoding operation switching process, the speech decoding switching device is configured to use the speech currently in use based on a comparison result of the comparison process in the coding system switching section indicated in the coding system switching section information. A speech decoding switching method, comprising: determining a timing suitable for switching from a decoding circuit to another speech decoding circuit, and instructing switching of the speech decoding circuit at the timing.
前記音声復号化切替え装置が、The speech decoding switching device is
送信音声のレベルの時間的な推移を第1のメモリに保存する処理と、A process of storing the temporal transition of the level of the transmission voice in the first memory;
受信音声のレベルの時間的な推移を第2のメモリに保存する処理と、A process of storing the temporal transition of the received voice level in the second memory;
前記第1のメモリに保存された前記送信音声のレベルの時間的な推移と前記第2のメモリに保存された前記受信音声のレベルの時間的な推移とを分析する分析処理と、An analysis process for analyzing a temporal transition of the level of the transmission voice stored in the first memory and a temporal transition of the level of the reception voice stored in the second memory;
現在使用中の前記音声復号回路から他の前記音声復号回路への切替えの指示を行う復号化動作切替え処理と、を実行し、A decoding operation switching process for instructing switching from the speech decoding circuit currently in use to another speech decoding circuit;
前記音声復号化切替え装置には、通信相手から、前記受信音声の音声符号と前記送信音声の音声符号の両方が入力されている区間である符号化方式切替区間に関する情報である符号化方式切替区間情報が入力され、In the speech decoding switching device, a coding scheme switching section which is information on a coding scheme switching section, which is a section in which both the speech code of the received speech and the speech code of the transmission speech are input from the communication partner. Information is entered,
前記復号化動作切替え処理において、前記音声復号化切替え装置は、前記符号化方式切替区間情報に示される前記符号化方式切替区間において、前記分析処理の分析結果に基づいて、現在使用中の前記音声復号回路から他の前記音声復号回路への切替えに適したタイミングを判断し、前記タイミングにおいて、前記音声復号回路の切替えの指示を行うことを特徴とする音声復号化切替え方法。In the decoding operation switching process, the speech decoding switching device is configured to use the speech currently in use based on an analysis result of the analysis process in the coding system switching section indicated in the coding system switching section information. A speech decoding switching method, comprising: determining a timing suitable for switching from a decoding circuit to another speech decoding circuit, and instructing switching of the speech decoding circuit at the timing.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010046025A JP5653050B2 (en) | 2010-03-03 | 2010-03-03 | Speech decoding switching device, speech decoding switching system, and speech decoding switching method used therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010046025A JP5653050B2 (en) | 2010-03-03 | 2010-03-03 | Speech decoding switching device, speech decoding switching system, and speech decoding switching method used therefor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011180466A JP2011180466A (en) | 2011-09-15 |
| JP5653050B2 true JP5653050B2 (en) | 2015-01-14 |
Family
ID=44691988
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010046025A Expired - Fee Related JP5653050B2 (en) | 2010-03-03 | 2010-03-03 | Speech decoding switching device, speech decoding switching system, and speech decoding switching method used therefor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5653050B2 (en) |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1021646A (en) * | 1996-07-03 | 1998-01-23 | Toshiba Corp | Recording, transmission, reproduction method and reproduction apparatus for audio signal |
| JP2002062897A (en) * | 2000-08-18 | 2002-02-28 | Matsushita Electric Ind Co Ltd | Speech encoding device, speech decoding device, speech encoding method, and speech decoding method |
| JP4628798B2 (en) * | 2005-01-13 | 2011-02-09 | Kddi株式会社 | Communication terminal device |
| WO2009084165A1 (en) * | 2007-12-28 | 2009-07-09 | Panasonic Corporation | Audio mixing/reproducing device |
-
2010
- 2010-03-03 JP JP2010046025A patent/JP5653050B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2011180466A (en) | 2011-09-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA2865533C (en) | Speech/audio signal processing method and apparatus | |
| US9100756B2 (en) | Microphone occlusion detector | |
| US20150281853A1 (en) | Systems and methods for enhancing targeted audibility | |
| EP4270390B1 (en) | Adaptive comfort noise parameter determination | |
| US20130103398A1 (en) | Method and Apparatus for Audio Signal Classification | |
| US10009475B2 (en) | Perceptually continuous mixing in a teleconference | |
| KR20100003729A (en) | Method of transmitting data in a communication system | |
| US9876913B2 (en) | Perceptual continuity using change blindness in conferencing | |
| JP2006505003A (en) | Operation method of speech recognition system | |
| JP5045751B2 (en) | Speech mixing apparatus, noise suppression method thereof, and program | |
| US20200265856A1 (en) | Speech-to-text conversion based on quality metric | |
| EP2158753B1 (en) | Selection of audio signals to be mixed in an audio conference | |
| CN111402914B (en) | Noise elimination method, device, electronic equipment and storage medium | |
| JP5653050B2 (en) | Speech decoding switching device, speech decoding switching system, and speech decoding switching method used therefor | |
| CN116095395B (en) | Method and device for adjusting buffer length, electronic equipment and storage medium | |
| KR100664271B1 (en) | Portable terminal capable of sound separation and method | |
| JP4437011B2 (en) | Speech encoding device | |
| JP4551817B2 (en) | Noise level estimation method and apparatus | |
| JP2007336364A (en) | Echo canceler | |
| KR20100082961A (en) | Apparatus and method for processing a received voice signal in mobile terminal | |
| AU735505B2 (en) | Echo reducing phone with state machine controlled switches | |
| JP5287502B2 (en) | Speech decoding apparatus and method | |
| KR100421365B1 (en) | Automatic robbery report method for mobile video phone | |
| CN115426561B (en) | Earphone control method and device, earphone and medium | |
| JP5449230B2 (en) | Remote communication device, remote communication method, program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130214 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131018 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131112 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131126 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140127 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140918 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141028 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141118 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5653050 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |