Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4487909B2 - Voice control device and voice control method - Google Patents
[go: Go Back, main page]

JP4487909B2 - Voice control device and voice control method - Google Patents

Voice control device and voice control method Download PDF

Info

Publication number
JP4487909B2
JP4487909B2 JP2005335224A JP2005335224A JP4487909B2 JP 4487909 B2 JP4487909 B2 JP 4487909B2 JP 2005335224 A JP2005335224 A JP 2005335224A JP 2005335224 A JP2005335224 A JP 2005335224A JP 4487909 B2 JP4487909 B2 JP 4487909B2
Authority
JP
Japan
Prior art keywords
microphone
mouth
signal
voice control
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005335224A
Other languages
Japanese (ja)
Other versions
JP2007140225A (en
Inventor
達也 出嶌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005335224A priority Critical patent/JP4487909B2/en
Publication of JP2007140225A publication Critical patent/JP2007140225A/en
Application granted granted Critical
Publication of JP4487909B2 publication Critical patent/JP4487909B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、音声制御装置および音声制御方法に関し、特に、マイクロフォンから出力される音声信号に対してエフェクト処理を施す音声制御装置および音声制御方法に関するものである。   The present invention relates to a sound control device and a sound control method, and more particularly to a sound control device and a sound control method for performing effect processing on a sound signal output from a microphone.

近年、電子楽器とエフェクタなどの装置とを組み合わせて、電子楽器から発生する楽音に対してエコーやリバーブの効果を付加するシステムが広く普及してきている。さらに、電子楽器とビデオカメラとを組み合わせて、電子楽器から発生する楽音に対して様々なバリエーションを持たせる提案もなされている。例えば、演奏者の表情に基づいて、演奏される音楽に表現効果を付与する音楽演奏装置の提案がある。この提案においては、演奏者の顔画像を撮影するための撮影手段からの画像データに基づいて、顔画像の注目部分、例えば、演奏者の口の形状から抽出された形状パラメータに応じて、音データに対する表現効果を制御するための制御信号を生成する。具体的には、演奏者の口の開口部の縦方向の開き度合いに応じて制御信号を生成し、その制御信号に応じて、音が通過するローパスフィルタの遮断周波数を変化させる。例えば、口を大きく開けると、ローパスフィルタの遮断周波数を大きくし、口を閉じるにしたがってローパスフィルタの遮断周波数を小さくする。あるいは、演奏者の口の開口部の幅に応じて制御信号を生成し、その制御信号に応じて、音が通過するアンプの非直線性を制御する。例えば、口の幅が広がると、アンプの非直線性を変化させて、音の振幅をクリップすることでひずみを与える。演奏する楽器としては、実施形態に記載されているエレキギターのほかに、ピアノやシンセサイザなどが想定されている。さらには、演奏者だけでなくDJ(ディスクジョッカー)の顔の表情によっても音データに対する表現効果を制御することが記載されている。(特許文献1参照)
特開平2002−140066号公報
In recent years, systems that add an echo or reverb effect to musical sounds generated from electronic musical instruments by combining electronic musical instruments and devices such as effectors have become widespread. In addition, there have been proposals for combining electronic musical instruments and video cameras to give various variations to musical sounds generated from electronic musical instruments. For example, there is a proposal of a music performance device that gives an expression effect to music to be played based on a player's facial expression. In this proposal, based on the image data from the photographing means for photographing the performer's face image, the sound is determined according to the shape parameter extracted from the attention portion of the face image, for example, the shape of the performer's mouth. A control signal for controlling the expression effect on the data is generated. Specifically, a control signal is generated according to the degree of vertical opening of the opening of the performer's mouth, and the cut-off frequency of the low-pass filter through which the sound passes is changed according to the control signal. For example, when the mouth is opened wide, the cutoff frequency of the low-pass filter is increased, and as the mouth is closed, the cutoff frequency of the low-pass filter is decreased. Alternatively, a control signal is generated according to the width of the opening of the performer's mouth, and the nonlinearity of the amplifier through which the sound passes is controlled according to the control signal. For example, if the width of the mouth widens, distortion is applied by changing the nonlinearity of the amplifier and clipping the sound amplitude. As a musical instrument to be played, in addition to the electric guitar described in the embodiment, a piano or a synthesizer is assumed. Furthermore, it is described that the expression effect on the sound data is controlled not only by the performer but also by the facial expression of a DJ (disc jocker). (See Patent Document 1)
Japanese Patent Laid-Open No. 2002-140066

しかしながら、上記特許文献のように、演奏者の表情に基づいて、演奏される音楽に表現効果を制御することは、却って音楽性を喪失又は破壊するおそれがある。なぜなら、演奏者の表情と発生する楽音と間に相関性があるとは考えられないからである。例えば、演奏者が笑いながら明るい音色で演奏している場合でも、口の幅が広がった画像によって、音にひずみを与えて荒々しい音色にすると、演奏者の意図とは逆の効果になってしまう。また、演奏者の中には、静かでメランコリックな曲を演奏していても、メロディにひたって口を大きく開ける場合もある。このような場合に、その口の動きに応じて音にひずみを与えて荒々しい音色にすると、演奏を台無しにすることになる。   However, as in the above-mentioned patent document, controlling the expression effect on the music to be played based on the player's facial expression may cause loss or destruction of musicality. This is because it cannot be considered that there is a correlation between the performer's facial expression and the generated musical sound. For example, even if the performer is playing with a bright tone while laughing, if the sound is distorted and the tone is rough due to an image with a wide mouth, the effect will be the opposite of the intention of the performer. End up. Also, some performers may open their mouths with a melody, even if they are playing a quiet, melancholic song. In such a case, if the sound is distorted according to the movement of the mouth to create a rough tone, the performance will be spoiled.

演奏者の口の表情と発生する楽音と間に相関性があるのは、歌唱する場合だけである。口を頻繁にぱくぱく大きく開けて「…は夜露に濡れて……」と静かに歌う人はいないし、逆に口を開けずに「…来たぜ函館……」と歯切れよく大きな声で歌う人もいない。すなわち、歌唱者の口の動きと歌声の音色と間には高い相関性があり、この相関性を利用すれば、歌唱力を高めることが期待できる。
例えば、広く普及しているカラオケは、歌唱力を競い合うというより、会社などの団体における親睦、宴会、接待などのイベントとして利用されている。しかし、歌唱力に自身のない人にとっては皆の前で歌うことは恥ずかしく、苦痛を伴うことになる。したがって、実際よりも高い歌唱力で歌うことができれば、羞恥心や苦痛を和らげることができる上、聴いている回りの人にとっても雰囲気がよくなる。
本発明は、このような従来の課題を解決するためのものであり、歌唱者の口の動きと歌声の音色との相関性を利用して、実際よりも歌唱力を高めることができるようにすることを目的とする。
There is a correlation between the expression of the performer's mouth and the generated musical sound only when singing. No one sings quietly, saying that “... is wet with night dew ...” and singing loudly, “... Came Ze Hakodate ...” without opening his mouth. There are no people. That is, there is a high correlation between the movement of the singer's mouth and the timbre of the singing voice, and if this correlation is used, it can be expected to improve the singing ability.
For example, karaoke, which is widely used, is used as an event for relatives, banquets, entertainment, etc. in organizations such as companies rather than competing for singing ability. However, it is embarrassing and painful to sing in front of everyone for those who have no singing ability. Therefore, if you can sing with higher singing ability than you can, you can relieve shame and pain, and the atmosphere will be better for those around you.
The present invention is for solving such a conventional problem, and by utilizing the correlation between the movement of the singer's mouth and the timbre of the singing voice, the singing ability can be enhanced more than actual. The purpose is to do.

請求項1に記載の音声制御装置は、マイクロフォンに収容され、入力される音声に応じて音声信号を出力する信号発生手段(実施形態においては、図2、図3のマイク部5に相当する)と、マイクロフォンに収容され、歌唱者の口の映像を撮像して画像信号を出力する撮像手段(実施形態においては、図2、図3のカメラ部6に相当する)と、信号発生手段から出力された音声信号と前記撮像手段によって出力された画像信号との相関性を検出する相関性検出手段(実施形態においては、図3のCPU1に相当する)と、相関性検出手段によって検出された相関性のデータに応じて信号発生手段から出力される音声信号に対してエフェクト処理を施す信号処理手段(実施形態においては、図3のCPU10およびDSP制御部18に相当する)と、を備えた構成になっている。   The voice control device according to the first aspect is a signal generating means that is accommodated in a microphone and outputs a voice signal in accordance with an inputted voice (in the embodiment, it corresponds to the microphone unit 5 in FIGS. 2 and 3). And an image pickup means (corresponding to the camera unit 6 in FIGS. 2 and 3 in the embodiment) which is housed in the microphone and picks up an image of the mouth of the singer and outputs an image signal, and is output from the signal generation means. Correlation detection means (corresponding to the CPU 1 in FIG. 3 in the embodiment) for detecting the correlation between the sound signal thus generated and the image signal output by the imaging means, and the correlation detected by the correlation detection means Signal processing means for effecting the audio signal output from the signal generating means in accordance with the sex data (corresponding to the CPU 10 and the DSP control section 18 in FIG. 3 in the embodiment). It has a configuration which includes a, and.

請求項1の音声制御装置において、請求項2に記載したように、相関性検出手段は、撮像手段から出力された画像信号と信号発生手段から出力される音声信号との差分関係を検出する差分検出手段(実施形態においては、図3のCPU10に相当する)を備え、信号処理手段は、差分検出手段によって検出された差分関係のデータに基づいて信号発生手段から出力される音声信号に対してエフェクト処理を施すような構成にしてもよい。   2. The audio control apparatus according to claim 1, wherein the correlation detecting unit detects a difference between the image signal output from the imaging unit and the audio signal output from the signal generating unit. The signal processing means includes a detection means (corresponding to the CPU 10 in FIG. 3 in the embodiment), and the signal processing means outputs an audio signal output from the signal generation means based on the difference relation data detected by the difference detection means. You may make it a structure which performs an effect process.

請求項1又は2の音声制御装置において、請求項3に記載したように、信号処理手段は、マイクロフォン内に収容されているような構成にしてもよい。
請求項1又は2の音声制御装置において、請求項4に記載したように、信号処理手段は、リバーブ処理のフィードバック成分を制御するような構成にしてもよい。
請求項1又は2の音声制御装置において、請求項5に記載したように、信号処理手段は、リバーブ処理のリバーブタイムを制御するような構成にしてもよい。
請求項1又は2の音声制御装置において、請求項6に記載したように、信号処理手段は、遅延処理のフィードバック成分を制御するような構成にしてもよい。
請求項1又は2の音声制御装置において、請求項7に記載したように、信号処理手段は、遅延処理の遅延時間を制御するような構成にしてもよい。
In the voice control device according to claim 1 or 2, as described in claim 3, the signal processing means may be accommodated in a microphone.
In the audio control apparatus according to claim 1 or 2, as described in claim 4, the signal processing means may be configured to control a feedback component of the reverberation process.
In the voice control device according to claim 1 or 2, as described in claim 5, the signal processing means may be configured to control a reverb time of the reverb process.
In the voice control device according to claim 1 or 2, as described in claim 6, the signal processing means may be configured to control the feedback component of the delay processing.
In the voice control device according to claim 1 or 2, as described in claim 7, the signal processing means may be configured to control the delay time of the delay processing.

請求項8に記載の音声制御方法は、入力される音声に応じてマイクロフォンから出力される音声信号を検出するステップAと、マイクロフォンに収容されて歌唱者の口の映像を撮像する撮像手段(実施形態においては、図2、図3のカメラ部6に相当する)から出力される画像信号を検出するステップBと、ステップAによって検出された音声信号と前記ステップBによって検出された画像信号との相関性を検出するステップCと、ステップCによって検出された相関性のデータに応じてマイクロフォンから出力される音声信号に対してエフェクト処理を施すステップDと、を実行する構成になっている。
ステップAないしステップDは、実施形態においては、図3のCPU10の処理に相当する。
The voice control method according to claim 8 includes a step A for detecting a voice signal output from a microphone in accordance with an input voice, and an imaging means for picking up an image of a singer's mouth contained in the microphone. In the embodiment, step B for detecting an image signal output from the camera unit 6 in FIGS. 2 and 3), the audio signal detected in step A, and the image signal detected in step B Step C for detecting the correlation and Step D for performing the effect processing on the audio signal output from the microphone in accordance with the correlation data detected in Step C are executed.
Step A to step D correspond to the processing of the CPU 10 in FIG. 3 in the embodiment.

請求項8の音声制御方法において、請求項9に記載したように、ステップCは、ステップAによって検出された音声信号とステップBによって出力された画像信号との差分関係を検出するステップEを有し、ステップDは、ステップEによって検出された差分関係のデータに基づいてマイクロフォンから出力される音声信号に対してエフェクト処理を施すような構成にしてもよい。   9. The audio control method according to claim 8, wherein, as described in claim 9, step C includes step E for detecting a difference relationship between the audio signal detected at step A and the image signal output at step B. Then, step D may be configured such that effect processing is performed on the audio signal output from the microphone based on the difference-related data detected in step E.

請求項8又は請求項9の音声制御方法において、請求項10に記載したように、ステップDは、マイクロフォン内に収容されている信号処理手段によってエフェクト処理を行うような構成にしてもよい。
請求項8又は請求項9の音声制御方法において、請求項11に記載したように、ステップDは、リバーブ処理のフィードバック成分を制御するような構成にしてもよい。
請求項8又は請求項9の音声制御方法において、請求項12に記載したように、ステップDは、リバーブ処理のリバーブタイムを制御するような構成にしてもよい。
請求項8又は請求項9の音声制御方法において、請求項13に記載したように、ステップDは、遅延処理のフィードバック成分を制御するような構成にしてもよい。
請求項8又は請求項9の音声制御方法において、請求項14に記載したように、ステップDは、遅延処理の遅延時間を制御するような構成にしてもよい。
In the audio control method according to claim 8 or 9, as described in claim 10, step D may be configured such that the effect processing is performed by the signal processing means accommodated in the microphone.
In the voice control method according to claim 8 or claim 9, as described in claim 11, step D may be configured to control the feedback component of the reverb process.
In the voice control method according to claim 8 or 9, as described in claim 12, step D may be configured to control the reverb time of the reverb process.
In the voice control method according to claim 8 or claim 9, as described in claim 13, step D may be configured to control a feedback component of delay processing.
In the voice control method according to claim 8 or claim 9, as described in claim 14, step D may be configured to control the delay time of the delay processing.

本発明の音声制御装置および音声制御方法によれば、歌唱者の口の動きと歌声の音色との相関性を利用して、実際よりも歌唱力を高めることができるという効果が得られる。   According to the voice control device and the voice control method of the present invention, the effect that the singing ability can be enhanced more than the actual one is obtained by utilizing the correlation between the movement of the singer's mouth and the tone of the singing voice.

以下、本発明による音声制御装置およびその音声制御方法の第1実施形態および第2実施形態について、図を参照して詳細に説明する。
図1は、各実施形態に共通するカラオケ用のマイクロフォン1の外観図であり、メッシュ状又は多数の孔が形成されたマイクカバー2が取り付けられている。図2は、マイクロフォン1の内部の構造を示す図である。マイクカバー2にはポリカーボネイトやアクリルなどの樹脂からなる透明保護カバー3が接着やその他の方法で設けられている。また、マイクカバー2の奥のマイクロフォン1の内部には基板4が取り付けられている。その基板4には、マイクカバー2を通して入力される音声を電気信号に変換して音声信号を出力するマイク部5、透明保護カバー3を通して見える歌唱者の口の映像を撮像するカメラ部6が搭載されている。図には示していないが、マイク部5には音声信号を増幅する増幅回路などが含まれている。また、カメラ部6には、CCDやCMOSなどの撮像素子、駆動回路、増幅回路、A/D変換回路などが含まれている。マイク部5からのアナログの音声信号はリード線7によってマイクロフォン1から出力され、カメラ部6からのデジタルの画像信号はリード線8によってマイクロフォン1から出力される。
Hereinafter, a first embodiment and a second embodiment of a voice control device and a voice control method according to the present invention will be described in detail with reference to the drawings.
FIG. 1 is an external view of a karaoke microphone 1 common to each embodiment, and a microphone cover 2 in which a mesh shape or a plurality of holes are formed is attached. FIG. 2 is a diagram showing an internal structure of the microphone 1. The microphone cover 2 is provided with a transparent protective cover 3 made of a resin such as polycarbonate or acrylic by bonding or other methods. A substrate 4 is attached inside the microphone 1 behind the microphone cover 2. The board 4 is equipped with a microphone section 5 that converts sound input through the microphone cover 2 into an electrical signal and outputs the sound signal, and a camera section 6 that captures an image of the singer's mouth that can be seen through the transparent protective cover 3. Has been. Although not shown in the figure, the microphone unit 5 includes an amplifier circuit for amplifying an audio signal. The camera unit 6 includes an image pickup device such as a CCD or CMOS, a drive circuit, an amplifier circuit, an A / D conversion circuit, and the like. An analog audio signal from the microphone unit 5 is output from the microphone 1 through the lead wire 7, and a digital image signal from the camera unit 6 is output from the microphone 1 through the lead wire 8.

図3は、本発明による音声制御装置を用いた第1実施形態におけるカラオケシステムの構成を示すブロック図である。図3において、CPU10は、システムバス11を介して、プログラムROM12、ワークRAM13、操作スイッチ14、表示部15、音源16、曲データROM17、DSP(Digital Signal Processor)部18、および図2に示したカメラ部6に接続されている。CPU10は、システムバス11を介して接続された上記各部との間でデータやコマンドを授受してカラオケシステム全体を制御する。   FIG. 3 is a block diagram showing the configuration of the karaoke system in the first embodiment using the voice control device according to the present invention. In FIG. 3, a CPU 10 is connected to a program ROM 12, a work RAM 13, an operation switch 14, a display unit 15, a sound source 16, a music data ROM 17, a DSP (Digital Signal Processor) unit 18 and a DSP (Digital Signal Processor) unit 18 via a system bus 11. It is connected to the camera unit 6. The CPU 10 controls the entire karaoke system by exchanging data and commands with the above-described units connected via the system bus 11.

プログラムROM12は、CPU10によって実行される音声制御処理のプログラムや初期データなどをあらかじめ格納している。また、一般的な口の形状のパターンを記憶している。ワークRAM13は、CPU10によって処理されるデータを一時的に記憶するワークエリアであり、各種のレジスタ、フラグが設けられている。スイッチ部14は、曲選択キー、曲スタートキー、曲停止キーなどのスイッチ群で構成され、操作に応じたコマンドやデータをCPU10に入力する。表示部15は、カラオケ曲のリストや歌詞などを表示する。音源16は、PCM波形データなどを記憶する波形ROMを内蔵しており、CPU10の発音コマンドに応じて、デジタルの楽音信号を生成する。曲データROM17は、カラオケの伴奏曲の楽音データおよび歌詞データを記憶している。   The program ROM 12 stores a voice control processing program executed by the CPU 10 and initial data in advance. Also, a general mouth shape pattern is stored. The work RAM 13 is a work area that temporarily stores data processed by the CPU 10, and is provided with various registers and flags. The switch unit 14 includes a group of switches such as a song selection key, a song start key, and a song stop key, and inputs commands and data corresponding to operations to the CPU 10. The display unit 15 displays a list of karaoke songs and lyrics. The sound source 16 has a built-in waveform ROM for storing PCM waveform data and the like, and generates a digital musical tone signal in accordance with the sound generation command of the CPU 10. The song data ROM 17 stores musical tone data and lyrics data of karaoke accompaniment.

一方、A/D変換回路20は、図2に示したマイク部5からの音声信号を入力して、その音声信号をアナログからデジタルに変換してDSP部18に入力する。音源16は、CPU10によって曲データROM17から読み出されて入力されたカラオケの伴奏曲に応じて、内部の波形ROMから読み出した波形データに基づいて伴奏曲の楽音信号を生成してDSP部18に入力する。DSP部18は、CPU10からの係数に基づいて、A/D変換回路20を介してマイク部5から入力される音声信号に対する信号処理を行って、その音声信号と伴奏曲の楽音信号とを合成してD/A変換回路21に入力する。D/A変換回路21は、DSP部18から入力された合成信号をデジタルからアナログに変換し、パワーアンプ22に入力してスピーカ23から発音させる。   On the other hand, the A / D conversion circuit 20 receives the audio signal from the microphone unit 5 shown in FIG. 2, converts the audio signal from analog to digital, and inputs it to the DSP unit 18. The sound source 16 generates an accompaniment musical tone signal based on the waveform data read from the internal waveform ROM in accordance with the karaoke accompaniment read and input from the song data ROM 17 by the CPU 10 to the DSP unit 18. input. The DSP unit 18 performs signal processing on the audio signal input from the microphone unit 5 via the A / D conversion circuit 20 based on the coefficient from the CPU 10 and synthesizes the audio signal and the musical tone signal of the accompaniment. And input to the D / A conversion circuit 21. The D / A conversion circuit 21 converts the composite signal input from the DSP unit 18 from digital to analog, and inputs it to the power amplifier 22 to generate sound from the speaker 23.

図4は、第1実施形態におけるDSP部18の内部構成を示すブロック図である。図4において、エフェクタ181は、マイク部5から入力された音声信号に対して、CPU10から入力された係数に基づいて信号処理を施して、信号合成部182に入力する。信号合成部182は、エフェクタ181から入力された音声信号と、図3の音源16から入力された伴奏曲の楽音信号とを合成して、図3のD/A変換回路21に入力する。エフェクタ181は、遅延部183および帰還部184で構成されている。遅延部183はマイク部5から入力された音声信号に対して、CPU10から入力される遅延係数に応じた遅延処理を施して出力する。帰還部184は、CPU10から入力されるフィードバック係数に応じて、遅延処理された音声信号を遅延部183の入力側にフィードバックする。この場合のエフェクト処理は、最もポピュラーなプレートタイプのリバーブであり、リバーブタイムは標準的に使用される4秒である。また、プリディレイは、自然な感じを演出する10msに固定されている。   FIG. 4 is a block diagram showing an internal configuration of the DSP unit 18 in the first embodiment. In FIG. 4, the effector 181 performs signal processing on the audio signal input from the microphone unit 5 based on the coefficient input from the CPU 10, and inputs the signal processing unit 182. The signal synthesis unit 182 synthesizes the audio signal input from the effector 181 and the musical tone signal of the accompaniment input from the sound source 16 in FIG. 3 and inputs the synthesized signal to the D / A conversion circuit 21 in FIG. The effector 181 includes a delay unit 183 and a feedback unit 184. The delay unit 183 performs a delay process corresponding to the delay coefficient input from the CPU 10 on the audio signal input from the microphone unit 5 and outputs the result. The feedback unit 184 feeds back the delayed audio signal to the input side of the delay unit 183 in accordance with the feedback coefficient input from the CPU 10. The effect processing in this case is the most popular plate type reverb, and the reverberation time is 4 seconds which is normally used. The pre-delay is fixed at 10 ms for producing a natural feeling.

次に、第1実施形態の音声制御処理方法について、図5ないし図9に示すCPU10のフローチャートおよびその他の図に基づいて説明する。
図5は、各実施形態に共通するCPU10のメインルーチンのフローチャートである。まず、所定のイニシャライズ(ステップSA1)の後、曲選択の操作に応じて曲選択処理を行い(ステップSA2)、曲スタートキーがオンされたか否かを判別する(ステップSA3)。曲スタートキーがオンされたときは、タイマーをスタートして(ステップSA4)、口の開閉の回数を表す変数Nを0にセットする(ステップSA5)。次に、選択された曲データを曲データROM17から読み出し(ステップSA6)、音源16に送付する(ステップSA7)。次に、カメラ部6からの画像信号に基づいて画像認識処理を実行し(ステップSA8)、DSP制御処理を実行する(ステップSA9)。この後は、曲が終了したか又はスイッチ部14の停止キーがオンされたか否かを判別し(ステップSA10)、曲の終了でなく、且つ停止キーがオンでない場合には、ステップSA6に移行して曲データの読み出しを繰り返す。ステップSA10において、曲の終了又は停止キーがオンの場合は、ステップSA2に移行して、スイッチ部14の操作に応じて次ぎの曲選択を行う。
Next, the voice control processing method of the first embodiment will be described based on the flowchart of the CPU 10 shown in FIGS. 5 to 9 and other drawings.
FIG. 5 is a flowchart of a main routine of the CPU 10 common to the embodiments. First, after predetermined initialization (step SA1), music selection processing is performed in accordance with the music selection operation (step SA2), and it is determined whether or not the music start key is turned on (step SA3). When the music start key is turned on, a timer is started (step SA4), and a variable N indicating the number of opening / closing of the mouth is set to 0 (step SA5). Next, the selected music data is read from the music data ROM 17 (step SA6) and sent to the sound source 16 (step SA7). Next, image recognition processing is executed based on the image signal from the camera unit 6 (step SA8), and DSP control processing is executed (step SA9). After this, it is determined whether or not the music is finished or the stop key of the switch unit 14 is turned on (step SA10). If the music is not finished and the stop key is not on, the process proceeds to step SA6. And repeat the reading of the song data. If the song end or stop key is on in step SA10, the process proceeds to step SA2 to select the next song in accordance with the operation of the switch unit 14.

図6および図7は、メインルーチンにおける画像認識処理のフローチャートである。図6において、曲の開始時刻であるか否か、すなわち、メインルーチンのイニシャライズ(ステップSA1)がされた直後であるか否かを判別し(ステップSB1)、イニシャライズの直後である場合には、最初の口認識処理を実行する(ステップSB2)。図8は、その口認識処理のフローチャートである。カメラ部6から画像を取り込み(ステップSC1)、白黒画像に変換する(ステップSC2)。次に、プログラムROM12に予め記憶されている口の形状のパターンとマッチングをとり(ステップSC3)、歌唱者の口を認識したか否かを判別する(ステップSC4)。認識できない場合には、ステップSC1において、再びカメラ部6からの画像の取り込みを行う。ステップSC4において歌唱者の口を認識したときは、口の両端と上下の4個のポイントの座標a1〜a4をワークRAM13のレジスタ(a1〜a4)に記憶する(ステップSC5)。図10は、口の両端の座標a1、a2および口の上下の座標a3、a4を示す図である。この座標a1〜a4によって口の開け度合いを検出することができる。   6 and 7 are flowcharts of the image recognition process in the main routine. In FIG. 6, it is determined whether or not it is the start time of the music, that is, whether or not it is immediately after the initialization of the main routine (step SA1) (step SB1). The first mouth recognition process is executed (step SB2). FIG. 8 is a flowchart of the mouth recognition process. An image is captured from the camera unit 6 (step SC1) and converted into a monochrome image (step SC2). Next, it is matched with a mouth shape pattern stored in advance in the program ROM 12 (step SC3), and it is determined whether or not the singer's mouth is recognized (step SC4). If it cannot be recognized, an image from the camera unit 6 is captured again in step SC1. When the mouth of the singer is recognized in step SC4, the coordinates a1 to a4 of both ends of the mouth and the upper and lower four points are stored in the registers (a1 to a4) of the work RAM 13 (step SC5). FIG. 10 is a diagram showing coordinates a1 and a2 at both ends of the mouth and upper and lower coordinates a3 and a4 of the mouth. The opening degree of the mouth can be detected by the coordinates a1 to a4.

図8のステップSC5において座標a1〜a4を記憶した後は、図6のフローチャートに戻って、ステップSB3に移行する。ステップSB3においては、記憶した座標a1〜a4をレジスタFa1〜Fa4に記憶(コピー)する。次に、a1〜a4に基づき口の大きさDを演算する(ステップSB4)。すなわち、図10において、口の両端の幅(a2−a1)および口の上下の間隔(a4−a3)に基づいて口の大きさDを演算する。さらに、その演算したDをレジスタFD、FFDにストアする(ステップSB5)。すなわち、イニシャライズの後は、D、FD、およびFFDの初期データは同じである。   After storing the coordinates a1 to a4 in step SC5 of FIG. 8, the process returns to the flowchart of FIG. 6 and proceeds to step SB3. In step SB3, the stored coordinates a1 to a4 are stored (copied) in the registers Fa1 to Fa4. Next, the mouth size D is calculated based on a1 to a4 (step SB4). That is, in FIG. 10, the mouth size D is calculated based on the widths of both ends of the mouth (a2-a1) and the vertical distance (a4-a3) of the mouth. Further, the calculated D is stored in the registers FD and FFD (step SB5). That is, after initialization, the initial data of D, FD, and FFD are the same.

このように、メインルーチンのイニシャライズの後は、上記ステップSB2ないしステップSB5を実行して、演算したDをFD、FFDにストアするが、その後は、ステップSB1において曲の開始時刻(最初の口認識)でないと判別されて、ステップSB1のNOからステップSB6に移行して、図8に示した2度目以降の口認識処理を実行する。この口認識処理によって、新たに口の両端の座標a1、a2および口の上下の座標a3、a4がワークRAM13に記憶される。したがって、前回の口の両端の座標および口の上下の座標がFa1〜Fa4に記憶され、今回の口の両端の座標および口の上下の座標がa1〜a4に記憶されることになる。次に、a1〜a4とFa1〜Fa4との差分、すなわち、水平方向のx座標および垂直方向のy座標の差分を下記のように求める(ステップSB7)。
Δx1=x1−xF1、Δy1=y1−yF1
Δx2=x2−xF2、Δy2=y2−yF2
Δx3=x3−xF3、Δy3=y3−yF3
Δx4=x4−xF4、Δy4=y4−yF4
そして、a1〜a4をFa1〜Fa4にストアする(ステップSB8)。
As described above, after the initialization of the main routine, steps SB2 to SB5 are executed, and the calculated D is stored in the FD and FFD. Thereafter, in step SB1, the music start time (first mouth recognition) is stored. ), The process proceeds from NO in step SB1 to step SB6, and the mouth recognition process for the second time and thereafter shown in FIG. 8 is executed. By this mouth recognition process, the coordinates a1 and a2 of the both ends of the mouth and the coordinates a3 and a4 of the top and bottom of the mouth are newly stored in the work RAM 13. Therefore, the previous coordinates of both ends of the mouth and the upper and lower coordinates of the mouth are stored in Fa1 to Fa4, and the current coordinates of both ends of the mouth and the upper and lower coordinates of the mouth are stored in a1 to a4. Next, the difference between a1 to a4 and Fa1 to Fa4, that is, the difference between the x coordinate in the horizontal direction and the y coordinate in the vertical direction is obtained as follows (step SB7).
Δx1 = x1−xF1, Δy1 = y1−yF1
Δx2 = x2-xF2, Δy2 = y2-yF2
Δx3 = x3-xF3, Δy3 = y3-yF3
Δx4 = x4-xF4, Δy4 = y4-yF4
Then, a1 to a4 are stored in Fa1 to Fa4 (step SB8).

次に、求めた差分に基づき同一方向移動成分を算出する(ステップSB9)。同一方向移動成分は、口の両端の2個のポイントの中心のx座標および口の上下の2個のポイントの中心のy座標の移動の有無で判断できる。したがって、下記の演算によって同一方向移動成分Δx、Δyを算出する。
Δx=(Δx1+Δx2)/2−(ΔFx1+ΔFx2)/2
Δy=(Δy1+Δy2)/2−(ΔFy1+ΔFy2)/2
次に、a1〜a4により同一方向の移動成分(Δx、Δy)を下記のように減算する(ステップSB10)。
Δx1’=Δx1−Δx、Δy1’=Δy1−Δy
Δx2’=Δx2−Δx、Δy2’=Δy2−Δy
Δx3’=Δx3−Δx、Δy3’=Δy3−Δy
Δx4’=Δx4−Δx、Δy4’=Δy4−Δy
なお、口とマイクロフォンとの距離によって画像が拡大又は縮小されるので、4個のポイントの座標が変化する。この場合を考慮して、口認識の後に図10の点線の面積すなわち口の面積を算出して座標データを正規化する。一般の画像処理の技法において、このような正規化については公知であるので、その演算処理の詳細な説明は省略する。
Next, the same direction moving component is calculated based on the obtained difference (step SB9). The same direction movement component can be determined by the presence or absence of movement of the x coordinate of the center of two points at both ends of the mouth and the y coordinate of the center of two points above and below the mouth. Therefore, the same direction moving components Δx and Δy are calculated by the following calculation.
Δx = (Δx1 + Δx2) / 2− (ΔFx1 + ΔFx2) / 2
Δy = (Δy1 + Δy2) / 2− (ΔFy1 + ΔFy2) / 2
Next, the movement components (Δx, Δy) in the same direction are subtracted as follows using a1 to a4 (step SB10).
Δx1 ′ = Δx1−Δx, Δy1 ′ = Δy1−Δy
Δx2 ′ = Δx2−Δx, Δy2 ′ = Δy2−Δy
Δx3 ′ = Δx3−Δx, Δy3 ′ = Δy3−Δy
Δx4 ′ = Δx4−Δx, Δy4 ′ = Δy4−Δy
Since the image is enlarged or reduced depending on the distance between the mouth and the microphone, the coordinates of the four points change. Considering this case, the area of the dotted line in FIG. 10, that is, the area of the mouth is calculated after the mouth recognition, and the coordinate data is normalized. Such normalization is well known in general image processing techniques, and therefore detailed description of the arithmetic processing is omitted.

次に、a1〜a4により口の大きさDを演算する(ステップSB11)。そして、Dが所定値より大きいか否かを判別する(ステップSB12)。所定値とは、口の開け方が歌っていない場合の上限の値である。したがって、Dが所定値よりも大きい場合には、歌っている状態であると判断する。この場合には、前回の口の大きさFDが前々回の口の大きさFFD以上であるか否かを判別し(ステップSB13)、FDがFFD以上である場合には、FDが今回の口の大きさよりも大きいか否かを判別する(ステップSB14)。例えば、図11に示すように、(A)の状態の口の大きさFFDが、(B)の状態で大きいFDに変化し、(C)の状態で再び小さいDに変化した場合には、FFDからDに推移する過程において、FDの大きさが極大値であることを示している。すなわち、口が大きくなって再び小さくなったことを示している。この場合には、口の開閉数を表す変数Nの値をインクリメントする(ステップSB15)。   Next, the mouth size D is calculated from a1 to a4 (step SB11). And it is discriminate | determined whether D is larger than predetermined value (step SB12). The predetermined value is an upper limit value when the mouth opening method is not singing. Therefore, when D is larger than a predetermined value, it is determined that the user is singing. In this case, it is determined whether or not the previous mouth size FD is greater than or equal to the previous mouth size FFD (step SB13). If FD is greater than or equal to FFD, FD is the current mouth size FFD. It is determined whether or not it is larger than the size (step SB14). For example, as shown in FIG. 11, when the mouth size FFD in the state (A) changes to a large FD in the state (B) and changes to a small D again in the state (C), In the process of transition from FFD to D, it shows that the magnitude of FD is a maximum value. That is, it shows that the mouth has become larger and smaller again. In this case, the value of the variable N indicating the number of opening / closing of the mouth is incremented (step SB15).

Nの値をインクリメントした後、又は、ステップSB14においてFDがD以下である場合、ステップSB13においてFDがFFDよりも小さい場合、すなわち、FDの大きさが極大値でなく、口が開閉されなかった場合、若しくはステップSB12においてDの大きさが所定値以下である場合には、FDの値をFFDにストアし(ステップSB16)、Dの値をFDにストアする(ステップSB17)。そして、図5のメインルーチンに戻る。   After incrementing the value of N or when FD is less than or equal to D in step SB14, if FD is smaller than FFD in step SB13, that is, the size of FD is not a maximum value and the mouth has not been opened or closed If the value of D is equal to or smaller than a predetermined value in step SB12, the value of FD is stored in FFD (step SB16), and the value of D is stored in FD (step SB17). Then, the process returns to the main routine of FIG.

なお、ステップSB7からステップSB11の演算処理の代わり、又は、これらの演算処理と併せて、図11に示す口の左右の幅FFH、FH、Hと、口の上下の距離FFV、FV、Vのそれぞれの比であるFFV/FFH、FV/FH、V/Hを演算して、口の開閉を判別し、又は、口の平行移動の場合および口とマイクロフォンとの距離によって画像が拡大又は縮小した場合の補正処理を行う構成にしてもよい。   It should be noted that instead of the calculation processing from step SB7 to step SB11 or in combination with these calculation processing, the widths FFH, FH, H of the left and right sides of the mouth shown in FIG. The respective ratios FFV / FFH, FV / FH, and V / H are calculated to determine the opening / closing of the mouth, or the image is enlarged or reduced depending on the translation of the mouth and the distance between the mouth and the microphone. It may be configured to perform the correction process.

図9は、メインルーチンのステップSA9における第1実施形態のDSP制御処理のフローチャートである。タイマーがエフェクト処理のインターバルである一定時間をカウントしたか否かを判別し(ステップSD1)、一定時間をカウントしていない場合にはメインルーチンに戻るが、一定時間をカウントしたときは、Nの値に基づいてsend係数を生成する(ステップSD2)。send係数とは、図4のDSP部18の帰還部184におけるフィードバック成分(量など)を決定するパラメータである。さらに、Nの値に基づいてtime係数を生成する(ステップSD3)。time係数とは、DSP部18の遅延部183における遅延時間を決定するパラメータである。次に、生成したsend係数およびtime係数をDSP部18に供給する(ステップSD4)。この後は、Nの値に初期値の0をストアし(ステップSD5)、タイマーをクリアして再びスタートさせる(ステップSD6)。そして、図5のメインルーチンに戻る。   FIG. 9 is a flowchart of the DSP control process of the first embodiment in step SA9 of the main routine. It is determined whether or not the timer has counted a certain time, which is an effect processing interval (step SD1). If the certain time has not been counted, the process returns to the main routine. A send coefficient is generated based on the value (step SD2). The send coefficient is a parameter that determines a feedback component (amount or the like) in the feedback unit 184 of the DSP unit 18 in FIG. Further, a time coefficient is generated based on the value of N (step SD3). The time coefficient is a parameter that determines the delay time in the delay unit 183 of the DSP unit 18. Next, the generated send coefficient and time coefficient are supplied to the DSP unit 18 (step SD4). Thereafter, the initial value 0 is stored as the value of N (step SD5), the timer is cleared and started again (step SD6). Then, the process returns to the main routine of FIG.

図12は、口の開閉数Nに対するDSP部18に対する係数Cdspの特性を示す図である。係数Cdspには、DSP部18の遅延部183に対する遅延係数Cdsp(delay time)および帰還係数Cdsp(send)がある。図12に示すように、Nの値が小さいほど、すなわち、口の開閉頻度が低いほど、どちらの係数も大きくなる。この結果、口をあまり動かさずにムードのある曲を歌っている場合には、リバーブやエコーを深くして発音するので、実際よりも歌唱力を向上することができる。逆に、口を頻繁に開けて歯切れよく歌っている人の場合には、元々歌唱力のある人が多いので、リバーブやエコーをカットしてそのまま音声信号を出力することで、歌唱力を活かした発音を行う。   FIG. 12 is a diagram showing the characteristic of the coefficient Cdsp for the DSP unit 18 with respect to the opening / closing number N of the mouth. The coefficient Cdsp includes a delay coefficient Cdsp (delay time) for the delay unit 183 of the DSP unit 18 and a feedback coefficient Cdsp (send). As shown in FIG. 12, the smaller the value of N, that is, the lower the opening / closing frequency of the mouth, the larger both coefficients. As a result, when a song with a mood is sung without much movement of the mouth, the reverb and the echo are deeply pronounced, so that the singing ability can be improved more than actual. On the other hand, if you are singing crisply with your mouth open frequently, there are many people who originally have singing ability, so you can use the singing ability by cutting the reverb and echo and outputting the audio signal as it is. To pronounce.

例えば、プレートタイプのリバーブにおいて、リバーブタイムを4秒、プリディレイタイムを10msとした場合に、口の開閉頻度が高くNの値が大きいときはリバーブをかけない。一方、口の開閉頻度が中程度のNの値の場合には、send量(変化量)を−10dBとし、口の開閉頻度が低くNの値が小さいときは、send量を−3dBにして、口の開閉頻度が低くなるに従ってリバーブを次第に深くする。
あるいは、口の開閉頻度にかかわらずsend量を一定の−5dBにした状態で、口の開閉頻度が多いときはリバーブタイムを0.5秒、開閉頻度が中程度のときはリバーブタイムを2.8秒、開閉頻度が高いときはリバーブタイムを4.8秒として、開閉頻度が低くなるほどリバーブを次第に深くする。
あるいは、ディレイタイムを150msに固定した状態で、口の開閉頻度が高いときはリバーブをかけず、口の開閉頻度が中程度のNの値の場合には、send量を−10dBとし、口の開閉頻度が低くNの値が小さいときは、send量を−3dBにしてリバーブを次第に深くする。
あるいは、send量を−5dBに固定した状態で、口の開閉頻度が高いときはディレイタイムを5msとし、口の開閉頻度が中程度のときはディレイタイムを50msとし、口の開閉頻度が低いときはディレイタイムを500msにして、リバーブを次第に深くする。
また、図11(B)のように口が開く極大値から次の極大値までの間隔の平均、すなわち、歌うテンポに応じてディレイタイムを設定する構成にして、音楽業界用語では「プレートタイム」と称するディレイタイムを実現する構成にしてもよい。
For example, in a plate-type reverb, when the reverb time is 4 seconds and the pre-delay time is 10 ms, the reverb is not applied when the opening / closing frequency of the mouth is high and the value of N is large. On the other hand, when the opening / closing frequency of the mouth is a medium value of N, the send amount (change amount) is −10 dB, and when the opening / closing frequency of the mouth is low and the value of N is small, the send amount is −3 dB. The reverb is gradually deepened as the opening and closing frequency of the mouth decreases.
Alternatively, when the send amount is constant -5 dB regardless of the opening / closing frequency of the mouth, the reverb time is 0.5 seconds when the opening / closing frequency of the mouth is high, and the reverb time is 2. When the open / close frequency is high for 8 seconds, the reverb time is set to 4.8 seconds, and the reverb is gradually deepened as the open / close frequency is low.
Alternatively, with the delay time fixed at 150 ms, when the mouth opening / closing frequency is high, no reverb is applied, and when the mouth opening / closing frequency is a medium N value, the send amount is set to −10 dB, When the switching frequency is low and the value of N is small, the send amount is set to -3 dB and the reverb is gradually deepened.
Alternatively, with the send amount fixed at −5 dB, when the mouth opening / closing frequency is high, the delay time is set to 5 ms, when the mouth opening / closing frequency is medium, the delay time is set to 50 ms, and the mouth opening / closing frequency is low. Increases the delay time to 500 ms and gradually deepens the reverb.
Also, as shown in FIG. 11B, the delay time is set according to the average interval from the maximum value at which the mouth opens to the next maximum value, that is, the tempo of singing. It may be configured to realize a delay time called.

このように、第1実施形態のカラオケシステムは、マイクロフォン1に収容されて、入力される音声に応じて音声信号を出力するマイク部5と、マイクロフォン1に収容されて歌唱者の口の映像を撮像して画像信号を出力するカメラ部6とを備えている。CPU10は、マイク部5から出力された音声信号とカメラ部6によって出力された画像信号との差分関係を検出して、その差分関係のデータに応じてDSP部18に制御信号を与えて、マイク部5から出力される音声信号に対してエフェクト処理を施す。
したがって、歌唱者の口の動きと歌声の音色との相関性を利用して、実際よりも歌唱力を高めることができる。
As described above, the karaoke system according to the first embodiment is housed in the microphone 1 and outputs a sound signal according to the input sound, and the microphone 1 accommodates the video of the singer's mouth. And a camera unit 6 that captures an image and outputs an image signal. The CPU 10 detects a difference relationship between the audio signal output from the microphone unit 5 and the image signal output from the camera unit 6, and gives a control signal to the DSP unit 18 according to the difference relationship data, Effect processing is performed on the audio signal output from the unit 5.
Therefore, the singing ability can be enhanced more than actual using the correlation between the movement of the singer's mouth and the tone of the singing voice.

次に、本発明の第2実施形態について説明する。
図13は、本発明による音声制御装置を用いた第2実施形態におけるカラオケシステムの構成を示すブロック図である。図13において、CPU10は、システムバス11を介して、プログラムROM12、ワークRAM13、スイッチ部14、表示部15、音源16、曲データROM17、A/D変換回路20、および図2に示したカメラ部6に接続されている。CPU10は、システムバス11を介して接続された上記各部との間でデータやコマンドを授受してカラオケシステム全体を制御する。また、図2に示したマイク部5は音声信号をA/D変換回路20に入力する。A/D変換回路20は、その音声信号をアナログからデジタルに変換してDSP部18に入力する。DSP部18の内部構成については、図4に示した第1実施形態と同じである。
このように、第2実施形態におけるカラオケシステムは、第1実施形態の構成とほとんど同じであるが、第2実施形態においては、A/D変換回路20の出力がシステムバス11に接続されている。CPU10は、以下に記載するように、A/D変換回路20から得られる音声信号を取り込んでDSP部18を制御する。
Next, a second embodiment of the present invention will be described.
FIG. 13 is a block diagram showing a configuration of a karaoke system in the second embodiment using the voice control device according to the present invention. In FIG. 13, a CPU 10 is connected via a system bus 11 to a program ROM 12, a work RAM 13, a switch unit 14, a display unit 15, a sound source 16, a song data ROM 17, an A / D conversion circuit 20, and the camera unit shown in FIG. 6 is connected. The CPU 10 controls the entire karaoke system by exchanging data and commands with the above-described units connected via the system bus 11. The microphone unit 5 shown in FIG. 2 inputs an audio signal to the A / D conversion circuit 20. The A / D conversion circuit 20 converts the audio signal from analog to digital and inputs it to the DSP unit 18. The internal configuration of the DSP unit 18 is the same as that of the first embodiment shown in FIG.
As described above, the karaoke system in the second embodiment is almost the same as the configuration of the first embodiment, but in the second embodiment, the output of the A / D conversion circuit 20 is connected to the system bus 11. . As described below, the CPU 10 takes in an audio signal obtained from the A / D conversion circuit 20 and controls the DSP unit 18.

図14は、第2実施形態におけるCPU10のメインルーチンのフローチャートである。まず、所定のイニシャライズ(ステップSG1)の後、曲選択の操作に応じて曲選択処理を行い(ステップSG2)、曲スタートキーがオンされたか否かを判別する(ステップSG3)。曲スタートキーがオンされたときは、タイマーをスタートする(ステップSG4)。次に、音声信号のエンベロープの前々回の値をストアするレジスタFFE、および前回の値をストアするレジスタFEをともに0にクリアする(ステップSG5)。さらに、口の開閉の回数を表す変数Nおよび音声信号のエンベロープの山(極大値)の数を表すMをともに0にセットする(ステップSG6)。次に、選択された曲データを曲データROM17から読み出し(ステップSG7)、音源16に送付する(ステップSG8)。次に、カメラ部6からの画像信号に基づいて画像認識処理を実行し(ステップSG9)、A/D変換回路20を介してマイク部5から得られる音声信号に基づいてマイク入力制御処理を実行し(ステップSG10)、DSP制御処理を実行する(ステップSA11)。この後は、曲が終了したか又は停止キーがオンされたか否かを判別し(ステップSA12)、曲の終了でなく、且つ停止キーがオンでない場合には、ステップSG7に移行して曲データの読み出しを繰り返す。ステップSG12において、曲の終了又は停止キーがオンの場合は、ステップSG2に移行して、スイッチ部14の操作に応じて次の曲選択を行う。
なお、このメインルーチンにおいて、ステップSG9の画像処理、およびその画像処理における口認識処理は、図6、図7に示した第1実施形態の画像処理、および図8に示した第1実施形態の口認識処理と同じである。
FIG. 14 is a flowchart of the main routine of the CPU 10 in the second embodiment. First, after predetermined initialization (step SG1), music selection processing is performed in accordance with the music selection operation (step SG2), and it is determined whether or not the music start key is turned on (step SG3). When the song start key is turned on, a timer is started (step SG4). Next, both the register FFE for storing the previous value of the envelope of the audio signal and the register FE for storing the previous value are cleared to 0 (step SG5). Further, a variable N representing the number of times of opening and closing the mouth and M representing the number of peaks (maximum values) of the envelope of the audio signal are both set to 0 (step SG6). Next, the selected music data is read from the music data ROM 17 (step SG7) and sent to the sound source 16 (step SG8). Next, image recognition processing is executed based on the image signal from the camera unit 6 (step SG9), and microphone input control processing is executed based on the audio signal obtained from the microphone unit 5 via the A / D conversion circuit 20. (Step SG10), and DSP control processing is executed (step SA11). After this, it is determined whether or not the song is finished or the stop key is turned on (step SA12). If the song is not finished and the stop key is not turned on, the process proceeds to step SG7 and the song data is transferred. Repeat reading. In step SG12, if the song end or stop key is on, the process proceeds to step SG2, and the next song is selected in accordance with the operation of the switch unit.
In this main routine, the image processing in step SG9 and the mouth recognition processing in the image processing are the same as those in the first embodiment shown in FIGS. 6 and 7 and the first embodiment shown in FIG. This is the same as the mouth recognition process.

図15は、ステップSG10のマイク入力制御処理のフローチャートである。A/D変換回路20から出力される音声信号のエンベロープを抽出し(ステップSH1)、そのエンベロープ値をレジスタEにストアする(ステップSH2)。そして、Eにストアしたエンベロープ値が所定値より大きいか否かを判別する(ステップSH3)。所定値とは、歌唱者がマイクロフォン1に向かって歌っていないと判断される上限値である。Eのエンベロープ値が所定値より大きい場合、すなわち、歌唱者がマイクロフォン1に向かって歌っていると判断した場合には、FEにストアされている前回のエンベロープ値がFFEにストアされている前々回のエンベロープ値以上であるか否かを判別する(ステップSH4)。FEの値がFFEの値以上である場合には、さらにFEの値がEにストアされている今回のエンベロープ値より大きいか否かを判別する(ステップSH5)。図14のステップSG1のイニシャライズの直後は、FEおよびFFEの値は、ステップSG5において0に初期化されているので、ステップSH6の処理はスキップしてステップSH7に移行するが、このマイク入力制御処理が2回繰り返された後は、FFEに前々回のエンベロープ値がストアされ、FEに前回のエンベロープ値がストアされる。   FIG. 15 is a flowchart of the microphone input control process in step SG10. The envelope of the audio signal output from the A / D conversion circuit 20 is extracted (step SH1), and the envelope value is stored in the register E (step SH2). Then, it is determined whether or not the envelope value stored in E is larger than a predetermined value (step SH3). The predetermined value is an upper limit value at which it is determined that the singer is not singing toward the microphone 1. If the envelope value of E is larger than the predetermined value, that is, if it is determined that the singer is singing into the microphone 1, the previous envelope value stored in the FE is It is determined whether or not the value is greater than or equal to the envelope value (step SH4). If the FE value is greater than or equal to the FFE value, it is further determined whether or not the FE value is greater than the current envelope value stored in E (step SH5). Immediately after the initialization of step SG1 in FIG. 14, since the values of FE and FFE are initialized to 0 in step SG5, the process of step SH6 is skipped and the process proceeds to step SH7. Is repeated twice, the previous envelope value is stored in the FFE, and the previous envelope value is stored in the FE.

3回目のマイク入力制御処理において、FEの値がEの値より大きい場合、例えば、図17に示すエンベロープの推移で、エンベロープ値が所定値より大きい状態で、FFEの値から上昇してFEの値になり、その後Eの値に下降した場合には、FEのエンベロープは極大値である。すなわち、歌唱者は口を開けて声を発した状態であると判断できる。したがってこの場合には、エンベロープの山を表すMの値をインクリメントする(ステップSH6)。この後、又は、ステップSH5においてFEの値がEの値より大きくない場合、ステップSH4においてFEの値がFFEの値より小さい場合、若しくは、ステップSH3においてEの値が所定値以下の場合には、ステップSH7に移行してFEの値をFFEにストアし、さらに、Eの値をFEにストアする(ステップSH8)。そして、図14のメインルーチンに戻る。   In the third microphone input control process, when the value of FE is larger than the value of E, for example, in the transition of the envelope shown in FIG. When the value reaches the value E and then falls to the value E, the envelope of the FE is a maximum value. That is, it can be determined that the singer is in a state of opening his mouth and speaking out. Therefore, in this case, the value of M representing the peak of the envelope is incremented (step SH6). After this, or when the value of FE is not larger than the value of E at step SH5, when the value of FE is smaller than the value of FFE at step SH4, or when the value of E is less than or equal to a predetermined value at step SH3 In step SH7, the value of FE is stored in FFE, and the value of E is stored in FE (step SH8). Then, the process returns to the main routine of FIG.

図16は、メインルーチンにおけるステップSG11のDSP制御処理のフローチャートである。タイマーがエフェクト処理のインターバルである一定時間をカウントしたか否かを判別し(ステップSJ1)、一定時間をカウントしていない場合にはメインルーチンに戻るが、一定時間をカウントしたときは、Mの値とNの値の差の絶対値を算出してレジスタαにストアする(ステップSJ2)。そして、αに基づいてsend係数を生成する(ステップSJ3)。send係数は、第1実施形態と同様に、図4のDSP部18の帰還部184におけるフィードバック成分(量など)を決定するパラメータである。さらに、αの値に基づいてtime係数を生成する(ステップSJ4)。time係数も、第1実施形態と同様に、DSP部18の遅延部183における遅延時間を決定するパラメータである。次に、生成したsend係数およびtime係数をDSP部18に供給する(ステップSJ5)。この後は、M、Nの値に初期値の0をストアし(ステップSJ6)、タイマーをクリアして再びスタートさせる(ステップSJ7)。そして、図13のメインルーチンに戻る。 FIG. 16 is a flowchart of the DSP control process in step SG11 in the main routine. It is determined whether or not the timer has counted a certain time as an effect processing interval (step SJ1). If the certain time has not been counted, the process returns to the main routine, but if the certain time has been counted, The absolute value of the difference between the value and the value of N is calculated and stored in the register α (step SJ2). Then, a send coefficient is generated based on α (step SJ3). As in the first embodiment, the send coefficient is a parameter that determines a feedback component (such as an amount) in the feedback unit 184 of the DSP unit 18 in FIG. Further, a time coefficient is generated based on the value of α (step SJ4). The time coefficient is also a parameter for determining the delay time in the delay unit 183 of the DSP unit 18 as in the first embodiment. Next, the generated send coefficient and time coefficient are supplied to the DSP unit 18 (step SJ5). After this, the initial value 0 is stored in the values of M and N (step SJ6), the timer is cleared and restarted (step SJ7). Then, the process returns to the main routine of FIG.

図18は、音声信号のエンベロープの山の数Mと口の開閉数Nとの差の絶対値であるαに対するDSP部18に対する係数Cdspの特性を示す図である。第1実施形態と同様に、係数Cdspには、DSP部18の遅延部183に対する遅延係数Cdsp(delay time)および帰還係数Cdsp(send)がある。図18に示すように、αの値が大きいほど、どちらの係数も大きくなる。この結果、口をあまり動かさずにムードのある曲を歌っている場合で、音声信号のエンベロープの山を検出したときには、リバーブやエコーを効かせて発音するので、実際よりも歌唱力を向上することができる。逆に、口を頻繁に開けて歯切れよく歌っている人の場合には、元々歌唱力のある人が多いので、リバーブやエコーをカットして音声信号をそのまま出力することで、歌唱力を活かした発音を行う。また、曲の間の間奏部分で口を閉じた状態でハミングやシャウトのように声を出している場合、あるいは、曲のエンディングにおいて口を大きく開けた状態で声を小さくして余韻に浸っている場合には、リバーブを深くしてムードを盛り上げるようなエフェクト処理を行う。   FIG. 18 is a diagram illustrating the characteristic of the coefficient Cdsp for the DSP unit 18 with respect to α, which is the absolute value of the difference between the number M of the envelopes of the audio signal and the number N of mouth opening / closing. Similar to the first embodiment, the coefficient Cdsp includes a delay coefficient Cdsp (delay time) and a feedback coefficient Cdsp (send) for the delay unit 183 of the DSP unit 18. As shown in FIG. 18, as the value of α increases, both coefficients increase. As a result, when you are singing a moody song without moving your mouth too much, if you detect a peak of the envelope of the audio signal, you can use reverb and echo to pronounce it, improving the singing ability more than it actually is be able to. On the other hand, if you are singing crisply with your mouth open frequently, there are many people who originally have singing ability, so you can use the singing ability by cutting the reverb and echo and outputting the audio signal as it is. To pronounce. Also, if you are singing like a humming or shout with your mouth closed at the interlude part of the song, or if your mouth is wide open during the ending of the song, make your voice lower and immerse yourself in the finish. If so, effect processing is performed to increase the mood by deepening the reverb.

具体的には、口の開閉頻度が高い状態(頻度高)、口の開閉頻度が中程度の状態(頻度中)、又は口の開閉頻度が低い状態(頻度低)の3つの場合を、さらに、音声信号のエンベロープが所定値より大きい状態(発生有り)又は音声信号のエンベロープが所定値以下の状態(発生無し)で分類すると、これら6通りの歌唱状態のエフェクト処理の制御目的は下記のようになる。
(1)<頻度高、音声有り:通常テンポの歌声>適度なエフェクト処理
(2)<頻度高、音声無し>声は出ていないので、純粋に伴奏曲だけを聴かせるように、不要部分をカットして聞きやすくするエフェクト処理
(3)<頻度中、音声有り:スローテンポの歌声>響きを深くして雰囲気を盛り上げるエフェクト処理
(4)<頻度中、音声無し>声は出ていないので、純粋に伴奏曲だけを聴かせるように、不要部分をカットして聞きやすくするエフェクト処理
(5)<頻度低、音声有り:ハミングやシャウトの歌声>ゆったりと長く伸ばすようなエフェクト処理
(6)<頻度低、音声無し>声は出ていないので、純粋に伴奏曲だけを聴かせるように、不要部分をカットして聞きやすくするエフェクト処理
この6通りの歌唱状態におけるsend(リバーブ、ディレイ)、リバーブタイム、およびディレイタイムの例を図19に示す。
Specifically, the three cases of a state where the mouth opening / closing frequency is high (high frequency), a state where the mouth opening / closing frequency is medium (medium frequency), or a state where the mouth opening / closing frequency is low (frequency) are further When the sound signal envelope is classified into a state where the envelope of the audio signal is larger than the predetermined value (occurrence occurs) or the state where the envelope of the audio signal is equal to or smaller than the predetermined value (occurrence occurs), the control purpose of the effect processing in these six singing states is as follows: become.
(1) <High frequency, with voice: normal tempo singing voice> Moderate effect processing (2) <High frequency, no voice> Since no voice is produced, unneeded parts can be heard so that only the accompaniment is heard Effect processing to cut and make it easy to hear (3) <With voice during frequency: Singing voice of slow tempo> Effect processing to deepen the sound and excite the atmosphere (4) <No voice during frequency> Since there is no voice, Effect processing that cuts unnecessary parts and makes it easier to hear so that only the accompaniment is heard (5) <Infrequent, with voice: humming and shout singing voice> Effect processing that stretches slowly and long (6) < Low frequency, no voice> Since there is no voice, effect processing that makes it easy to hear by cutting unnecessary parts so that only the accompaniment can be heard purely. nd (reverb, delay), an example of a reverberation time, and delay time in FIG.

このように、第2実施形態のカラオケシステムは、マイクロフォン1に収容されて入力される音声に応じて音声信号を出力するマイク部5と、マイクロフォン1に収容されて歌唱者の口の映像を撮像して画像信号を出力するカメラ部6とを備えている。CPU10は、マイク部5から出力された音声信号のエンベロープとカメラ部6によって出力された画像信号との差分関係を検出して、その差分関係のデータに応じてDSP部18に制御信号を与えて、マイク部5から出力される音声信号に対してエフェクト処理を施す。
したがって、歌唱者の歌声と歌唱者の口の動きとの差に応じてエフェクトを制御することにより、歌唱者の口の動きと歌声の音色との相関性を利用して、実際よりも歌唱力を高めることができる。
As described above, the karaoke system according to the second embodiment captures an image of a singer's mouth accommodated in the microphone 1 and the microphone unit 5 that outputs an audio signal according to the sound accommodated in the microphone 1 and input. And a camera unit 6 for outputting an image signal. The CPU 10 detects the differential relationship between the envelope of the audio signal output from the microphone unit 5 and the image signal output from the camera unit 6, and gives a control signal to the DSP unit 18 according to the data of the differential relationship. Then, effect processing is performed on the audio signal output from the microphone unit 5.
Therefore, by controlling the effect according to the difference between the singing voice of the singer and the movement of the singer's mouth, the correlation between the singing's mouth movement and the timbre of the singing voice is used, and the singing ability is more than actual. Can be increased.

なお、上記第1および第2実施形態において、マイク部5から出力された音声信号とカメラ部6によって出力された画像信号との相関性を両者の差分関係としたが、相関性は差分関係に限定されるものでない。
図11に示した口の縦横の比と音声信号の波形データと相関性を検出して、その相関性に対応する制御データをDSP部18に与えて、マイク部5から出力される音声信号に対してエフェクト処理を施すような構成にしてもよい。例えば、縦/横の比が小さく音声信号の波形データの周波数が変動している場合には、口をあまり開けずに声を震わせて歌っている状態である考えられるので、ビブラートを強調したエフェクト処理を施す。あるいは、縦/横の比が大きく音声信号の波形データの周波数が高い場合には、高い声を出そうとがんばって歌っている状態である考えられるので、高音を強調したエフェクト処理を施す。
また、音声信号の複数種類の波形データにそれぞれ対応する画像信号の口の形状のパターンと、各パターンに対応する制御信号のデータとをあらかじめ記憶し、カメラ部6によって出力された画像信号に対応する制御信号のデータを読み出して、その制御信号をDSP部18に与えてマイク部5から出力される音声信号に対してエフェクト処理を施すような構成にしてもよい。
In the first and second embodiments, the correlation between the audio signal output from the microphone unit 5 and the image signal output from the camera unit 6 is the difference relationship between the two, but the correlation is the difference relationship. It is not limited.
The correlation between the aspect ratio of the mouth and the waveform data of the audio signal shown in FIG. 11 is detected, control data corresponding to the correlation is supplied to the DSP unit 18, and the audio signal output from the microphone unit 5 is output. Alternatively, the effect processing may be performed. For example, when the ratio of the aspect ratio of the audio signal is small and the frequency of the waveform data of the audio signal is fluctuating, it can be considered that the voice is sung without shaking your mouth so much, so an effect that emphasizes vibrato Apply processing. Alternatively, when the ratio of the vertical / horizontal ratio is large and the frequency of the waveform data of the audio signal is high, it can be considered that the voice is being sung in an effort to produce a high voice.
In addition, the mouth shape pattern of the image signal corresponding to each of a plurality of types of waveform data of the audio signal and the control signal data corresponding to each pattern are stored in advance, and the image signal output by the camera unit 6 is supported. The control signal data to be read may be read out, and the control signal may be provided to the DSP unit 18 to effect the audio signal output from the microphone unit 5.

本発明の各実施形態におけるマイクロフォンの外観図。The external view of the microphone in each embodiment of this invention. 図1のマイクロフォンの内部構造を示す図。The figure which shows the internal structure of the microphone of FIG. 第1実施形態のカラオケシステムの構成を示すブロック図。The block diagram which shows the structure of the karaoke system of 1st Embodiment. 図1におけるDSP部の内部構成を示すブロック図。The block diagram which shows the internal structure of the DSP part in FIG. 第1実施形態におけるCPUのメインルーチンのフローチャート。The flowchart of the main routine of CPU in 1st Embodiment. 図5における画像認識処理のフローチャート。6 is a flowchart of image recognition processing in FIG. 5. 図6に続く画像認識処理のフローチャート。The flowchart of the image recognition process following FIG. 図6における口認識処理のフローチャート。The flowchart of the mouth recognition process in FIG. 図5におけるDSP制御処理のフローチャート。6 is a flowchart of DSP control processing in FIG. 第1実施形態における口の両端と上下の4個のポイントの座標を示す図。The figure which shows the coordinate of four points of the both ends of an opening | mouth and upper and lower sides in 1st Embodiment. 第1実施形態における口の開閉の推移を示す図。The figure which shows transition of opening and closing of the opening | mouth in 1st Embodiment. 第1実施形態における口の開閉数に対するDSP部に対する係数の特性を示す図。The figure which shows the characteristic of the coefficient with respect to the DSP part with respect to the opening-and-closing number of mouths in 1st Embodiment. 第2実施形態のカラオケシステムの構成を示すブロック図。The block diagram which shows the structure of the karaoke system of 2nd Embodiment. 第2実施形態におけるCPUのメインルーチンのフローチャート。The flowchart of the main routine of CPU in 2nd Embodiment. 図14におけるマイク入力制御処理のフローチャート。The flowchart of the microphone input control process in FIG. 図14におけるDSP制御処理のフローチャート。The flowchart of the DSP control processing in FIG. 第2実施形態における音声信号のエンベロープを示す図。The figure which shows the envelope of the audio | voice signal in 2nd Embodiment. 第2実施形態における口の開閉数と音声信号のエンベロープとの差に対するDSP部に対する係数の特性を示す図。The figure which shows the characteristic of the coefficient with respect to the DSP part with respect to the difference of the opening / closing number of mouths and the envelope of an audio | voice signal in 2nd Embodiment. 第2実施形態における口の状態に対するDSP部に対する係数の具体例を示す図。The figure which shows the specific example of the coefficient with respect to the DSP part with respect to the state of the mouth in 2nd Embodiment.

符号の説明Explanation of symbols

1 マイクロフォン
2 マイクカバー
3 透明保護カバー
4 基板
5 マイク部
6 カメラ部
10 CPU
12 プログラムROM
13 ワークRAM
16 音源
17 曲データROM
18 DSP部
20 A/D変換回路
181 エフェクタ
182 信号合成部
183 遅延部
184 帰還部
DESCRIPTION OF SYMBOLS 1 Microphone 2 Microphone cover 3 Transparent protective cover 4 Board | substrate 5 Microphone part 6 Camera part 10 CPU
12 Program ROM
13 Work RAM
16 sound source 17 song data ROM
18 DSP unit 20 A / D conversion circuit 181 Effector 182 Signal synthesis unit 183 Delay unit 184 Feedback unit

Claims (14)

マイクロフォンに収容され、入力される音声に応じて音声信号を出力する信号発生手段と、
前記マイクロフォンに収容され、歌唱者の口の映像を撮像して画像信号を出力する撮像手段と、
前記信号発生手段から出力された音声信号と前記撮像手段によって出力された画像信号との相関性を検出する相関性検出手段と、
前記相関性検出手段によって検出された相関性のデータに応じて前記信号発生手段から出力される音声信号に対してエフェクト処理を施す信号処理手段と、
を備えた音声制御装置。
A signal generating means that is accommodated in a microphone and outputs an audio signal according to the input audio;
Imaging means housed in the microphone and imaging a singer's mouth and outputting an image signal;
Correlation detecting means for detecting the correlation between the audio signal output from the signal generating means and the image signal output by the imaging means;
Signal processing means for effecting the audio signal output from the signal generating means according to the correlation data detected by the correlation detecting means;
A voice control device.
前記相関性検出手段は、前記撮像手段から出力された画像信号と前記信号発生手段から出力される音声信号との差分関係を検出する差分検出手段を備え、前記信号処理手段は、前記差分検出手段によって検出された差分関係のデータに基づいて前記信号発生手段から出力される音声信号に対してエフェクト処理を施すことを特徴とする請求項1に記載の音声制御装置 The correlation detection unit includes a difference detection unit that detects a difference relationship between an image signal output from the imaging unit and an audio signal output from the signal generation unit, and the signal processing unit includes the difference detection unit. The sound control apparatus according to claim 1, wherein effect processing is performed on the sound signal output from the signal generating unit based on the difference relation data detected by the step . 前記信号処理手段は、前記マイクロフォン内に収容されていることを特徴とする請求項1又は2に記載の音声制御装置。   The voice control apparatus according to claim 1, wherein the signal processing unit is accommodated in the microphone. 前記信号処理手段は、リバーブ処理のフィードバック成分を制御することを特徴とする請求項1又は2に記載の音声制御装置。   The audio control apparatus according to claim 1, wherein the signal processing unit controls a feedback component of reverberation processing. 前記信号処理手段は、リバーブ処理のリバーブタイムを制御することを特徴とする請求項1又は2に記載の音声制御装置。 The voice control apparatus according to claim 1, wherein the signal processing unit controls a reverberation time of a reverb process. 前記信号処理手段は、遅延処理のフィードバック成分を制御することを特徴とする請求項1又は2に記載の音声制御装置。   The voice control apparatus according to claim 1, wherein the signal processing unit controls a feedback component of delay processing. 前記信号処理手段は、遅延処理の遅延時間を制御することを特徴とする請求項1又は2に記載の音声制御装置。 The voice control apparatus according to claim 1, wherein the signal processing unit controls a delay time of delay processing. 入力される音声に応じてマイクロフォンから出力される音声信号を検出するステップAと、
前記マイクロフォンに収容されて歌唱者の口の映像を撮像する撮像手段から出力される画像信号を検出するステップBと、
前記ステップAによって検出された音声信号と前記ステップBによって検出された画像信号との相関性を検出するステップCと、
前記ステップCによって検出された相関性のデータに応じて前記マイクロフォンから出力される音声信号に対してエフェクト処理を施すステップDと、
を実行する音声制御方法。
Detecting a sound signal output from the microphone in accordance with the input sound; and
A step B of detecting an image signal output from an image pickup means for picking up an image of a singer's mouth contained in the microphone;
Detecting a correlation between the audio signal detected in step A and the image signal detected in step B;
Performing an effect process on the audio signal output from the microphone according to the correlation data detected in the step C; and
Voice control method to execute.
前記ステップCは、前記ステップAによって検出された音声信号と前記ステップBによって出力された画像信号との差分関係を検出するステップEを有し、前記ステップDは、前記ステップEによって検出された差分関係のデータに基づいて前記マイクロフォンから出力される音声信号に対してエフェクト処理を施すことを特徴とする請求項8に記載の音声制御方法。   The step C includes a step E for detecting a difference relationship between the audio signal detected in the step A and the image signal output in the step B, and the step D includes the difference detected in the step E. 9. The audio control method according to claim 8, wherein effect processing is performed on an audio signal output from the microphone based on related data. 前記ステップDは、前記マイクロフォン内に収容されている信号処理手段によってエフェクト処理を行うことを特徴とする請求項8又は9に記載の音声制御方法。   The voice control method according to claim 8 or 9, wherein in step D, effect processing is performed by signal processing means accommodated in the microphone. 前記ステップDは、リバーブ処理のフィードバック成分を制御することを特徴とする請求項8又は9に記載の音声制御方法。   The voice control method according to claim 8 or 9, wherein the step D controls a feedback component of reverberation processing. 前記ステップDは、リバーブ処理のリバーブタイムを制御することを特徴とする請求項8又は9に記載の音声制御方法。 The voice control method according to claim 8 or 9, wherein the step D controls a reverb time of a reverb process. 前記ステップDは、遅延処理のフィードバック成分を制御することを特徴とする請求項8又は9に記載の音声制御方法。   The voice control method according to claim 8 or 9, wherein the step D controls a feedback component of delay processing. 前記ステップDは、遅延処理の遅延時間を制御することを特徴とする請求項8又は9に記載の音声制御方法。 The voice control method according to claim 8 or 9, wherein the step D controls a delay time of delay processing.
JP2005335224A 2005-11-21 2005-11-21 Voice control device and voice control method Expired - Fee Related JP4487909B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005335224A JP4487909B2 (en) 2005-11-21 2005-11-21 Voice control device and voice control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005335224A JP4487909B2 (en) 2005-11-21 2005-11-21 Voice control device and voice control method

Publications (2)

Publication Number Publication Date
JP2007140225A JP2007140225A (en) 2007-06-07
JP4487909B2 true JP4487909B2 (en) 2010-06-23

Family

ID=38203147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005335224A Expired - Fee Related JP4487909B2 (en) 2005-11-21 2005-11-21 Voice control device and voice control method

Country Status (1)

Country Link
JP (1) JP4487909B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10540139B1 (en) 2019-04-06 2020-01-21 Clayton Janes Distance-applied level and effects emulation for improved lip synchronized performance

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5574130B2 (en) * 2012-09-24 2014-08-20 ブラザー工業株式会社 Karaoke device and karaoke program
JP6429610B2 (en) * 2014-11-28 2018-11-28 株式会社第一興商 Karaoke equipment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10540139B1 (en) 2019-04-06 2020-01-21 Clayton Janes Distance-applied level and effects emulation for improved lip synchronized performance
US10871937B2 (en) 2019-04-06 2020-12-22 Clayton Janes Distance-applied level and effects emulation for improved lip synchronized performance

Also Published As

Publication number Publication date
JP2007140225A (en) 2007-06-07

Similar Documents

Publication Publication Date Title
JPH08263077A (en) Karaoke device with voice converting function
US7563975B2 (en) Music production system
CN105185366B (en) Electronic musical instrument, pronunciation control method
JPH0772853A (en) Electronic wind instrument
JP2879948B2 (en) Audio processing device
CN108573689B (en) Electronic musical instrument, sound generating method, and recording medium
CN111739495A (en) Accompaniment control device, electronic musical instrument, control method, and recording medium
JP4487909B2 (en) Voice control device and voice control method
JP6728843B2 (en) Electronic musical instrument, musical tone generating device, musical tone generating method and program
JP4757971B2 (en) Harmony sound adding device
JP3901008B2 (en) Karaoke device with voice conversion function
JP3613859B2 (en) Karaoke equipment
JP3329635B2 (en) Effect device
JP4534967B2 (en) Tone and / or effect setting device and program
JP3262981B2 (en) Audio processing device
JP2007114239A (en) Musical sound control device and musical sound control method
JPS60192993A (en) Musical sound generator by inputting voice
JP3982514B2 (en) Karaoke equipment
JP3262100B2 (en) Audio processing device
JP3704851B2 (en) Electronic stringed instrument capable of playing tapping harmonics
JP3241038B2 (en) Audio processing device
JP2734797B2 (en) Electronic musical instrument
JPH1031496A (en) Tone generator
KR20060076638A (en) ΜΙDI file synthesizing apparatus and method
JP2757659B2 (en) Music control device

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081016

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100322

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140409

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees