Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4286446B2 - A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal - Google Patents
[go: Go Back, main page]

JP4286446B2 - A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal - Google Patents

A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal Download PDF

Info

Publication number
JP4286446B2
JP4286446B2 JP2000385777A JP2000385777A JP4286446B2 JP 4286446 B2 JP4286446 B2 JP 4286446B2 JP 2000385777 A JP2000385777 A JP 2000385777A JP 2000385777 A JP2000385777 A JP 2000385777A JP 4286446 B2 JP4286446 B2 JP 4286446B2
Authority
JP
Japan
Prior art keywords
input
music
karaoke
song
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000385777A
Other languages
Japanese (ja)
Other versions
JP2002183189A (en
Inventor
明峰 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichikosho Co Ltd
Original Assignee
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichikosho Co Ltd filed Critical Daiichikosho Co Ltd
Priority to JP2000385777A priority Critical patent/JP4286446B2/en
Publication of JP2002183189A publication Critical patent/JP2002183189A/en
Application granted granted Critical
Publication of JP4286446B2 publication Critical patent/JP4286446B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide the melody retrieval technology of a sound input system by a client server system, which guides a user to sound-input correct melody, prevents a wasteful retrieval instruction from being given to a melody database retrieval processing means as much as possible and can usefully use the function of the system at the most. SOLUTION: The sound input analysis means of a client analyzes a sound signal with timing made by a metronome as a reference in a sound input reception process and calculates the synchronous degree of the pause of a musical time sequential change and metronome timing and gives an instruction to reinput sound to the user when the synchronous degree does not satisfy the reference. When the synchronous degree reaches the reference, a query including melody piece data obtained by expressing the musical time sequential change of the sound signal in an electronic music system is generated. The server retrieves a melody database with melody piece data in the query as a key, detects music and generates a retrieval report.

Description

【0001】
【発明が属する技術分野】
この発明は、カラオケ店舗においてカラオケ演奏端末とともに利用されるカラオケ付属コンピュータに関し、とくに、音声入力式の旋律検索により選曲してカラオケ演奏端末に予約する機能を備えたカラオケ付属コンピュータに関するものである。
【0002】
【従来の技術】
たとえば特開平2000−172693号公報に詳しく解説されているように、音声入力された旋律に基づいて楽曲を検索するつぎのようなシステムが最近開発された。このシステムでは、多数の楽曲の旋律データをデータベース化しておき、利用者がマイクロホンに向けて発声したハミングやスキャットの音声信号をコンピュータで解析し、その音声信号の音楽的時系列変化から旋律を抽出し、その旋律を手掛かりとしてデータベースを検索し、類似した旋律を含んだ楽曲を見つけだす。この旋律検索システムをカラオケ装置と組み合せると、特徴のある旋律を覚えているけれども曲名の分からない楽曲を音声入力でリクエストできるようになる。
【0003】
【発明が解決しようとする課題】
通信カラオケシステムでは、現状でも2万曲もの楽曲を演奏することができる。このような膨大な曲数の旋律データベースを備えて音声入力による旋律検索を高精度かつ高速に実現するコンピュータシステムはかなり高度なシステムであり、ハードウェアおよびソフトウェアの両面で高価格になる。そのため、この種の旋律検索システムを1台1台のカラオケ装置に付設することは難しく、高度なコンピュータシステムを多数の端末機器で共用するクライアントサーバーシステムが適していると言える。
【0004】
ハミングやスキャットの音声入力を分析し、その音楽的時系列変化を抽出して旋律片データを作成し、それを手掛かりとして膨大なデータ量の旋律データベースを検索するという処理は非常に複雑であるため、クライアントサーバーシステムを採用しても、一般的なデータベース検索システムと同様な負荷分散の設計手法では、サーバーに負荷が集中してしまい、多数のクライアントからの検索要求に高速に応答できなくなる。
【0005】
プロの音楽家と違って素人が正確に旋律を口ずさむことは難しい。もともと正確に旋律を覚えていないことも多い。また、音痴気味の人のスキャットは音程やリズムが相当に狂うであろう。そのような不正確な旋律の音声入力がたくさん行われるであろうから、旋律データベースを検索した結果、旋律類似度の高い楽曲が見つからないことも多くなる。そのような結果として無駄になる処理もすべてサーバーに実行させたのでは、有意義な処理を高能率にさばくことは困難である。
【0006】
この発明は以上のような問題点に鑑みなされたもので、その目的は、利用者にできるだけ正確な旋律を音声入力してもらえるようにガイドするとともに、旋律データベース検索処理手段に対して無駄な検索指示をできるだけ与えないようにし、システムの機能を最大限に有意義に活用できるようにしたクライアントサーバーシステムによる音声入力式の旋律検索技術を提供することにある。
【0007】
【課題を解決するための手段】
この発明は、音声入力式の旋律検索により選曲してカラオケ演奏端末に予約するカラオケ付属コンピュータに関し、つぎの事項(1)〜(10)のように分説される構成を備えたものである。
(1)第1通信手段と、第2通信手段と、表示手段と、操作入力手段と、音声入出力手段と、楽曲索引データベースと、制御手段を備えたカラオケ付属コンピュータであること
(2)第1通信手段は、カラオケ演奏端末に予約コマンドを送信可能とすること
(3)第2通信手段は、ネットワーク上の検索サーバーと通信可能とすること
(4)表示手段は、制御手段の制御により利用者に情報を表示すること
(5)操作入力手段は、利用者入力を受け付け可能とすること
(6)音声入出力手段は、利用者に向けて音響を出力しつつ当該利用者が発する音声を検出可能とすること
(7)楽曲索引データベースは、楽曲IDと曲名と、カラオケ用の選曲番号の対応付けを集約すること
(8)制御手段は、旋律検索要求の利用者入力を受け付けた際、音声入出力手段よりメトロノーム音を出力するとともに音声入出力手段からの入力音声をデジタル録音し、当該録音データに基づいて電子楽譜形式の旋律片データを生成し、当該旋律片データを含んだ楽曲検索クエリーを検索サーバーに送信すること
(9)制御手段は、楽曲検索クエリーに応答する検索サーバーから楽曲IDリストを含む検索レポートを受信した際、楽曲IDリストに基づいて楽曲索引データベースから該当する各楽曲の曲名を抽出して表示手段に曲名リストを表示させ、曲名リストから1曲を特定した演奏予約指示の利用者入力を受け付け可能とすること
(10)制御手段は、表示中の曲目リストから1曲を特定した演奏予約指示の利用者入力を受け付けた際、当該曲名に該当する選曲番号を楽曲索引データベースから抽出し、当該選曲番号予約コマンドをカラオケ演奏端末に送信すること
【0008】
この発明において、望ましくは、音声入出力手段は、電話機の送受話器と同様な形態を備えるものとする。
【0009】
この発明において、望ましくは、制御手段は、音声入出力手段からの入力音声をデジタル録音するプロセスにおいて、録音する期間の全長と録音済みの区間を識別可能なグラフ画像を生成して表示手段に表示させることとする。
【0010】
この発明において、望ましくは、制御手段は、音声入出力手段からの入力音声をデジタル録音するプロセスにおいて、やり直しコマンドの利用者入力を受け付け可能とし、やり直しコマンドの利用者入力を受け付けた際、音声入出力手段からの入力音声をデジタル録音するプロセスを最初からやり直すこととする。
【0011】
【発明の実施の形態】
===システム構成例===
多数の客室があるカラオケ店舗に装備されるカラオケ集合システムに本発明を適用したシステム構成例を図1に示している。各客室にそれぞれ設置されたカラオケ演奏端末1および客室多用途端末2と、店舗に設置された1台の店舗サーバー3とを備え、これらがLAN8により接続されてクライアントサーバーシステムが構成されている。
【0012】
各カラオケ演奏端末1は、直接または宅内交換機を介して公衆電話回線4に接続し、公衆電話回線4に接続されている外部のカラオケホスト装置5と通信するホスト間通信制御手段と、このホスト間通信制御手段によりカラオケホスト装置5から取得したカラオケデータ(伴奏音楽を生成するデータと歌詞を表示するためのデータを含んでいる)を記憶装置に保存してカラオケ楽曲データベースとして管理する情報処理手段と、リクエスト曲を受け付けて待ち行列管理するユーザインタフェースと、待ち行列に従ってリクエスト曲のカラオケデータをカラオケ楽曲データベースから取り出して伴奏音楽と歌詞とを同期して音響映像出力する演奏制御手段とを備えている。
【0013】
店舗サーバー3はインターネットなどの外部ネットワーク6に接続していてプロキシーサーバーとして機能し、前記LAN接続された各カラオケ演奏端末1および各客室多用途端末2と外部ネットワーク6上で運用されている外部サーバー7との間のTCP/IP通信を中継する。
【0014】
各客室多用途端末2は、タッチパネル付きディスプレイを用いた対話型GUI(グラフィカル・ユーザ・インターフェース)と、電話機の送受話器(ハンドセット)のような形態の音声入出力手段と、客室多用途端末2において利用可能なコンテンツ(外部サーバー7が提供する情報サービス)を対話型GUIにより利用者に提示する手段と、利用者が選択したコンテンツを提供する外部サーバー7に店舗サーバー3を介してアクセスする手段とを備える。各客室多用途端末2にて利用した有料コンテンツの課金情報などを店舗サーバー3が記録して管理者に適時に提示する。
【0015】
===旋律検索処理の概要===
この実施例の「音声入力された旋律に基づいて楽曲を検索するクライアントサーバーシステム」においては、図1のシステム構成例の各客室多用途端末2が前記のクライアントコンピュータであり、外部ネットワーク6上で運用されている特定の外部サーバー7が前記のサーバーコンピュータに相当する(これを検索サーバー7とする)。各客室多用途端末2が店舗内LAN8・店舗サーバー3・外部ネットワーク6を介して検索サーバー7とTCP/IP通信を行い、楽曲検索クエリーと検索レポートをやり取りする。
【0016】
検索サーバー7は、MIDIなどの電子楽譜形式でデータ表現された多数の楽曲の歌唱パートの旋律データを楽曲IDをキーとして集約した旋律データベースを備えている。各客室多用途端末2は、検索対象となるカラオケ楽曲に関する各種の情報(曲名・作曲者・作詞者・ジャンル・使用された映画やテレビドラマやCMの名前・カラオケ演奏端末1に対する選曲番号など)が楽曲IDをキーとして集約した楽曲索引データベースを備えている。
【0017】
利用者は、客室多用途端末2の対話型GUIによる操作ガイドに従って前記ハンドセットを用いてハミングやスキャットで旋律を発声して入力する。客室多用途端末2は、入力された音声信号をDSPに取り込んでデジタルデータ化してメモリに一時記憶するとともに分析処理し、その音楽的時系列変化を抽出して電子楽譜形式でデータ表現した旋律片データを生成し、これを含んだ楽曲検索クエリーを検索サーバー7に送達する。
【0018】
楽曲旋律クエリーを受け取った検索サーバー7は、前記の旋律片データを手掛かりとして前記旋律データベースを検索し、その旋律片データとの類似度の高い旋律パターンを含んだ楽曲を類似度順にリストアップし、それら楽曲IDのリストを含んだ検索レポートを作成してクエリー起源の客室多用途端末2に送達する。
【0019】
検索レポートを受け取った客室多用途端末2では、レポートに報告された楽曲IDのリストに基づいて前記楽曲索引データベースから必要な情報(曲名・作曲者・作詞者・選曲番号など)を取り出し、対話型GUIの画面に適宜なレイアウトで該当楽曲のリストを表示する。この検索結果報告画面では検索レポートで報告された各楽曲の類似度順に列記する。
【0020】
利用者は検索結果報告画面に列記された曲名中に意図した楽曲を見つけたら、その曲名にカーソルを合わせて予約コマンドを入力すると、客室多用途端末2から同室のカラオケ演奏端末1にその楽曲の選曲番号と予約コマンドが伝送され、演奏予約がなされる。
【0021】
===音声入力受付プロセス===
客室多用途端末2において実行される音声入力受付プロセスの処理手順を図2のフローチャートに示している。旋律検索メニューが選択されると、対話型GUIの画面に図3に例示するようなメトロノーム映像が表示される。このメトロノームは初期設定テンポで動作し、前記ハンドセットのスピーカーからピッピッという電子メトロノーム音が映像と同期して発生している。対話型GUI上のメトロノームの画面にはそのテンポを可変するための操作ガイドも表示されており、利用者が画面にタッチ入力することでメトロノームのテンポを任意に変えることができる。つまり端末2のコンピュータが利用者のタッチ入力に従ってメトロノーム映像のテンポを変化させる(図2のステップ100、101、108)。
【0022】
利用者はメトロノームのテンポを適当に合わせてから、メトロノームが刻むタイミングに合わせて、検索しようとする楽曲の旋律をハミングやスキャットで発声して前記ハンドセットのマイクロホンに入力する。端末2のコンピュータがこれを認知し、メトロノームが刻んでいるテンポで16拍分の時間だけ入力音声をデジタル録音しながら分析処理を開始する。同時に録音の進行に伴って、利用者に録音がどこまで進んでいるのかを示すためのバーグラフ画像などを対話型GUIの画面に表示する。利用者は、旋律発声が間違ったと思ったら、やり直しコマンドを入力して、プロセス先頭に戻る。(この部分の動作は図2のステップ102、103、104に相当する)。
【0023】
端末2のコンピュータは、16拍分の音声信号を分析してその音楽的時系列変化を抽出し、電子楽譜形式で表現された旋律片データを生成する処理において、リズム音痴判定とピッチ音痴判定を行う(ステップ105、106)。
【0024】
リズム音痴判定処理では、音声入力受付プロセスにおいて前記メトロノームにより刻んだタイミングを基準として前記音声信号を解析し、その音声信号の音楽的時系列変化の区切りと前記メトロノーム・タイミングとの同期度合いを算出し、同期度合いが基準に満たしているか否かを判定する。もちろん、ある程度までのタイミング差は許容するが、1音符相当の発声タイミングごとのずれや、ずれの合計値が基準を上回るとリズム音痴と判定し、前記対話型GUIにより利用者に音声入力のやり直しを指示する(ステップ109)。
【0025】
ピッチ音痴判定処理では、音声入力受付プロセスで利用者から取得した音声信号の音高(ピッチ)変化が音楽的な音階に適合しているかどうかを所定の基準で判定する。周知のように、楽譜で表現される音楽の音高は所定の規則性をもった離散値である。そのような音階のもつ離散値に正規化できない大きく外れた音高が入力音声に含まれている場合、これをピッチ音痴と判定し、前記対話型GUIにより利用者に音声入力のやり直しを指示する(ステップ110)。
【0026】
リズム音痴ともピッチ音痴とも判定されなかった場合は処理を先に進め、利用者からの検索コマンドの入力を待って、音声信号の音楽的時系列変化に基づいて生成した旋律片データを含む楽曲検索クエリーを検索サーバー7に送達することになる(ステップ107、112)。なお、利用者は検索コマンドを入力せずに音声入力のやり直しを選択することもできる(ステップ107、111)。
【0027】
【発明の効果】
(A)利用者が発声した音声信号(デジタル録音データ)をサーバーコンピュータに渡すのではなく、その音声信号の音楽的時系列変化に基づいてクライアントコンピュータにて生成した旋律片データをサーバーコンピュータに渡すので、サーバーコンピュータの負担が大いに軽減され、クライアントからサーバーに伝送するデータ量も著しく小さくなり、システム全体としての高能率化に著効を奏する。
【0028】
(B)検索しようとする旋律を利用者がハミングやスキャットで発声する際に、ガイドとなるメトロノームの映像を提示し、しかもそのテンポを利用者が自由に変えられるので、音声入力がきわめてやりやすくなり、意図した旋律を正しく入力できる確率が高くなる。したがって、サーバーに無駄な検索を依頼する確率が低減する。
【0029】
(C)クライアントコンピュータの処理段階で、前記メトロノームの刻むタイミングを基準にして入力音声がリズム音痴と判断されると、その入力音声に基づくクエリーをサーバーに発行することなく、利用者に音声入力をやり直させる。したがってサーバーに無駄な検索を依頼する確率が低減し、サーバーは結果として有意義な検索を実行する確率が高まる。
【0030】
(D)クライアントコンピュータの処理段階で、利用者の入力音声の音高変化が音楽的な音階の特徴から著しく外れている場合、その入力音声に基づくクエリーをサーバーに発行することなく、利用者に音声入力をやり直させる。したがってサーバーに無駄な検索を依頼する確率が低減し、サーバーは結果として有意義な検索を実行する確率が高まる。
【図面の簡単な説明】
【図1】多数の客室があるカラオケ店舗に装備されるカラオケ集合システムに本発明を適用したシステム構成例を示す図である。
【図2】この発明の旋律検索システムにおけるクライアントコンピュータが実行する音声入力受付プロセスの制御手順を示すフローチャートである。
【図3】この発明においてクライアントコンピュータの対話型ユーザインタフェースの画面に表示されるメトロノーム映像の一例を示す図である。
【符号の説明】
1 カラオケ演奏端末
2 客室多用途端末(本発明のクライアントコンピュータ)
3 店舗サーバー
4 公衆電話回線
5 カラオケホスト装置
6 外部ネットワーク
7 外部のサーバー(その中の1台が本発明のサーバーコンピュータである)
8 店舗内のLAN
[0001]
[Technical field to which the invention belongs]
The present invention relates to a karaoke accessory computer used together with a karaoke performance terminal in a karaoke store, and more particularly to a karaoke accessory computer having a function of selecting a song by voice input type melody search and making a reservation in a karaoke performance terminal.
[0002]
[Prior art]
For example, as described in detail in Japanese Patent Application Laid-Open No. 2000-172893, the following system for searching for music based on a melody inputted by voice has been recently developed. In this system, the melody data of a large number of songs is stored in a database, the humming and scat audio signals uttered by the user toward the microphone are analyzed by a computer, and the melody is extracted from the musical time-series changes of the audio signals. Then, the database is searched by using the melody as a clue, and a song including a similar melody is found. Combining this melody search system with a karaoke device makes it possible to request a song that has a distinctive melody but does not know the song name by voice input.
[0003]
[Problems to be solved by the invention]
In the online karaoke system, 20,000 songs can be played even in the present situation. A computer system that provides such a melody database with a large number of songs and realizes high-precision and high-speed melody search by voice input is a fairly advanced system, and is expensive in terms of both hardware and software. For this reason, it is difficult to attach this type of melody search system to each karaoke device, and it can be said that a client server system in which an advanced computer system is shared by many terminal devices is suitable.
[0004]
Analyzing Hamming and Scat voice input, extracting musical time-series changes to create melodic piece data, and using it as a clue to search a melody database with an enormous amount of data, the process is very complex Even if a client-server system is adopted, the load distribution design method similar to a general database search system concentrates the load on the server and cannot respond to search requests from a large number of clients at high speed.
[0005]
Unlike professional musicians, it is difficult for amateurs to use accurate melody. In many cases, the original melodies are not accurately remembered. In addition, the pitch and rhythm of the scat of a person who is timid will be quite crazy. Since many such inaccurate melodic voice inputs will be performed, as a result of searching the melodic database, it is often the case that music with high melodic similarity cannot be found. If all the processing that is wasted as a result is executed by the server, it is difficult to efficiently process meaningful processing with high efficiency.
[0006]
The present invention has been made in view of the above problems, and its purpose is to guide the user to input the most accurate melody as much as possible, and to useless search for the melody database search processing means. It is an object of the present invention to provide a voice input type melody search technique using a client server system in which instructions are given as little as possible and the functions of the system can be utilized to the maximum and meaningful.
[0007]
[Means for Solving the Problems]
The present invention relates to a karaoke-attached computer that selects a melody by voice input type melody search and reserves it at a karaoke performance terminal, and has a configuration described as the following items (1) to (10).
(1) It is a karaoke accessory computer provided with a first communication means, a second communication means, a display means, an operation input means, a voice input / output means, a music index database, and a control means. (1) The communication means can transmit the reservation command to the karaoke performance terminal. (3) The second communication means can communicate with the search server on the network. (4) The display means is used under the control of the control means. (5) The operation input means is capable of accepting user input. (6) The voice input / output means is configured to output the sound emitted by the user while outputting sound to the user. be detectable (7) music index database is a music ID, a title, aggregating the correspondence of music selection number for karaoke (8) control means, upon receiving a user input of a melody retrieval request The metronome sound is output from the voice input / output means, and the voice input from the voice input / output means is digitally recorded, and music score data in the form of electronic score is generated based on the recorded data, and the music search including the melody piece data is performed Sending the query to the search server (9) When the control means receives a search report including a song ID list from the search server responding to the song search query, each of the corresponding songs from the song index database based on the song ID list The song name is extracted and the song name list is displayed on the display means so that the user input of the performance reservation instruction specifying one song from the song name list can be accepted. (10) The control means can receive 1 from the song list being displayed. When the user input of the performance reservation instruction specifying the song is accepted, the music selection number corresponding to the song name is extracted from the song index database. And transmitting the music selection number and the reservation command to the karaoke performance terminal.
In the present invention, preferably, the voice input / output means has the same form as a telephone handset.
[0009]
In the present invention, preferably, in the process of digitally recording the input voice from the voice input / output means, the control means generates a graph image that can identify the total length of the recording period and the recorded section and displays it on the display means. I will let you.
[0010]
In the present invention, preferably, the control means is capable of accepting a user input of a redo command in a process of digitally recording an input voice from the voice input / output means. The process of digitally recording the input sound from the output means will be restarted from the beginning.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
=== System configuration example ===
FIG. 1 shows an example of a system configuration in which the present invention is applied to a karaoke group system installed in a karaoke store having a large number of guest rooms. A karaoke performance terminal 1 and a guest room versatile terminal 2 installed in each guest room and a single store server 3 installed in the store are connected via a LAN 8 to constitute a client server system.
[0012]
Each karaoke performance terminal 1 is connected to a public telephone line 4 directly or via a private branch exchange, and an inter-host communication control means for communicating with an external karaoke host device 5 connected to the public telephone line 4, and between the hosts Information processing means for storing karaoke data (including data for generating accompaniment music and data for displaying lyrics) stored in a storage device and managed as a karaoke music database by the communication control means from the karaoke host device 5; , A user interface for receiving the requested music and managing the queue, and a performance control means for extracting the karaoke data of the requested music from the karaoke music database according to the queue and outputting the accompaniment music and lyrics in synchronism with the audio video .
[0013]
The store server 3 is connected to an external network 6 such as the Internet and functions as a proxy server, and is operated on the external network 6 with each karaoke performance terminal 1 and each guest room versatile terminal 2 connected to the LAN. 7 relays TCP / IP communication with the network.
[0014]
Each guest room versatile terminal 2 includes an interactive GUI (graphical user interface) using a display with a touch panel, voice input / output means such as a telephone handset (handset), and the guest room versatile terminal 2. Means for presenting usable content (information service provided by the external server 7) to the user through an interactive GUI, and means for accessing the external server 7 providing the content selected by the user via the store server 3; Is provided. The store server 3 records the charging information of the paid content used in each guest room multipurpose terminal 2 and presents it to the manager in a timely manner.
[0015]
=== Outline of melody search process ===
In the “client server system for searching for music based on a melody inputted by voice” of this embodiment, each guest room versatile terminal 2 in the system configuration example of FIG. 1 is the client computer, and on the external network 6. A specific external server 7 in operation corresponds to the server computer (this is referred to as a search server 7). Each guest room versatile terminal 2 performs TCP / IP communication with the search server 7 via the in-store LAN 8, the store server 3, and the external network 6 to exchange music search queries and search reports.
[0016]
The search server 7 includes a melody database in which melody data of singing parts of a large number of songs expressed in an electronic score format such as MIDI is aggregated using song IDs as keys. Each guest room versatile terminal 2 has various information about the karaoke music to be searched (song name, composer, lyricist, genre, used movie, TV drama and commercial name, song selection number for karaoke performance terminal 1, etc.) Has a music index database in which music IDs are collected as keys.
[0017]
The user utters and inputs a melody by humming or scat using the handset according to the operation guide by the interactive GUI of the cabin multi-use terminal 2. The guest room versatile terminal 2 takes the input audio signal into the DSP, converts it into digital data, temporarily stores it in the memory, analyzes it, extracts the musical time-series change, and expresses the data in the form of an electronic musical score. Data is generated and a music search query including the data is delivered to the search server 7.
[0018]
The search server 7 that has received the music melody query searches the melody database using the melody piece data as a clue, lists music pieces including a melody pattern having a high similarity to the melody piece data, in order of similarity, A search report including a list of these music IDs is created and delivered to the query-use guest room multi-use terminal 2.
[0019]
Upon receiving the search report, the guest room multi-use terminal 2 extracts necessary information (song name, composer, songwriter, song selection number, etc.) from the song index database based on the list of song IDs reported in the report, and is interactive. A list of corresponding songs is displayed on the GUI screen in an appropriate layout. In this search result report screen, they are listed in the order of similarity of each music reported in the search report.
[0020]
When the user finds the intended song in the song names listed on the search result report screen, the user moves the cursor to the song name and enters a reservation command. Then, the user enters the karaoke performance terminal 1 in the same room from the guest room versatile terminal 2. A music selection number and a reservation command are transmitted, and a performance reservation is made.
[0021]
=== Voice input acceptance process ===
The processing procedure of the voice input reception process executed in the cabin multipurpose terminal 2 is shown in the flowchart of FIG. When the melody search menu is selected, a metronome video as illustrated in FIG. 3 is displayed on the interactive GUI screen. The metronome operates at an initial tempo, and a beeping electronic metronome sound is generated in synchronization with the video from the speaker of the handset. An operation guide for changing the tempo is also displayed on the screen of the metronome on the interactive GUI, and the tempo of the metronome can be arbitrarily changed by the user touching the screen. That is, the computer of the terminal 2 changes the tempo of the metronome video according to the user's touch input (steps 100, 101, and 108 in FIG. 2).
[0022]
The user appropriately adjusts the tempo of the metronome, and then utters the melody of the music to be searched by humming or scat in accordance with the timing of the metronome and inputs it to the microphone of the handset. The computer of the terminal 2 recognizes this and starts the analysis process while digitally recording the input voice for a time of 16 beats at the tempo engraved by the metronome. At the same time, as the recording progresses, a bar graph image or the like for showing to the user how far the recording has progressed is displayed on the screen of the interactive GUI. If the user thinks the melody utterance is wrong, he enters a redo command and returns to the top of the process. (The operation of this portion corresponds to steps 102, 103, and 104 in FIG. 2).
[0023]
The computer of the terminal 2 analyzes the audio signal for 16 beats, extracts the musical time-series change, and performs rhythm sound determination and pitch sound determination in the process of generating melodic piece data expressed in electronic score format. (Steps 105 and 106).
[0024]
In the rhythm sound detection process, the voice signal is analyzed based on the timing ticked by the metronome in the voice input acceptance process, and the degree of synchronization between the musical time-series change of the voice signal and the metronome timing is calculated. Then, it is determined whether or not the degree of synchronization meets the standard. Of course, a timing difference up to a certain extent is allowed, but if the deviation at each utterance timing equivalent to one note or the total deviation exceeds a standard, it is determined that the rhythm is unsatisfactory, and the interactive GUI is used to perform voice input again to the user. (Step 109).
[0025]
In the pitch sound determination process, it is determined based on a predetermined standard whether or not the pitch (pitch) change of the voice signal acquired from the user in the voice input reception process is suitable for a musical scale. As is well known, the pitch of music expressed by a score is a discrete value having a predetermined regularity. If the input voice contains a pitch that is too large to be normalized to the discrete value of such a scale, it is determined that this is a pitch sound, and the interactive GUI is used to instruct the user to repeat the voice input. (Step 110).
[0026]
If neither rhythm nor pitch is determined, the process is advanced and a song search including melodic piece data generated based on the musical time-series change of the audio signal is waited for input of a search command from the user. The query is delivered to the search server 7 (steps 107 and 112). Note that the user can also select to redo voice input without inputting a search command (steps 107 and 111).
[0027]
【The invention's effect】
(A) The voice signal (digital recording data) uttered by the user is not passed to the server computer, but the melodic piece data generated by the client computer based on the musical time-series change of the voice signal is passed to the server computer. Therefore, the load on the server computer is greatly reduced, the amount of data transmitted from the client to the server is remarkably reduced, and the system as a whole is highly efficient.
[0028]
(B) When a user utters a melody to be searched for by humming or scat, a video of a metronome that serves as a guide is presented, and the user can freely change the tempo, so voice input is extremely easy. This increases the probability that the intended melody can be correctly input. Therefore, the probability of requesting a useless search to the server is reduced.
[0029]
(C) At the processing stage of the client computer, if the input speech is determined to be rhythmic based on the timing of the metronome, the user is prompted to input the speech without issuing a query based on the input speech to the server. Let me start over. Therefore, the probability of requesting a useless search to the server is reduced, and the server is consequently more likely to execute a meaningful search.
[0030]
(D) If the pitch change of the input voice of the user deviates significantly from the musical scale characteristic at the processing stage of the client computer, the query is not issued to the user without issuing a query based on the input voice to the server. Retry voice input. Therefore, the probability of requesting a useless search to the server is reduced, and the server is consequently more likely to execute a meaningful search.
[Brief description of the drawings]
FIG. 1 is a diagram showing a system configuration example in which the present invention is applied to a karaoke collective system installed in a karaoke store having a large number of guest rooms.
FIG. 2 is a flowchart showing a control procedure of a voice input reception process executed by a client computer in the melody search system of the present invention.
FIG. 3 is a diagram showing an example of a metronome video displayed on a screen of an interactive user interface of a client computer in the present invention.
[Explanation of symbols]
1 Karaoke performance terminal 2 Guest room versatile terminal (client computer of the present invention)
3 store server 4 public telephone line 5 karaoke host device 6 external network 7 external server (one of which is the server computer of the present invention)
8 In-store LAN

Claims (4)

第1通信手段と、第2通信手段と、表示手段と、操作入力手段と、音声入出力手段と、楽曲索引データベースと、制御手段を備えたカラオケ付属コンピュータであって、
第1通信手段は、カラオケ演奏端末に予約コマンドを送信可能とし、
第2通信手段は、ネットワーク上の検索サーバーと通信可能とし、
表示手段は、制御手段の制御により利用者に情報を表示し、
操作入力手段は、利用者入力を受け付け可能とし、
音声入出力手段は、利用者に向けて音響を出力しつつ当該利用者が発する音声を検出可能とし、
楽曲索引データベースは、楽曲IDと曲名と、カラオケ用の選曲番号の対応付けを集約し、
制御手段は、旋律検索要求の利用者入力を受け付けた際、音声入出力手段よりメトロノーム音を出力するとともに音声入出力手段からの入力音声をデジタル録音し、当該録音データに基づいて電子楽譜形式の旋律片データを生成し、当該旋律片データを含んだ楽曲検索クエリーを検索サーバーに送信し、
制御手段は、楽曲検索クエリーに応答する検索サーバーから楽曲IDリストを含む検索レポートを受信した際、楽曲IDリストに基づいて楽曲索引データベースから該当する各楽曲の曲名を抽出して表示手段に曲名リストを表示させ、曲名リストから1曲を特定した演奏予約指示の利用者入力を受け付け可能とし、
制御手段は、表示中の曲目リストから1曲を特定した演奏予約指示の利用者入力を受け付けた際、当該曲名に該当する選曲番号を楽曲索引データベースから抽出し、当該選曲番号予約コマンドをカラオケ演奏端末に送信する
カラオケ付属コンピュータ。
A karaoke-attached computer comprising a first communication means, a second communication means, a display means, an operation input means, a voice input / output means, a music index database, and a control means,
The first communication means can transmit a reservation command to the karaoke performance terminal,
The second communication means can communicate with a search server on the network,
The display means displays information to the user under the control of the control means,
The operation input means can accept user input,
The voice input / output means can detect the voice emitted by the user while outputting sound toward the user,
Music index database, aggregation and music ID, the song title, the association of music selection numbers for karaoke,
When receiving the user input of the melody search request, the control means outputs the metronome sound from the voice input / output means and digitally records the input voice from the voice input / output means, and generates an electronic score format based on the recorded data. Generate melodic piece data, send a music search query containing the melodic piece data to the search server,
When the control means receives the search report including the music ID list from the search server responding to the music search query, the control means extracts the music name of each corresponding music from the music index database based on the music ID list and displays the music name list on the display means. And accepting user input for performance reservation instructions that specify one song from the song name list,
When the control unit accepts a user input of a performance reservation instruction specifying one song from the displayed song list, the control unit extracts the song selection number corresponding to the song name from the song index database, and the song selection number and the reservation command are extracted from the karaoke. A computer with karaoke that is sent to the performance terminal.
音声入出力手段は、電話機の送受話器と同様な形態を備える
請求項1に記載のカラオケ付属コンピュータ。
The karaoke-attached computer according to claim 1, wherein the voice input / output means has the same form as a telephone handset.
制御手段は、音声入出力手段からの入力音声をデジタル録音するプロセスにおいて、録音する期間の全長と録音済みの区間を識別可能なグラフ画像を生成して表示手段に表示させる
請求項1または2に記載のカラオケ付属コンピュータ。
The control means generates a graph image capable of identifying the total length of the recording period and the recorded section in the process of digitally recording the input voice from the voice input / output means and displays the graph on the display means. Computer with karaoke as described.
制御手段は、音声入出力手段からの入力音声をデジタル録音するプロセスにおいて、やり直しコマンドの利用者入力を受け付け可能とし、やり直しコマンドの利用者入力を受け付けた際、音声入出力手段からの入力音声をデジタル録音するプロセスを最初からやり直す
請求項1〜3のいずれかに記載のカラオケ付属コンピュータ。
In the process of digitally recording the input voice from the voice input / output means, the control means can accept the user input of the redo command, and when receiving the user input of the redo command, the control means receives the input voice from the voice input / output means. The karaoke-attached computer according to any one of claims 1 to 3, wherein the digital recording process is restarted from the beginning.
JP2000385777A 2000-12-19 2000-12-19 A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal Expired - Lifetime JP4286446B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000385777A JP4286446B2 (en) 2000-12-19 2000-12-19 A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000385777A JP4286446B2 (en) 2000-12-19 2000-12-19 A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal

Publications (2)

Publication Number Publication Date
JP2002183189A JP2002183189A (en) 2002-06-28
JP4286446B2 true JP4286446B2 (en) 2009-07-01

Family

ID=18852985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000385777A Expired - Lifetime JP4286446B2 (en) 2000-12-19 2000-12-19 A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal

Country Status (1)

Country Link
JP (1) JP4286446B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013239203A (en) * 2013-08-05 2013-11-28 Toshiba Corp Electronic apparatus, method and program
CN112465679B (en) * 2020-09-28 2023-10-31 青岛大学 Piano learning and creation system and method
WO2025033250A1 (en) * 2023-08-08 2025-02-13 ソニーグループ株式会社 Information processing system, information processing method, and terminal device

Also Published As

Publication number Publication date
JP2002183189A (en) 2002-06-28

Similar Documents

Publication Publication Date Title
JP2002510403A (en) Method and apparatus for real-time correlation of performance with music score
CN111223470A (en) Audio processing method and device and electronic equipment
JP2002258874A (en) Method and system for trial listening to music, information treminal and music retrieval server
JP2000020078A (en) Communication karaoke performance terminal that displays song selection history
JP4286446B2 (en) A computer with karaoke that uses a voice input melody search to select a song and make a reservation at a karaoke performance terminal
CN101551997A (en) Assisted learning system of music
JP2003131674A (en) Music search system
JP7161301B2 (en) karaoke system
JP2002189483A (en) Voice input type music search system
JP2004233723A (en) Karaoke music selection system, karaoke remote control device, karaoke device, music selection mediation device
JP3602059B2 (en) Melody search formula karaoke performance reservation system, melody search server, karaoke computer
JPH08160975A (en) Karaoke music selecting device
JP3602085B2 (en) Karaoke collection system with special features in distributed processing of melody search
KR20200106328A (en) System and method for providing cbmr based music identifying serivce using note
JP2011180271A (en) Karaoke music selection reservation device connected to host system through cradle
JPH11249674A (en) Singing scoring system for karaoke equipment
CN201397671Y (en) Media player
CN101551999A (en) Automatic page overturning device
JP6543155B2 (en) Operation control device and program
JP6859204B2 (en) Karaoke song recommendation system
JP7755514B2 (en) Karaoke equipment
JP4319054B2 (en) A communication karaoke application system that tracks the user's vocal range and reflects it in the performance keys.
JP2013231881A (en) Karaoke scoring system
CN201397673Y (en) Music score indicating device
JP2003288088A (en) A method for controlling the performance keys of a karaoke apparatus according to the user's range

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040924

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050330

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050330

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090108

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090324

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090325

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120403

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120403

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130403

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140403

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250