JP7073705B2 - Call terminal, speaker identification server, call system, call terminal processing method, speaker identification server processing method and program - Google Patents
Call terminal, speaker identification server, call system, call terminal processing method, speaker identification server processing method and program Download PDFInfo
- Publication number
- JP7073705B2 JP7073705B2 JP2017242497A JP2017242497A JP7073705B2 JP 7073705 B2 JP7073705 B2 JP 7073705B2 JP 2017242497 A JP2017242497 A JP 2017242497A JP 2017242497 A JP2017242497 A JP 2017242497A JP 7073705 B2 JP7073705 B2 JP 7073705B2
- Authority
- JP
- Japan
- Prior art keywords
- call
- speaker identification
- terminal
- information
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 96
- 238000000034 method Methods 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 38
- 238000004891 communication Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 5
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、通話端末、話者識別サーバ、通話システム、通話端末の処理方法、話者識別サーバの処理方法及びプログラムに関する。 The present invention relates to a call terminal, a speaker identification server, a call system, a process method for a call terminal, a process method for a speaker identification server, and a program.
特許文献1には、発呼操作後かつ通話開始前に、発呼した者の生体情報を取得し、本人認証を行い、認証結果を通話相手の端末に送信する通話端末が開示されている。生体情報としては、顔、音声、指紋等が例示されている。 Patent Document 1 discloses a call terminal that acquires biometric information of the person who made the call, authenticates the person, and transmits the authentication result to the terminal of the other party after the call operation and before the start of the call. Examples of biological information include faces, voices, fingerprints, and the like.
特許文献2には、相手端末から着呼があると、無鳴動でそれをユーザに知らせることなく一時応答して相手端末から音声を受付け、この音声の特徴データと整合する通話許可音声モデルを検索し、検索できたならば鳴動音を出力してユーザに着呼を知らせる電話装置が開示されている。 In Patent Document 2, when there is an incoming call from the other party terminal, the call is received from the other party terminal by temporarily responding without ringing without notifying the user, and a call permission voice model consistent with the characteristic data of this voice is searched for. However, a telephone device that outputs a ringing sound to notify the user of an incoming call if it can be searched is disclosed.
特許文献3には、通信端末同士の通信を中継する中継装置を備えた通信システムが開示されている。通信元の通信端末は、発呼操作に応じて発呼者の認証情報を取得し、当該認証情報を含む通話要求を中継装置に送信する。中継装置は、当該認証情報に基づき発呼者を識別する。また、中継装置は、通話の宛先である電話番号に対応付けて登録されている着信拒否ユーザの中に、識別した発呼者が含まれないか判断する。そして、含まれる場合、中継装置は、通信元の通信端末に拒否通知を行う。 Patent Document 3 discloses a communication system including a relay device that relays communication between communication terminals. The communication terminal of the communication source acquires the authentication information of the caller in response to the call operation, and transmits the call request including the authentication information to the relay device. The relay device identifies the caller based on the authentication information. In addition, the relay device determines whether or not the identified caller is included in the incoming call rejection users registered in association with the telephone number that is the destination of the call. Then, if included, the relay device notifies the communication terminal of the communication source of the refusal.
通話中に通話相手(現在電話で話をしている相手)を識別したい場合がある。例えば、本人確認を行わなければならない場合や、声だけでは通話相手を識別できない場合等が挙げられるが、これらに限定されない。 During a call, you may want to identify the person you are talking to (the person you are currently talking to). For example, there are cases where identity verification must be performed, cases where the other party cannot be identified by voice alone, and the like, but the present invention is not limited to these cases.
特許文献1乃至3に記載の技術によれば、通話開始前に発呼操作を行った者を識別することができる。しかし、通話中に通話相手を識別することはできない。発呼操作を行った者と、通話している者とが異なる場合があり得る。 According to the techniques described in Patent Documents 1 to 3, it is possible to identify the person who made the call before the start of the call. However, it is not possible to identify the other party during a call. The person who made the call may be different from the person who is making the call.
本発明は、通話中に通話相手を識別する技術を提供することを課題とする。 An object of the present invention is to provide a technique for identifying a call partner during a call.
本発明によれば、
他の通話端末と通話する通話手段と、
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段と、
を有する通話端末が提供される。
According to the present invention
A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Means and
A telephone terminal having the above is provided.
また、本発明によれば、
通話中の通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信手段と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段と、
を有する話者識別サーバが提供される。
Further, according to the present invention,
A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission means for transmitting information indicating the identified speaker to the calling terminal of the sender of the speaker identification information, or to the calling terminal of the sender of the speaker identification information and the calling terminal during a call.
A speaker identification server is provided.
また、本発明によれば、
通話端末と話者識別サーバとを有し、
前記通話端末は、
他の通話端末と通話する通話手段と、
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を前記話者識別サーバに繰り返し送信する第1の送信手段と、
を有し、
前記話者識別サーバは、
通話中の前記通話端末から、前記話者識別情報を受信する受信手段と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段と、
を有する通話システムが提供される。
Further, according to the present invention,
It has a call terminal and a speaker identification server,
The call terminal is
A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
A first transmission means for repeatedly transmitting the biological information or speaker identification information, which is a feature amount extracted from the biological information, to the speaker identification server during a call.
Have,
The speaker identification server is
A receiving means for receiving the speaker identification information from the calling terminal during a call, and
A speaker identification means for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission means for transmitting information indicating the identified speaker to the calling terminal of the sender of the speaker identification information, or to the calling terminal of the sender of the speaker identification information and the calling terminal during a call.
A calling system with is provided.
また、本発明によれば、
コンピュータが、
他の通話端末と通話する通話工程と、
通話中、生体情報を繰り返し取得する生体情報取得工程と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信工程と、
を実行する通話端末の処理方法が提供される。
Further, according to the present invention,
The computer
The call process of talking to other call terminals and
The biometric information acquisition process, which repeatedly acquires biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Process and
Is provided with a processing method for the calling terminal to execute.
また、本発明によれば、
コンピュータを、
他の通話端末と通話する通話手段、
通話中、生体情報を繰り返し取得する生体情報取得手段、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段、
として機能させるプログラムが提供される。
Further, according to the present invention,
Computer,
A means of calling to talk to other calling terminals,
Biometric information acquisition means that repeatedly acquires biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. means,
A program is provided that functions as.
また、本発明によれば、
コンピュータが、
通話中の通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信工程と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別工程と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信工程と、
を実行する話者識別サーバの処理方法が提供される。
Further, according to the present invention,
The computer
A receiving process of receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification process for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission step of transmitting information indicating the identified speaker to the call terminal of the sender of the speaker identification information or the call terminal of the sender of the speaker identification information and the call terminal in conversation.
The processing method of the speaker identification server that executes the above is provided.
また、本発明によれば、
コンピュータを、
通話中の通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信手段、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段、
として機能させるプログラムが提供される。
Further, according to the present invention,
Computer,
A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information and the reference information registered in advance.
A transmission means for transmitting information indicating an identified speaker to a calling terminal that is a source of the speaker identification information, or a calling terminal that is in a call with a calling terminal that is a source of the speaker identification information.
A program is provided that functions as.
本発明によれば、通話中に通話相手を識別できるようになる。 According to the present invention, the other party can be identified during a call.
<第1の実施形態>
まず、本実施形態の通話システムの概要を説明する。通話システムは、通話端末と、話者識別サーバとを有する。
<First Embodiment>
First, an outline of the call system of the present embodiment will be described. The call system has a call terminal and a speaker identification server.
通話端末は、他の通話端末と通話する手段と、通話中に生体情報を繰り返し取得する手段と、通話中に生体情報、又は、当該生体情報から抽出された特徴量である話者識別情報を話者識別サーバに繰り返し送信する手段とを有する。 The call terminal has a means for talking to another call terminal, a means for repeatedly acquiring biometric information during a call, biometric information during a call, or speaker identification information which is a feature amount extracted from the biometric information. It has a means for repeatedly transmitting to a speaker identification server.
話者識別サーバは、通話中の通話端末から話者識別情報を受信する手段と、話者識別情報及び予め登録されている参照情報に基づき話者を識別する手段と、識別した話者を示す情報を、話者識別情報の送信元の通話端末と通話中の通話端末に送信する手段とを有する。 The speaker identification server indicates a means for receiving speaker identification information from a calling terminal during a call, a means for identifying a speaker based on the speaker identification information and pre-registered reference information, and an identified speaker. It has a means for transmitting information to a calling terminal from which the speaker identification information is transmitted and a calling terminal during a call.
このような本実施形態の通話システムによれば、通話中に話者を識別できるようになる。 According to the call system of the present embodiment as described above, the speaker can be identified during the call.
次に、通話端末及び話者識別サーバの構成を詳細に説明する。まず、通話端末及び話者識別サーバのハードウエア構成の一例について説明する。本実施形態の通話端末及び話者識別サーバが備える各機能は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット(あらかじめ装置を出荷する段階から格納されているプログラムのほか、CD(Compact Disc)等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる)、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。 Next, the configurations of the call terminal and the speaker identification server will be described in detail. First, an example of the hardware configuration of the call terminal and the speaker identification server will be described. Each function of the call terminal and the speaker identification server of the present embodiment includes a CPU (Central Processing Unit) of an arbitrary computer, a memory, a program loaded into the memory, and a storage unit (preliminary device) such as a hard disk for storing the program. In addition to the programs stored from the stage of shipping, it can also store programs downloaded from storage media such as CDs (Compact Discs) and servers on the Internet), hardware and software centered on network connection interfaces. It is realized by any combination of wear. And, it is understood by those skilled in the art that there are various variations in the method of realizing the device and the device.
図1は、本実施形態の通話端末及び話者識別サーバ各々のハードウエア構成を例示するブロック図である。図1に示すように、通話端末及び話者識別サーバ各々は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。通話端末及び話者識別サーバは周辺回路4Aを有さなくてもよい。
FIG. 1 is a block diagram illustrating a hardware configuration of each of the call terminal and the speaker identification server of the present embodiment. As shown in FIG. 1, each of the call terminal and the speaker identification server has a
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU(Central Processing Unit) やGPU(Graphics Processing Unit)などの演算処理装置である。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置(例:キーボード、マウス、マイク等)、外部装置、外部サーバ、外部センサ等から情報を取得するためのインターフェイスや、出力装置(例:ディスプレイ、スピーカ、プリンター、メーラ等)、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
The
次に、通話端末及び話者識別サーバの機能構成について説明する。まず、通話端末の機能構成を説明する。図2の機能ブロック図に示すように、通話端末10は、通話部11と、生体情報取得部12と、第1の送信部13とを有する。
Next, the functional configuration of the call terminal and the speaker identification server will be described. First, the functional configuration of the telephone terminal will be described. As shown in the functional block diagram of FIG. 2, the
通話部11は、他の通話端末と通話する。すなわち、通話部11は、ユーザ操作に応じて、発呼処理及び着呼処理を行う。また、発信側通話端末の発呼処理、及び、着信側通話端末の着呼処理により通話が確立されると、通話部11は、マイクを介して入力された音声データを通話相手の通話端末に送信する。また、通話部11は、通話相手の通話端末から音声データを受信し、当該音声データを処理してスピーカから音を出力させる。通話部11による通話手段は特段制限されないが、例えばSIP(session initiation protocol)等を利用することができる。
The
生体情報取得部12は、通話中(発呼処理及びそれに対する着呼処理により通話が確立されている間。以下同様。)、生体情報を繰り返し取得する。
The biometric
生体情報取得部12は、所定時間毎に繰り返し生体情報を取得してもよい。その他、生体情報取得部12は、通話開始後に少なくとも1回生体情報を取得し、その後、話者が変更したと判断される毎に生体情報を取得してもよい。話者変更の検出は、例えばマイクを介して入力される話者の声を利用した声紋認証により実現できる。
The biological
生体情報取得部12は、生体情報として、体の一部(例:顔)の画像、体(例:耳の中)で反射した反射音(耳認証で用いる情報)、指紋又は声を取得する手段を有する。なお、生体情報取得部12は、その他の生体情報を取得する手段を有してもよい。
The biological
例えば、通話端末10はカメラを有してもよい。そして、当該カメラで話者の体の一部(例:顔)を撮影してもよい。その他、通話端末10にマイク一体型イヤホンが取り付けられてもよい。そして、イヤホンから音を出力し、話者の耳の中で反射した音をマイクで収集してもよい。
For example, the
その他、通話端末10は、指紋センサを有してもよい。そして、当該指紋センサで話者の指紋を収集してもよい。指紋センサは通話端末10の持ち手部分に設けられてもよい。このようにすれば、通話中に話者に意識させることなく話者の指紋を収集できる。その他、通話端末10は、マイクを有してもよい。そして、当該マイクで話者の声を収集してもよい。なお、通話中、話者の声が継続的にマイクを介して入力され、その音声データが通話相手の通話端末に送信される。生体情報取得部12は、当該音声データ(話者の声)を生体情報として取得することができる。
In addition, the
以降、通話端末10と通話中の通話端末を「通話相手端末」という。
Hereinafter, the calling terminal that is in a call with the calling
第1の送信部13は、通話中、話者識別情報を話者識別サーバ20に繰り返し送信する。話者識別情報は、生体情報取得部12により取得された生体情報、又は、当該生体情報から抽出された特徴量である。第1の送信部13は、生体情報取得部12により生体情報を取得される毎に、話者識別情報を話者識別サーバ20に送信してもよい。
The
また、第1の送信部13は、通話相手端末の通信アドレス(例:IPアドレス)を話者識別サーバ20に送信してもよい。
Further, the
次に、図3のフローチャートを用いて、通話端末10の処理の流れの一例を説明する。図3の処理は、他の通話端末との間の通話の確立に応じて行われる。
Next, an example of the processing flow of the
通話開始後、生体情報取得タイミングになると(S10のYes)、生体情報取得部12は話者の生体情報を取得する(S11)。そして、第1の送信部13は、話者識別情報を話者識別サーバ20に送信する(S12)。話者識別情報は、S11で取得された生体情報、又は、当該生体情報から抽出された特徴量である。
After the start of the call, when the biometric information acquisition timing comes (Yes in S10), the biometric
通話が終了していない間(S13のNo)、生体情報取得タイミング待ちとなる(S10)。そして、生体情報取得タイミングになると(S10のYes)、同様の処理を行う。また、通話が終了すると(S13のYes)、当該処理を終了する。 While the call is not completed (No in S13), it waits for the biometric information acquisition timing (S10). Then, when the biometric information acquisition timing comes (Yes in S10), the same processing is performed. When the call ends (Yes in S13), the process ends.
次に、話者識別サーバの機能構成を説明する。図4の機能ブロック図に示すように、話者識別サーバ20は、受信部21と、話者識別部22と、送信部23とを有する。
Next, the functional configuration of the speaker identification server will be described. As shown in the functional block diagram of FIG. 4, the
受信部21は、通話中の通話端末10から、通話中に繰り返し取得された生体情報、又は、当該生体情報から抽出された特徴量である話者識別情報を受信する。
The receiving
話者識別部22は、受信部21により受信された話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する。図5に参照情報の一例を模式的に示す。図示する参照情報は、ユーザの氏名と、話者識別情報とが対応付けて登録されている。なお、ユーザの属性(年齢、性別、会社名、部署名、肩書等)等、その他の情報が登録されてもよい。
The
話者識別部22は、受信部21により受信された話者識別情報と、参照情報に含まれる話者識別情報とを用いた照合処理により、話者を識別することができる。
The
送信部23は、識別した話者を示す情報を、話者識別情報の送信元の通話端末10と通話中の通話相手端末に送信する。送信される情報は、話者の氏名のほか、話者の属性が含まれてもよい。話者識別サーバ20は、例えば通話端末10から、通話相手端末の通信アドレス(例:IPアドレス)を取得することができる。そして、それを利用して通話相手端末への情報の送信を実現できる。
The
次に、図6のフローチャートを用いて、話者識別サーバ20の処理の流れの一例を説明する。図6の処理は、話者識別情報の受信に応じて行われる。
Next, an example of the processing flow of the
S20では、話者識別部22は、受信部21により受信された話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する。
In S20, the
S21では、送信部23は、識別した話者を示す情報を通話相手端末に送信する。話者識別サーバ20から話者を示す情報を受信した通話相手端末は、その情報を任意の出力手段(例:ディスプレイ、スピーカ等)を介して出力することができる。出力された情報に基づき、通話相手端末のユーザは、通話端末10の話者を識別できる。
In S21, the
なお、通話相手端末も、通話端末10と同様の機能を備えることができる。かかる場合、通話端末10のユーザは、話者識別サーバ20からの情報に基づき、通話相手端末の話者を識別できる。
The other party terminal can also have the same function as the
以上説明した本実施形態の通話システムによれば、ユーザは、通話中に通話相手(現在電話で話をしている相手)を識別することができる。 According to the calling system of the present embodiment described above, the user can identify the other party (the other party currently talking on the phone) during the call.
例えば、契約内容の変更、契約内容の確認等を電話で行う場合、通話相手が契約者本人であるかの確認が求められる。本実施形態の通話システムによれば、本人確認を容易かつ高精度に行うことができる。 For example, when changing the contract contents or confirming the contract contents by telephone, it is required to confirm whether the other party is the contractor. According to the call system of the present embodiment, identity verification can be performed easily and with high accuracy.
また、声だけでの通話相手の識別が困難な場合であっても、本実施形態の通話システムによれば、通話中に容易かつ高精度に通話相手を識別することができる。 Further, even when it is difficult to identify the other party by voice alone, the call system of the present embodiment can easily and highly accurately identify the other party during a call.
また、声だけでの通話相手の識別が困難なことを利用した詐欺行為が存在するが、本実施形態の通話システムによれば、当該詐欺行為の抑制効果が期待される。 Further, there is a fraudulent act utilizing the fact that it is difficult to identify the call partner only by voice, but according to the call system of the present embodiment, the effect of suppressing the fraudulent act is expected.
また、本実施形態の通話システムによれば、電話している相手を識別できるので、通話相手を誤認して秘密の情報等を部外者に話してしまう不都合等を回避できる。結果、セキュリティーが向上する。 Further, according to the calling system of the present embodiment, since the calling party can be identified, it is possible to avoid the inconvenience of misidentifying the calling party and telling secret information or the like to an outsider. As a result, security is improved.
また、本実施形態の通話システムによれば、電話している相手を識別できるので、電話の取次ぎの間違いが減るほか、電話の取次業務が簡易化される。 Further, according to the call system of the present embodiment, since the telephone party can be identified, the mistake of the telephone agency is reduced and the telephone agency work is simplified.
また、本実施形態の通話システムでは、通話中に話者の生体情報の取得を繰り返し行い、当該生体情報に基づく話者識別を繰り返し行うことができる。このため、例えば通話端末10の話者が通話中に変わった場合、通話相手端末のユーザは当該話者の変更を認識することができる。そして、通話相手端末のユーザは、変更後の話者を識別することができる。
Further, in the call system of the present embodiment, it is possible to repeatedly acquire the biological information of the speaker during the call and repeatedly identify the speaker based on the biological information. Therefore, for example, when the speaker of the
ここで、変形例を説明する。通話システムは、発呼操作後かつ通話開始前に、上記話者識別処理を行ってもよい。すなわち、通話端末10の生体情報取得部12は、発呼操作後かつ通話開始前に、生体情報を取得してもよい。そして、通話端末10の第1の送信部13は、発呼操作後かつ通話開始前に、話者識別情報を話者識別サーバ20に送信してもよい。話者識別サーバ20の受信部21は、発呼操作後かつ通話開始前に通話端末10から話者識別情報を受信してもよい。そして、話者識別サーバ20の送信部23は、識別した話者を示す情報を、話者識別情報の送信元の通話端末10、又は、話者識別情報の送信元の通話端末10の発呼先の通話端末に送信してもよい。
Here, a modified example will be described. The call system may perform the speaker identification process after the call is made and before the call is started. That is, the biometric
当該変形例によれば、ユーザは、通話中に通話相手(現在電話で話をしている相手)を識別するのみならず、通話開始前に発呼元の相手を識別することができる。 According to the modification, the user can not only identify the other party (the other party currently talking on the phone) during the call, but also identify the caller party before the start of the call.
<第2の実施形態>
本実施形態の通話システムは、話者識別サーバ20により生成された話者を示す情報が通話相手端末に届けられるまでのルートが第1の実施形態と異なる。具体的には、話者識別サーバ20は、話者識別情報を通話端末10に返信する。そして、通話端末10が話者識別サーバ20から受信した話者を示す情報を通話相手端末に送信する。その他の構成は第1の実施形態と同様である。
<Second embodiment>
In the call system of the present embodiment, the route until the information indicating the speaker generated by the
通話端末10及び話者識別サーバ20のハードウエア構成の一例は、第1の実施形態と同様である。
An example of the hardware configuration of the
まず、通話端末10の機能構成を説明する。図7の機能ブロック図に示すように、通話端末10は、通話部11と、生体情報取得部12と、第1の送信部13と、受信部14と、第2の送信部15とを有する。通話部11、生体情報取得部12及び第1の送信部13の機能構成は、第1の実施形態と同様である。
First, the functional configuration of the
受信部14は、話者識別サーバ20から話者を示す情報を受信する。話者を示す情報は、第1の送信部13が話者識別サーバ20に送信した話者識別情報に基づき、話者識別サーバ20にて識別された話者を示す情報である。
The receiving
第2の送信部15は、受信部14により受信された話者を示す情報を、通話相手端末に送信する。
The
次に、図8のフローチャートを用いて、通話端末10の処理の流れの一例を説明する。図8の処理は、他の通話端末との間の通話の確立に応じて行われる。
Next, an example of the processing flow of the
通話開始後、生体情報取得タイミングになると(S30のYes)、生体情報取得部12は話者の生体情報を取得する(S31)。そして、第1の送信部13は、話者識別情報を話者識別サーバ20に送信する(S32)。話者識別情報は、S11で取得された生体情報、又は、当該生体情報から抽出された特徴量である。
After the start of the call, when the biometric information acquisition timing comes (Yes in S30), the biometric
その後、S32での話者識別情報の送信に応じて話者識別サーバ20から返信されてきた話者を示す情報を、受信部14が受信する(S33)。そして、第2の送信部15は、S33で受信された話者を示す情報を通話相手端末に送信する。通話端末10から話者を示す情報を受信した通話相手端末は、その情報を任意の出力手段(例:ディスプレイ、スピーカ等)を介して出力することができる。出力された情報に基づき、通話相手端末のユーザは、通話端末10の話者を識別できる。
After that, the receiving
通話が終了していない間(S35のNo)、生体情報取得タイミング待ちとなる(S30)。そして、生体情報取得タイミングになると(S30のYes)、同様の処理を行う。また、通話が終了すると(S35のYes)、当該処理を終了する。 While the call is not completed (No in S35), it waits for the biometric information acquisition timing (S30). Then, when the biometric information acquisition timing comes (Yes in S30), the same processing is performed. When the call ends (Yes in S35), the process ends.
次に、話者識別サーバの機能構成を説明する。図4の機能ブロック図に示すように、話者識別サーバ20は、受信部21と、話者識別部22と、送信部23とを有する。受信部21及び話者識別部22の機能構成は、第1の実施形態と同様である。
Next, the functional configuration of the speaker identification server will be described. As shown in the functional block diagram of FIG. 4, the
送信部23は、話者識別部22により識別された話者を示す情報を、話者識別情報の送信元の通話端末10に送信する。
The
次に、図9のフローチャートを用いて、話者識別サーバ20の処理の流れの一例を説明する。図9の処理は、話者識別情報の受信に応じて行われる。
Next, an example of the processing flow of the
S40では、話者識別部22は、受信部21により受信された話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する。
In S40, the
S41では、送信部23は、識別した話者を示す情報を、話者識別情報の送信元である通話端末10に送信する。
In S41, the
以上説明した本実施形態の通話システムによれば、第1の実施形態と同様な作用効果が実現される。 According to the communication system of the present embodiment described above, the same operation and effect as those of the first embodiment are realized.
<第3の実施形態>
本実施形態の通話システムでは、通話端末10は複数種類の生体情報を取得する手段を有し、周囲環境に基づき話者識別サーバ20に送信する生体情報の種類を変更できる点で、第1及び第2の実施形態と異なる。その他の構成は第1及び第2の実施形態と同様である。
<Third embodiment>
In the call system of the present embodiment, the
通話端末10及び話者識別サーバ20のハードウエア構成の一例は、第1及び第2の実施形態と同様である。
An example of the hardware configuration of the
まず、通話端末10の機能構成を説明する。図10の機能ブロック図に示すように、通話端末10は、通話部11と、生体情報取得部12と、第1の送信部13と、選択部16とを有する。通話端末10は、さらに受信部14と、第2の送信部15とを有してもよい。通話部11、受信部14及び第2の送信部15の機能構成は、第1及び第2の実施形態と同様である。
First, the functional configuration of the
生体情報取得部12は、体の一部(例:顔)の画像、体(例:耳の中)で反射した反射音、指紋又は声の中の少なくとも2つを取得する手段を有する。生体情報取得部12のその他の機能構成は、第1及び第2の実施形態と同様である。
The biological
選択部16は、通話端末10の周囲環境に基づき、話者識別サーバ20に送信する生体情報の種類を選択する。
The
例えば、選択部16は、通話端末10の周囲が所定レベルより暗い場合、体で反射した反射音又は声を選択してもよい。この場合、通話端末10は照度センサを備えてもよい。そして、選択部16は照度センサの検出結果に基づき、通話端末10の周囲が所定レベルより暗いか否かを判断できる。
For example, the
また、選択部16は、通話端末10の周囲の騒音レベルが閾値以上である場合、体の一部の画像または指紋を選択してもよい。選択部16は、通話端末10のマイクを介して入力された音に基づき、通話端末10の周囲の騒音レベルが閾値以上か否かを判断できる。
Further, the
第1の送信部13は、選択部16により選択された種類の生体情報、又は、選択部16により選択された種類の生体情報から抽出された特徴量である話者識別情報を話者識別サーバ20に送信する。
The
話者識別サーバ20は、ユーザの氏名と、複数種類の話者識別情報とを対応付けた参照情報を記憶し、通話端末10から受信した種類の話者識別情報を用いて話者識別を行う。話者識別サーバ20のその他の機能構成は、第1及び第2の実施形態と同様である。
The
以上説明した本実施形態の通話システムによれば、第1及び第2の実施形態と同様な作用効果が実現される。また、本実施形態の通話システムによれば、通話端末10の周囲環境に基づき、話者認証に用いる生体情報を選択することができる。例えば、周囲が暗い場合は、周囲の明るさに影響されない情報(体で反射した反射音や声)を話者認証に用いる生体情報として選択することができる。また、周囲がうるさい場合は、周囲のうるささに影響されない情報(体の一部の画像や指紋)を話者認証に用いる生体情報として選択することができる。かかる場合、周囲環境に影響されない高精度な話者認証が実現できる。
According to the communication system of the present embodiment described above, the same effects as those of the first and second embodiments are realized. Further, according to the call system of the present embodiment, biometric information used for speaker authentication can be selected based on the surrounding environment of the
<第4の実施形態>
本実施形態の通話システムでは、内線通話中に話者識別を行い、外線通話中に話者識別を行わない点で、第1乃至第3の実施形態と異なる。その他の構成は第1乃至第3の実施形態と同様である。
<Fourth Embodiment>
The call system of the present embodiment is different from the first to third embodiments in that the speaker is identified during the extension call and the speaker is not identified during the outside line call. Other configurations are the same as those of the first to third embodiments.
通話端末10及び話者識別サーバ20のハードウエア構成の一例は、第1乃至第3の実施形態と同様である。
An example of the hardware configuration of the
まず、通話端末10の機能構成を説明する。通話端末10の機能ブロック図の一例は、図2で示される。図示するように、通話端末10は、通話部11と、生体情報取得部12と、第1の送信部13とを有する。なお、通話端末10は、さらに、受信部14及び第2の送信部15を有してもよい。また、通話端末10は、受信部14及び第2の送信部15に加えて、又は代えて、選択部16を有してもよい。通話部11、受信部14、第2の送信部15及び選択部16の機能構成は、第1乃至第3の実施形態と同様である。
First, the functional configuration of the
生体情報取得部12は、内線通話中に生体情報を繰り返し取得する。そして、第1の送信部13は、内線通話中に話者識別情報を話者識別サーバ20に送信する。なお、生体情報取得部12は、外線通話中に生体情報を取得しない。そして、第1の送信部13は、外線通話中に話者識別情報を話者識別サーバ20に送信しない。生体情報取得部12及び第1の送信部13のその他の機能構成は、第1乃至第3の実施形態と同様である。
The biometric
話者識別サーバ20の機能構成は、第1乃至第3の実施形態と同様である。
The functional configuration of the
以上説明した本実施形態の通話システムによれば、第1乃至第3の実施形態と同様の作用効果を実現できる。また、本実施形態の通話システムによれば、閉じられた所定のエリア内(例:社内等)でのみ、話者識別機能を利用することができる。すなわち、利用エリアを制限することができる。 According to the communication system of the present embodiment described above, the same operation and effect as those of the first to third embodiments can be realized. Further, according to the call system of the present embodiment, the speaker identification function can be used only within a closed predetermined area (eg, in-house or the like). That is, the usage area can be restricted.
<第5の実施形態>
本実施形態の通話システムでは、通話端末10は所定の機能を有する通話端末と通話中に話者識別のための処理(生体情報の取得、話者識別情報の送信等)を行い、所定の機能を有さない通話端末と通話中に話者識別のための処理を行わない点で、第1乃至第4の実施形態と異なる。その他の構成は第1乃至第4の実施形態と同様である。
<Fifth Embodiment>
In the call system of the present embodiment, the
通話端末10及び話者識別サーバ20のハードウエア構成の一例は、第1乃至第4の実施形態と同様である。
An example of the hardware configuration of the
まず、通話端末10の機能構成を説明する。通話端末10の機能ブロック図の一例は、図2で示される。図示するように、通話端末10は、通話部11と、生体情報取得部12と、第1の送信部13とを有する。なお、通話端末10は、さらに、受信部14及び第2の送信部15を有してもよい。また、通話端末10は、受信部14及び第2の送信部15に加えて、又は代えて、選択部16を有してもよい。通話部11、受信部14、第2の送信部15及び選択部16の機能構成は、第1乃至第4の実施形態と同様である。
First, the functional configuration of the
生体情報取得部12は、所定の機能を有する通話端末と通話中に、生体情報を繰り返し取得する。そして、第1の送信部13は、所定の機能を有する通話端末と通話中に、話者識別情報を話者識別サーバ20に送信する。なお、生体情報取得部12は、所定の機能を有さない通話端末と通話中に、生体情報を取得しない。そして、第1の送信部13は、所定の機能を有さない通話端末と通話中に、話者識別情報を話者識別サーバ20に送信しない。なお、通話端末10は、発呼操作後かつ通話確立前、又は、通話確立後に、通話相手端末から所定の機能を有するか否かを示す情報を受信してもよい。そして、生体情報取得部12は、当該情報に基づき、通話相手端末が所定の機能を有するか否かを判断してもよい。生体情報取得部12及び第1の送信部13のその他の機能構成は、第1乃至第4の実施形態と同様である。
The biometric
所定の機能は、話者識別機能である。話者識別機能は、生体情報取得部12及び第1の送信部13により実現される機能である。なお、話者識別機能は、生体情報取得部12、第1の送信部13、受信部14及び第2の送信部15により実現される機能であってもよい。
A predetermined function is a speaker identification function. The speaker identification function is a function realized by the biological
話者識別サーバ20の機能構成は、第1乃至第4の実施形態と同様である。
The functional configuration of the
以上説明した本実施形態の通話システムによれば、第1乃至第4の実施形態と同様の作用効果を実現できる。また、本実施形態の通話システムによれば、通話中の2つの通話端末が互いに話者識別機能を有する場合に話者識別を行い、通話中の2つの通話端末の少なくとも一方が話者識別機能を有さない場合に話者識別を行わないようにできる。かかる場合、一方のみが自身を示す情報を相手方に伝える不公平を回避できる。 According to the communication system of the present embodiment described above, the same operation and effect as those of the first to fourth embodiments can be realized. Further, according to the call system of the present embodiment, speaker identification is performed when two call terminals in a call have a speaker identification function with each other, and at least one of the two call terminals in a call has a speaker identification function. It is possible to prevent speaker identification when the speaker is not identified. In such a case, it is possible to avoid unfairness in which only one person conveys information indicating himself / herself to the other party.
<第6の実施形態>
本実施形態の通話システムでは、通話端末10は所定の電話番号の通話端末と通話中に話者識別のための処理(生体情報の取得、話者識別情報の送信等)を行い、所定の電話番号でない通話端末と通話中に話者識別のための処理を行わない点で、第1乃至第5の実施形態と異なる。その他の構成は第1乃至第5の実施形態と同様である。
<Sixth Embodiment>
In the call system of the present embodiment, the
通話端末10及び話者識別サーバ20のハードウエア構成の一例は、第1乃至第5の実施形態と同様である。
An example of the hardware configuration of the
まず、通話端末10の機能構成を説明する。通話端末10の機能ブロック図の一例は、図2で示される。図示するように、通話端末10は、通話部11と、生体情報取得部12と、第1の送信部13とを有する。なお、通話端末10は、さらに、受信部14及び第2の送信部15を有してもよい。また、通話端末10は、受信部14及び第2の送信部15に加えて、又は代えて、選択部16を有してもよい。通話部11、受信部14、第2の送信部15及び選択部16の機能構成は、第1乃至第5の実施形態と同様である。
First, the functional configuration of the
生体情報取得部12は、所定の電話番号の通話端末と通話中に、生体情報を繰り返し取得する。そして、第1の送信部13は、所定の電話番号の通話端末と通話中に、話者識別情報を話者識別サーバ20に送信する。なお、生体情報取得部12は、所定の電話番号でない通話端末と通話中に、生体情報を取得しない。そして、第1の送信部13は、所定の電話番号でない通話端末と通話中に、話者識別情報を話者識別サーバ20に送信しない。生体情報取得部12及び第1の送信部13のその他の機能構成は、第1乃至第5の実施形態と同様である。
The biometric
例えば、ユーザは、予め自身の氏名等を通知してもよい電話番号のリスト(ホワイトリスト)を作成し、通話端末10に登録しておいてもよい。この場合、ホワイトリストに登録された電話番号が所定の電話番号となる。その他、ユーザは、予め自身の氏名等を通知することを拒否する電話番号のリスト(ブラックリスト)を作成し、通話端末10に登録しておいてもよい。この場合、ブラックリストに登録されていない電話番号が所定の電話番号となる。
For example, the user may create a list (white list) of telephone numbers for which his / her name or the like may be notified in advance and register it in the
話者識別サーバ20の機能構成は、第1乃至第5の実施形態と同様である。
The functional configuration of the
以上説明した本実施形態の通話システムによれば、第1乃至第5の実施形態と同様の作用効果を実現できる。また、本実施形態の通話システムによれば、ユーザは、自身の氏名等を伝える相手と、伝えない相手を決定することができる。このため、当該機能を利用して個人情報が不当に取得される不都合を回避できる。 According to the communication system of the present embodiment described above, the same operation and effect as those of the first to fifth embodiments can be realized. Further, according to the call system of the present embodiment, the user can determine a person who conveys his / her name and the like and a person who does not convey his / her name. Therefore, it is possible to avoid the inconvenience that personal information is illegally acquired by using the function.
<第7の実施形態>
本実施形態の通話システムは、話者識別サーバ20が識別結果を通話履歴として登録する機能を有する点で、第1乃至第6の実施形態と異なる。その他の構成は第1乃至第6の実施形態と同様である。
<7th Embodiment>
The call system of the present embodiment is different from the first to sixth embodiments in that the
通話端末10及び話者識別サーバ20のハードウエア構成の一例は、第1乃至第6の実施形態と同様である。
An example of the hardware configuration of the
通話端末10の機能構成は、第1乃至第6の実施形態と同様である。
The functional configuration of the
次に、話者識別サーバ20の機能構成を説明する。図11の機能ブロック図に示すように、話者識別サーバ20は、受信部21と、話者識別部22と、送信部23と、通話履歴登録部24とを有する。受信部21、話者識別部22及び送信部23の機能構成は、第1乃至第6の実施形態と同様である。
Next, the functional configuration of the
通話履歴登録部24は、話者識別部22による識別結果を通話履歴として登録する。図12に、通話履歴登録部24により登録される情報の一例を模式的に示す。図示する情報は、通話開始日時、通話終了日時、発呼側通話端末(第1の通話端末)のID(identifier)、発呼側通話端末の話者、着呼側通話端末(第2の通話端末)のID、及び、着呼側通話端末の話者を互いに対応付けている。発呼側通話端末の話者は、発呼側通話端末から話者識別サーバ20に送信された話者識別情報に基づき識別された話者である。着呼側通話端末の話者は、着呼側通話端末から話者識別サーバ20に送信された話者識別情報に基づき識別された話者である。
The call
図12に示すように、通話履歴登録部24は、通話中の2つの通話端末10各々に対応して識別された話者を、互いに対応付けて登録してもよい。当該情報によれば、だれとだれが電話する関係かを示す人間マップが得られる。
As shown in FIG. 12, the call
また、図12に示すように、通話履歴登録部24は、ある通話端末10に対応して識別された話者を、その通話端末10に対応付けて登録してもよい。当該情報によれば、ある通話端末10を利用する者を特定できる。また、ある通話端末10をよく利用する者や、たまに利用する者、ほとんど利用しない者、全く利用しない者等を特定できる。
Further, as shown in FIG. 12, the call
なお、「ある通話端末10に対応して識別された話者」は、その通話端末10から話者識別サーバ20に送信された話者識別情報に基づき識別された話者である。
The "speaker identified corresponding to a
また、図12に示すように、通話履歴登録部24は、ある通話端末10に対応して識別された複数の話者を、互いに対応付けて登録してもよい。例えば、通話履歴登録部24は、1つの通話中に、ある通話端末10に対応して識別された複数の話者を、互いに対応付けて登録してもよい。当該情報によれば、だれとだれが通話を途中で変わる関係かを示す人間マップが得られる。
Further, as shown in FIG. 12, the call
また、通話履歴登録部24により登録される情報は、ある人がある時刻に電話していたことを証明する資料としても利用することができる。例えば、電話会議などの場合には、当該会議に参加していた者を確認したり、証明したりできる。
In addition, the information registered by the call
以上説明した本実施形態の通話システムによれば、第1乃至第6の実施形態と同様の作用効果を実現できる。また、本実施形態の通話システムによれば、話者識別の結果を通話履歴として登録できる。登録された情報によれば、人間関係や、人と通話端末10との関係等を把握することができる。また、登録された情報を、所定の事実の証明として利用することもできる。
According to the communication system of the present embodiment described above, the same operation and effect as those of the first to sixth embodiments can be realized. Further, according to the call system of the present embodiment, the result of speaker identification can be registered as a call history. According to the registered information, it is possible to grasp the human relationship, the relationship between the person and the calling
以下、参考形態の例を付記する。
1. 他の通話端末と通話する通話手段と、
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段と、
を有する通話端末。
2. 1に記載の通話端末において、
前記話者識別情報に基づき識別された話者を示す情報を、前記話者識別サーバから受信する受信手段と、
前記話者を示す情報を通話相手の通話端末に送信する第2の送信手段と、
を有する通話端末。
3. 1又は2に記載の通話端末において、
前記生体情報取得手段は、体の一部の画像、体で反射した反射音、指紋又は声を取得する手段を有する通話端末。
4. 1又は2に記載の通話端末において、
前記生体情報取得手段は、体の一部の画像、体で反射した反射音、指紋及び声の中の少なくとも2つを取得する手段を有し、
周囲環境に基づき、前記話者識別サーバに送信する前記生体情報の種類を選択する選択手段を有し、
前記第1の送信手段は、前記選択手段により選択された種類の前記生体情報、又は、前記選択手段により選択された種類の前記生体情報から抽出された特徴量である前記話者識別情報を前記話者識別サーバに送信する通話端末。
5. 4に記載の通話端末において、
前記選択手段は、周囲が所定レベルより暗い場合、体で反射した反射音又は声を選択する通話端末。
6. 4又は5に記載の通話端末において、
前記選択手段は、周囲の騒音レベルが閾値以上である場合、体の一部の画像または指紋を選択する通話端末。
7. 1から6のいずれかに記載の通話端末において、
前記生体情報取得手段は、発呼操作後かつ通話開始前に、前記生体情報を取得し、
前記第1の送信手段は、発呼操作後かつ通話開始前に、前記話者識別情報を前記話者識別サーバに送信する通話端末。
8. 1から7のいずれかに記載の通話端末において、
内線通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
外線通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しない通話端末。
9. 1から8のいずれかに記載の通話端末において、
所定の機能を有する通話端末と通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
所定の機能を有さない通話端末と通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しない通話端末。
10. 1から9のいずれかに記載の通話端末において、
所定の電話番号の通話端末と通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
所定の電話番号でない通話端末と通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しない通話端末。
11. 通話中の通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信手段と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段と、
を有する話者識別サーバ。
12. 11に記載の話者識別サーバにおいて、
前記話者識別手段による識別結果を登録する通話履歴登録手段を有する話者識別サーバ。
13. 12に記載の話者識別サーバにおいて、
前記通話履歴登録手段は、通話中の2つの通話端末各々に対応して識別された話者を、互いに対応付けて登録する話者識別サーバ。
14. 12又は13に記載の話者識別サーバにおいて、
前記通話履歴登録手段は、ある通話端末に対応して識別された話者を、その通話端末に対応付けて登録する話者識別サーバ。
15. 12から14のいずれかに記載の話者識別サーバにおいて、
前記通話履歴登録手段は、ある通話端末に対応して識別された複数の話者を、互いに対応付けて登録する話者識別サーバ。
16. 15に記載の話者識別サーバにおいて、
前記通話履歴登録手段は、1つの通話中に、ある通話端末に対応して識別された複数の話者を、互いに対応付けて登録する話者識別サーバ。
17. 11から16のいずれかに記載の話者識別サーバにおいて、
前記受信手段は、発呼操作後かつ通話開始前に前記通話端末から前記話者識別情報を受信し、
前記送信手段は、前記識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末の発呼先の通話端末に送信する話者識別サーバ。
18. 通話端末と話者識別サーバとを有し、
前記通話端末は、
他の通話端末と通話する通話手段と、
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を前記話者識別サーバに繰り返し送信する第1の送信手段と、
を有し、
前記話者識別サーバは、
通話中の前記通話端末から、前記話者識別情報を受信する受信手段と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段と、
を有する通話システム。
19. コンピュータが、
他の通話端末と通話する通話工程と、
通話中、生体情報を繰り返し取得する生体情報取得工程と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信工程と、
を実行する通話端末の処理方法。
20. コンピュータを、
他の通話端末と通話する通話手段、
通話中、生体情報を繰り返し取得する生体情報取得手段、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段、
として機能させるプログラム。
21. コンピュータが、
通話中の通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信工程と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別工程と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信工程と、
を実行する話者識別サーバの処理方法。
22. コンピュータを、
通話中の通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信手段、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段、
として機能させるプログラム。
Hereinafter, an example of the reference form will be added.
1. 1. A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Means and
Call terminal with.
2. 2. In the call terminal according to 1.
A receiving means for receiving information indicating a speaker identified based on the speaker identification information from the speaker identification server, and
A second transmission means for transmitting information indicating the speaker to the call terminal of the other party,
Call terminal with.
3. 3. In the call terminal described in 1 or 2,
The biological information acquisition means is a communication terminal having a means for acquiring an image of a part of a body, a reflected sound reflected by the body, a fingerprint, or a voice.
4. In the call terminal described in 1 or 2,
The biological information acquisition means has means for acquiring at least two of an image of a part of the body, a reflected sound reflected by the body, a fingerprint, and a voice.
It has a selection means for selecting the type of biometric information to be transmitted to the speaker identification server based on the surrounding environment.
The first transmission means uses the speaker identification information, which is a feature amount extracted from the biological information of the type selected by the selection means or the biological information of the type selected by the selection means. A calling terminal that sends to the speaker identification server.
5. In the call terminal according to 4.
The selection means is a telephone terminal that selects a reflected sound or voice reflected by the body when the surroundings are darker than a predetermined level.
6. In the calling terminal described in 4 or 5,
The selection means is a telephone terminal that selects an image or fingerprint of a part of the body when the ambient noise level is equal to or higher than a threshold value.
7. In the call terminal according to any one of 1 to 6,
The biometric information acquisition means acquires the biometric information after the call operation and before the start of the call.
The first transmission means is a call terminal that transmits the speaker identification information to the speaker identification server after a call call operation and before the start of a call.
8. In the call terminal described in any one of 1 to 7,
During the extension call, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
A call terminal in which the biometric information acquisition means does not acquire the biometric information during an outside line call, and the first transmission means does not transmit the speaker identification information to the speaker identification server.
9. In the call terminal according to any one of 1 to 8,
During a call with a call terminal having a predetermined function, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
During a call with a call terminal that does not have a predetermined function, the biometric information acquisition means does not acquire the biometric information, and the first transmission means does not transmit the speaker identification information to the speaker identification server. Terminal.
10. In the call terminal according to any one of 1 to 9.
During a call with a call terminal having a predetermined telephone number, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
A call terminal in which the biometric information acquisition means does not acquire the biometric information and the first transmission means does not transmit the speaker identification information to the speaker identification server during a call with a call terminal that does not have a predetermined telephone number.
11. A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission means for transmitting information indicating the identified speaker to the calling terminal of the sender of the speaker identification information, or to the calling terminal of the sender of the speaker identification information and the calling terminal during a call.
Speaker identification server with.
12. In the speaker identification server according to 11.
A speaker identification server having a call history registration means for registering an identification result by the speaker identification means.
13. In the speaker identification server according to 12.
The call history registration means is a speaker identification server that registers speakers identified corresponding to each of two call terminals during a call in association with each other.
14. In the speaker identification server according to 12 or 13,
The call history registration means is a speaker identification server that registers a speaker identified corresponding to a certain call terminal in association with the call terminal.
15. In the speaker identification server according to any one of 12 to 14.
The call history registration means is a speaker identification server that registers a plurality of speakers identified corresponding to a certain call terminal in association with each other.
16. In the speaker identification server according to 15.
The call history registration means is a speaker identification server that registers a plurality of speakers identified corresponding to a certain call terminal in association with each other during one call.
17. In the speaker identification server according to any one of 11 to 16.
The receiving means receives the speaker identification information from the calling terminal after the calling operation and before the start of the call, and the receiving means receives the speaker identification information.
The transmitting means transmits information indicating the identified speaker to the calling terminal of the source of the speaker identification information or the calling terminal of the calling terminal of the source of the speaker identification information. Speaker identification server.
18. It has a call terminal and a speaker identification server,
The call terminal is
A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
A first transmission means for repeatedly transmitting the biological information or speaker identification information, which is a feature amount extracted from the biological information, to the speaker identification server during a call.
Have,
The speaker identification server is
A receiving means for receiving the speaker identification information from the calling terminal during a call, and
A speaker identification means for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission means for transmitting information indicating the identified speaker to the calling terminal of the sender of the speaker identification information, or to the calling terminal of the sender of the speaker identification information and the calling terminal during a call.
Call system with.
19. The computer
The call process of talking to other call terminals and
The biometric information acquisition process, which repeatedly acquires biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Process and
How to handle the calling terminal that executes.
20. Computer,
A means of calling to talk to other calling terminals,
Biometric information acquisition means that repeatedly acquires biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. means,
A program that functions as.
21. The computer
A receiving process of receiving biometric information repeatedly acquired during a call or speaker identification information, which is a feature amount extracted from the biometric information, from a calling terminal during a call.
A speaker identification process for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission step of transmitting information indicating the identified speaker to the call terminal of the sender of the speaker identification information or the call terminal of the sender of the speaker identification information and the call terminal in conversation.
How to handle the speaker identification server that runs.
22. Computer,
A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information and the reference information registered in advance.
A transmission means for transmitting information indicating an identified speaker to a calling terminal that is a source of the speaker identification information, or a calling terminal that is in a call with a calling terminal that is a source of the speaker identification information.
A program that functions as.
1A プロセッサ
2A メモリ
3A 入出力I/F
4A 周辺回路
5A バス
10 通話端末
11 通話部
12 生体情報取得部
13 第1の送信部
14 受信部
15 第2の送信部
16 選択部
20 話者識別サーバ
21 受信部
22 話者識別部
23 送信部
24 通話履歴登録部
4A
Claims (27)
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段と、
を有し、
内線通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
外線通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しない通話端末。 A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Means and
Have,
During the extension call, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
A call terminal in which the biometric information acquisition means does not acquire the biometric information during an outside line call, and the first transmission means does not transmit the speaker identification information to the speaker identification server .
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段と、
を有し、
所定の電話番号の通話端末と通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
所定の電話番号でない通話端末と通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しない通話端末。 A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Means and
Have,
During a call with a call terminal having a predetermined telephone number, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
A call terminal in which the biometric information acquisition means does not acquire the biometric information and the first transmission means does not transmit the speaker identification information to the speaker identification server during a call with a call terminal that does not have a predetermined telephone number.
前記話者識別情報に基づき識別された話者を示す情報を、前記話者識別サーバから受信する受信手段と、
前記話者を示す情報を通話相手の通話端末に送信する第2の送信手段と、
を有する通話端末。 In the call terminal according to claim 1 or 2 .
A receiving means for receiving information indicating a speaker identified based on the speaker identification information from the speaker identification server, and
A second transmission means for transmitting information indicating the speaker to the call terminal of the other party,
Call terminal with.
前記生体情報取得手段は、体の一部の画像、体で反射した反射音、指紋又は声を取得する手段を有する通話端末。 In the telephone terminal according to any one of claims 1 to 3 ,
The biological information acquisition means is a communication terminal having a means for acquiring an image of a part of a body, a reflected sound reflected by the body, a fingerprint, or a voice.
前記生体情報取得手段は、体の一部の画像、体で反射した反射音、指紋及び声の中の少なくとも2つを取得する手段を有し、
周囲環境に基づき、前記話者識別サーバに送信する前記生体情報の種類を選択する選択手段を有し、
前記第1の送信手段は、前記選択手段により選択された種類の前記生体情報、又は、前記選択手段により選択された種類の前記生体情報から抽出された特徴量である前記話者識別情報を前記話者識別サーバに送信する通話端末。 In the telephone terminal according to any one of claims 1 to 4 .
The biological information acquisition means has means for acquiring at least two of an image of a part of the body, a reflected sound reflected by the body, a fingerprint, and a voice.
It has a selection means for selecting the type of biometric information to be transmitted to the speaker identification server based on the surrounding environment.
The first transmission means uses the speaker identification information, which is a feature amount extracted from the biological information of the type selected by the selection means or the biological information of the type selected by the selection means. A calling terminal that sends to the speaker identification server.
前記選択手段は、周囲が所定レベルより暗い場合、体で反射した反射音又は声を選択する通話端末。 In the call terminal according to claim 5 ,
The selection means is a telephone terminal that selects a reflected sound or voice reflected by the body when the surroundings are darker than a predetermined level.
前記選択手段は、周囲の騒音レベルが閾値以上である場合、体の一部の画像または指紋を選択する通話端末。 In the call terminal according to claim 5 or 6 .
The selection means is a telephone terminal that selects an image or fingerprint of a part of the body when the ambient noise level is equal to or higher than a threshold value.
前記生体情報取得手段は、発呼操作後かつ通話開始前に、前記生体情報を取得し、
前記第1の送信手段は、発呼操作後かつ通話開始前に、前記話者識別情報を前記話者識別サーバに送信する通話端末。 In the telephone terminal according to any one of claims 1 to 7 .
The biometric information acquisition means acquires the biometric information after the call operation and before the start of the call.
The first transmission means is a call terminal that transmits the speaker identification information to the speaker identification server after a call call operation and before the start of a call.
所定の機能を有する通話端末と通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
所定の機能を有さない通話端末と通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しない通話端末。 In the telephone terminal according to any one of claims 1 to 8.
During a call with a call terminal having a predetermined function, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
During a call with a call terminal that does not have a predetermined function, the biometric information acquisition means does not acquire the biometric information, and the first transmission means does not transmit the speaker identification information to the speaker identification server. Terminal.
前記受信手段が受信した前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
前記話者識別手段が識別した話者を示す情報を、前記話者識別情報の送信元の前記通話端末、又は、前記話者識別情報の送信元の前記通話端末と通話中の通話端末に送信する送信手段と、
を有し、
前記受信手段は、内線通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信し、外線通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信しない話者識別サーバ。 A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information received by the receiving means and the reference information registered in advance.
Information indicating the speaker identified by the speaker identification means is transmitted to the call terminal of the sender of the speaker identification information or the call terminal in talk with the call terminal of the sender of the speaker identification information. And the means of transmission
Have,
The receiving means receives the biometric information and the speaker identification information from the call terminal during an extension call, and does not receive the biometric information and the speaker identification information from the call terminal during an outside line call. Speaker identification server.
前記受信手段が受信した前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
前記話者識別手段が識別した話者を示す情報を、前記話者識別情報の送信元の前記通話端末、又は、前記話者識別情報の送信元の前記通話端末と通話中の通話端末に送信する送信手段と、
を有し、
前記受信手段は、所定の電話番号の通話端末と通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信し、所定の電話番号でない通話端末と通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信しない話者識別サーバ。 A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from a calling terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information received by the receiving means and the reference information registered in advance.
Information indicating the speaker identified by the speaker identification means is transmitted to the call terminal of the sender of the speaker identification information or the call terminal in talk with the call terminal of the sender of the speaker identification information. And the means of transmission
Have,
The receiving means receives the biometric information and the speaker identification information from the calling terminal during a call with the calling terminal having a predetermined telephone number, and from the calling terminal during a call with a calling terminal having a non-predetermined telephone number. A speaker identification server that does not receive the biometric information and the speaker identification information .
前記話者識別手段による識別結果を登録する通話履歴登録手段を有する話者識別サーバ。 In the speaker identification server according to claim 10 or 11 .
A speaker identification server having a call history registration means for registering an identification result by the speaker identification means.
前記通話履歴登録手段は、通話中の2つの通話端末各々に対応して識別された話者を、互いに対応付けて登録する話者識別サーバ。 In the speaker identification server according to claim 12,
The call history registration means is a speaker identification server that registers speakers identified corresponding to each of two call terminals during a call in association with each other.
前記通話履歴登録手段は、ある通話端末に対応して識別された話者を、その通話端末に対応付けて登録する話者識別サーバ。 In the speaker identification server according to claim 12 or 13.
The call history registration means is a speaker identification server that registers a speaker identified corresponding to a certain call terminal in association with the call terminal.
前記通話履歴登録手段は、ある通話端末に対応して識別された複数の話者を、互いに対応付けて登録する話者識別サーバ。 In the speaker identification server according to any one of claims 12 to 14,
The call history registration means is a speaker identification server that registers a plurality of speakers identified corresponding to a certain call terminal in association with each other.
前記通話履歴登録手段は、1つの通話中に、ある通話端末に対応して識別された複数の話者を、互いに対応付けて登録する話者識別サーバ。 In the speaker identification server according to claim 15,
The call history registration means is a speaker identification server that registers a plurality of speakers identified corresponding to a certain call terminal in association with each other during one call.
前記受信手段は、発呼操作後かつ通話開始前に前記通話端末から前記話者識別情報を受信し、
前記送信手段は、前記識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末の発呼先の通話端末に送信する話者識別サーバ。 In the speaker identification server according to any one of claims 11 to 16.
The receiving means receives the speaker identification information from the calling terminal after the calling operation and before the start of the call, and the receiving means receives the speaker identification information.
The transmitting means transmits information indicating the identified speaker to the calling terminal of the source of the speaker identification information or the calling terminal of the calling terminal of the source of the speaker identification information. Speaker identification server.
前記通話端末は、
他の通話端末と通話する通話手段と、
通話中、生体情報を繰り返し取得する生体情報取得手段と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を前記話者識別サーバに繰り返し送信する第1の送信手段と、
を有し、
内線通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
外線通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信せず、
前記話者識別サーバは、
通話中の前記通話端末から、前記話者識別情報を受信する受信手段と、
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段と、
を有する通話システム。 It has a call terminal and a speaker identification server,
The call terminal is
A means of calling with other calling terminals,
Biometric information acquisition means for repeatedly acquiring biometric information during a call,
A first transmission means for repeatedly transmitting the biological information or speaker identification information, which is a feature amount extracted from the biological information, to the speaker identification server during a call.
Have,
During the extension call, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
During an outside line call, the biometric information acquisition means does not acquire the biometric information, and the first transmission means does not transmit the speaker identification information to the speaker identification server.
The speaker identification server is
A receiving means for receiving the speaker identification information from the calling terminal during a call, and
A speaker identification means for identifying a speaker based on the speaker identification information and pre-registered reference information,
A transmission means for transmitting information indicating the identified speaker to the calling terminal of the sender of the speaker identification information, or to the calling terminal of the sender of the speaker identification information and the calling terminal during a call.
Call system with.
前記通話端末は、 The call terminal is
他の通話端末と通話する通話手段と、 A means of calling with other calling terminals,
通話中、生体情報を繰り返し取得する生体情報取得手段と、 Biometric information acquisition means for repeatedly acquiring biometric information during a call,
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を前記話者識別サーバに繰り返し送信する第1の送信手段と、 A first transmission means for repeatedly transmitting the biological information or speaker identification information, which is a feature amount extracted from the biological information, to the speaker identification server during a call.
を有し、Have,
所定の電話番号の通話端末と通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、 During a call with a call terminal having a predetermined telephone number, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
所定の電話番号でない通話端末と通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信せず、 During a call with a call terminal that does not have a predetermined telephone number, the biometric information acquisition means does not acquire the biometric information, and the first transmission means does not transmit the speaker identification information to the speaker identification server.
前記話者識別サーバは、 The speaker identification server is
通話中の前記通話端末から、前記話者識別情報を受信する受信手段と、A receiving means for receiving the speaker identification information from the calling terminal during a call, and
前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段と、 A speaker identification means for identifying a speaker based on the speaker identification information and pre-registered reference information,
識別した話者を示す情報を、前記話者識別情報の送信元の通話端末、又は、前記話者識別情報の送信元の通話端末と通話中の通話端末に送信する送信手段と、 A transmission means for transmitting information indicating the identified speaker to the calling terminal of the sender of the speaker identification information, or to the calling terminal of the sender of the speaker identification information and the calling terminal during a call.
を有する通話システム。Call system with.
他の通話端末と通話する通話工程と、
通話中、生体情報を繰り返し取得する生体情報取得工程と、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信工程と、
を実行する通話端末の処理方法であって、
前記コンピュータは、
当該通話端末が前記通話工程において内線通話中の場合に、前記生体情報取得工程、及び前記第1の送信工程を実行し、
当該通話端末が前記通話工程において外線通話中の場合に、前記生体情報取得工程、及び前記第1の送信工程を実行しない通話端末の処理方法。 The computer installed in the calling terminal
The call process of talking to other call terminals and
The biometric information acquisition process, which repeatedly acquires biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Process and
It is a processing method of the calling terminal that executes
The computer
When the call terminal is in an extension call in the call process, the biometric information acquisition step and the first transmission step are executed.
A processing method for a call terminal that does not execute the biometric information acquisition step and the first transmission step when the call terminal is in an outside line call in the call step .
他の通話端末と通話する通話工程と、 The call process of talking to other call terminals and
通話中、生体情報を繰り返し取得する生体情報取得工程と、 The biometric information acquisition process, which repeatedly acquires biometric information during a call,
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信工程と、 During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. Process and
を実行する通話端末の処理方法であって、It is a processing method of the calling terminal that executes
前記コンピュータは、 The computer
当該通話端末が前記通話工程において所定の電話番号の通話端末と通話中の場合に、前記生体情報取得工程、及び前記第1の送信工程を実行し、 When the call terminal is in a call with a call terminal having a predetermined telephone number in the call process, the biometric information acquisition step and the first transmission step are executed.
当該通話端末が前記通話工程において所定の電話番号でない通話端末と通話中の場合に、前記生体情報取得工程、及び前記第1の送信工程を実行しない通話端末の処理方法。 A method for processing a call terminal that does not execute the biometric information acquisition step and the first transmission step when the call terminal is in a call with a call terminal that does not have a predetermined telephone number in the call process.
他の通話端末と通話する通話手段、
通話中、生体情報を繰り返し取得する生体情報取得手段、
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段、
として機能させ、
当該通話端末が内線通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、
当該通話端末が外線通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しないプログラム。 A computer equipped with a calling terminal ,
A means of calling to talk to other calling terminals,
Biometric information acquisition means that repeatedly acquires biometric information during a call,
During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. means,
To function as
While the call terminal is making an extension call, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server.
A program in which the biometric information acquisition means does not acquire the biometric information and the first transmission means does not transmit the speaker identification information to the speaker identification server while the call terminal is on an outside line call .
他の通話端末と通話する通話手段、 A means of calling to talk to other calling terminals,
通話中、生体情報を繰り返し取得する生体情報取得手段、 Biometric information acquisition means that repeatedly acquires biometric information during a call,
通話中、前記生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を、前記話者識別情報に基づき話者を識別する話者識別サーバに繰り返し送信する第1の送信手段、 During a call, the biometric information or the speaker identification information, which is a feature amount extracted from the biometric information, is repeatedly transmitted to the speaker identification server that identifies the speaker based on the speaker identification information. means,
として機能させ、To function as
当該通話端末が所定の電話番号の通話端末と通話中に、前記生体情報取得手段は前記生体情報を繰り返し取得し、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信し、 While the call terminal is talking to a call terminal having a predetermined telephone number, the biometric information acquisition means repeatedly acquires the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server. death,
当該通話端末が所定の電話番号でない通話端末と通話中に、前記生体情報取得手段は前記生体情報を取得せず、前記第1の送信手段は前記話者識別情報を前記話者識別サーバに送信しないプログラム。 While the call terminal is talking to a call terminal that does not have a predetermined telephone number, the biometric information acquisition means does not acquire the biometric information, and the first transmission means transmits the speaker identification information to the speaker identification server. Not a program.
前記通話端末が内線通話をしている場合、
前記通話端末から通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信工程と、
前記受信工程において受信した前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別工程と、
前記話者識別工程において識別した話者を示す情報を、前記話者識別情報の送信元の前記通話端末、又は、前記話者識別情報の送信元の前記通話端末と通話中の通話端末に送信する送信工程と、
を実行し、
前記通話端末が外線通話をしている場合、
前記受信工程、前記話者識別工程、及び前記送信工程を実行しない話者識別サーバの処理方法。 The computer installed in the speaker identification server used with the telephone terminal
If the calling terminal is making an extension call
A receiving step of receiving biometric information repeatedly acquired from the calling terminal during a call or speaker identification information which is a feature amount extracted from the biometric information.
A speaker identification step for identifying a speaker based on the speaker identification information received in the reception step and reference information registered in advance, and a speaker identification step.
Information indicating the speaker identified in the speaker identification step is transmitted to the call terminal of the sender of the speaker identification information or the call terminal in talk with the call terminal of the sender of the speaker identification information. Transmission process and
And
If the calling terminal is making an outside line call,
A processing method of a speaker identification server that does not execute the reception step, the speaker identification step, and the transmission step .
前記通話端末が所定の電話番号の通話端末と通話をしている場合、 When the calling terminal is talking to a calling terminal with a predetermined telephone number,
前記通話端末から通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信工程と、 A receiving step of receiving biometric information repeatedly acquired from the call terminal during a call or speaker identification information which is a feature amount extracted from the biometric information.
前記受信工程において受信した前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別工程と、 A speaker identification step for identifying a speaker based on the speaker identification information received in the reception step and reference information registered in advance, and a speaker identification step.
前記話者識別工程において識別した話者を示す情報を、前記話者識別情報の送信元の前記通話端末、又は、前記話者識別情報の送信元の前記通話端末と通話中の通話端末に送信する送信工程と、 Information indicating the speaker identified in the speaker identification step is transmitted to the call terminal of the sender of the speaker identification information or the call terminal in talk with the call terminal of the sender of the speaker identification information. Transmission process and
を実行し、And
前記通話端末が所定の電話番号でない通話端末と通話をしている場合、 If the calling terminal is talking to a calling terminal that does not have a predetermined phone number,
前記受信工程、前記話者識別工程、及び前記送信工程を実行しない話者識別サーバの処理方法。 A processing method of a speaker identification server that does not execute the reception step, the speaker identification step, and the transmission step.
通話中の前記通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信手段、
前記受信手段が受信した前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段、
前記話者識別手段が識別した話者を示す情報を、前記話者識別情報の送信元の前記通話端末、又は、前記話者識別情報の送信元の前記通話端末と通話中の通話端末に送信する送信手段、
として機能させ、
前記受信手段は、内線通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信し、外線通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信しないプログラム。 A computer equipped with a speaker identification server used with a calling terminal ,
A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from the call terminal during a call.
A speaker identification means for identifying a speaker based on the speaker identification information received by the receiving means and the reference information registered in advance.
Information indicating the speaker identified by the speaker identification means is transmitted to the call terminal of the sender of the speaker identification information or the call terminal in talk with the call terminal of the sender of the speaker identification information. Transmission means,
To function as
The receiving means receives the biometric information and the speaker identification information from the call terminal during an extension call, and does not receive the biometric information and the speaker identification information from the call terminal during an outside line call. program.
通話中の前記通話端末から、通話中に繰り返し取得された生体情報、又は、前記生体情報から抽出された特徴量である話者識別情報を受信する受信手段、 A receiving means for receiving biometric information repeatedly acquired during a call or speaker identification information which is a feature amount extracted from the biometric information from the call terminal during a call.
前記受信手段が受信した前記話者識別情報と、予め登録されている参照情報とに基づき、話者を識別する話者識別手段、 A speaker identification means for identifying a speaker based on the speaker identification information received by the receiving means and the reference information registered in advance.
前記話者識別手段が識別した話者を示す情報を、前記話者識別情報の送信元の前記通話端末、又は、前記話者識別情報の送信元の前記通話端末と通話中の通話端末に送信する送信手段、 Information indicating the speaker identified by the speaker identification means is transmitted to the call terminal of the sender of the speaker identification information or the call terminal in talk with the call terminal of the sender of the speaker identification information. Transmission means,
として機能させ、To function as
前記受信手段は、所定の電話番号の通話端末と通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信し、所定の電話番号でない通話端末と通話中の前記通話端末から前記生体情報、及び、前記話者識別情報を受信しないプログラム。 The receiving means receives the biometric information and the speaker identification information from the calling terminal during a call with the calling terminal having a predetermined telephone number, and from the calling terminal during a call with a calling terminal having a non-predetermined telephone number. A program that does not receive the biometric information and the speaker identification information.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017242497A JP7073705B2 (en) | 2017-12-19 | 2017-12-19 | Call terminal, speaker identification server, call system, call terminal processing method, speaker identification server processing method and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017242497A JP7073705B2 (en) | 2017-12-19 | 2017-12-19 | Call terminal, speaker identification server, call system, call terminal processing method, speaker identification server processing method and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019110450A JP2019110450A (en) | 2019-07-04 |
| JP7073705B2 true JP7073705B2 (en) | 2022-05-24 |
Family
ID=67180247
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017242497A Active JP7073705B2 (en) | 2017-12-19 | 2017-12-19 | Call terminal, speaker identification server, call system, call terminal processing method, speaker identification server processing method and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7073705B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7375817B2 (en) * | 2019-07-24 | 2023-11-08 | 日本電気株式会社 | Voice processing device, telephone device, voice processing method, and program |
| EP4414979A3 (en) * | 2020-03-16 | 2024-09-11 | Panasonic Intellectual Property Corporation of America | Information transmission device, information reception device, information transmission method, program, and system |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004194008A (en) | 2002-12-11 | 2004-07-08 | Sanyo Electric Co Ltd | Telephone set |
| JP2007258954A (en) | 2006-03-22 | 2007-10-04 | Fujitsu Ltd | Spoofing prevention system, authentication device and authentication device program |
| JP2008035114A (en) | 2006-07-27 | 2008-02-14 | Nakayo Telecommun Inc | Telephone system with authentication function during incoming call response |
| US20090094029A1 (en) | 2007-10-04 | 2009-04-09 | Robert Koch | Managing Audio in a Multi-Source Audio Environment |
| JP2010212860A (en) | 2009-03-09 | 2010-09-24 | Hitachi Software Eng Co Ltd | Message transmission system |
| JP2013254315A (en) | 2012-06-06 | 2013-12-19 | Nec Casio Mobile Communications Ltd | Information processing device, authentication system, authentication server, method of controlling information processing device, method of controlling authentication server, and program |
| JP2014176033A (en) | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | Communication system, communication method and program |
-
2017
- 2017-12-19 JP JP2017242497A patent/JP7073705B2/en active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004194008A (en) | 2002-12-11 | 2004-07-08 | Sanyo Electric Co Ltd | Telephone set |
| JP2007258954A (en) | 2006-03-22 | 2007-10-04 | Fujitsu Ltd | Spoofing prevention system, authentication device and authentication device program |
| JP2008035114A (en) | 2006-07-27 | 2008-02-14 | Nakayo Telecommun Inc | Telephone system with authentication function during incoming call response |
| US20090094029A1 (en) | 2007-10-04 | 2009-04-09 | Robert Koch | Managing Audio in a Multi-Source Audio Environment |
| JP2010212860A (en) | 2009-03-09 | 2010-09-24 | Hitachi Software Eng Co Ltd | Message transmission system |
| JP2013254315A (en) | 2012-06-06 | 2013-12-19 | Nec Casio Mobile Communications Ltd | Information processing device, authentication system, authentication server, method of controlling information processing device, method of controlling authentication server, and program |
| JP2014176033A (en) | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | Communication system, communication method and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019110450A (en) | 2019-07-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5351787B2 (en) | Communication processing system and program | |
| US9094387B2 (en) | Authentication system and method for operating an authentication system | |
| US9648153B2 (en) | Method and device for incoming call notification | |
| KR20100061582A (en) | Apparatus and method for providing emotion expression service in mobile communication terminal | |
| CN105915521B (en) | Multi-party call management method, device and terminal | |
| JP5477379B2 (en) | Rogue call detection device, rogue call detection method, and rogue call detection program | |
| JP7073705B2 (en) | Call terminal, speaker identification server, call system, call terminal processing method, speaker identification server processing method and program | |
| US10708415B1 (en) | Systems and methods for identification and action on attempted controlled-environment facility resident communications with internet-protocol phone numbers | |
| JP2016149636A (en) | Authentication device, telephone terminal, authentication method, and authentication program | |
| US10205826B1 (en) | Inbound calls to intelligent controlled-environment facility resident media and/or communications devices | |
| JPWO2015194148A1 (en) | Caller identification device, caller identification method, and recording medium for storing caller identification program | |
| JP5010131B2 (en) | Authentication method, authentication system, authentication server, call terminal, and authentication program | |
| CN110913055B (en) | Terminal device searching method and device and electronic device | |
| KR20140006640A (en) | Method and apparatus for verifying a visitor using sip sever | |
| JP5136913B2 (en) | Telephone system and method for canceling incoming call rejection | |
| US11765260B2 (en) | Communication terminal, information processing device, information processing system, information processing method, and program | |
| CN108234782B (en) | Incoming call processing method, device and equipment | |
| KR101524768B1 (en) | Spam filtering managing method of mobile phone | |
| KR101221885B1 (en) | Appratus and method for picture in common using SMS in mobile terminal | |
| CN106936998B (en) | Screen capture method and screen capture device | |
| KR20100054188A (en) | One ring spam processing method and terminal | |
| JP2009049559A (en) | Message relay device, message relay system, and program | |
| JP2019176234A (en) | Communication system, communication terminal, communication program, and communication method | |
| JP2004363874A (en) | Communication terminal registration method, communication session establishment method, and terminal in IP network | |
| JP2005184076A (en) | Mobile phone system and mobile phone used therefor |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201106 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210830 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211108 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220425 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7073705 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |