Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7202938B2 - Program name search support device and program name search support method - Google Patents
[go: Go Back, main page]

JP7202938B2 - Program name search support device and program name search support method - Google Patents

Program name search support device and program name search support method Download PDF

Info

Publication number
JP7202938B2
JP7202938B2 JP2019053657A JP2019053657A JP7202938B2 JP 7202938 B2 JP7202938 B2 JP 7202938B2 JP 2019053657 A JP2019053657 A JP 2019053657A JP 2019053657 A JP2019053657 A JP 2019053657A JP 7202938 B2 JP7202938 B2 JP 7202938B2
Authority
JP
Japan
Prior art keywords
program name
program
character data
data
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019053657A
Other languages
Japanese (ja)
Other versions
JP2020155976A (en
Inventor
伸三 松原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TVS Regza Corp
Original Assignee
TVS Regza Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TVS Regza Corp filed Critical TVS Regza Corp
Priority to JP2019053657A priority Critical patent/JP7202938B2/en
Priority to CN202080002686.1A priority patent/CN112243524B/en
Priority to PCT/CN2020/080259 priority patent/WO2020187301A1/en
Publication of JP2020155976A publication Critical patent/JP2020155976A/en
Application granted granted Critical
Publication of JP7202938B2 publication Critical patent/JP7202938B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for programme selection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本実施形態は、番組名検索支援装置、及び、番組名検索支援方法に関する。 The present embodiment relates to a program name search support device and a program name search support method.

テレビ等のAV機器では、放送波から取得するEPG(Electronic Program Guide)を利用して、放送番組の検索を行うことが一般的である。検索キーワードを用いて放送番組名を検索する場合、従来、リモコンのボタンを操作して検索する文字を入力していた。 2. Description of the Related Art AV equipment such as televisions generally uses an EPG (Electronic Program Guide) obtained from broadcast waves to search for broadcast programs. When searching for a broadcast program name using a search keyword, conventionally, characters to be searched for have been entered by operating buttons on a remote controller.

近年、操作者の音声を認識し、認識結果に基づいてAV機器等を操作する音声認識技術が実用化されている(例えば、特許文献1参照)。例えば、マイクが搭載されたリモコンに向かって操作者が検索キーワードを発声すると、音声認識結果に基づいて放送番組名を検索することができる。このような音声検索は、文字入力検索に比べて手間なく短時間で検索を行うことができ、操作者の利便性向上に大きく貢献している。 In recent years, a voice recognition technology has been put into practical use for recognizing an operator's voice and operating an AV device or the like based on the recognition result (see, for example, Patent Document 1). For example, when an operator utters a search keyword toward a remote control equipped with a microphone, it is possible to search for broadcast program names based on voice recognition results. Such a voice search enables a search to be performed in a short period of time with less trouble than a character input search, and greatly contributes to the improvement of operator's convenience.

しかし、音声検索では、音声認識結果として得られた番組名(文字列)と、EPGから取得した番組名とが一致しない場合、番組検索ができないという問題があった。 However, the voice search has a problem that the program cannot be searched if the program name (character string) obtained as a voice recognition result does not match the program name obtained from the EPG.

特開2012-168349号公報JP 2012-168349 A

本実施形態は、音声検索による番組名検索の確度を向上させることができる、番組名検索支援装置、及び、番組名検索支援方法を提供することを目的とする。 An object of the present embodiment is to provide a program name search support device and a program name search support method capable of improving accuracy of program name search by voice search.

本実施形態の番組名検索支援装置は、番組名検索対象機器に格納される番組名の表記である第1番組名と、前記番組名の読みとを対にして記憶する番組情報記憶部と、前記番組情報記憶部に格納されている前記番組名の読みに基づく音声データに対し、音声認識処理を施し得られた文字データである第2番組名を取得する文字データ取得回路と、前記第1番組名と前記第2番組名とが異なる場合、前記第1番組名と前記第2番組名とを対にして格納する読み替え辞書と、を有する。 A program name search support device of the present embodiment includes a program information storage unit that stores a first program name, which is a notation of a program name stored in a program name search target device, and a reading of the program name in pairs; a character data acquisition circuit for acquiring a second program name, which is character data obtained by performing voice recognition processing on audio data based on the pronunciation of the program name stored in the program information storage unit; and a translation dictionary for storing the first program name and the second program name in pairs when the program name and the second program name are different.

本実施形態に係わる番組名検索支援装置を用いた番組名検索システムの構成の一例を示す概略図。1 is a schematic diagram showing an example of configuration of a program name search system using a program name search support device according to the present embodiment; FIG. 実施形態に係る番組名検索支援装置の一例である、言語処理サーバの構成を示すブロック図。1 is a block diagram showing the configuration of a language processing server, which is an example of a program name search support device according to an embodiment; FIG. 新番組情報データの一例を説明する図。The figure explaining an example of new program information data. 番組名読み替えデータの一例を説明する図。The figure explaining an example of program name reading data. 読み替え辞書作成方法の一例を説明するフローチャート。4 is a flowchart for explaining an example of a method for creating a replacement dictionary;

以下、図面を参照して実施形態を説明する。 Embodiments will be described below with reference to the drawings.

図1は、本実施形態に係わる番組名検索支援装置を用いた番組名検索システムの構成の一例を示す概略図である。番組名検索システムは、言語処理サーバ1と、番組名被検索装置である放送受信装置2と、音声認識サーバ3とから構成されている。言語処理サーバ1と、放送受信装置2と、音声認識サーバ3とは、インターネット回線4を介して互いに接続されている。 FIG. 1 is a schematic diagram showing an example of the configuration of a program name search system using a program name search support device according to this embodiment. The program name search system is composed of a language processing server 1, a broadcast receiver 2 as a program name searched device, and a speech recognition server 3. FIG. The language processing server 1 , the broadcast receiving device 2 and the speech recognition server 3 are connected to each other via the Internet line 4 .

放送受信装置2は、空間を伝搬する電波として放送事業者が提供する番組や、ケーブル網やIP網などのネットワークを通じて配信事業者が供給する番組などを受信して再生する。放送受信装置2は、リモートコントローラ(以下、リモコンと示す)21を介して、ユーザからの操作指示を受け付ける。なお、放送受信装置2は、受信した番組を記録する記録再生装置を含む構成でもよい。 The broadcast receiver 2 receives and reproduces programs provided by broadcasters as radio waves propagating in space, and programs provided by distributors through networks such as cable networks and IP networks. The broadcast receiving apparatus 2 receives operation instructions from a user via a remote controller (hereinafter referred to as a remote controller) 21 . The broadcast receiving device 2 may be configured to include a recording/playback device for recording the received program.

リモコン21は、操作キー(数字キーや矢印キー、カラーボタンなど)と、マイクとを具備している。例えば、操作キーの一つであるマイクボタンを押すなど、リモコン21に対して所定の操作を行うことで、ユーザは、リモコン21のマイクを介して放送受信装置2に音声データを送信することができる。すなわち、ユーザは、音声データにより放送受信装置2に対して操作指示を入力することができる。 The remote control 21 has operation keys (number keys, arrow keys, color buttons, etc.) and a microphone. For example, by performing a predetermined operation on the remote controller 21, such as pressing a microphone button, which is one of the operation keys, the user can transmit audio data to the broadcast receiver 2 via the microphone of the remote controller 21. can. That is, the user can input an operation instruction to the broadcast receiving device 2 using voice data.

音声認識サーバ3は、クラウドベースの音声認識サービスを提供するサーバである。音声認識サーバ3は、インターネット回線4に接続された機器から送信されてくる音声データを、文字データに変換して出力する。 The speech recognition server 3 is a server that provides a cloud-based speech recognition service. The voice recognition server 3 converts voice data transmitted from a device connected to the Internet line 4 into character data and outputs the character data.

番組名検索支援装置である言語処理サーバ1は、プロセッサ11を有している。言語処理サーバ1は、放送受信装置2、または、音声認識サーバ3から入力される文字データを解析し、放送受信装置2に対する操作内容やパラメータなどを抽出し、放送受信装置2で処理可能な形式に変換して出力する。 A language processing server 1 , which is a program name search support device, has a processor 11 . The language processing server 1 analyzes character data input from the broadcast receiving device 2 or the speech recognition server 3, extracts operation details and parameters for the broadcast receiving device 2, and extracts a format that can be processed by the broadcast receiving device 2. converted to and output.

図2は、言語処理サーバ1の構成を示すブロック図である。言語処理サーバ1は、文字データ通信回路51、言語データ解析回路52、コマンド出力回路53、読み替え辞書登録回路54、音声データ送信回路55、音声変換回路56、の各回路を備えている。また、言語処理サーバ1は、新番組情報データベース61と、読み替え辞書62の各記憶装置も備えている。 FIG. 2 is a block diagram showing the configuration of the language processing server 1. As shown in FIG. The language processing server 1 includes a character data communication circuit 51, a language data analysis circuit 52, a command output circuit 53, a reading dictionary registration circuit 54, a voice data transmission circuit 55, and a voice conversion circuit 56. The language processing server 1 also has storage devices for a new program information database 61 and a translation dictionary 62 .

文字データ通信回路51、言語データ解析回路52、コマンド出力回路53、読み替え辞書登録回路54、音声データ送信回路55、音声変換回路56、の各回路の機能は、プロセッサ11であるCPU(Central Processing Unit)によりソフトウェアで実現するものであってもよいし、FPGAなどを用いてハードウェアで実現するものであってもよい。 Character data communication circuit 51, language data analysis circuit 52, command output circuit 53, reading dictionary registration circuit 54, voice data transmission circuit 55, and voice conversion circuit 56 are provided by a CPU (Central Processing Unit), which is processor 11. ), or hardware using an FPGA or the like.

文字データ取得回路としての文字データ通信回路51は、インターネット回線4に接続された機器(例えば、放送受信装置2や音声認識サーバ3)との間での文字データの送受信を制御する。例えば、音声認識サーバ3から出力される文字データを取得したり、放送局などから送信される電子番組表(EPG)情報を取得したりする。また、文字データ通信回路51は、図示しない他のサーバから新番組情報を取得した場合、新番組情報データベース61に当該情報を登録する。なお、新番組情報とは、EPG情報において、それまでに取得していない新出の番組名を有する番組の情報である。 A character data communication circuit 51 as a character data acquisition circuit controls transmission and reception of character data with devices connected to the Internet line 4 (for example, the broadcast receiver 2 and the voice recognition server 3). For example, it acquires character data output from the voice recognition server 3, or acquires electronic program guide (EPG) information transmitted from a broadcasting station or the like. Further, when the character data communication circuit 51 acquires new program information from another server (not shown), the character data communication circuit 51 registers the information in the new program information database 61 . Note that the new program information is information of a program having a new program name that has not been acquired so far in the EPG information.

図3は、新番組情報データの一例を説明する図である。図3に示す新番組情報データは、新番組情報データベース61に登録される。図3に示すように、新番組情報データは、1番組ごとに1レコードが作成され、各レコードは、例えば、「番組名」と、読み方(番組名の読み方のひらがな表記)である「よみ」と、「(情報)取得日」の3項目から構成される。「番組名」と「よみ」には、文字データ通信回路51が取得した新番組情報から抽出されたデータが設定される。「取得日」には、当該レコードの新番組情報を他のサーバから受信した日が設定される。 FIG. 3 is a diagram for explaining an example of new program information data. The new program information data shown in FIG. 3 is registered in the new program information database 61. FIG. As shown in FIG. 3, one record is created for each program in the new program information data. and “(Information) Date of Acquisition”. Data extracted from the new program information acquired by the character data communication circuit 51 is set in the "program name" and "reading". In the "acquisition date", the date on which the new program information of the record was received from another server is set.

言語データ解析回路52は、文字データ通信回路51において取得した文字データ(自然文として構成されたテキスト)に対し、必要に応じて形態素解析や構文解析などの自然言語解析処理を実行し、文字データの意味内容(操作内容)を把握する。例えば、「〇〇(番組名)が見たい」という文字データが入力されている場合、「〇〇(番組名)」を「検索」するという意味であると解析される。なお、解析結果に番組名が含まれる場合、読み替え辞書62に当該番組名が登録されているか否かを検索する。登録されている場合、解析結果として得られた当該番組名の文字データを、読み替え辞書62で指定されている別の文字データに置き換えて出力する。 The language data analysis circuit 52 performs natural language analysis processing such as morphological analysis and syntactic analysis on the character data (text constructed as natural sentences) acquired by the character data communication circuit 51 as necessary, and converts the character data into Understand the meaning (operation content) of For example, when character data "I want to see OO (program name)" is input, it is analyzed as meaning to "search" for "OO (program name)". If a program name is included in the analysis result, a search is made to see if the program name is registered in the replacement dictionary 62 . If it is registered, the character data of the program name obtained as the analysis result is replaced with another character data specified in the replacement dictionary 62 and output.

コマンド出力回路53は、言語データ解析回路52における解析結果を、放送受信装置2において処理可能な形式に変換して出力する。例えば、上述の一例の場合、「〇〇(番組名)」をキーワードとする「検索」操作を実行するよう、放送受信装置2に対して操作指示信号を出力する。 The command output circuit 53 converts the analysis result of the language data analysis circuit 52 into a format that can be processed by the broadcast receiver 2 and outputs the result. For example, in the case of the above example, an operation instruction signal is output to the broadcast receiving device 2 so as to execute a "search" operation using "00 (program name)" as a keyword.

音声変換回路56は、入力される文字データを音声データに変換する。変換された音声データは、音声データ送信回路55へ出力される。 The voice conversion circuit 56 converts input character data into voice data. The converted voice data is output to voice data transmission circuit 55 .

音声データ送信回路55は、インターネット回線4に接続された機器(例えば、音声認識サーバ3)に対し、音声変換回路56から入力された音声データを送信する。 The voice data transmission circuit 55 transmits voice data input from the voice conversion circuit 56 to a device (for example, the voice recognition server 3) connected to the Internet line 4. FIG.

読み替え辞書登録回路54は、番組名読み替えデータを作成し、読み替え辞書62に登録する。図4は、番組名読み替えデータの一例を説明する図である。図4に示すように、番組名読み替えデータは、1番組ごとに1レコードが作成され、各レコードは、例えば、「入力番組名」と、「読み替え番組名」と、「登録日」の3項目から構成される。「入力番組名」は、新番組情報における「番組名」の「よみ」を音声認識サーバ3で文字データに変換して得られた番組名(文字データ)に対応する項目である。「読み替え番組名」は、「入力番組名」に登録された文字データと置き換えて使用する、別の文字データ(具体的には、新番組情報の「番組名」が設定される。「登録日」は、当該レコードが読み替え辞書62に登録された日が設定される。なお、読み替え辞書62は、言語データ解析回路52から参照される。 The reading dictionary registration circuit 54 creates program name reading data and registers it in the reading dictionary 62 . FIG. 4 is a diagram illustrating an example of program name replacement data. As shown in FIG. 4, one record is created for each program in the program name replacement data, and each record has three items, for example, "input program name", "replacement program name", and "registration date". consists of The "input program name" is an item corresponding to the program name (character data) obtained by converting the "pronunciation" of the "program name" in the new program information into character data by the voice recognition server 3. FIG. In the "replacement program name", another character data (specifically, the "program name" of the new program information is set to be used in place of the character data registered in the "input program name"). ” is set with the date when the record was registered in the replacement dictionary 62. The replacement dictionary 62 is referred to by the language data analysis circuit 52. FIG.

次に、言語処理サーバ1における読み替え辞書作成方法について、図5を用いて説明する。図5は、読み替え辞書作成方法の一例を説明するフローチャートである。 Next, a method of creating a replacement dictionary in the language processing server 1 will be described with reference to FIG. FIG. 5 is a flow chart illustrating an example of a method for creating a replacement dictionary.

まず、文字データ通信回路51において、外部のサーバ等から新番組情報が取得され、新番組情報データベース61に当該情報が登録される(S1)。続いて、読み替え辞書登録回路54は、新番組情報データベース61から、読み替え辞書登録候補となる番組名を抽出する(S2)。例えば、読み替え辞書の作成を最後に実施した日以降に新番組情報データベース61に登録された番組を抽出する。読み替え辞書の作成を最後に実施した日が、例えば、2018年11月1日である場合、「取得日」が2018年11月2日以降のレコードを抽出し、抽出されたレコードの「番組名」に登録されている番組を、読み替え辞書登録候補とする。 First, in the character data communication circuit 51, new program information is acquired from an external server or the like, and the information is registered in the new program information database 61 (S1). Subsequently, the reading dictionary registration circuit 54 extracts program names that are candidates for reading replacement dictionary registration from the new program information database 61 (S2). For example, it extracts programs registered in the new program information database 61 after the last day when the replacement dictionary was created. For example, if the date on which the translation dictionary was last created is November 1, 2018, the records whose “acquisition date” is after November 2, 2018 are extracted, and the extracted records have “program name ” is set as a candidate for registration of the replacement dictionary.

なお、読み替え辞書登録候補番組の抽出方法は、上述の方法に限定されない。例えば、新番組情報データベース61の各レコードに、読み替え辞書登録候補として抽出されたことがあるか否かを識別可能なフラグを設定しておき、未抽出を示すフラグを有するレコードの「番組名」に登録されている番組を、読み替え辞書登録候補としてもよい。 It should be noted that the method of extracting candidate programs for registration in the replacement dictionary is not limited to the method described above. For example, each record of the new program information database 61 is set with a flag that can identify whether or not it has been extracted as a replacement dictionary registration candidate. , may be used as a replacement dictionary registration candidate.

次に、読み替え辞書登録回路54は、S2で抽出された番組名を、音声データに変換して音声認識サーバ3へ出力する(S3)。具体的には、まず、読み替え辞書登録回路54は、抽出された番組名(文字データ)を、音声変換回路56へ出力する。音声変換回路56は、入力された文字データを音声データに変換し、音声データ送信回路55を介して音声認識サーバ3へ出力する。なお、S2で複数の番組名が抽出された場合、複数の番組名から一つの番組名を選択し、上述したS3の手順を実行する。 Next, the translation dictionary registration circuit 54 converts the program name extracted in S2 into voice data and outputs the voice data to the voice recognition server 3 (S3). Specifically, first, the replacement dictionary registration circuit 54 outputs the extracted program name (character data) to the voice conversion circuit 56 . The voice conversion circuit 56 converts the input character data into voice data and outputs the voice data to the voice recognition server 3 via the voice data transmission circuit 55 . In addition, when a plurality of program names are extracted in S2, one program name is selected from the plurality of program names, and the procedure of S3 described above is executed.

なお、抽出された番組名(文字データ)を音声データに変換するのは、音声変換回路56に限定されず、言語処理サーバ1から文字データを受信可能であって音声変換機能を有する他のサーバ等で行なってもよい。例えば、放送受信装置2に音声変換回路がある場合は、読み替え辞書登録回路54から文字データ通信回路51、インターネット回線4を介して放送受信装置2に当該番組名を送信し、放送受信装置2の音声変換回路で当該文字データを音声データに変換してもよい。この場合、変換された音声データは、インターネット回線4を介して放送受信装置2から音声認識サーバ3へ出力される。 It should be noted that the conversion of the extracted program name (character data) into voice data is not limited to the voice conversion circuit 56, but is performed by another server capable of receiving character data from the language processing server 1 and having a voice conversion function. etc. For example, if the broadcast receiver 2 has a voice conversion circuit, the program name is transmitted from the translation dictionary registration circuit 54 to the broadcast receiver 2 via the character data communication circuit 51 and the Internet line 4, and the broadcast receiver 2 The character data may be converted into voice data by a voice conversion circuit. In this case, the converted voice data is output from the broadcast receiver 2 to the voice recognition server 3 via the Internet line 4 .

続いて、言語処理サーバ1の文字データ通信回路51は、S3において出力した音声データの認識結果、すなわち、音声データから変換された文字データを、音声認識サーバ3から取得する(S4)。文字データ通信回路51は、取得した文字データを読み替え辞書登録回路54へ出力する。読み替え辞書登録回路54は、入力された文字データと、S3において出力した番組名(文字データ)とを比較する(S5)。両者が一致しない場合(S5、NO)、比較した文字データを、読み替え辞書62に新規レコードとして登録する(S6)。すなわち、S3において音声認識サーバ3へ出力した番組名(文字データ)を「読み替え番組名」に設定し、S4で音声認識サーバ3から取得した文字データを「入力番組名」に設定し、登録作業を行なっている日を「登録日」に設定したレコードを、読み替え辞書62に新規登録する。 Subsequently, the character data communication circuit 51 of the language processing server 1 acquires the recognition result of the speech data output in S3, that is, the character data converted from the speech data from the speech recognition server 3 (S4). Character data communication circuit 51 outputs the acquired character data to reading dictionary registration circuit 54 . The replacement dictionary registration circuit 54 compares the input character data with the program name (character data) output in S3 (S5). If the two do not match (S5, NO), the compared character data is registered as a new record in the replacement dictionary 62 (S6). That is, in S3, the program name (character data) output to the speech recognition server 3 is set as the "replacement program name", and in S4, the character data acquired from the speech recognition server 3 is set as the "input program name", and registration work is performed. A record is newly registered in the replacement dictionary 62 in which the date on which the

例えば、S3において、「3年K組」という表記の番組名(文字データ)を音声変換した音声データ、すなわち、「さんねんけーぐみ」という読みを音声変換した音声データを音声認識サーバ3に出力する。S4において「三年K組」という文字データが入力された場合、両者は一致しない。従って、「3年K組」と「三年K組」の文字データのペアは、S6において、図4に示す表の一番上のレコードのように、読み替え辞書62に登録される。 For example, in S3, the voice data obtained by converting the program name (character data) written as “3rd year K group”, that is, the voice data obtained by converting the reading “sannenkegumi” into voice, is sent to the voice recognition server 3. Output. If the character data "3rd year K class" is input in S4, the two do not match. Accordingly, the pair of character data "3rd year K group" and "3rd year K group" is registered in the reading dictionary 62 in S6 as the topmost record in the table shown in FIG.

一方、S5において、入力された文字データと、S3において出力した番組名(文字データ)とが一致する場合、読み替え辞書62への登録は行なわずに、S7に進む。 On the other hand, in S5, if the input character data matches the program name (character data) output in S3, registration in the translation dictionary 62 is not performed, and the process proceeds to S7.

S2において抽出された読み替え辞書登録候補の番組名が複数ある場合、全ての番組について、読み替え辞書62への登録要否判定の一連の手順(S3~S6)を実行済である場合(S7、YES)、図5に示す言語処理サーバ1における読み替え辞書作成手順を終了する。一方、読み替え辞書62への登録要否判定の一連の手順を実行していない番組名がある場合(S7、NO)、S8に進んで、未実行の番組名の中から番組名を一つ抽出して、次の判定対象番組名としてセットする。セットした番組名について、S3からS6の一例の手順を実行する。 If there are a plurality of program names that are candidates for registration in the replacement dictionary extracted in S2, and if all the programs have already undergone a series of procedures (S3 to S6) for determining whether or not they need to be registered in the replacement dictionary 62 (S7, YES ), the procedure for creating a replacement dictionary in the language processing server 1 shown in FIG. 5 is terminated. On the other hand, if there is a program name that has not been subjected to a series of procedures for judging necessity of registration in the translation dictionary 62 (S7, NO), proceed to S8, and extract one program name from among the program names that have not been performed. and set as the name of the program to be judged next. An example procedure of S3 to S6 is executed for the set program name.

このように、音声認識により取得した番組名の表記が、電子番組表(EPG)の番組名の表記と異なるものを、読み替え辞書として登録しておくことで、放送受信装置2で音声検索を行なった場合に、検索精度を向上させることができる。 In this way, by registering the notation of the program name obtained by voice recognition that differs from the notation of the program name in the electronic program guide (EPG) as a translation dictionary, the broadcast receiver 2 can perform voice search. In this case, the search accuracy can be improved.

例えば、図1に示す番組名検索システムにおいて、特定の番組名の音声検索は、以下のように行われる。まず、ユーザが放送受信装置2のリモコン21を用いて、特定の番組名を検索したい旨を音声入力する。例えば、「BACK STREET KIDS」という番組を検索したい場合、ユーザは、「ばっくすとりーときっずがみたい」と、リモコン21のマイクに向かって発生する。 For example, in the program name search system shown in FIG. 1, voice search for a specific program name is performed as follows. First, the user uses the remote controller 21 of the broadcast receiving apparatus 2 to voice input that he/she wishes to search for a specific program name. For example, when the user wants to search for a program called "BACK STREET KIDS", the user speaks into the microphone of the remote control 21, "Backstreet and Kids".

放送受信装置2は、ユーザから入力された音声データ(例えば、「ばっくすとりーときっずがみたい」という音声データ)を、インターネット回線4を介して音声認識サーバ3に送信する。音声認識サーバ3は、入力された音声データを文字データに変換し、インターネット回線4を介して言語処理サーバ1に送信する。例えば、「ばっくすとりーときっずがみたい」という音声データは、「バックストリートキッズが見たい」という文字データに変換されて送信される。 The broadcast receiving device 2 transmits voice data input by the user (for example, voice data saying “I want to watch the back story and kids”) to the voice recognition server 3 via the Internet line 4 . The voice recognition server 3 converts the input voice data into character data and transmits the character data to the language processing server 1 via the Internet line 4 . For example, voice data "I want to see Backstreet Kids" is converted into text data "I want to see Backstreet Kids" and is transmitted.

音声認識サーバ3から入力された文字データは、文字データ通信回路51から言語データ解析回路52へ出力される。言語データ解析回路52は、入力されている文字データに対して自然言語解析処理を行い、文字データの意味内容を把握し、解析結果を生成する。例えば、「バックストリートキッズが見たい」という文字データが入力された場合、「バックストリートキッズ」という番組名をキーワードとして「検索する」という操作を実行する、という解析結果を生成する。 Character data input from the speech recognition server 3 is output from the character data communication circuit 51 to the language data analysis circuit 52 . The language data analysis circuit 52 performs natural language analysis processing on input character data, grasps the meaning and content of the character data, and generates an analysis result. For example, when character data such as "I want to see Backstreet Kids" is input, an analysis result is generated in which an operation of "searching" is executed using the program name "Backstreet Kids" as a keyword.

言語データ解析回路52は、解析結果に含まれる番組名が、読み替え辞書62の「入力番組名」に登録されているか否かを検索する。登録されている場合、当該レコードの「読み替え番組名」に登録されている文字データを、解析結果に含まれる当該番組名と置き換える。そして、番組名置き換え後の解析結果をコマンド出力回路53へ出力する。 The language data analysis circuit 52 searches whether or not the program name included in the analysis result is registered in the “input program name” of the translation dictionary 62 . If registered, the character data registered in the "replacement program name" of the record is replaced with the program name included in the analysis result. Then, it outputs the analysis result after replacing the program name to the command output circuit 53 .

例えば、解析結果に「バックストリートキッズ」という番組名が存在する場合、言語データ解析回路52は、読み替え辞書62を参照し、「バックストリートキッズ」という番組名(文字データ)が「入力番組名」として登録されているか否かを検索する。登録されている場合、当該レコードの「読み替え番組名」に登録されている番組名(文字データ)を抽出する。 For example, if there is a program name "Backstreet Kids" in the analysis result, the language data analysis circuit 52 refers to the translation dictionary 62 and determines that the program name (character data) "Backstreet Kids" is the "input program name". Search whether it is registered as If registered, the program name (character data) registered in the "replacement program name" of the record is extracted.

上述のように、EPGの表記に基づく読み替え辞書登録作業がすでになされている場合、「入力番組名」が「バックストリートキッズ」、「読み替え番組名」が「BACK STREET KIDS」と設定されたレコードが、読み替え辞書62に登録されている。従って、言語データ解析回路52は、読み替え辞書62を参照し、解析結果の「バックストリートキッズ」という番組名(文字列)を「BACK STREET KIDS」に置き換える。そして、コマンド出力回路53には、「BACK STREET KIDS」という番組名をキーワードとして「検索する」という操作を実行する、という解析結果が出力される。 As described above, if the translation dictionary registration work based on the EPG notation has already been performed, there will be a record in which the "input program name" is set to "Backstreet Kids" and the "replacement program name" is set to "BACK STREET KIDS". , are registered in the translation dictionary 62 . Therefore, the language data analysis circuit 52 refers to the translation dictionary 62 and replaces the program name (character string) "Backstreet Kids" in the analysis result with "BACK STREET KIDS". Then, the command output circuit 53 outputs an analysis result indicating that an operation "search" is executed using the program name "BACK STREET KIDS" as a keyword.

コマンド出力回路53は、言語データ解析回路52から入力された解析結果を、放送受信装置2において処理可能な形式に変換して出力する。上述の一例の場合、番組表(EPG)や録画データなどの番組名において、「BACK STREET KIDS」を「検索」するよう、放送受信装置2に対して操作指示信号を出力する。 The command output circuit 53 converts the analysis result input from the language data analysis circuit 52 into a format that can be processed by the broadcast receiver 2 and outputs the result. In the case of the above example, an operation instruction signal is output to the broadcast receiving apparatus 2 to "search" for "BACK STREET KIDS" in program names such as a program table (EPG) and recorded data.

放送受信装置2は、記憶している番組表(EPG)等から、「BACK STREET KIDS」という表記の番組名を抽出し、検索結果画面などに表示する。音声認識サーバ3から出力された文字データである「バックストリートキッズ」という表記をそのまま用いて、放送受信装置2に対して検索指示を行った場合、番組表(EPG)における表記(「BACK STREET KIDS」)と異なるため、所望の番組が検索できないという問題
があった。これに対し、本実施形態では、言語処理サーバ1において、音声認識サーバ3から出力された文字データの表記が、EPGにおける表記と異なる番組名については、EPGの表記に読み替えて、放送受信装置2に対して操作指示を行っているので、表記の不一致による検索漏れを低減することができ、音声検索における検索精度を向上させることができる。
The broadcast receiver 2 extracts the program name written as "BACK STREET KIDS" from the stored program table (EPG) or the like, and displays it on the search result screen or the like. When the broadcast receiving device 2 is instructed to search using the notation "Backstreet Kids" which is character data output from the voice recognition server 3, the notation ("BACK STREET KIDS") in the program guide (EPG) is displayed. ), there is a problem that the desired program cannot be searched. On the other hand, in the present embodiment, in the language processing server 1, program names whose notation in the character data output from the speech recognition server 3 differs from the notation in the EPG are replaced with the notation in the EPG, and the broadcast receiving device 2 , it is possible to reduce omissions in search due to inconsistency in notation, and to improve search accuracy in voice search.

なお、上述では、放送受信装置2に対して番組名を音声検索する場合を一例にあげて説明したが、インターネットテレビなど、ネットワークを通じて配信業者が供給する番組などの音声検索についても、適用可能である。 In the above description, the case of performing voice search for a program name in the broadcast receiving apparatus 2 has been described as an example. be.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、一例として示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 While several embodiments of the invention have been described, these embodiments have been presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are included in the scope of the invention described in the claims and equivalents thereof.

1…言語処理サーバ、
2…放送受信装置、
3…音声認識サーバ、
4…インターネット回線、
21…リモコン、
51…文字データ通信回路、
52…言語データ解析回路、
53…コマンド出力回路、
54…読み替え辞書登録回路、
55…音声データ送信回路、
56…音声変換回路、
61…新番組情報データベース、
62…読み替え辞書、
1... language processing server,
2 ... broadcast receiving device,
3 ... voice recognition server,
4 Internet line,
21 ... remote control,
51 ... Character data communication circuit,
52... language data analysis circuit,
53 ... command output circuit,
54 ... reading dictionary registration circuit,
55 ... audio data transmission circuit,
56 ... voice conversion circuit,
61 ... new program information database,
62 ... reading dictionary,

Claims (5)

番組名検索対象機器に格納される番組名の表記である第1番組名と、前記番組名の読みとを対にして記憶する番組情報記憶部と、
前記番組情報記憶部に格納されている前記番組名の読みに基づく音声データに対し、音声認識処理を施し得られた文字データである第2番組名を取得する文字データ取得回路と、
前記第1番組名と前記第2番組名とが異なる場合、前記第1番組名と前記第2番組名とを対にして格納する読み替え辞書と、
を有する番組名検索支援装置。
a program information storage unit for storing a pair of a first program name, which is a notation of a program name stored in a program name search target device, and the reading of the program name;
a character data acquisition circuit for acquiring a second program name, which is character data obtained by performing voice recognition processing on audio data based on the pronunciation of the program name stored in the program information storage unit;
a translation dictionary for storing pairs of the first program name and the second program name when the first program name and the second program name are different;
A program name search support device having
前記番組名検索対象機器に格納される前記番組名は、電子番組表に記載されている番組名であることを特徴とする、請求項1に記載の番組名検索支援装置。 2. The program name search support device according to claim 1, wherein said program name stored in said program name search target device is a program name described in an electronic program guide. 前記番組名検索対象機器を操作するために入力された操作用音声データに対し、音声認識処理を施し得られた文字データの自然言語解析処理を実行する言語データ解析回路を更に有し、前記言語データ解析回路は、前記自然言語解析処理の対象となる前記文字データにおいて前記第2番組名が存在し、かつ、前記読み替え辞書に前記第2番組名が格納されている場合、前記第2番組名を、前記読み替え辞書において対にして格納されている前記第1番組名に置き換えて、前記自然言語解析処理を実行することを特徴とする、請求項1又は請求項2に記載の番組名検索支援装置。 further comprising a language data analysis circuit for executing natural language analysis processing of character data obtained by performing voice recognition processing on operation voice data input for operating the device to be searched for program name; When the second program name exists in the character data to be subjected to the natural language analysis processing and the second program name is stored in the replacement dictionary, the data analysis circuit performs the second program name 3. The program name search support according to claim 1 or 2, wherein the natural language analysis process is performed by replacing the first program name stored in the replacement dictionary with the first program name stored in pairs in the replacement dictionary. Device. 番組名検索対象機器に格納される番組名の表記である第1番組名と、前記番組名の読みとを対にして取得し、
前記番組名の読みに基づく音声データに対し、音声認識処理を施し得られた文字データである第2番組名を取得し、
前記第1番組名と前記第2番組名とが異なる場合、前記第1番組名と前記第2番組名とを対にして読み替え辞書に登録する、番組名検索支援方法。
acquiring a pair of a first program name, which is a notation of a program name stored in a program name search target device, and the reading of the program name;
Acquiring a second program name, which is character data obtained by performing voice recognition processing on voice data based on the reading of the program name,
A program name search support method, wherein when the first program name and the second program name are different, the first program name and the second program name are paired and registered in a translation dictionary.
前記番組名検索対象機器に格納される前記番組名は、電子番組表に記載されている番組名であることを特徴とする、請求項4に記載の番組名検索支援方法。 5. The program name search support method according to claim 4, wherein said program name stored in said program name search target device is a program name described in an electronic program guide.
JP2019053657A 2019-03-20 2019-03-20 Program name search support device and program name search support method Active JP7202938B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019053657A JP7202938B2 (en) 2019-03-20 2019-03-20 Program name search support device and program name search support method
CN202080002686.1A CN112243524B (en) 2019-03-20 2020-03-19 Program title retrieval assistance device and program title retrieval assistance method
PCT/CN2020/080259 WO2020187301A1 (en) 2019-03-20 2020-03-19 Program name searching auxiliary device and program name searching auxiliary method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019053657A JP7202938B2 (en) 2019-03-20 2019-03-20 Program name search support device and program name search support method

Publications (2)

Publication Number Publication Date
JP2020155976A JP2020155976A (en) 2020-09-24
JP7202938B2 true JP7202938B2 (en) 2023-01-12

Family

ID=72519567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019053657A Active JP7202938B2 (en) 2019-03-20 2019-03-20 Program name search support device and program name search support method

Country Status (3)

Country Link
JP (1) JP7202938B2 (en)
CN (1) CN112243524B (en)
WO (1) WO2020187301A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7241142B1 (en) 2021-09-27 2023-03-16 Tvs Regza株式会社 Receiving device and tuning system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242887A (en) 2000-02-29 2001-09-07 Xanavi Informatics Corp Speech recognition device and speech recognizing navigation device
JP2007178927A (en) 2005-12-28 2007-07-12 Canon Inc Information retrieval apparatus and method
JP2007213005A (en) 2006-01-10 2007-08-23 Nissan Motor Co Ltd Recognition dictionary system and updating method thereof
JP2010072507A (en) 2008-09-22 2010-04-02 Toshiba Corp Speech recognition search system and speech recognition search method
WO2015045039A1 (en) 2013-09-25 2015-04-02 株式会社東芝 Method, electronic device, and program

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT390685B (en) * 1988-10-25 1990-06-11 Philips Nv TEXT PROCESSING SYSTEM
JPH05143303A (en) * 1991-11-22 1993-06-11 Kobe Nippon Denki Software Kk Fetching system for program information
DE4142812A1 (en) * 1991-12-23 1993-06-24 Heyo Dr Ing Habil Mennenga Text information transmission procedure via HF bandwidth channels - using standard TV or radio channel when not being utilised for transmission of programme information
JPH11161640A (en) * 1997-11-27 1999-06-18 Toshiba Corp Chinese input conversion processing device, Chinese input conversion processing method, recording medium recording Chinese input conversion processing program
JP2001022374A (en) * 1999-07-05 2001-01-26 Victor Co Of Japan Ltd Manipulator for electronic program guide and transmitter therefor
JP3639776B2 (en) * 2000-07-28 2005-04-20 シャープ株式会社 Speech recognition dictionary creation device, speech recognition dictionary creation method, speech recognition device, portable terminal device, and program recording medium
US7437296B2 (en) * 2003-03-13 2008-10-14 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation apparatus and information search apparatus
JP2005227545A (en) * 2004-02-13 2005-08-25 Matsushita Electric Ind Co Ltd Dictionary creation device, program guide device, and dictionary creation method
CN1921606A (en) * 2005-08-22 2007-02-28 上海乐金广电电子有限公司 Device and method for broadcasting program index in electronic program guiding
JP2007140194A (en) * 2005-11-18 2007-06-07 Mitsubishi Electric Corp Program search device and morpheme dictionary management server
JP2007257134A (en) * 2006-03-22 2007-10-04 Mitsubishi Electric Corp Voice search device, voice search method, and voice search program
JP5142769B2 (en) * 2008-03-11 2013-02-13 株式会社日立製作所 Voice data search system and voice data search method
JP2010175708A (en) * 2009-01-28 2010-08-12 Toshiba Corp System and method for retrieval of speech recognition
CN104519403A (en) * 2014-12-25 2015-04-15 西安诺瓦电子科技有限公司 Audio control device and method
US10289677B2 (en) * 2015-02-19 2019-05-14 Tribune Broadcasting Company, Llc Systems and methods for using a program schedule to facilitate modifying closed-captioning text
CN105225659A (en) * 2015-09-10 2016-01-06 中国航空无线电电子研究所 A kind of instruction type Voice command pronunciation dictionary auxiliary generating method
US10418026B2 (en) * 2016-07-15 2019-09-17 Comcast Cable Communications, Llc Dynamic language and command recognition
CN108172223A (en) * 2017-12-14 2018-06-15 深圳市欧瑞博科技有限公司 Voice instruction recognition method, device and server and computer readable storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242887A (en) 2000-02-29 2001-09-07 Xanavi Informatics Corp Speech recognition device and speech recognizing navigation device
JP2007178927A (en) 2005-12-28 2007-07-12 Canon Inc Information retrieval apparatus and method
JP2007213005A (en) 2006-01-10 2007-08-23 Nissan Motor Co Ltd Recognition dictionary system and updating method thereof
JP2010072507A (en) 2008-09-22 2010-04-02 Toshiba Corp Speech recognition search system and speech recognition search method
WO2015045039A1 (en) 2013-09-25 2015-04-02 株式会社東芝 Method, electronic device, and program

Also Published As

Publication number Publication date
CN112243524A (en) 2021-01-19
JP2020155976A (en) 2020-09-24
WO2020187301A1 (en) 2020-09-24
CN112243524B (en) 2023-08-04

Similar Documents

Publication Publication Date Title
US11997344B2 (en) Translating a media asset with vocal characteristics of a speaker
JP6375521B2 (en) Voice search device, voice search method, and display device
JP5178109B2 (en) Search device, method and program
CN112115706A (en) Text processing method and device, electronic equipment and medium
JP4459267B2 (en) Dictionary data generation apparatus and electronic device
JP6327848B2 (en) Communication support apparatus, communication support method and program
CN105590627B (en) Image display apparatus, method for driving image display apparatus, and computer-readable recording medium
RU2009143360A (en) METHOD, SYSTEM AND USER INTERFACE FOR AUTOMATIC CREATION OF THE ATMOSPHERE, IN PARTICULAR LIGHTED ATMOSPHERE, BASED ON THE KEYWORD ENTRANCE
JP5296598B2 (en) Voice information extraction device
KR20140051767A (en) Program recommendation device and program recommendation program
WO2014103568A1 (en) Information processing device, information processing method and program
KR20100067174A (en) Metadata search apparatus, search method, and receiving apparatus for iptv by using voice interface
JP4100243B2 (en) Voice recognition apparatus and method using video information
CN108806688A (en) Sound control method, smart television, system and the storage medium of smart television
JP7202938B2 (en) Program name search support device and program name search support method
WO2019123854A1 (en) Translation device, translation method, and program
KR20190099676A (en) The system and an appratus for providig contents based on a user utterance
JP6322125B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition program
JP6433045B2 (en) Keyword extraction apparatus and program
JP5704686B2 (en) Speech translation system, speech translation device, speech translation method, and program
JP2004260544A (en) Program information display device having voice recognition function
JP2012022053A (en) Voice recognition device
JP7241142B1 (en) Receiving device and tuning system
JP2020201363A (en) Voice recognition text data output control device, voice recognition text data output control method, and program
JP2010182123A (en) Device and method for retrieving information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221226

R150 Certificate of patent or registration of utility model

Ref document number: 7202938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250