Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7624571B2 - Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc. - Google Patents
[go: Go Back, main page]

JP7624571B2 - Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc. - Google Patents

Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc. Download PDF

Info

Publication number
JP7624571B2
JP7624571B2 JP2020076808A JP2020076808A JP7624571B2 JP 7624571 B2 JP7624571 B2 JP 7624571B2 JP 2020076808 A JP2020076808 A JP 2020076808A JP 2020076808 A JP2020076808 A JP 2020076808A JP 7624571 B2 JP7624571 B2 JP 7624571B2
Authority
JP
Japan
Prior art keywords
voice
output
inspection
input
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020076808A
Other languages
Japanese (ja)
Other versions
JP2021173841A (en
Inventor
健太郎 山本
潤一 千嶋
佑記 片▲瀬▼
和輝 西山
勝彦 須賀
恵里 宮田
浩一郎 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Takasago Thermal Engineering Co Ltd
Original Assignee
Takasago Thermal Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Takasago Thermal Engineering Co Ltd filed Critical Takasago Thermal Engineering Co Ltd
Priority to JP2020076808A priority Critical patent/JP7624571B2/en
Publication of JP2021173841A publication Critical patent/JP2021173841A/en
Priority to JP2024224555A priority patent/JP2025028327A/en
Application granted granted Critical
Publication of JP7624571B2 publication Critical patent/JP7624571B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

本発明は、設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラムに関する。 The present invention relates to a voice recognition system, a voice recognition device, a voice recognition method, and a program used for equipment inspection, etc.

設備等を点検する上で、点検を行う者を支援する技術が知られている。 Technology is known that assists inspectors when inspecting equipment, etc.

例えば、タブレット端末、又は、ハンディーターミナル等によって、設備に張り付けたバーコードをスキャンして管理する技術が知られている。このようなバーコードを用いることで、機器の状況を素早く判断する。また、点検データが電子化されて集計及び管理されるため、点検のし忘れ、及び、点検の漏れといったヒューマンエラーを防止し、確実な点検の実施を支援する技術が知られている(例えば、非特許文献1等)。 For example, there is a known technology that uses a tablet terminal or handheld terminal to scan and manage barcodes attached to equipment. By using such barcodes, the status of the equipment can be quickly determined. In addition, there is a known technology that prevents human error such as forgetting to inspect or missing an inspection by digitizing, and supports the implementation of reliable inspections (for example, Non-Patent Document 1, etc.).

"設備巡回点検システム"、[online]、[令和2年3月11日検索]、インターネット〈URL:http://www.tm-es.co.jp/service-product/services/products/mimawari-kun-mit.html〉"Facility Patrol Inspection System", [online], [searched on March 11, 2020], Internet <URL: http://www.tm-es.co.jp/service-product/services/products/mimawari-kun-mit.html>

従来の技術では、点検の説明等を行う音声がすべて出力された後でないと、ユーザは、点検結果を音声で入力できない場合がある。そのため、装置による音声の出力が終わるまで待たないと、ユーザによる音声の入力、音声認識の処理を開始、又は、音声認識の処理結果を出力できないため、音声の入力を行うための待ち時間が長くなる場合がある。 In conventional technology, a user may not be able to input the inspection results by voice until all audio explaining the inspection has been output. As a result, the user cannot input voice, start voice recognition processing, or output the results of voice recognition processing until the device has finished outputting the audio, which can result in long wait times for voice input.

本発明は、上記課題に鑑みてなされたものであり、音声の入力を行うための時間を短縮させることを目的とする。 The present invention was made in consideration of the above problems, and aims to reduce the time required to input voice.

本発明の各実施形態による音声認識システム等は、以下のような構成を含む。 The speech recognition system according to each embodiment of the present invention includes the following configuration:

音声認識システム(例えば、音声認識システム1である。)は、
第1音声(例えば、第1音声SD1である。)を入力する音声入力手段(例えば、ステップS03である。)と、
前記第1音声に基づいて、音声認識を行う音声認識手段(例えば、ステップS05である。)と、
第2音声(例えば、第2音声SD2である。)を登録する登録手段(例えば、ステップS01である。)と、
前記第2音声を出力する出力手段(例えば、ステップS02である。)と、
前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手段(例えば、ステップS04である。)と
を含む。
A speech recognition system (for example, speech recognition system 1) includes:
A voice input unit (e.g., step S03) for inputting a first voice (e.g., the first voice SD1);
A voice recognition unit (e.g., step S05) that performs voice recognition based on the first voice;
A registration means (e.g., step S01) for registering a second voice (e.g., the second voice SD2);
An output means for outputting the second sound (e.g., step S02);
The voice input device further includes a limiting means (eg, step S04) for limiting the output of the second voice when the first voice is input while the second voice is being output.

このような構成であると、音声の入力を行うための時間を短縮できる。 This configuration can reduce the time it takes to input voice.

また、音声認識システムは、設備の点検に用いられるのが望ましい(例えば、図6である)。 It is also desirable for the voice recognition system to be used for equipment inspection (see, for example, Figure 6).

このような構成であると、点検を効率良く行うことができる。 This configuration allows inspections to be carried out efficiently.

また、音声認識システムは、
前記第1音声の音声認識結果に基づいて、前記第1音声の内容を示す第1入力データを生成する入力データ生成手段と、
前記第1入力データをチェックするのに用いられる第2入力データを記憶する記憶手段と、
前記第1入力データと前記第2入力データを比較して異常であるか否かを判断する判断手段と
を更に含む構成が望ましい。
In addition, the voice recognition system
an input data generating means for generating first input data indicating the content of the first voice based on a speech recognition result of the first voice;
a storage means for storing second input data used to check the first input data;
It is preferable that the configuration further includes a determination means for comparing the first input data with the second input data to determine whether or not the first input data is abnormal.

また、音声認識システムでは、
前記第2入力データは、
前記第1入力データより前に入力され(例えば、前回結果V21である。)、
前記判断手段は、
前記第1入力データと前記第2入力データが異なる、又は、前記第1入力データが前記第2入力データに対して許容範囲(例えば、許容範囲V22である。)外であると、異常であると判断するのが望ましい。
In addition, the voice recognition system
The second input data is
Inputted before the first input data (for example, the previous result V21),
The determination means is
It is desirable to determine that an abnormality exists if the first input data and the second input data are different, or if the first input data is outside an allowable range (for example, allowable range V22) with respect to the second input data.

また、音声認識システムでは、
前記第2入力データは、
正常値又は正常範囲を示す値(例えば、正常値V23である。)であり、
前記判断手段は、
前記第1入力データと前記第2入力データが異なる、又は、前記第1入力データが前記正常範囲の範囲外であると、異常であると判断するのが望ましい。
In addition, the voice recognition system
The second input data is
A value indicating a normal value or a normal range (for example, normal value V23),
The determination means is
It is preferable that if the first input data and the second input data are different, or if the first input data is outside the normal range, it is determined that an abnormality has occurred.

このように、前回結果V21、すなわち、直近の点検結果と比較して、違いがあるような場合には、設備に異常があると判断される。このようなチェックが行われると、音声認識システム1は、異常が発生している設備を知らせることができる。 In this way, if there is a difference when compared with the previous result V21, i.e., the most recent inspection result, it is determined that there is an abnormality in the equipment. When such a check is performed, the voice recognition system 1 can notify the user of the equipment in which the abnormality is occurring.

また、許容範囲V22によって、前回結果V21に対して幅を持たせる構成であってもよい。特に、数値が点検の対象となる場合には、数値の微小な変動が異常でない場合が多い。したがって、このように許容できる範囲が設定できると、異常を精度良く判断できる。 The tolerance range V22 may also be configured to provide a margin for the previous result V21. In particular, when a numerical value is subject to inspection, minute fluctuations in the numerical value are often not abnormal. Therefore, if an acceptable range can be set in this way, abnormalities can be determined with high accuracy.

また、音声認識システムは、
第1情報処理装置と第2情報処理装置を含む音声認識システムであって、
前記第1情報処理装置は、
第1辞書(例えば、第1辞書D211である。)を用いて音声認識を行い、
前記第2情報処理装置は、
第2辞書(例えば、第2辞書D212である。)を用いて、前記第1音声を認識する前記音声認識手段を含み(例えば、図17である。)、
前記第2辞書は、点検の分野用の辞書であるが望ましい。
In addition, the voice recognition system
A speech recognition system including a first information processing device and a second information processing device,
The first information processing device,
Performing speech recognition using a first dictionary (e.g., the first dictionary D211);
The second information processing device is
The speech recognition means recognizes the first speech by using a second dictionary (e.g., the second dictionary D212) (e.g., FIG. 17 ),
The second dictionary is preferably a dictionary for the field of inspection.

第2情報処理装置は、携帯する情報処理装置であるため、記憶領域MEMが第1情報処理装置と比較すると小さくなりやすい。 Since the second information processing device is a portable information processing device, the memory area MEM tends to be smaller than that of the first information processing device.

また、第2辞書D212は、点検の分野用の辞書である。したがって、第1辞書D211より、第2辞書D212は、データの容量を小さくできる。そのため、第2辞書D212は、第2情報処理装置のように、第1情報処理装置と比較して、記憶装置の記憶できる容量が小さい記憶領域MEMの情報処理装置であっても、記憶できる辞書が用いられるのが望ましい。 The second dictionary D212 is a dictionary for the inspection field. Therefore, the data capacity of the second dictionary D212 can be made smaller than that of the first dictionary D211. Therefore, it is preferable that the second dictionary D212 is a dictionary that can be stored even in an information processing device with a memory area MEM that has a smaller storage capacity than the first information processing device, such as the second information processing device.

点検の分野用の辞書は、点検に良く用いられる用語を音声認識するのに適する辞書である。例えば、点検の分野用の辞書は、数値、点検結果に用いられる用語及び設備の名称等が設定される。このように、点検において使用頻度が高い用語に絞った辞書が用いられると、音声認識を小さい記憶領域で実現でき、かつ、精度良く音声認識を実行して第1入力データV10を生成できる。 The dictionary for the inspection field is a dictionary suitable for voice recognition of terms frequently used in inspection. For example, a dictionary for the inspection field is set with numerical values, terms used in inspection results, names of equipment, etc. In this way, when a dictionary limited to terms frequently used in inspection is used, voice recognition can be realized in a small memory area, and voice recognition can be performed with high accuracy to generate the first input data V10.

また、音声認識システムは、
前記第1音声に含まれるノイズ(例えば、第1ノイズNZ1、第2ノイズNZ2及び第3ノイズNZ3である。)をキャンセルするノイズキャンセル手段を更に含み、
前記音声認識手段は、
前記ノイズキャンセル手段によって前記ノイズを減衰させた第3音声を用いて音声認識を行い、
前記ノイズキャンセル手段は、現場又は位置ごとに、キャンセルの対象とする周波数帯域(例えば、第1周波数帯域FR1及び第2周波数帯域FR2である。)が設定されるのが望ましい(例えば、図18である)。
In addition, the voice recognition system
The apparatus further includes a noise canceling unit that cancels noises (e.g., a first noise NZ1, a second noise NZ2, and a third noise NZ3) included in the first sound,
The voice recognition means
performing voice recognition using the third voice in which the noise has been attenuated by the noise canceling means;
It is desirable that the noise canceling means sets frequency bands to be cancelled (for example, a first frequency band FR1 and a second frequency band FR2) for each site or position (for example, as shown in FIG. 18).

このようにすると、それぞれの現場又は位置に適したノイズのキャンセルができる。そのため、音声に含まれるノイズを減衰させた第3音声で音声認識ができるため、音声認識の精度を向上させることができる。 In this way, noise can be canceled in a way that is appropriate for each site or location. As a result, voice recognition can be performed using the third voice in which the noise contained in the voice has been attenuated, thereby improving the accuracy of voice recognition.

また、音声認識システムでは、
前記制限手段は、前記第2音声の出力を停止する、前記第2音声の音量を小さくする、前記第2音声の音量を徐々に小さくする、前記第2音声の次に出力させる音声の出力を開始する、又は、前記第2音声の出力速度を速くして、前記第2音声の出力を制限する(例えば、ステップS04である。)のが望ましい。
In addition, the voice recognition system
It is desirable for the limiting means to limit the output of the second voice by stopping the output of the second voice, reducing the volume of the second voice, gradually reducing the volume of the second voice, starting the output of a voice to be output after the second voice, or increasing the output speed of the second voice (e.g., step S04).

このような制限処理PR1が行われると、不要な音声の出力を少なくできる。 When this type of restriction process PR1 is performed, it is possible to reduce the output of unnecessary audio.

また、音声認識システムでは、
前記登録手段は、複数の点検項目を前記第2音声に対応させて登録し、
前記点検項目をまとめたグループ(例えば、グループGSである。)を設定するグループ設定手段と(例えば、図13である。)、
前記グループを省略する省略操作(例えば、省略操作C3である。)を入力する省略操作手段と、
前記省略操作が入力されると、前記省略操作に対応する前記グループに属する前記点検項目に基づく前記第2音声の出力が省略されるのが望ましい。
In addition, the voice recognition system
The registration means registers a plurality of inspection items in association with the second sound,
A group setting means for setting a group (for example, group GS) that includes the inspection items (for example, FIG. 13 );
an omission operation means for inputting an omission operation (e.g., an omission operation C3) for omitting the group;
It is preferable that when the omission operation is input, output of the second sound based on the inspection item belonging to the group corresponding to the omission operation is omitted.

設備は、例えば、稼働していない場合には、点検を行わなくともよい場合がある。そのような設備に対する点検を省略できると、点検を効率良く行うことができる。 For example, equipment may not need to be inspected if it is not in operation. If inspection of such equipment can be omitted, inspections can be carried out more efficiently.

また、音声認識装置(例えば、携帯端末11である。)は、
第1音声を入力する音声入力手段と、
前記第1音声に基づいて、音声認識を行う音声認識手段と、
第2音声を登録する登録手段と、
前記第2音声を出力する出力手段と、
前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手段と
を含む。
In addition, the voice recognition device (for example, the mobile terminal 11)
A voice input means for inputting a first voice;
a voice recognition unit that performs voice recognition based on the first voice;
A registration means for registering a second voice;
an output means for outputting the second sound;
The device further includes a limiting means for limiting the output of the second sound when the first sound is input while the second sound is being output.

また、音声認識システムが行う音声認識方法(例えば、図3である。)であって、
音声認識システムが、第1音声を入力する音声入力手順と、
音声認識システムが、前記第1音声に基づいて、音声認識を行う音声認識手順と、
音声認識システムが、第2音声を登録する登録手順と、
音声認識システムが、前記第2音声を出力する出力手順と、
音声認識システムが、前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手順と
を含む。
Also, a speech recognition method (for example, FIG. 3) performed by a speech recognition system,
a speech input step of inputting a first speech by the speech recognition system;
a speech recognition step in which a speech recognition system performs speech recognition based on the first speech;
a registration step in which the voice recognition system registers the second voice;
an output step of the speech recognition system outputting the second speech;
The voice recognition system includes a limiting step of limiting output of the second voice when the first voice is input while the second voice is being output.

また、音声認識方法をコンピュータに実行させるためのプログラムである(例えば、図3である)。 It is also a program for causing a computer to execute the speech recognition method (for example, FIG. 3).

本発明に係る各実施形態によれば、音声の入力を行うための時間を短縮できる。 Each embodiment of the present invention can reduce the time required to input voice.

音声認識システム1のシステム構成例を示す図である。FIG. 1 is a diagram illustrating an example of a system configuration of a voice recognition system 1. 情報処理装置のハードウェア構成例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of an information processing device. 第1実施形態における全体処理例を示す図である。FIG. 4 is a diagram illustrating an example of an overall process in the first embodiment. 登録データベースD1の例を示す図である。FIG. 2 is a diagram showing an example of a registration database D1. 第1実施形態における処理結果の例を示す図である。FIG. 11 is a diagram illustrating an example of a processing result in the first embodiment. 第1実施形態における携帯端末の画面表示例を示す図である。FIG. 4 is a diagram showing an example of a screen display of a mobile terminal in the first embodiment. 第1実施形態における機能構成例を示す図である。FIG. 2 is a diagram illustrating an example of a functional configuration according to the first embodiment. 第2実施形態における全体処理例を示す図である。FIG. 11 is a diagram illustrating an example of an overall process in the second embodiment. 第2実施形態における処理結果の例を示す図である。FIG. 11 is a diagram illustrating an example of a processing result in the second embodiment. 第2実施形態における携帯端末の画面表示例を示す図である。FIG. 11 is a diagram showing an example of a screen display of a mobile terminal in the second embodiment. 第2実施形態における機能構成例を示す図である。FIG. 11 is a diagram illustrating an example of a functional configuration according to a second embodiment. グループ設定及び省略を行う変形例を示す図である。FIG. 13 is a diagram showing a modified example in which group setting and omission are performed. グループ設定の例を示す図である。FIG. 13 is a diagram illustrating an example of group settings. 第2入力データを前回結果とする例を示す図である。FIG. 13 is a diagram showing an example in which second input data is used as a previous result. 許容範囲を設定する例を示す図である。FIG. 13 is a diagram illustrating an example of setting a tolerance range. 第2入力データを正常値又は正常範囲とする例を示す図である。FIG. 13 is a diagram showing an example in which second input data is set as a normal value or a normal range. 第1辞書D211及び第2辞書D212を用いる変形例を示す図である。FIG. 23 is a diagram showing a modified example in which a first dictionary D211 and a second dictionary D212 are used. 現場ごとにキャンセルの対象とする周波数帯域を設定する例を示す図である。FIG. 13 is a diagram illustrating an example of setting a frequency band to be canceled for each site. 中断及び解除の第1変形例を示す図である。FIG. 13 is a diagram showing a first modified example of interruption and release. 中断及び解除の第2変形例を示す図である。FIG. 13 is a diagram showing a second modified example of interruption and release. 音声入力及び音声出力の変形例を示す図である。FIG. 13 is a diagram showing a modified example of audio input and audio output.

以下、発明を実施するための最適かつ最小限な形態について、図面を参照して説明する。なお、図面において、同一の符号を付す場合には、同様の構成であることを示し、重複する説明を省略する。また、図示する具体例は、例示であり、図示する以外の構成が更に含まれる構成であってもよい。 The optimal and minimal form for implementing the invention will be described below with reference to the drawings. Note that when the same reference numerals are used in the drawings, they indicate similar configurations, and duplicated explanations will be omitted. Also, the specific examples shown in the drawings are merely examples, and the configuration may further include configurations other than those shown in the drawings.

<第1実施形態>
<全体構成例>
図1は、音声認識システム1のシステム構成例を示す図である。例えば、音声認識システム1は、サーバ10、音声認識装置の例である携帯端末11、及び、イヤホン12を含む構成である。
First Embodiment
<Overall configuration example>
1 is a diagram showing an example of a system configuration of a voice recognition system 1. For example, the voice recognition system 1 includes a server 10, a mobile terminal 11 which is an example of a voice recognition device, and an earphone 12.

サーバ10、携帯端末11、及び、イヤホン12は、ネットワークNWを介して接続する。 The server 10, mobile terminal 11, and earphones 12 are connected via a network NW.

図示するように、ユーザ13は、イヤホン12を装着して、設備の点検を行う。また、ユーザ13は、携帯端末11を持って設備の点検を行う。一方で、サーバ10は、設備の点検が行われる現場とは異なる位置に設置される。したがって、設定値及びデータ等は、サーバ10にあらかじめ入力され、点検を行う際に、携帯端末11は、ネットワークNWを介して、設定値及びデータ等を取得する。 As shown in the figure, the user 13 wears earphones 12 and inspects the equipment. The user 13 also inspects the equipment while holding a mobile terminal 11. Meanwhile, the server 10 is installed in a location different from the site where the equipment inspection is performed. Therefore, the setting values, data, etc. are input in advance to the server 10, and when the inspection is performed, the mobile terminal 11 acquires the setting values, data, etc. via the network NW.

点検の対象となる設備は、例えば、空調設備等である。したがって、点検の現場は、企業における機械室等である。そして、点検では、圧力計、電圧計、電流計、薬液残量計、温度計、及び、湿度計等の計測器が示す値が、ユーザ13によって点検される。 The equipment to be inspected is, for example, air conditioning equipment. Therefore, the inspection site is a machine room in a company. During the inspection, the values indicated by measuring instruments such as a pressure gauge, a voltmeter, an ammeter, a chemical level gauge, a thermometer, and a hygrometer are checked by the user 13.

サーバ10及び携帯端末11は、情報処理装置である。例えば、情報処理装置は、以下のようなハードウェア構成の装置である。 The server 10 and the mobile terminal 11 are information processing devices. For example, the information processing device is a device with the following hardware configuration:

<ハードウェア構成例>
図2は、情報処理装置のハードウェア構成例を示す図である。例えば、サーバ10等の情報処理装置は、CPU(Central Processing Unit、以下「CPUHW1」という。)、記憶装置HW2、ネットワークインタフェースHW3、入力装置HW4、出力装置HW5、及び、インタフェースHW6を有するハードウェア構成である。
<Hardware configuration example>
2 is a diagram showing an example of the hardware configuration of an information processing device. For example, an information processing device such as a server 10 has a hardware configuration including a CPU (Central Processing Unit, hereinafter referred to as "CPUHW1"), a storage device HW2, a network interface HW3, an input device HW4, an output device HW5, and an interface HW6.

CPUHW1は、演算装置及び制御装置の例である。 CPUHW1 is an example of a calculation device and a control device.

記憶装置HW2は、主記憶装置及び補助記憶装置等である。 The memory device HW2 is a main memory device, an auxiliary memory device, etc.

ネットワークインタフェースHW3は、ネットワークを介して外部装置等とデータを送受信する通信装置である。 The network interface HW3 is a communication device that transmits and receives data to and from external devices via a network.

入力装置HW4は、ユーザの操作を入力するための装置である。例えば、入力装置HW4は、マウス、及び、キーボード等である。 The input device HW4 is a device for inputting user operations. For example, the input device HW4 is a mouse and a keyboard.

出力装置HW5は、処理結果をユーザに出力するための装置である。例えば、出力装置HW5は、ディスプレイ等である。 The output device HW5 is a device for outputting the processing results to the user. For example, the output device HW5 is a display, etc.

インタフェースHW6は、周辺機器を接続するためのコネクタ等である。 Interface HW6 is a connector for connecting peripheral devices.

イヤホン12は、音声を入力する入力装置である。そして、イヤホン12を介して入力されるユーザ13が発する音声は、携帯端末11に入力されて、音声認識等の処理が行われる。また、イヤホン12は、音声を出力する出力装置である。したがって、イヤホン12は、ユーザ13に対して、携帯端末11による処理によって音声を出力する。 The earphones 12 are an input device for inputting voice. Voice uttered by the user 13 and input through the earphones 12 is then input to the mobile terminal 11, where processing such as voice recognition is performed. The earphones 12 are also an output device for outputting voice. Therefore, the earphones 12 output voice to the user 13 through processing by the mobile terminal 11.

以下、ユーザ13がイヤホン12で入力する音声を「第1音声SD1」という。一方で、イヤホン12を介してユーザ13に出力される音声を「第2音声SD2」という。 Hereinafter, the audio input by the user 13 through the earphone 12 is referred to as the "first audio SD1." On the other hand, the audio output to the user 13 through the earphone 12 is referred to as the "second audio SD2."

<全体処理例>
図3は、第1実施形態における全体処理例を示す図である。以下、図示するように、全体処理を「事前処理」と「本処理」に分けて説明する。「事前処理」は、「本処理」より前に行われる、音声認識システム1を運用する準備となる処理である。したがって、「事前処理」と「本処理」は連続して行われなくともよく、「事前処理」が「本処理」が開始されるまでに完了していればよい。
<Overall processing example>
3 is a diagram showing an example of the overall processing in the first embodiment. Below, as shown in the figure, the overall processing will be explained by dividing it into "pre-processing" and "main processing". The "pre-processing" is a process that is performed before the "main processing" and is a preparation process for operating the speech recognition system 1. Therefore, the "pre-processing" and the "main processing" do not have to be performed consecutively, and it is sufficient that the "pre-processing" is completed before the "main processing" starts.

<事前処理の例>
「事前処理」では、以下のような処理が行われる。
<Example of pre-processing>
In the "pre-processing", the following processing is carried out:

ステップS01では、音声認識システム1は、例えば、点検項目、及び、第2音声SD2用のデータ等を登録して、登録データベースD1を構築する。すなわち、登録データベースD1は、点検において、第2音声SD2となって読み上げられる内容を示す。また、入力される音声のデータのうち、どのデータをどのタイミングで第2音声SD2として出力すればよいかといった点検項目との対応付けも、登録データベースD1上に登録される。例えば、このように登録手順が行われる。このようにして、「事前処理」では、音声認識システム1は、「本処理」で第2音声SD2を出力できるようにするためのデータの入力及び設定を行う。具体的には、登録データベースD1は、以下のように構築される。 In step S01, the voice recognition system 1 registers, for example, inspection items and data for the second voice SD2 to construct a registration database D1. That is, the registration database D1 indicates the contents to be read out as the second voice SD2 during the inspection. In addition, the correspondence between the inspection items and which data of the input voice should be output as the second voice SD2 and at what timing is also registered in the registration database D1. For example, the registration procedure is performed in this manner. In this way, in the "pre-processing", the voice recognition system 1 inputs and sets data to enable the second voice SD2 to be output in the "main processing". Specifically, the registration database D1 is constructed as follows.

図4は、登録データベースD1の例を示す図である。図示するように、登録データベースD1は、「項目番号」及び「点検項目」で構成される。 Figure 4 shows an example of registration database D1. As shown in the figure, registration database D1 is composed of "item numbers" and "inspection items."

例えば、第2音声SD2で出力される内容は、「点検項目」に入力される内容である。具体的には、「点検項目」には、点検の対象となる設備を特定する設備の名称(例えば、「項目番号」が「1」の例では、「消火ポンプ」である。)等が入力される。したがって、第2音声によって設備の名称が読み上げられると、ユーザ13は、第2音声SD2を聞いて、これから点検する対象となる設備を特定できる。 For example, the content output by the second audio SD2 is the content entered in "inspection item." Specifically, the name of the equipment that identifies the equipment to be inspected (for example, in the example where the "item number" is "1," it is "fire pump") is entered in "inspection item." Therefore, when the name of the equipment is read out by the second audio, the user 13 can identify the equipment that is to be inspected by listening to the second audio SD2.

さらに、「点検項目」には、図示するように、詳細な点検内容が入力される。具体的には、詳細な点検内容は、「項目番号」が「1」の例における「圧力値」である。このような詳細な点検内容が第2音声によって読み上げられると、ユーザ13は、第2音声SD2を聞いて、圧力値を点検し、第1音声SD1で圧力値を入力する作業を行うことが分かる。 Furthermore, as shown in the figure, detailed inspection content is input in "Inspection item". Specifically, the detailed inspection content is "Pressure value" in the example where "Item number" is "1". When such detailed inspection content is read out by the second voice, the user 13 knows that by listening to the second voice SD2, he or she will inspect the pressure value and input the pressure value with the first voice SD1.

また、ステップS01では、音声認識システム1は、辞書D2を入力する。すなわち、「事前処理」では、音声認識システム1は、「本処理」において第1音声SD1で入力される音声を言葉として認識する、音声認識が可能となるようにするためのデータの入力及び設定を行う。 In addition, in step S01, the voice recognition system 1 inputs the dictionary D2. That is, in the "pre-processing", the voice recognition system 1 inputs and sets data to enable voice recognition, that is, to recognize the voice input in the first voice SD1 as words in the "main processing".

<本処理の例>
「本処理」は、点検の開始に応じて開始される。
<Example of this process>
"This process" begins when inspection begins.

ステップS02では、音声認識システム1は、登録された第2音声SD2を出力する出力手順を行う。 In step S02, the voice recognition system 1 performs an output procedure to output the registered second voice SD2.

以下、ステップS02が実行されている間、すなわち、第2音声SD2が出力されている間に第1音声SD1が入力されるとする。このような場合には、音声認識システム1は、ステップS03に進む。 Hereinafter, it is assumed that the first voice SD1 is input while step S02 is being executed, i.e., while the second voice SD2 is being output. In such a case, the voice recognition system 1 proceeds to step S03.

ステップS03では、音声認識システム1は、第1音声SD1を入力する音声入力手順を行う。すなわち、ステップS03では、音声認識システム1は、ユーザ13が音声を発したのを感知する。このように、第1音声SD1が入力されると、音声認識システム1は、ステップS04に進む。 In step S03, the voice recognition system 1 performs a voice input procedure to input the first voice SD1. That is, in step S03, the voice recognition system 1 detects that the user 13 has spoken. In this way, when the first voice SD1 is input, the voice recognition system 1 proceeds to step S04.

ステップS04では、音声認識システム1は、第2音声SD2の出力を制限する制限手順を行う。 In step S04, the voice recognition system 1 performs a restriction procedure to restrict the output of the second voice SD2.

ステップS05では、音声認識システム1は、第1音声SD1に基づいて音声認識を行う音声認識手順を行う。 In step S05, the voice recognition system 1 performs a voice recognition procedure to perform voice recognition based on the first voice SD1.

ステップS06では、音声認識システム1は、第1音声SD1を音声認識した音声認識結果を第2音声SD2で出力する。 In step S06, the voice recognition system 1 outputs the voice recognition result of the first voice SD1 as the second voice SD2.

例えば、以上のような全体処理が行われると、以下のような処理結果となる。 For example, when the overall processing described above is performed, the processing result will be as follows.

図5は、第1実施形態における処理結果の例を示す図である。以下、制限を行わない「第1項目実行例」と制限を行う「第2項目実行例」を比較して説明する。 Figure 5 shows an example of a processing result in the first embodiment. Below, we will explain by comparing a "first item execution example" that does not impose restrictions and a "second item execution example" that imposes restrictions.

「第1項目実行例」では、まず、音声認識システム1は、第2音声SD2によって第11出力EX11を出力する。この例では、第11出力EX11は、「消火ポンプ:圧力」というように、点検の対象となる設備の名称、及び、点検の内容を続けて示す音声である。 In the "first item execution example," the voice recognition system 1 first outputs the eleventh output EX11 by the second voice SD2. In this example, the eleventh output EX11 is a voice that successively indicates the name of the equipment to be inspected and the details of the inspection, such as "fire pump: pressure."

第11出力EX11に対して、ユーザ13は、第11出力EX11で示す設備を点検した結果を示す第12出力EX12を第1音声SD1で、音声認識システム1に入力する操作を行う。具体的には、この例では、ユーザ13は、「消火ポンプ」の設備が有する圧力計が示す「圧力」の値である「12.3」を読み上げる。この読み上げで発せられる音声が第12出力EX12となる。 In response to the 11th output EX11, the user 13 performs an operation to input the 12th output EX12, which indicates the results of inspecting the equipment indicated by the 11th output EX11, to the speech recognition system 1 using the first voice SD1. Specifically, in this example, the user 13 reads out "12.3", which is the "pressure" value indicated by the pressure gauge of the "fire pump" equipment. The voice emitted by this reading becomes the 12th output EX12.

次に、この例では、音声認識システム1は、第12出力EX12を音声認識する。そして、第13出力EX13で、点検が完了した内容、かつ、音声認識結果を第2音声SD2によって出力する。図示するように、第13出力EX13で出力される内容のうち、前半は、第11出力EX11の復唱である。続いて、第13出力EX13では、後半で、音声認識結果、すなわち、第12出力EX12と同様の内容が続けて出力される。このように、制限をせず、かつ、音声認識が正しく行われた場合には、音声認識システム1は、点検項目等の出力、点検結果の入力、音声認識、及び、音声認識結果の出力という順で動作する。 Next, in this example, the voice recognition system 1 performs voice recognition on the twelfth output EX12. Then, in the thirteenth output EX13, the details of the completed inspection and the voice recognition result are output by the second voice SD2. As shown in the figure, the first half of the contents output in the thirteenth output EX13 is a repetition of the eleventh output EX11. Next, in the second half of the thirteenth output EX13, the voice recognition result, i.e., the same contents as the twelfth output EX12, is output. In this way, if no restrictions are imposed and the voice recognition is performed correctly, the voice recognition system 1 operates in the following order: output of inspection items, etc., input of the inspection results, voice recognition, and output of the voice recognition results.

このような動作が可能な音声認識システム1に対して、「第2項目実行例」では、第2音声SD2が出力されている間に、ユーザ13は、第1音声SD1を入力して、第2音声SD2の出力を制限する。 For a voice recognition system 1 capable of such operations, in the "second item execution example", while the second voice SD2 is being output, the user 13 inputs the first voice SD1 to limit the output of the second voice SD2.

図示する例では、制限の対象となる第2音声SD2を第21出力EX21とする例である(ステップS02)。第21出力EX21は、第11出力EX11が示す点検項目の次になる点検項目である。そして、第21出力EX21は、制限されない場合には、「消火ポンプ:外観」という内容である。 In the illustrated example, the second audio SD2 to be restricted is set as the 21st output EX21 (step S02). The 21st output EX21 is the inspection item that follows the inspection item indicated by the 11th output EX11. If the 21st output EX21 is not restricted, the content is "Fire pump: exterior."

図示するように、「第2項目実行例」では、第21出力EX21が出力されている(ステップS02)途中で、ユーザ13は、第21出力EX21で示す設備を点検した結果を示す第22出力EX22を第1音声SD1で、音声認識システム1に入力する操作を行う(ステップS03)。 As shown in the figure, in the "second item execution example", while the 21st output EX21 is being output (step S02), the user 13 performs an operation to input the 22nd output EX22, which indicates the results of inspecting the equipment indicated by the 21st output EX21, to the speech recognition system 1 using the first voice SD1 (step S03).

このように、第21出力EX21が出力されている間に、第22出力EX22が入力されると、音声認識システム1は、第21出力EX21の出力を制限する制限処理PR1を行う(ステップS04)。例えば、制限処理PR1は、第21出力EX21の出力を停止させる処理である。 In this way, when the 22nd output EX22 is input while the 21st output EX21 is being output, the speech recognition system 1 performs a restriction process PR1 that restricts the output of the 21st output EX21 (step S04). For example, the restriction process PR1 is a process that stops the output of the 21st output EX21.

また、ユーザ13は、「消火ポンプ」の設備の外観をチェックした結果である「× 液漏れあり」を読み上げる(ステップS03)。この読み上げで発せられる音声が第22出力EX22となる。 The user 13 also reads out the result of checking the appearance of the "fire pump" equipment: "X - Liquid leaking" (step S03). The voice emitted by this reading becomes the 22nd output EX22.

次に、この例では、音声認識システム1は、第22出力EX22を音声認識する(ステップS05)。そして、音声認識システム1は、第23出力EX23で、第13出力EX13と同様に、点検が完了した内容、かつ、音声認識結果を第2音声SD2によって出力する(ステップS06)。図示するように、第23出力EX23で出力される内容のうち、前半は、第21出力EX21の復唱である。続いて、第23出力EX23では、後半で、音声認識結果、すなわち、第22出力EX22と同様の内容が続けて出力される。 Next, in this example, the voice recognition system 1 performs voice recognition on the 22nd output EX22 (step S05). Then, in the 23rd output EX23, the voice recognition system 1 outputs the content that the inspection has been completed and the voice recognition result by the second voice SD2, similar to the 13th output EX13 (step S06). As shown in the figure, the first half of the content output in the 23rd output EX23 is a repetition of the 21st output EX21. Next, in the second half of the 23rd output EX23, the voice recognition result, i.e., the same content as the 22nd output EX22, is continuously output.

<画面表示例>
図6は、第1実施形態における携帯端末の画面表示例を示す図である。例えば、点検は、以下のような順序で行われる。ただし、図示するような画面表示、順序及び入力項目は必須ではない。
<Screen display example>
6 is a diagram showing an example of a screen display of a mobile terminal in the first embodiment. For example, inspection is performed in the following order. However, the screen display, order, and input items shown in the figure are not essential.

図6(A)は、「メインメニュー」を示す画面である。以下、図6(A)に示す画面を第11画面PN11という。第11画面PN11で「点検フロー」が押されると、点検を行う準備を行う画面である図6(B)に画面が遷移する。 Figure 6 (A) is a screen showing the "Main Menu." Hereinafter, the screen shown in Figure 6 (A) will be referred to as the eleventh screen PN11. When "Inspection Flow" is pressed on the eleventh screen PN11, the screen transitions to Figure 6 (B), which is a screen for preparing to perform an inspection.

図6(B)は、「点検フロー一覧」を選択する画面である。以下、図6(B)に示す画面を第12画面PN12という。第12画面PN12は、点検を行う対象となる設備を選ぶ画面である。次に、第12画面PN12で設備が選ばれると、点検を行うユーザ13を指定する画面である図6(C)に画面が遷移する。 Figure 6 (B) is a screen for selecting "Inspection flow list." Hereinafter, the screen shown in Figure 6 (B) will be referred to as the 12th screen PN12. The 12th screen PN12 is a screen for selecting the equipment to be inspected. Next, when equipment is selected on the 12th screen PN12, the screen transitions to Figure 6 (C), which is a screen for specifying the user 13 who will perform the inspection.

図6(C)は、「作業者の選択」を行う画面である。以下、図6(C)に示す画面を第13画面PN13という。第13画面PN13は、これから点検を行う作業者となるユーザ13を選ぶ画面である。次に、第13画面PN13でユーザ13が選ばれると、点検が開始され、図6(D)に画面が遷移する。 Figure 6 (C) is a screen for "selecting a worker." Hereinafter, the screen shown in Figure 6 (C) will be referred to as the thirteenth screen PN13. The thirteenth screen PN13 is a screen for selecting a user 13 who will be the worker who will perform the inspection. Next, when a user 13 is selected on the thirteenth screen PN13, the inspection begins and the screen transitions to Figure 6 (D).

図6(D)は、第1番目の点検項目用画面である。以下、図6(D)に示す画面を第14画面PN14という。第14画面PN14は、「点検項目書」に、点検の対象となる設備の名称及び点検の進捗度を示す。また、第14画面PN14は、「点検項目」に、点検内容となる「缶内圧力」を示す。例えば、第14画面PN14の表示に応じて、同様の内容を示す第2音声SD2が出力される(ステップS02)。次に、点検結果を示す第1音声SD1が入力されると(ステップS03)、音声認識が行われて(ステップS05)、図6(E)に画面が遷移する。 Figure 6 (D) is a screen for the first inspection item. Hereinafter, the screen shown in Figure 6 (D) is referred to as the 14th screen PN14. The 14th screen PN14 shows the name of the equipment to be inspected and the progress of the inspection in the "Inspection Item List". The 14th screen PN14 also shows the "boiler pressure", which is the inspection content, in the "Inspection Item". For example, in response to the display of the 14th screen PN14, a second voice SD2 indicating the same content is output (step S02). Next, when the first voice SD1 indicating the inspection result is input (step S03), voice recognition is performed (step S05) and the screen transitions to Figure 6 (E).

図6(E)は、第1番目の点検結果を示す画面である。以下、図6(E)に示す画面を第15画面PN15という。第15画面PN15は、第14画面PN14と比較すると、認識結果に「0.66」という数値が表示される点が異なる。この「0.66」は、第1音声SD1を音声認識した結果である。このように、音声認識結果が画面に表示されると、ユーザ13は、音声認識結果を確認しやすい。 Figure 6 (E) is a screen showing the first inspection result. Hereinafter, the screen shown in Figure 6 (E) will be referred to as the fifteenth screen PN15. The fifteenth screen PN15 differs from the fourteenth screen PN14 in that the numerical value "0.66" is displayed as the recognition result. This "0.66" is the result of voice recognition of the first voice SD1. When the voice recognition result is displayed on the screen in this way, it is easy for the user 13 to check the voice recognition result.

例えば、以上のように、第1番目の点検項目について点検が行われる。以下、2番目以降の点検項目も同様に処理が行われる。 For example, the first inspection item is inspected as described above. The second and subsequent inspection items are processed in the same manner.

図6(F)は、第2番目の点検項目用画面である。以下、図6(F)に示す画面を第16画面PN16という。第1番目の点検項目が「缶内圧力」であったのに対して、第16画面PN16では、点検項目が「押込ファン電流値」となる。そして、第16画面PN16では、第1番目の点検項目と同様に、画面と同様の内容を示す第2音声SD2が出力される(ステップS02)。次に、点検結果を示す第1音声SD1が入力されると(ステップS03)、音声認識が行われて(ステップS05)、図6(G)に画面が遷移する。 Figure 6 (F) is the screen for the second inspection item. Hereinafter, the screen shown in Figure 6 (F) is referred to as the 16th screen PN16. Whereas the first inspection item was "boiler internal pressure", the inspection item in the 16th screen PN16 is "forced fan current value". Then, in the 16th screen PN16, as in the case of the first inspection item, a second voice SD2 indicating the same content as in the screen is output (step S02). Next, when the first voice SD1 indicating the inspection result is input (step S03), voice recognition is performed (step S05) and the screen transitions to Figure 6 (G).

図6(G)は、第2番目の点検結果を示す画面である。以下、図6(G)に示す画面を第17画面PN17という。第17画面PN17は、第16画面PN16と比較すると、認識結果に「43」という数値が表示される点が異なる。この「43」は、第1音声SD1を音声認識した結果である。 Figure 6 (G) is a screen showing the second inspection result. Hereinafter, the screen shown in Figure 6 (G) will be referred to as the 17th screen PN17. The 17th screen PN17 differs from the 16th screen PN16 in that the number "43" is displayed as the recognition result. This "43" is the result of voice recognition of the first voice SD1.

例えば、第14画面PN14又は第16画面PN16において、画面と同様の内容を示す第2音声SD2が出力されている間に、第1音声SD1が入力されると、音声認識システム1は、第2音声SD2の出力が制限して(ステップS04)、音声認識の開始、及び、次の画面に遷移する。 For example, when the first voice SD1 is input while the second voice SD2 indicating the same content as the screen is being output on the 14th screen PN14 or the 16th screen PN16, the voice recognition system 1 restricts the output of the second voice SD2 (step S04), starts voice recognition, and transitions to the next screen.

<機能構成例>
図7は、第1実施形態における機能構成例を示す図である。例えば、音声認識システム1は、音声入力手段1F11、音声認識手段1F12、登録手段1F13、出力手段1F14、制限手段1F15、入力データ生成手段1F16、記憶手段1F17、判断手段1F18、ノイズキャンセル手段1F19、グループ設定手段1F20、及び、省略操作手段1F21を含む機能構成である。
<Functional configuration example>
7 is a diagram showing an example of a functional configuration in the first embodiment. For example, the voice recognition system 1 has a functional configuration including a voice input unit 1F11, a voice recognition unit 1F12, a registration unit 1F13, an output unit 1F14, a restriction unit 1F15, an input data generation unit 1F16, a storage unit 1F17, a determination unit 1F18, a noise cancellation unit 1F19, a group setting unit 1F20, and an omission operation unit 1F21.

音声入力手段1F11及び出力手段1F14は、例えば、イヤホン12等で実現される。また、音声認識手段1F12、登録手段1F13、制限手段1F15、入力データ生成手段1F16、記憶手段1F17、判断手段1F18、ノイズキャンセル手段1F19、グループ設定手段1F20、及び、省略操作手段1F21は、携帯端末11又はサーバ10が有するCPUHW1、記憶装置HW2、入力装置HW4、出力装置HW5、及び、インタフェースHW6等の演算装置、記憶装置、入力装置、及び、出力装置等が協働して動作して実現する。 The voice input means 1F11 and the output means 1F14 are realized, for example, by earphones 12. The voice recognition means 1F12, the registration means 1F13, the restriction means 1F15, the input data generation means 1F16, the storage means 1F17, the determination means 1F18, the noise cancellation means 1F19, the group setting means 1F20, and the omission operation means 1F21 are realized by the cooperation of the arithmetic units, storage units, input devices, and output devices, such as the CPU HW1, the storage unit HW2, the input unit HW4, the output unit HW5, and the interface HW6, of the mobile terminal 11 or the server 10.

特に、点検を行うユーザ13が点検に慣れているような場合には、点検の内容及び順序といった詳細が第2音声SD2で案内されなくとも、熟知している場合がある。このような場合には、ユーザ13は、第2音声SD2がすべて出力され終わる前に、点検結果を第1音声SD1で入力して、点検を早く終わらせたい場合がある。そこで、上記の例のように、第2音声SD2の出力をしている間に、第1音声SD1が入力されると、第2音声SD2の出力が制限されるのが望ましい。このように、第2音声SD2の出力を制限して、第1音声SD1が入力できるようになると、ユーザ13は、第2音声SD2が出力され終わるのを待たずに済むため、音声の入力を行うための時間を短縮できる。 In particular, if the user 13 performing the inspection is accustomed to inspections, the user 13 may be familiar with the details of the inspection, such as the contents and sequence of the inspection, even if they are not guided by the second voice SD2. In such a case, the user 13 may want to finish the inspection quickly by inputting the inspection results in the first voice SD1 before all of the second voice SD2 has been output. Therefore, as in the above example, if the first voice SD1 is input while the second voice SD2 is being output, it is desirable to limit the output of the second voice SD2. In this way, if the output of the second voice SD2 is limited and the first voice SD1 can be input, the user 13 does not have to wait for the second voice SD2 to finish being output, and the time required to input voice can be shortened.

<第2実施形態>
第2実施形態は、第1実施形態と同様のシステム構成である音声認識システム1で実現する。また、第2実施形態における携帯端末11及びサーバ10のハードウェア構成も第1実施形態と同様とする。第2実施形態は、第1実施形態と比較すると、全体処理が異なる。以下、異なる点を中心に説明し、重複する説明を省略する。
Second Embodiment
The second embodiment is realized by a voice recognition system 1 having the same system configuration as the first embodiment. The hardware configurations of the mobile terminal 11 and the server 10 in the second embodiment are also the same as those in the first embodiment. The second embodiment differs from the first embodiment in the overall processing. The following description will focus on the differences and omit redundant description.

<全体処理例>
図8は、第2実施形態における全体処理例を示す図である。第1実施形態と比較すると、第2実施形態は、ステップS21乃至ステップS23が行われる点が異なる。また、第2実施形態における「事前処理」は、第1実施形態と同様とする。
<Overall processing example>
8 is a diagram showing an example of the overall processing in the second embodiment. Compared with the first embodiment, the second embodiment is different in that steps S21 to S23 are performed. Also, the "pre-processing" in the second embodiment is the same as that in the first embodiment.

ステップS02では、音声認識システム1は、登録された第2音声SD2を出力する。 In step S02, the voice recognition system 1 outputs the registered second voice SD2.

以下、ステップS02が実行されている間、すなわち、第2音声SD2が出力されている間に、中断操作C1が入力される例で説明する。このような場合には、音声認識システム1は、ステップS21に進む。なお、中断操作C1がどのような操作かは、事前に設定される。 Below, an example will be described in which the interrupt operation C1 is input while step S02 is being executed, i.e., while the second voice SD2 is being output. In such a case, the voice recognition system 1 proceeds to step S21. Note that the type of operation that the interrupt operation C1 is is set in advance.

ステップS21では、音声認識システム1は、中断操作C1を入力する。このように、中断操作C1が入力されると、音声認識システム1は、第2音声SD2の出力を中断させる。 In step S21, the voice recognition system 1 inputs an interruption operation C1. In this manner, when the interruption operation C1 is input, the voice recognition system 1 interrupts the output of the second voice SD2.

また、音声認識システム1は、第2音声SD2の出力を中断している間に中断を解除する解除操作C2が入力されると、ステップS22に進む。なお、解除操作C2がどのような操作かは、事前に設定される。 When a cancel operation C2 is input to cancel the interruption while the output of the second voice SD2 is interrupted, the voice recognition system 1 proceeds to step S22. Note that the type of operation that the cancel operation C2 is is set in advance.

ステップS22では、音声認識システム1は、解除操作C2に基づいて、中断を解除する。 In step S22, the voice recognition system 1 releases the interruption based on the release operation C2.

ステップS23では、音声認識システム1は、第2音声SD2の出力を再開する。 In step S23, the voice recognition system 1 resumes output of the second voice SD2.

例えば、以上のような全体処理が行われると、以下のような処理結果となる。 For example, when the overall processing described above is performed, the processing result will be as follows.

図9は、第2実施形態における処理結果の例を示す図である。以下、第2実施形態における「第2項目実行例」の第21出力EX21を中断の対象とする例で説明する。 Figure 9 is a diagram showing an example of a processing result in the second embodiment. Below, we will explain an example in which the 21st output EX21 of the "Second item execution example" in the second embodiment is the target of interruption.

例えば、第21出力EX21を示す出力音声が出力されている(ステップS02)間に、中断操作C1が入力されるとする。そして、中断操作C1が入力されると、音声認識システム1は、中断処理PR2を行う(ステップS21)。以下、中断操作C1を入力して、中断した時点を「第1時点」という。 For example, suppose that an interruption operation C1 is input while an output voice indicating the 21st output EX21 is being output (step S02). When the interruption operation C1 is input, the voice recognition system 1 performs an interruption process PR2 (step S21). Hereinafter, the point in time when the interruption operation C1 is input and interrupted is referred to as the "first point in time."

中断処理PR2は、図示するように、第21出力EX21の途中で出力を止める処理である。さらに、中断処理PR2は、中断した時点以降、解除操作C2が入力されるまで出力を行わないようにする処理である。 As shown in the figure, the interruption process PR2 is a process that stops the output midway through the 21st output EX21. Furthermore, the interruption process PR2 is a process that prevents output from being performed after the interruption until the cancel operation C2 is input.

次に、解除操作C2が入力されると、音声認識システム1は、中断を解除する(ステップS22)。具体的には、解除操作C2が入力されると、音声認識システム1は、第200出力EX200を示す出力音声を出力し、第21出力EX21を示す出力音声の出力を再開する。 Next, when the cancel operation C2 is input, the voice recognition system 1 cancels the interruption (step S22). Specifically, when the cancel operation C2 is input, the voice recognition system 1 outputs an output voice indicating the 200th output EX200, and resumes output of an output voice indicating the 21st output EX21.

第200出力EX200は、第1時点で完了していた点検の内容を示す出力音声である。このような出力音声によって、ユーザ13に、どこまで点検が終わっていたかを思い出させる。 The 200th output EX200 is an output sound that indicates the contents of the inspection that was completed at the first point in time. This output sound reminds the user 13 of how much of the inspection has been completed.

そして、第200出力EX200が出力された後、第21出力EX21の出力が再開される(ステップS23)。 Then, after the 200th output EX200 is output, the output of the 21st output EX21 is resumed (step S23).

<画面表示例>
図10は、第2実施形態における携帯端末の画面表示例を示す図である。例えば、点検は、以下のような順序で行われる。ただし、図示するような画面表示、順序及び入力項目は必須ではない。
<Screen display example>
10 is a diagram showing an example of a screen display of a mobile terminal in the second embodiment. For example, inspection is performed in the following order. However, the screen display, order, and input items shown in the figure are not essential.

図10(A)は、第1番目の点検結果を示す画面である。以下、図10(A)に示す画面を第21画面PN21という。第21画面PN21は、第1番目に行う点検の内容が「蒸気温度」であって、点検結果として「120」が入力された場合に表示される画面の例である。図示するように、テキスト出力B2によって音声認識結果が出力される。そして、テキスト出力B2を見て音声認識結果が誤っている場合には、再入力ボタンB1を押して、再度、点検結果を入力できるのが望ましい。 Figure 10 (A) is a screen showing the first inspection result. Hereinafter, the screen shown in Figure 10 (A) will be referred to as the 21st screen PN21. The 21st screen PN21 is an example of a screen that is displayed when the first inspection is "steam temperature" and "120" is entered as the inspection result. As shown in the figure, the voice recognition result is output by text output B2. Then, if the voice recognition result is incorrect when looking at the text output B2, it is desirable to be able to press the re-input button B1 and re-input the inspection result.

同様に、第2番目、第3番目、及び、第4番目の順序で点検が行われる。そして、この例では、図10(B)に示す第22画面PN22が、第2番目の点検結果が入力された場合に表示される画面の例である。 Similarly, the second, third, and fourth inspections are performed in that order. In this example, the 22nd screen PN22 shown in FIG. 10(B) is an example of the screen that is displayed when the second inspection result is entered.

図10(C)に示す第23画面PN23は、第3番目の点検結果が入力された場合に表示される画面の例である。そして、図10(D)に示す第24画面PN24は、第4番目の点検結果が入力された場合に表示される画面の例である。 The 23rd screen PN23 shown in FIG. 10(C) is an example of a screen that is displayed when the third inspection result is input. And the 24th screen PN24 shown in FIG. 10(D) is an example of a screen that is displayed when the fourth inspection result is input.

<機能構成例>
図11は、第2実施形態における機能構成例を示す図である。例えば、音声認識システム1は、音声入力手段1F11、音声認識手段1F12、出力手段1F14、解除手段1F101、及び、中断手段1F100を含む機能構成である。
<Functional configuration example>
11 is a diagram showing an example of a functional configuration in the second embodiment. For example, the voice recognition system 1 has a functional configuration including a voice input unit 1F11, a voice recognition unit 1F12, an output unit 1F14, a release unit 1F101, and an interruption unit 1F100.

音声入力手段1F11及び出力手段1F14は、例えば、イヤホン12等で実現される。また、音声認識手段1F12、解除手段1F101、及び、中断手段1F100は、携帯端末11又はサーバ10が有するCPUHW1、記憶装置HW2、入力装置HW4、出力装置HW5、及び、インタフェースHW6等の演算装置、記憶装置、入力装置、及び、出力装置等が協働して動作して実現する。 The voice input means 1F11 and the output means 1F14 are realized, for example, by earphones 12. The voice recognition means 1F12, the release means 1F101, and the interruption means 1F100 are realized by the cooperation of the arithmetic units, memory units, input devices, and output devices, such as the CPU HW1, the memory unit HW2, the input unit HW4, the output unit HW5, and the interface HW6, of the mobile terminal 11 or the server 10.

例えば、図10に示すように、事前に設定される複数の点検項目に基づいて、点検が行われる。このような点検作業の流れの中では、例えば、電話が鳴る、又は、他の人から話しかけられるといった割込となる作業が発生する場合がある。このような割込があった場合に、ユーザ13は、中断操作C1で点検を中断できるのが望ましい。このように、ユーザ13は、中断操作C1で点検を中断できると、点検を中断させた上で、割り込んできた作業を行うことができる。そして、割り込んできた作業の完了後、解除操作C2によって、ユーザ13は、点検を再開できる。 For example, as shown in FIG. 10, an inspection is performed based on multiple inspection items that are set in advance. During the flow of such an inspection work, an interrupting task may occur, for example, the telephone rings or someone speaks to the user. When such an interruption occurs, it is desirable for the user 13 to be able to interrupt the inspection with an interrupt operation C1. In this way, if the user 13 can interrupt the inspection with the interrupt operation C1, the user 13 can interrupt the inspection and then perform the interrupting task. Then, after completing the interrupting task, the user 13 can resume the inspection with a cancel operation C2.

<変形例>
なお、点検項目は、数値、又は、「〇」若しくは「×」(「YES」若しくは「NO」等でもよい。)の形式で入力及びチェックされる「定式」と、「漏れあり」等のようにユーザ13がコメントで入力する「非定式」があってもよい。また、点検結果は、ユーザ13が撮影した画像等が添付できてもよい。
<Modification>
The inspection items may be either "standardized" items that are input and checked in the form of numerical values or "o" or "x" (or "YES" or "NO", etc.), or "non-standardized" items that the user 13 inputs as comments such as "missing". Also, images taken by the user 13 may be attached to the inspection results.

なお、音声認識システム1は、設備の点検以外に用いられてもよい。すなわち、点検の対象となる対象物は、設備以外の装置でもよい。また、音声認識システム1は、点検以外に用いられてもよい。 The voice recognition system 1 may be used for purposes other than equipment inspection. In other words, the object to be inspected may be a device other than equipment. The voice recognition system 1 may be used for purposes other than inspection.

音声認識システム1が設備の点検に用いられると、設備の点検を行う作業時間を短縮させて、作業の省力化ができる。 When the voice recognition system 1 is used for equipment inspection, the time required for equipment inspection can be shortened, making the work more labor-saving.

なお、音声認識システム1は、空調設備機器の機械室における点検で用いられるのが望ましい。空調設備機器の機械室における点検では、点検箇所が機械室内で点在する場合が多い。また、多数の大型機器が設置されている場合には、個々の大型機器について、点検の対象となるメータ類も点在する場合が多い。このような機械室では、点検項目も多岐にわたる場合が多い。そして、このような多数の点検を行う場合には、ユーザは、点検をするために多く移動する。また、場合によっては、ユーザは、移動において梯子を登る等の移動もあり得る。 The voice recognition system 1 is preferably used for inspections in the machine room of air conditioning equipment. When inspecting the machine room of air conditioning equipment, the inspection points are often scattered throughout the machine room. Furthermore, when a large number of large pieces of equipment are installed, the meters to be inspected for each piece of large equipment are often also scattered throughout the machine room. In such machine rooms, the inspection items are often diverse. Furthermore, when performing such a large number of inspections, the user moves around a lot to carry out the inspections. Furthermore, in some cases, the user may have to move around by climbing a ladder, etc.

さらに、ユーザは、点検では、照明を点灯させる(そして、終了後は消灯させる。)、又は、動力盤の扉を開ける等の付随的な作業も行う。そのため、点検結果の入力等をできるだけ手作業で入力するのをなくしたい事情がある。そこで、音声認識システム1によって、音声で点検結果等を入力できると、ユーザは点検を行いやすい。 Furthermore, when inspecting, the user also performs incidental tasks such as turning on the lights (and turning them off when finished) or opening the door to the power panel. For this reason, there is a desire to eliminate manual input of inspection results as much as possible. Therefore, if the voice recognition system 1 can be used to input inspection results by voice, it will be easier for the user to inspect.

また、上記のような機械室での点検のように、移動が多い場合には、他の作業者及び管理者等から点検を行っている間に声を掛けられる可能性も高くなる。そのため、音声認識システム1で中断及び解除ができると、点検を中断し、再開できるため、点検を効率良く行うことができる。 In addition, when there is a lot of movement, such as in the case of inspections in machine rooms as described above, there is a high possibility that other workers and managers will talk to the inspector while he or she is performing the inspection. Therefore, if the voice recognition system 1 can pause and cancel the inspection, the inspection can be stopped and resumed, making the inspection more efficient.

また、設備及びメータ類等の配置によっては、1か所に複数の計器類が設置される場合もある。このような設置状況下では、1か所で多くの点検結果を入力する場合も多い。そのため、装置による音声の出力が終わるまで待ってから音声入力を行うと、音声の入力を行うための待ち時間が長くなるので点検に時間がかかる。一方で、装置による音声の出力を制限して、音声が入力できる構成であると、ユーザは、音声が出力され終わるのを待たずに済むため、音声の入力を行うための時間を短縮できる。ゆえに、点検を効率良く行うことができる。 Depending on the layout of the equipment and meters, multiple instruments may be installed in one location. In such installation situations, many inspection results are often input in one location. Therefore, if the user waits until the device finishes outputting audio before inputting audio, the waiting time for inputting audio increases, and the inspection takes time. On the other hand, if the device is configured to limit audio output while allowing audio input, the user does not have to wait for audio output to finish, and the time required to input audio can be reduced. This allows the inspection to be performed efficiently.

音声を出力するのに用いられるイヤホン12は、内耳式であるのが望ましい。内耳式は、イヤホン12を装着した際に、外部からの音を遮音する形状である。例えば、設備が稼働中の現場では、設備が稼働する音等によるノイズが多い環境で場合が多い。そのため、内耳式のイヤホン12であると、ノイズが多い環境であっても、出力される音声が聞き取りやすい。また、骨伝導方式のイヤホンと比較すると、内耳式である方が小型化できる場合が多い。 The earphones 12 used to output sound are preferably of the cochlear type. Cochlear type earphones 12 are shaped to block external sounds when worn. For example, at work sites where equipment is in operation, the environment is often noisy due to the sounds of the equipment operating. Therefore, with cochlear type earphones 12, the output sound is easy to hear even in noisy environments. Also, compared to bone conduction type earphones, cochlear type earphones can often be made smaller.

点検項目に対して、順序、及び、点検の要否等が設定できてもよい。例えば、第2音声SD2は、登録データベースD1における「項目番号」の順に出力を行う。そこで、点検を行う前に、「事前処理」において、「項目番号」の設定、又は、「点検項目」と「項目番号」の対応付けを変更して、点検が行われる順序を変更できてもよい。 The order and the necessity of inspection for each inspection item may be set. For example, the second audio SD2 is output in the order of the "item numbers" in the registration database D1. Therefore, before the inspection is performed, the order in which the inspections are performed may be changed in "pre-processing" by changing the setting of the "item numbers" or the correspondence between the "inspection items" and the "item numbers."

また、点検を行わない「点検項目」を「OFF」にするような設定ができてもよい。 It may also be possible to set "inspection items" that are not to be inspected to "OFF."

点検する項目は、設備の稼働状況等によって異なる場合がある。したがって、順序及び点検の要否が設定できると、点検を行う日の稼働状況等に揃えて柔軟に点検する内容を変更できる。 The items to be inspected may vary depending on the operating status of the equipment. Therefore, if the order and necessity of inspections can be set, the contents of the inspection can be flexibly changed to match the operating status on the day of inspection.

情報処理装置は、上記に示すハードウェア構成に限られない。例えば、情報処理装置は、上記に示す以外の演算装置、制御装置、記憶装置、入力装置、出力装置、及び、周辺機器を更に有するハードウェア構成でもよい。また、入力装置及び出力装置が一体となってタッチパネル等でもよい。なお、携帯端末11及びサーバ10は、異なるハードウェア構成の装置でもよい。さらに、周辺機器及び他の装置との接続は、有線でもよいし、無線でもよい。 The information processing device is not limited to the hardware configuration shown above. For example, the information processing device may have a hardware configuration that further includes a calculation device, a control device, a storage device, an input device, an output device, and peripheral devices other than those shown above. Furthermore, the input device and the output device may be integrated into a touch panel or the like. Note that the mobile terminal 11 and the server 10 may be devices with different hardware configurations. Furthermore, the connection with the peripheral devices and other devices may be wired or wireless.

また、携帯端末11は、タブレット、スマートフォン、又は、モバイルパソコン等の情報処理装置でもよい。 The mobile terminal 11 may also be an information processing device such as a tablet, smartphone, or mobile computer.

<制限処理の変形例>
なお、制限処理PR1は、第2音声SD2の出力を停止する処理に限られない。例えば、制限処理PR1は、第2音声SD2の音量を小さくして第2音声SD2を制限する処理でもよい。また、制限処理PR1は、第2音声SD2の音量を徐々に小さくして第2音声SD2を制限する処理でもよい。このように、制限処理PR1は、通常よりも音量を絞って第2音声SD2の出力を制限してもよい。
<Modification of Restriction Processing>
Note that the restriction process PR1 is not limited to a process of stopping the output of the second sound SD2. For example, the restriction process PR1 may be a process of limiting the second sound SD2 by lowering the volume of the second sound SD2. The restriction process PR1 may also be a process of limiting the second sound SD2 by gradually lowering the volume of the second sound SD2. In this way, the restriction process PR1 may limit the output of the second sound SD2 by lowering the volume more than usual.

又は、制限処理PR1は、第2音声SD2の次に出力させる音声の出力を開始する第2音声SD2を制限する処理でもよい。このように、制限処理PR1は、現在、第2音声SD2で示している点検項目から次の点検項目に進むようにして、第2音声SD2の出力を制限してもよい。 Alternatively, the restriction process PR1 may be a process that restricts the second audio SD2 that starts to be output as the audio to be output next to the second audio SD2. In this way, the restriction process PR1 may restrict the output of the second audio SD2 by moving from the inspection item currently indicated by the second audio SD2 to the next inspection item.

ほかにも、制限処理PR1は、第2音声SD2の出力速度を速くして第2音声SD2を制限する処理でもよい。すなわち、制限処理PR1は、第2音声SD2を早送り再生して、第2音声SD2の出力を制限してもよい。 Alternatively, the restriction process PR1 may be a process that restricts the second audio SD2 by increasing the output speed of the second audio SD2. In other words, the restriction process PR1 may restrict the output of the second audio SD2 by playing the second audio SD2 in fast forward.

このような制限処理PR1が行われると、不要な音声の出力を少なくできる。 When this type of restriction process PR1 is performed, it is possible to reduce the output of unnecessary audio.

<グループ設定及び省略を行う変形例>
なお、点検は、一部が省略できてもよい。例えば、省略は、以下のような処理である。
<Modification for Group Setting and Omission>
In addition, some of the inspections may be omitted. For example, the following process may be omitted.

図12は、グループ設定及び省略を行う変形例を示す図である。以下、点検の対象となる設備が「第1設備」、「第2設備」、「第3設備」、及び、「第4設備」であり、この順序で点検を行う例で説明する。 Figure 12 shows a modified example of group setting and omission. In the following, an example will be described in which the equipment to be inspected is "first equipment," "second equipment," "third equipment," and "fourth equipment," and inspections are performed in this order.

この例では、第1実施形態等と同様に、第1設備についての点検項目が、第31出力EX31で出力されるとする。また、この例では、第31出力EX31を含む第1設備についての点検が省略の対象であるとする。 In this example, similar to the first embodiment, the inspection items for the first equipment are output in the 31st output EX31. Also, in this example, the inspection of the first equipment including the 31st output EX31 is subject to omission.

省略を行う場合には、ユーザ13は、省略操作C3を行う。例えば、省略操作C3は、所定のボタンを押す、又は、「省略」等のように事前に設定される言葉を第1音声SD1で入力する等の操作である。なお、省略操作C3がどのような操作かは事前に設定される。 When omission is to be performed, the user 13 performs the omission operation C3. For example, the omission operation C3 is an operation such as pressing a specific button or inputting a pre-set word such as "omission" in the first voice SD1. Note that the type of operation that the omission operation C3 is is set in advance.

図示するように、第31出力EX31が出力されている間に、省略操作C3が行われると、音声認識システム1は、第31出力EX31を含む第1設備の点検を省略する省略処理PR3を行う。例えば、省略処理PR3は、第31出力EX31の出力を中止して、第2設備の点検に進む処理である。したがって、省略操作C3が行われると、音声認識システム1は、第2設備についての点検項目を示す第32出力EX32の出力を開始する。 As shown in the figure, when an omission operation C3 is performed while the 31st output EX31 is being output, the voice recognition system 1 performs an omission process PR3 that omits the inspection of the first equipment, including the 31st output EX31. For example, the omission process PR3 is a process that stops the output of the 31st output EX31 and proceeds to the inspection of the second equipment. Therefore, when the omission operation C3 is performed, the voice recognition system 1 starts outputting the 32nd output EX32, which indicates the inspection items for the second equipment.

なお、事前に登録される点検項目のうち、どの点検項目が第1設備の点検に対応するかは、例えば、以下のようなグループ設定に基づいて把握される。 Which of the pre-registered inspection items corresponds to the inspection of the first equipment is determined based on, for example, a group setting such as the following:

図13は、グループ設定の例を示す図である。例えば、図示するような点検項目が事前に登録された場合を例に説明する。この例では、「項目番号」が「1」及び「2」の「点検項目」が第1設備についての点検である。同様に、「項目番号」が「3」乃至「5」の「点検項目」が第2設備についての点検である。さらに、「項目番号」が「6」の「点検項目」が第3設備についての点検である。さらにまた、「項目番号」が「7」の「点検項目」が第4設備についての点検である。 Figure 13 is a diagram showing an example of group settings. For example, a case will be described where inspection items such as those shown in the figure have been registered in advance. In this example, the "inspection items" with "item numbers" of "1" and "2" are inspections of the first equipment. Similarly, the "inspection items" with "item numbers" of "3" through "5" are inspections of the second equipment. Furthermore, the "inspection item" with "item number" of "6" is an inspection of the third equipment. Furthermore, the "inspection item" with "item number" of "7" is an inspection of the fourth equipment.

これらの複数の点検項目に対して、グループGSが設定される。例えば、グループGSは、図示するように、音声認識システム1は、「グループ」に数値を入力して設定するグループ設定手順を行う。この例では、「項目番号」が「1」及び「2」の「点検項目」をまとめて「G1」というグループに設定した例である。同様に、この例では、「項目番号」が「3」乃至「5」の「点検項目」をまとめて「G2」というグループに設定した例である。なお、グループGSは、設備ごとに限られず、「G3」のように、第3設備及び第4設備の点検項目をまとめて1つのグループに設定してもよい。 A group GS is set for these multiple inspection items. For example, as shown in the figure, the voice recognition system 1 performs a group setting procedure in which a numerical value is entered into "group" to set the group GS. In this example, "inspection items" with "item numbers" of "1" and "2" are grouped together and set as a group called "G1". Similarly, in this example, "inspection items" with "item numbers" of "3" through "5" are grouped together and set as a group called "G2". Note that groups GS are not limited to per equipment, and may be set as one group, such as "G3," which groups together the inspection items for the third and fourth equipment.

図12に示すように、例えば、第1設備についての点検に対応する第31出力EX31に対して省略操作C3がされた場合には、音声認識システム1は、省略操作C3が「G1」というグループに対応する操作であると判断する。 As shown in FIG. 12, for example, when the omission operation C3 is performed on the 31st output EX31 corresponding to the inspection of the first equipment, the voice recognition system 1 determines that the omission operation C3 is an operation corresponding to the group "G1."

図13に示すように、「G1」のグループGSには、「項目番号」が「1」及び「2」の「点検項目」が属する。ゆえに、音声認識システム1は、「項目番号」が「1」及び「2」の「点検項目」を示す第2音声SD2を省略する省略手順を行う。 As shown in FIG. 13, the group GS of "G1" includes the "inspection items" with the "item numbers" "1" and "2." Therefore, the voice recognition system 1 performs an omission procedure to omit the second voice SD2 indicating the "inspection items" with the "item numbers" "1" and "2."

なお、省略操作C3は、省略するグループ又は設備の名称を入力する操作でもよい。 Note that the omission operation C3 may be an operation of inputting the name of the group or facility to be omitted.

設備は、例えば、稼働していない場合には、点検を行わなくともよい場合がある。そのような設備に対する点検を省略できると、点検を効率良く行うことができる。 For example, equipment may not need to be inspected if it is not in operation. If inspection of such equipment can be omitted, inspections can be carried out more efficiently.

<チェックを行う変形例>
音声認識システム1は、点検結果をチェックして設備に異常があるか否かを判断する構成が望ましい。以下、チェックの対象となる値、すなわち、第1音声SD1で入力される内容であって音声認識された結果を示すデータを「第1入力データ」という。一方で、第1データをチェックするのに用いられるデータを「第2入力データ」という。
<Modification for Checking>
It is desirable that the voice recognition system 1 is configured to check the inspection results and determine whether or not there is an abnormality in the equipment. Hereinafter, the value to be checked, i.e., the data input by the first voice SD1 and showing the voice recognition result, will be referred to as "first input data". On the other hand, the data used to check the first data will be referred to as "second input data".

音声認識システム1は、第1入力データが第1データ生成手順、すなわち、音声認識によって生成されると、第1入力データと第2入力データを比較して異常であるか否かを判断する判断手順を行う。 When the first input data is generated through the first data generation procedure, i.e., through voice recognition, the voice recognition system 1 performs a judgment procedure in which the first input data is compared with the second input data to judge whether or not there is an abnormality.

第2入力データは、第1入力データより前、すなわち、第1入力データをチェックするまでに記憶手順によって記憶されていればよい。例えば、第2入力データは、以下のように記憶される。 The second input data only needs to be stored by the storage procedure before the first input data, i.e., before the first input data is checked. For example, the second input data is stored as follows:

図14は、第2入力データを前回結果とする例を示す図である。以下、第1実施形態と同様の点検項目である場合を例に説明する。例えば、第2入力データは、図示する「第2入力データ」のように、それぞれの「点検項目」に対応して記憶される前回の点検結果(以下「前回結果V21」という。)である。 Figure 14 is a diagram showing an example in which the second input data is the previous result. Below, an example will be described in which the inspection items are the same as those in the first embodiment. For example, the second input data is the previous inspection result (hereinafter referred to as "previous result V21") that is stored corresponding to each "inspection item" as shown in the figure as "second input data."

なお、前回結果V21は、前回の点検で異常がなかったのを前提とする。したがって、前回の点検で異常があった場合には、それ以前の点検結果又は正常値が前回結果V21に入力されてもよい。 Note that the previous result V21 is based on the assumption that no abnormalities were found in the previous inspection. Therefore, if an abnormality was found in the previous inspection, the previous inspection result or a normal value may be entered in the previous result V21.

つまり、音声認識システム1は、第1入力データ、すなわち、今回の点検結果を前回結果V21と比較して違いがあるか否かを判断する。そして、音声認識システム1は、第1入力データと第2入力データが異なると、異常であると判断する。 In other words, the voice recognition system 1 compares the first input data, i.e., the current inspection result, with the previous result V21 to determine whether there is a difference. Then, if the first input data and the second input data differ, the voice recognition system 1 determines that there is an abnormality.

なお、正常と判断する範囲には、ある程度の許容範囲があってもよい。すなわち、音声認識システム1は、第1入力データが第2入力データに対して許容範囲外であると、異常であると判断する。例えば、許容範囲は、以下のように設定される。 The range that is determined to be normal may have a certain degree of tolerance. In other words, the voice recognition system 1 determines that the first input data is abnormal if it is outside the tolerance range for the second input data. For example, the tolerance range is set as follows:

図15は、許容範囲を設定する例を示す図である。例えば、許容範囲V22は、図示する「許容範囲」のように、前回結果V21から結果が外れても「正常」と判断する範囲を示す。なお、この例は、「項目番号」が「2」の場合のように、前回結果V21と一致しない場合をすべて「異常」と判断させるために、許容範囲V22に「なし」と設定する例である。 Figure 15 is a diagram showing an example of setting an acceptable range. For example, the acceptable range V22 indicates the range within which the result is judged to be "normal" even if it deviates from the previous result V21, as in the "acceptable range" shown in the figure. Note that this example is an example in which the acceptable range V22 is set to "none" so that all cases where there is no match with the previous result V21, such as when the "item number" is "2", are judged to be "abnormal".

このように、許容範囲V22によって、前回結果V21に対して幅を持たせる構成であってもよい。特に、数値が点検の対象となる場合には、数値の微小な変動が異常でない場合が多い。したがって、このように許容できる範囲が設定できると、異常を精度良く判断できる。 In this way, the tolerance range V22 may be configured to provide a margin for the previous result V21. In particular, when a numerical value is subject to inspection, minute fluctuations in the numerical value are often not abnormal. Therefore, if an acceptable range can be set in this way, abnormalities can be determined with high accuracy.

このように、前回結果V21、すなわち、直近の点検結果と比較して、違いがあるような場合には、設備に異常があると判断される。このようなチェックが行われると、音声認識システム1は、異常が発生しているような設備を知らせることができる。 In this way, if there is a difference when compared with the previous result V21, i.e., the most recent inspection result, it is determined that there is an abnormality in the equipment. When such a check is performed, the voice recognition system 1 can notify the user of any equipment in which an abnormality has occurred.

なお、チェックは、以下のように第2入力データに正常値又は正常範囲を示す値を設定して行われてもよい。 The check may also be performed by setting a value indicating a normal value or normal range in the second input data as follows:

図16は、第2入力データを正常値又は正常範囲とする例を示す図である。例えば、図示する「第2入力データ 正常値又は正常範囲」のような値(以下「正常値V23」という。)が事前に設定されてもよい。 Figure 16 is a diagram showing an example in which the second input data is set to a normal value or normal range. For example, a value such as the illustrated "second input data normal value or normal range" (hereinafter referred to as "normal value V23") may be set in advance.

正常値V23が設定されると、音声認識システム1は、正常とする値又は範囲を把握できる。したがって、音声認識システム1は、第1入力データを正常値V23と比較して、第1入力データと第2入力データが異なる、又は、第1入力データが正常範囲の範囲外であると、異常であると判断する。このようなチェックが行われると、音声認識システム1は、異常が発生しているような設備を知らせることができる。 When the normal value V23 is set, the voice recognition system 1 can grasp the value or range that is considered normal. Therefore, the voice recognition system 1 compares the first input data with the normal value V23, and if the first input data and the second input data are different, or if the first input data is outside the normal range, it determines that there is an abnormality. When such a check is performed, the voice recognition system 1 can notify equipment in which an abnormality is occurring.

<第1辞書及び第2辞書を用いる変形例>
なお、携帯端末11にデータ及びプログラム等がダウンロードされて、携帯端末11で全体処理が行われてもよい。例えば、点検を行う現場は、通信環境が良くない場合がある。すなわち、現場は、携帯端末11とサーバ10の間で通信を行うのが難しい通信環境である場合がある。
<Modification using first and second dictionaries>
In addition, data, programs, etc. may be downloaded to the mobile terminal 11, and the entire processing may be performed by the mobile terminal 11. For example, the communication environment at the site where the inspection is performed may be poor. That is, the communication environment at the site may be such that it is difficult to communicate between the mobile terminal 11 and the server 10.

そこで、点検を開始する前に、サーバ10から事前に入力される設定値等がダウンロードされて、点検を行っている間は、携帯端末11とサーバ10の間で通信が行われなくとも全体処理が完了できる構成であってもよい。なお、この場合には、点検が完了し、携帯端末11とサーバ10の間で通信が行える環境となった場合に、携帯端末11からサーバ10へ点検結果等をアップロードしてもよい。 Therefore, a configuration may be adopted in which setting values and the like input in advance are downloaded from the server 10 before the start of the inspection, and the entire process can be completed without communication between the mobile terminal 11 and the server 10 while the inspection is being performed. In this case, when the inspection is completed and an environment is created in which communication can be performed between the mobile terminal 11 and the server 10, the inspection results and the like may be uploaded from the mobile terminal 11 to the server 10.

このような場合等において、音声認識を行うために用いる辞書が、以下のように点検の分野用の辞書であるのが望ましい。 In such cases, it is desirable that the dictionary used for voice recognition is a dictionary for the inspection field, as follows:

図17は、第1辞書D211及び第2辞書D212を用いる変形例を示す図である。以下、サーバ10のようにネットワークNWを介して利用できる情報処理装置を「第1情報処理装置」という。第1情報処理装置に対して、現場でユーザ13が利用できる携帯端末11のような情報処理装置を「第2情報処理装置」という。 Figure 17 is a diagram showing a modified example using a first dictionary D211 and a second dictionary D212. Hereinafter, an information processing device that can be used via a network NW, such as the server 10, is referred to as a "first information processing device." In contrast to the first information processing device, an information processing device such as a mobile terminal 11 that can be used by a user 13 on-site is referred to as a "second information processing device."

図示するように、第1情報処理装置で音声認識に用いられる辞書を「第1辞書D211」という。一方で、第2情報処理装置で音声認識に用いられる辞書を「第2辞書D212」という。 As shown in the figure, the dictionary used for voice recognition in the first information processing device is called the "first dictionary D211." On the other hand, the dictionary used for voice recognition in the second information processing device is called the "second dictionary D212."

第2情報処理装置は、携帯する情報処理装置であるため、記憶領域MEMが第1情報処理装置と比較すると小さくなりやすい。 Since the second information processing device is a portable information processing device, the memory area MEM tends to be smaller than that of the first information processing device.

第2辞書D212は、点検の分野用の辞書である。したがって、第1辞書D211より、第2辞書D212は、データの容量を小さくできる。そのため、第2辞書D212は、第2情報処理装置のように、第1情報処理装置と比較して、記憶装置の記憶できる容量が小さい記憶領域MEMの情報処理装置であっても、記憶できる辞書が用いられるのが望ましい。 The second dictionary D212 is a dictionary for the inspection field. Therefore, the second dictionary D212 can have a smaller data capacity than the first dictionary D211. For this reason, it is preferable that the second dictionary D212 is a dictionary that can be stored even in an information processing device with a memory area MEM that has a smaller storage capacity than the first information processing device, such as the second information processing device.

点検の分野用の辞書は、点検に良く用いられる用語を音声認識するのに適する辞書である。例えば、点検の分野用の辞書は、数値、点検結果に用いられる用語及び設備の名称等が設定される。このように、点検において使用頻度が高い用語に絞った辞書が用いられると、音声認識を小さい記憶領域で実現でき、かつ、精度良く音声認識を実行して第1入力データV10を生成できる。 The dictionary for the inspection field is a dictionary suitable for voice recognition of terms frequently used in inspection. For example, a dictionary for the inspection field is set with numerical values, terms used in inspection results, names of equipment, etc. In this way, when a dictionary limited to terms frequently used in inspection is used, voice recognition can be realized in a small memory area, and voice recognition can be performed with high accuracy to generate the first input data V10.

<ノイズキャンセルの変形例>
音声認識システム1は、第1音声SD1に含まれるノイズをキャンセルする構成が望ましい。そして、第1音声SD1ノイズをキャンセルした音声(以下「第3音声」という。)に基づいて、音声認識が行われるのが望ましい。
<Modification of noise cancellation>
The voice recognition system 1 is preferably configured to cancel noise contained in the first voice SD1, and preferably performs voice recognition based on a voice (hereinafter referred to as a "third voice") obtained by canceling the noise of the first voice SD1.

ノイズのキャンセルは、例えば、ローパスフィルタ、及び、バンドパスフィルタ等のフィルタ又は複数のフィルタの組み合わせによって、対象する周波数帯域に含まれるノイズを減衰するようにして行われる。例えば、フィルタは、デジタルフィルタ、又は、フィルタリングを行う回路等によって実現する。 Noise cancellation is performed by attenuating noise in the target frequency band using, for example, a low-pass filter, a band-pass filter, or a combination of multiple filters. For example, the filter is realized by a digital filter or a filtering circuit.

また、キャンセルの対象となる周波数帯域は、現場又は位置ごとに個別に設定されるのが望ましい。以下、現場ごとに、キャンセルの対象とする周波数帯域を設定する場合の例を説明する。 Furthermore, it is desirable to set the frequency bands to be canceled individually for each site or location. Below, we explain an example of setting the frequency bands to be canceled for each site.

図18は、現場ごとにキャンセルの対象とする周波数帯域を設定する例を示す図である。以下、図18(A)を「第1現場」用とし、図18(B)を「第2現場」用とする。なお、キャンセルの対象とする周波数帯域は、GPS等を用いて位置情報に基づいて設定されてもよい。 Figure 18 shows an example of setting frequency bands to be cancelled for each site. Hereinafter, Figure 18(A) is for the "first site" and Figure 18(B) is for the "second site." Note that the frequency bands to be cancelled may be set based on location information using GPS or the like.

例えば、第1現場において、一定時間の音声(ユーザ13が発する音声はない状態であるとする。)を入力し、音声を入力したデータに対して周波数解析(例えば、FFT(高速フーリエ変換、Fast Fourier Transform)等である。)を行うと、図18(A)及び図18(B)のような周波数解析結果が得られる。 For example, at the first site, if a certain period of voice (assuming that no voice is being produced by the user 13) is input and frequency analysis (e.g., FFT (Fast Fourier Transform)) is performed on the voice input data, the frequency analysis results shown in Figures 18(A) and 18(B) are obtained.

図18(A)は、第1現場で、図18(A)に示すような周波数帯域(以下「第1周波数帯域FR1」という。)に、ノイズ(以下、第1現場で発生するノイズを「第1ノイズNZ1」という。)が発生する例である。 Figure 18 (A) shows an example in which noise (hereinafter, the noise generated at the first site is referred to as "first noise NZ1") occurs in the frequency band shown in Figure 18 (A) (hereinafter, referred to as "first frequency band FR1") at the first site.

図18(B)は、第2現場で、図18(B)に示すような周波数帯域(以下「第2周波数帯域FR2」という。)に、ノイズ(以下、第2現場で発生する2つのノイズを「第2ノイズNZ2」及び「第3ノイズNZ3」という。)が発生する例である。 Figure 18 (B) is an example where noise (hereinafter, the two noises occurring at the second site are referred to as "second noise NZ2" and "third noise NZ3") occurs at the second site in the frequency band shown in Figure 18 (B) (hereinafter, referred to as "second frequency band FR2").

ノイズは、現場又は位置ごとに異なる場合がある。例えば、現場ごとに、稼働している設備の種類が異なると、設備は、異なる音を発する場合があるため、ノイズの発生する周波数帯域も異なるようになる場合がある。この例では、第1現場は、第1ノイズNZ1が発生するのに対して、第2現場は、第2ノイズNZ2及び第3ノイズNZ3が発生する。この例では、第1現場は、第2現場よりも低い周波数帯域でノイズが発生する。 Noise may vary from site to site or location. For example, if different types of equipment are in operation at each site, the equipment may emit different sounds, and the frequency band in which noise occurs may also be different. In this example, the first site generates a first noise NZ1, while the second site generates a second noise NZ2 and a third noise NZ3. In this example, the first site generates noise in a lower frequency band than the second site.

そのため、第1現場では、第1ノイズNZ1を減衰させるため、第1周波数帯域FR1がキャンセルの対象となるのが望ましい。一方で、第2現場では、第2ノイズNZ2及び第3ノイズNZ3を減衰させるため、第2周波数帯域FR2がキャンセルの対象となるのが望ましい。 Therefore, at the first site, it is desirable to target the first frequency band FR1 for cancellation in order to attenuate the first noise NZ1. On the other hand, at the second site, it is desirable to target the second frequency band FR2 for cancellation in order to attenuate the second noise NZ2 and the third noise NZ3.

第1周波数帯域FR1及び第2周波数帯域FR2は、例えば、点検を行う前に現場又は位置ごとに音声を解析して設定される。なお、周波数帯域の設定は、数値で入力できてもよい。 The first frequency band FR1 and the second frequency band FR2 are set, for example, by analyzing the sound for each site or location before an inspection is performed. The frequency bands may be set by inputting numerical values.

このようにすると、それぞれの現場又は位置に適したノイズのキャンセルができる。そのため、音声に含まれるノイズを減衰させた第3音声で音声認識ができるため、音声認識の精度を向上させることができる。 In this way, noise can be canceled in a way that is appropriate for each site or location. As a result, voice recognition can be performed using the third voice in which the noise contained in the voice has been attenuated, thereby improving the accuracy of voice recognition.

<中断及び解除の変形例>
中断処理PR2は、以下のように、音声認識システム1が、音声認識によって所定の言葉を認識する場合に行われてもよい。
<Variations of Suspension and Cancellation>
The interruption process PR2 may be performed when the voice recognition system 1 recognizes a predetermined word by voice recognition, as follows.

図19は、中断及び解除の第1変形例を示す図である。以下、第2実施形態と同様の第2音声SD2を出力する場合を例に説明する。第2実施形態と比較すると、この変形例は、中断及び解除に所定の言葉を用いる点が異なる。 Figure 19 shows a first modified example of interruption and cancellation. Below, an example will be described in which the second audio SD2 is output in the same way as in the second embodiment. Compared to the second embodiment, this modified example differs in that specific words are used for interruption and cancellation.

この例では、音声認識システム1は、第1音声SD1で「ポーズ」という言葉(以下「中断音声C11」という。)を入力すると、第2音声SD2の出力を中断する。 In this example, when the word "pause" (hereinafter referred to as "interrupted speech C11") is input in the first speech SD1, the speech recognition system 1 interrupts the output of the second speech SD2.

そして、中断の後、音声認識システム1は、第1音声SD1で「解除」という言葉(以下「解除音声C21」という。)を入力すると、中断を解除する。 Then, after the interruption, the voice recognition system 1 cancels the interruption when the word "cancel" (hereinafter referred to as "cancel voice C21") is input as the first voice SD1.

なお、中断音声C11及び解除音声C21がどのような言葉かは、事前に設定される。 The words used for the interruption sound C11 and the release sound C21 are set in advance.

このように、所定の言葉で中断及び解除が操作できると、ユーザ13は、例えば、手に道具を持つような場合等でも操作を行うことができ、操作性を向上できる。 In this way, being able to pause and cancel using specific words allows the user 13 to perform the operation even when, for example, holding a tool in their hand, improving operability.

図20は、中断及び解除の第2変形例を示す図である。この例は、図示するように、イヤホン12が有するボタンを押す操作が中断操作となる例である。 Figure 20 shows a second modified example of interruption and cancellation. In this example, as shown in the figure, the operation of pressing a button on the earphone 12 is the interruption operation.

例えば、1回目のボタンを押す操作(以下「第1操作C12」という。)によって、音声認識システム1は、第2音声SD2の出力を中断する。 For example, the first button press (hereinafter referred to as the "first operation C12") causes the voice recognition system 1 to interrupt the output of the second voice SD2.

次に、2回目のボタンを押す操作(以下「第2操作C22」という。)によって、音声認識システム1は、中断を解除する。 Next, by pressing the button a second time (hereinafter referred to as the "second operation C22"), the voice recognition system 1 releases the interruption.

このようなイヤホン12で操作ができると、携帯端末11を取り出す手間等を省ける。 Being able to operate using such earphones 12 eliminates the need to take out the mobile terminal 11.

なお、図示するように、第200出力EX200が省略されてもよい。この例では、音声認識システム1は、中断が行われた第1時点より、前の時点である第21出力EX21が開始される時点(以下「第2時点」という。)から出力音声を出力する。なお、第2時点は、事前に設定される、又は、第1時点で出力されていた出力音声の最初の時点等である。このように、出力音声が言い直しされる構成でもよい。 As shown in the figure, the 200th output EX200 may be omitted. In this example, the speech recognition system 1 outputs the output speech from the point in time when the 21st output EX21 is started (hereinafter referred to as the "second point in time"), which is a point in time before the first point in time when the interruption occurred. The second point in time is set in advance, or is the initial point in time of the output speech that was output at the first point in time, etc. In this way, the output speech may be restated.

また、中断及び解除は、例えば、所定のボタンを押している間、中断し、ボタンが押されるのが終わると解除するといったように、ボタン等で実現してもよい。 Also, the interruption and release may be realized by a button, for example, by interrupting while a specific button is pressed and releasing when the button is no longer pressed.

他にも、中断及び解除は、携帯端末11等による所定の動作の開始及び終了に連動してもよい。例えば、携帯端末11に電話がかかってきたのを感知すると、音声認識システム1は、第2音声SD2の出力を中断する。なお、所定の動作は、事前に設定される。また、所定の動作は、外部装置による動作であってもよい。 Additionally, the interruption and release may be linked to the start and end of a specified operation by the mobile terminal 11 or the like. For example, when the voice recognition system 1 detects an incoming call to the mobile terminal 11, it interrupts the output of the second voice SD2. The specified operation is set in advance. The specified operation may also be an operation by an external device.

<音声入力及び音声出力の変形例>
図21は、音声入力及び音声出力の変形例を示す図である。以下、図示するように音声で「12.3」という数値(以下「対象数値20」という。)を扱う場合を例に説明する。
<Modifications of Audio Input and Audio Output>
21 is a diagram showing a modified example of voice input and voice output. Hereinafter, an example will be described in which a numerical value of "12.3" (hereinafter referred to as "target numerical value 20") is handled by voice as shown in the figure.

第1音声SD1、すなわち、入力では、対象数値20は、1桁ずつ入力されるのが望ましい。具体的には、図示するように、第1音声SD1となる発音21は、対象数値20を分解して、「いち」、「に」、「てん」、及び、「さん」というように、1桁ずつ読み上げられるのが望ましい。 In the first voice SD1, i.e., input, it is preferable that the target number 20 is input one digit at a time. Specifically, as shown in the figure, the pronunciation 21 that becomes the first voice SD1 is preferable to break down the target number 20 and read out one digit at a time, such as "ichi," "ni," "ten," and "san."

第2音声SD2、すなわち、出力では、対象数値20は、数値全体を表現するように出力されるのが望ましい。具体的には、図示するように、第2音声SD2となるデータ音声22は、対象数値20の全体を表現して「じゅうにてんさん」というように、数値全体が表現されるように出力されるのが望ましい。 In the second audio SD2, i.e., in the output, it is desirable that the target numerical value 20 is output so as to express the entire numerical value. Specifically, as shown in the figure, it is desirable that the data audio 22 which becomes the second audio SD2 expresses the entire target numerical value 20 and is output so as to express the entire numerical value, such as "ten thousand and ten."

発音21のように、1桁ずつ読み上げられる音声であると、音声認識を精度良く行うことができる。一方で、データ音声22が、数値全体を表現すると、ユーザ13は、1桁ずつ出力されるより、数値を音声で理解しやすい。 When the voice reads out one digit at a time, as in pronunciation 21, voice recognition can be performed with high accuracy. On the other hand, when data voice 22 expresses the entire number, it is easier for user 13 to understand the number by voice rather than when it is output one digit at a time.

<オフラインで音声認識を行う変形例>
オフラインの環境であっても、入力された音声を音声認識できる構成が望ましい。
<Modification of Offline Speech Recognition>
It is desirable to have a configuration that can recognize input speech even in an offline environment.

建築・保守現場は、通信環境によってインターネットにつながりにくい環境である場合も多い。そのため、常時クラウドを用いるのが困難な場合も多い。ゆえに、常時、クラウドにある音声認識エンジンを用いる構成であると、作業現場で音声認識等が実行できない場合がある。このような事態を避けるため、携帯端末11内で動作する音声認識エンジンを用いる構成が望ましい。特に、定型であって、短い言葉は、携帯端末11内で動作する音声認識エンジンで音声認識される構成が望ましい。 In construction and maintenance sites, the communication environment often makes it difficult to connect to the Internet. As a result, it is often difficult to use the cloud all the time. Therefore, if a voice recognition engine in the cloud is always used, voice recognition and the like may not be able to be performed at the work site. To avoid such situations, a configuration that uses a voice recognition engine that operates within the mobile terminal 11 is desirable. In particular, a configuration in which standard, short words are voice-recognized by the voice recognition engine that operates within the mobile terminal 11 is desirable.

このような構成であると、オフラインでも音声認識システム1を用いることができる。ゆえに、インターネットにつながりにくい環境であっても、音声認識システム1を用いて音声を入力することができる。 With this configuration, the voice recognition system 1 can be used offline. Therefore, even in an environment where it is difficult to connect to the Internet, voice can be input using the voice recognition system 1.

さらに、ユーザ13によるコメント等といった非定型な音声入力は、携帯端末11が録音する構成であるのが望ましい。そして、事務所等といったインターネットにつながる環境下において、携帯端末11は、録音済みの音声をクラウド上の音声認識エンジンに送信してテキスト化する構成が望ましい。 Furthermore, it is preferable that the mobile terminal 11 is configured to record non-standard voice input such as comments by the user 13. In an environment connected to the Internet, such as an office, the mobile terminal 11 is preferably configured to transmit the recorded voice to a voice recognition engine on the cloud and convert it into text.

このように、オフラインで使用できる音声認識エンジンと、オンラインで使用できる音声認識エンジンを使い分ける構成が望ましい。 In this way, it is desirable to have a configuration that allows separate use of a voice recognition engine that can be used offline and a voice recognition engine that can be used online.

また、音声認識エンジンの使い分けは、通信環境を考慮して切り替えられてもよい。具体的には、携帯端末11は、電波強度を計測して通信環境の良し悪しを判断する。なお、通信環境良し悪しは、現場ごとにあらかじめ登録又は以前の判断結果等が記憶されてもよい。このように、通信環境を考慮する構成であると、クラウド上の音声認識エンジンが使用できないといったトラブルを防ぐことができる。 The voice recognition engine may be switched depending on the communication environment. Specifically, the mobile terminal 11 measures radio wave strength to determine whether the communication environment is good or bad. The quality of the communication environment may be registered in advance for each site, or previous judgment results may be stored. In this way, a configuration that takes the communication environment into consideration can prevent problems such as the voice recognition engine on the cloud being unable to be used.

また、上記のようにオフライン等で録音を行うため、携帯端末11は、入力した音声データを録音し、録音データを生成及び録音データを記憶できる記憶部及び録音データ生成部を有する構成であるのが望ましい。 In addition, in order to record offline as described above, it is preferable that the mobile terminal 11 is configured to have a memory unit and a recording data generation unit that can record input voice data, generate recording data, and store the recording data.

なお、記憶部及び録音データ生成部は、オフラインに用いられるに限られない。すなわち、記憶部及び録音データ生成部は、クラウド上の音声認識エンジンが使用できる環境であっても、録音データを生成及び録音データを記憶してもよい。 The storage unit and the recording data generation unit are not limited to being used offline. In other words, the storage unit and the recording data generation unit may generate and store recording data even in an environment where a cloud-based voice recognition engine can be used.

通信は、突然切断される場合もあるため、クラウド上の音声認識エンジンが使用できる場合であっても、録音できる構成が望ましい。このような構成であると、バックアップを行うことができる。 Since communication may be suddenly cut off, it is desirable to have a configuration that allows recording even if a cloud-based voice recognition engine is available. This configuration allows for backup.

<その他の実施形態>
実施形態は、上記の例に限られない。例えば、装置の数は、上記の例に示す台数に限られない。したがって、上記の例における各装置は、2台以上のシステムであってもよい。一方で、装置は、1台の構成でもよい。また、情報処理装置の種類及び組み合わせも、上記に示す装置でなくともよい。
<Other embodiments>
The embodiment is not limited to the above example. For example, the number of devices is not limited to the number shown in the above example. Therefore, each device in the above example may be a system of two or more devices. On the other hand, the device may be a single device. In addition, the type and combination of information processing devices may not be the devices shown above.

実施形態は、上記の処理に限られない。例えば、本発明に係る音声認識方法は、上記に説明した以外の順序で行われてもよい。また、音声認識方法は、複数の情報処理装置で実行されてもよい。つまり、音声認識方法における各ステップは、冗長、分散、並列、仮想化又はこれらの組み合わせで実行されてもよい。 The embodiment is not limited to the above process. For example, the speech recognition method according to the present invention may be performed in an order other than that described above. Furthermore, the speech recognition method may be executed on multiple information processing devices. In other words, each step in the speech recognition method may be executed in a redundant, distributed, parallel, virtualized, or combination of these.

実施形態は、プログラムによって実現されてもよい。すなわち、情報処理装置等のコンピュータは、プログラムに基づいて、演算装置及び記憶装置等を制御して、上記の方法を実行してもよい。また、プログラムは、コンピュータが読み取り可能な記録媒体に記録されて頒布することができる。なお、記録媒体は、磁気テープ、フラッシュメモリ、光ディスク、光磁気ディスク又は磁気ディスク等のメディアである。さらに、プログラムは、電気通信回線を通じて頒布することができる。 The embodiment may be realized by a program. That is, a computer such as an information processing device may control an arithmetic unit and a storage device based on the program to execute the above-mentioned method. The program may be recorded on a computer-readable recording medium and distributed. The recording medium may be a medium such as a magnetic tape, a flash memory, an optical disk, a magneto-optical disk, or a magnetic disk. Furthermore, the program may be distributed through a telecommunications line.

なお、上記に示す実施形態の構成等に、その他の要素との組み合わせ等、上記の構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。 The present invention is not limited to the above-described configuration of the embodiment shown above, and may be combined with other elements. These aspects may be changed without departing from the spirit of the present invention, and may be appropriately determined according to the application form.

1 音声認識システム
1F100 中断手段
1F101 解除手段
1F11 音声入力手段
1F12 音声認識手段
1F13 登録手段
1F14 出力手段
1F15 制限手段
1F16 入力データ生成手段
1F17 記憶手段
1F18 判断手段
1F19 ノイズキャンセル手段
1F20 グループ設定手段
1F21 省略操作手段
10 サーバ
11 携帯端末
12 イヤホン
13 ユーザ
20 対象数値
21 発音
22 データ音声
C1 中断操作
C2 解除操作
C3 省略操作
C11 中断音声
C12 第1操作
C21 解除音声
C22 第2操作
D211 第1辞書
D212 第2辞書
EX11 第11出力
EX12 第12出力
EX13 第13出力
EX21 第21出力
EX22 第22出力
EX23 第23出力
EX31 第31出力
EX32 第32出力
EX200 第200出力
FR1 第1周波数帯域
FR2 第2周波数帯域
GS グループ
MEM 記憶領域
NW ネットワーク
NZ1 第1ノイズ
NZ2 第2ノイズ
NZ3 第3ノイズ
PR1 制限処理
PR2 中断処理
PR3 省略処理
SD1 第1音声
SD2 第2音声
V10 第1入力データ
V21 前回結果
V22 許容範囲
V23 正常値
1 Speech recognition system 1F100 Interruption means 1F101 Cancellation means 1F11 Speech input means 1F12 Speech recognition means 1F13 Registration means 1F14 Output means 1F15 Restriction means 1F16 Input data generation means 1F17 Storage means 1F18 Judgment means 1F19 Noise cancellation means 1F20 Group setting means 1F21 Omission operation means 10 Server 11 Mobile terminal 12 Earphone 13 User 20 Target numerical value 21 Pronunciation 22 Data voice C1 Interruption operation C2 Cancellation operation C3 Omission operation C11 Interruption voice C12 First operation C21 Cancellation voice C22 Second operation D211 First dictionary D212 Second dictionary EX11 Eleventh output EX12 Twelfth output EX13 Thirteenth output EX21 Twenty-first output EX22 Twenty-second output EX23 Twenty-third output EX31 Thirty-first output EX32 32nd output EX200 200th output FR1 First frequency band FR2 Second frequency band GS Group MEM Memory area NW Network NZ1 First noise NZ2 Second noise NZ3 Third noise PR1 Restriction process PR2 Interruption process PR3 Omission process SD1 First voice SD2 Second voice V10 First input data V21 Previous result V22 Allowable range V23 Normal value

Claims (14)

設備の点検に用いられる音声認識システムであって、
第1音声を入力する音声入力手段と、
前記第1音声に基づいて、音声認識を行う音声認識手段と、
複数の点検項目と点検順序と第2音声対応付けて登録する登録手段と、
前記第2音声を出力する出力手段と、
前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手段とを含み、
前記出力手段は、前記点検順序に従って前記点検項目を示す前記第2音声を出力し、前記点検項目の点検結果を示す前記第1音声が入力されると、前記点検項目を示す前記第2音声と前記第1音声の音声認識結果とを出力し、次の前記点検項目を示す前記第2音声を出力し、
前記制限手段は、前記第2音声の出力を停止し、前記第2音声の次に出力させる音声の出力を開始する
音声認識システム。
A voice recognition system for use in equipment inspection, comprising:
A voice input means for inputting a first voice;
a voice recognition unit that performs voice recognition based on the first voice;
a registration means for registering a plurality of inspection items, an inspection sequence, and a second sound in association with each other;
an output means for outputting the second sound;
a limiting means for limiting an output of the second sound when the first sound is input while the second sound is being output,
the output means outputs the second voice indicating the inspection items in accordance with the inspection order, and when the first voice indicating the inspection result of the inspection item is input, outputs the second voice indicating the inspection item and a voice recognition result of the first voice, and outputs the second voice indicating the next inspection item;
the limiting means stops output of the second voice and starts output of a voice to be output next to the second voice .
Voice recognition system.
前記点検結果を示す前記第1音声の音声認識結果を携帯端末の画面に表示し、displaying a speech recognition result of the first speech indicating the inspection result on a screen of a mobile terminal;
前記携帯端末に再入力操作が行われると、前記画面に表示された前記点検結果の再入力を受け付ける、When a re-input operation is performed on the mobile terminal, re-input of the inspection result displayed on the screen is accepted.
請求項1に記載の音声認識システム。2. The speech recognition system of claim 1.
第1音声を入力する音声入力手段と、
前記第1音声に基づいて、音声認識を行う音声認識手段と、
第2音声を登録する登録手段と、
前記第2音声を出力する出力手段と、
前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手段とを含み、
前記登録手段は、複数の点検項目を前記第2音声に対応させて登録し、
前記点検項目をまとめたグループを設定するグループ設定手段と、
前記グループを省略する省略操作を入力する省略操作手段と、をさらに含み、
前記省略操作が入力されると、前記省略操作に対応する前記グループに属する前記点検項目に基づく前記第2音声の出力が省略される、
音声認識システム。
A voice input means for inputting a first voice;
a voice recognition unit that performs voice recognition based on the first voice;
A registration means for registering a second voice;
an output means for outputting the second sound;
a limiting means for limiting an output of the second sound when the first sound is input while the second sound is being output,
The registration means registers a plurality of inspection items in association with the second sound,
A group setting means for setting a group of the inspection items;
and an omission operation means for inputting an omission operation for omitting the group,
When the omission operation is input, output of the second sound based on the inspection item belonging to the group corresponding to the omission operation is omitted.
Voice recognition system.
設備の点検に用いられる
請求項に記載の音声認識システム。
4. The voice recognition system according to claim 3, which is used for inspecting facilities.
前記第1音声の音声認識結果に基づいて、前記第1音声の内容を示す第1入力データを生成する入力データ生成手段と、
前記第1入力データをチェックするのに用いられる第2入力データを記憶する記憶手段と、
前記第1入力データと前記第2入力データを比較して異常であるか否かを判断する判断手段と
を更に含む
請求項1乃至のいずれか1項に記載の音声認識システム。
an input data generating means for generating first input data indicating the content of the first voice based on a speech recognition result of the first voice;
a storage means for storing second input data used to check the first input data;
5. The speech recognition system according to claim 1, further comprising a determination unit for comparing the first input data with the second input data to determine whether or not the first input data is abnormal.
前記第2入力データは、
前記第1入力データより前に入力され、
前記判断手段は、
前記第1入力データと前記第2入力データが異なる、又は、前記第1入力データが前記第2入力データに対して許容範囲外であると、異常であると判断する
請求項に記載の音声認識システム。
The second input data is
inputted before the first input data,
The determination means is
6. The speech recognition system according to claim 5 , wherein if the first input data and the second input data are different, or if the first input data is outside an allowable range for the second input data, it is determined that an abnormality has occurred.
前記第2入力データは、
正常値又は正常範囲を示す値であり、
前記判断手段は、
前記第1入力データと前記第2入力データが異なる、又は、前記第1入力データが前記正常範囲の範囲外であると、異常であると判断する
請求項に記載の音声認識システム。
The second input data is
A value indicating a normal value or normal range,
The determination means is
6. The speech recognition system according to claim 5 , wherein if the first input data and the second input data are different, or if the first input data is outside the normal range, it is determined that there is an abnormality.
第1情報処理装置と第2情報処理装置を含む音声認識システムであって、
前記第1情報処理装置は、
第1辞書を用いて音声認識を行い、
前記第2情報処理装置は、
第2辞書を用いて、前記第1音声を認識する前記音声認識手段を含み、
前記第2辞書は、点検の分野用の辞書である
請求項1乃至のいずれか1項に記載の音声認識システム。
A speech recognition system including a first information processing device and a second information processing device,
The first information processing device,
Performing speech recognition using the first dictionary;
The second information processing device is
the speech recognition means for recognizing the first speech using a second dictionary;
8. A speech recognition system according to claim 1 , wherein the second dictionary is a dictionary for the field of inspection.
前記第1音声に含まれるノイズをキャンセルして第3音声を生成するノイズキャンセル手段を更に含み、
前記音声認識手段は、
前記第3音声を用いて音声認識を行い、
前記ノイズキャンセル手段は、現場又は位置ごとに、キャンセルの対象とする周波数帯域を設定する
請求項1乃至のいずれか1項に記載の音声認識システム。
a noise canceling unit that cancels noise included in the first sound to generate a third sound,
The voice recognition means
performing speech recognition using the third speech;
9. The speech recognition system according to claim 1, wherein the noise canceling means sets a frequency band to be cancelled for each site or position.
設備の点検に用いられる音声認識装置であって、
第1音声を入力する音声入力手段と、
前記第1音声に基づいて、音声認識を行う音声認識手段と、
複数の点検項目と点検順序と第2音声対応付けて登録する登録手段と、
前記第2音声を出力する出力手段と、
前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手段とを含み、
前記出力手段は、前記点検順序に従って前記点検項目を示す前記第2音声を出力し、前記点検項目の点検結果を示す前記第1音声が入力されると、前記点検項目を示す前記第2音声と前記第1音声の音声認識結果とを出力し、次の前記点検項目を示す前記第2音声を出力し、
前記制限手段は、前記第2音声の出力を停止し、前記第2音声の次に出力させる音声の出力を開始する
音声認識装置。
A voice recognition device used for inspecting equipment, comprising:
A voice input means for inputting a first voice;
a voice recognition unit that performs voice recognition based on the first voice;
a registration means for registering a plurality of inspection items, an inspection sequence, and a second sound in association with each other;
an output means for outputting the second sound;
a limiting means for limiting an output of the second sound when the first sound is input while the second sound is being output,
the output means outputs the second voice indicating the inspection items in accordance with the inspection order, and when the first voice indicating the inspection result of the inspection item is input, outputs the second voice indicating the inspection item and a voice recognition result of the first voice, and outputs the second voice indicating the next inspection item;
the limiting means stops output of the second voice and starts output of a voice to be output next to the second voice .
Speech recognition device.
第1音声を入力する音声入力手段と、
前記第1音声に基づいて、音声認識を行う音声認識手段と、
第2音声を登録する登録手段と、
前記第2音声を出力する出力手段と、
前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手段とを含み、
前記登録手段は、複数の点検項目を前記第2音声に対応させて登録し、
前記点検項目をまとめたグループを設定するグループ設定手段と、
前記グループを省略する省略操作を入力する省略操作手段と、をさらに含み、
前記省略操作が入力されると、前記省略操作に対応する前記グループに属する前記点検項目に基づく前記第2音声の出力が省略される、
音声認識装置。
A voice input means for inputting a first voice;
a voice recognition unit that performs voice recognition based on the first voice;
A registration means for registering a second voice;
an output means for outputting the second sound;
a limiting means for limiting an output of the second sound when the first sound is input while the second sound is being output,
The registration means registers a plurality of inspection items in association with the second sound,
A group setting means for setting a group of the inspection items;
and an omission operation means for inputting an omission operation for omitting the group,
When the omission operation is input, output of the second sound based on the inspection item belonging to the group corresponding to the omission operation is omitted.
Speech recognition device.
設備の点検に用いられる音声認識システムが行う音声認識方法であって、
音声認識システムが、第1音声を入力する音声入力手順と、
音声認識システムが、前記第1音声に基づいて、音声認識を行う音声認識手順と、
音声認識システムが、複数の点検項目と点検順序と第2音声対応付けて登録する登録手順と、
音声認識システムが、前記第2音声を出力する出力手順と、
音声認識システムが、前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手順とを含み、
前記出力手順は、前記点検順序に従って前記点検項目を示す前記第2音声を出力し、前記点検項目の点検結果を示す前記第1音声が入力されると、前記点検項目を示す前記第2音声と前記第1音声の音声認識結果とを出力し、次の前記点検項目を示す前記第2音声を出力し、
前記制限手順は、前記第2音声の出力を停止し、前記第2音声の次に出力させる音声の出力を開始する
音声認識方法。
A voice recognition method performed by a voice recognition system used for inspecting equipment , comprising:
a speech input step of inputting a first speech by the speech recognition system;
a speech recognition step in which a speech recognition system performs speech recognition based on the first speech;
a registration step in which the voice recognition system registers a plurality of inspection items, an inspection sequence, and a second voice in association with each other;
an output step of the speech recognition system outputting the second speech;
a limiting step of limiting output of the second voice when the first voice is input while the second voice is being output,
The output step includes outputting the second voice indicating the inspection items according to the inspection order, and when the first voice indicating an inspection result of the inspection item is input, outputting the second voice indicating the inspection item and a voice recognition result of the first voice, and outputting the second voice indicating the next inspection item;
the restriction step includes stopping output of the second voice and starting output of a voice to be output next to the second voice .
Speech recognition methods.
音声認識システムが行う音声認識方法であって、
音声認識システムが、第1音声を入力する音声入力手順と、
音声認識システムが、前記第1音声に基づいて、音声認識を行う音声認識手順と、
音声認識システムが、第2音声を登録する登録手順と、
音声認識システムが、前記第2音声を出力する出力手順と、
音声認識システムが、前記第2音声が出力されている間に、前記第1音声が入力されると、前記第2音声の出力を制限する制限手順とを含み、
前記登録手順は、複数の点検項目を前記第2音声に対応させて登録し、
前記点検項目をまとめたグループを設定するグループ設定手順と、
前記グループを省略する省略操作を入力する省略操作手順と、をさらに含み、
前記省略操作が入力されると、前記省略操作に対応する前記グループに属する前記点検項目に基づく前記第2音声の出力が省略される、
音声認識方法。
A speech recognition method performed by a speech recognition system, comprising:
a speech input step of inputting a first speech by the speech recognition system;
a speech recognition step in which a speech recognition system performs speech recognition based on the first speech;
a registration step in which the voice recognition system registers the second voice;
an output step of the speech recognition system outputting the second speech;
a limiting step of limiting output of the second voice when the first voice is input while the second voice is being output,
The registration step includes registering a plurality of inspection items in association with the second sound,
A group setting procedure for setting a group that includes the inspection items;
and an omission operation procedure for inputting an omission operation for omitting the group,
When the omission operation is input, output of the second sound based on the inspection item belonging to the group corresponding to the omission operation is omitted.
Speech recognition methods.
請求項12又は13に記載の音声認識方法をコンピュータに実行させるためのプログラム。
A program for causing a computer to execute the speech recognition method according to claim 12 or 13 .
JP2020076808A 2020-04-23 2020-04-23 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc. Active JP7624571B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020076808A JP7624571B2 (en) 2020-04-23 2020-04-23 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.
JP2024224555A JP2025028327A (en) 2020-04-23 2024-12-19 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020076808A JP7624571B2 (en) 2020-04-23 2020-04-23 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024224555A Division JP2025028327A (en) 2020-04-23 2024-12-19 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Publications (2)

Publication Number Publication Date
JP2021173841A JP2021173841A (en) 2021-11-01
JP7624571B2 true JP7624571B2 (en) 2025-01-31

Family

ID=78281667

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020076808A Active JP7624571B2 (en) 2020-04-23 2020-04-23 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.
JP2024224555A Pending JP2025028327A (en) 2020-04-23 2024-12-19 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024224555A Pending JP2025028327A (en) 2020-04-23 2024-12-19 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Country Status (1)

Country Link
JP (2) JP7624571B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7624571B2 (en) * 2020-04-23 2025-01-31 高砂熱学工業株式会社 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030012A (en) 2002-06-24 2004-01-29 Mitsubishi Heavy Ind Ltd Maintenance information providing device and maintenance information providing method
JP2005284543A (en) 2004-03-29 2005-10-13 Chugoku Electric Power Co Inc:The Business support system and method
US20050275558A1 (en) 2004-06-14 2005-12-15 Papadimitriou Wanda G Voice interaction with and control of inspection equipment
JP2008242067A (en) 2007-03-27 2008-10-09 Advanced Telecommunication Research Institute International Speech recognition apparatus, speech recognition system, and speech recognition method
JP2010113397A (en) 2008-11-04 2010-05-20 Multi Solution:Kk Maintenance check recording management system
JP2013222184A (en) 2012-04-19 2013-10-28 Mitsubishi Electric Corp Voice control device
JP2015153342A (en) 2014-02-19 2015-08-24 三菱電機株式会社 Facility inspection apparatus and facility inspection management system
JP2017073184A (en) 2015-10-05 2017-04-13 オリンパス株式会社 Control device and recording system for recording system
WO2019138651A1 (en) 2018-01-10 2019-07-18 ソニー株式会社 Information processing device, information processing system, information processing method and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6481014A (en) * 1987-09-24 1989-03-27 Hitachi Ltd Aural instruction device for operation of equipment
JPH05307397A (en) * 1992-04-30 1993-11-19 Fujitsu Ltd Voice recognizer
JP7624571B2 (en) * 2020-04-23 2025-01-31 高砂熱学工業株式会社 Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030012A (en) 2002-06-24 2004-01-29 Mitsubishi Heavy Ind Ltd Maintenance information providing device and maintenance information providing method
JP2005284543A (en) 2004-03-29 2005-10-13 Chugoku Electric Power Co Inc:The Business support system and method
US20050275558A1 (en) 2004-06-14 2005-12-15 Papadimitriou Wanda G Voice interaction with and control of inspection equipment
JP2008242067A (en) 2007-03-27 2008-10-09 Advanced Telecommunication Research Institute International Speech recognition apparatus, speech recognition system, and speech recognition method
JP2010113397A (en) 2008-11-04 2010-05-20 Multi Solution:Kk Maintenance check recording management system
JP2013222184A (en) 2012-04-19 2013-10-28 Mitsubishi Electric Corp Voice control device
JP2015153342A (en) 2014-02-19 2015-08-24 三菱電機株式会社 Facility inspection apparatus and facility inspection management system
JP2017073184A (en) 2015-10-05 2017-04-13 オリンパス株式会社 Control device and recording system for recording system
WO2019138651A1 (en) 2018-01-10 2019-07-18 ソニー株式会社 Information processing device, information processing system, information processing method and program

Also Published As

Publication number Publication date
JP2021173841A (en) 2021-11-01
JP2025028327A (en) 2025-02-28

Similar Documents

Publication Publication Date Title
EP3621069B1 (en) Management and execution of equipment maintenance
US10043513B2 (en) Systems and methods of interpreting speech data
US9152604B2 (en) System and method for event logging in a technical installation or a technical process
JP2025028327A (en) Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.
JP6183841B2 (en) Call center term management system and method for grasping signs of NG word
JP2000267690A (en) Voice detection device and voice control system
CN110895509B (en) Test processing method and device, electronic equipment and storage medium
US20230397868A1 (en) Control Method, Conference System, and Non-Transitory Recording Medium
JP7610803B6 (en) Voice recognition system, voice recognition device, voice recognition method, and program used for facility inspection, etc.
US20080109223A1 (en) Information processing apparatus, method and program
US11538475B2 (en) Information processing apparatus and information processing method
CN111309606A (en) Page exception handling method and device, computer equipment and storage medium
JP7401241B2 (en) Inspection support system
JP7808349B2 (en) Nursing care information generation system
JPWO2022168433A5 (en)
US10505879B2 (en) Communication support device, communication support method, and computer program product
JPWO2017208444A1 (en) Voice call registration device for elevator and self-diagnosis method of voice call registration function
CN112564284A (en) Alarm prompting method and device, computer equipment and readable storage medium
US11010128B1 (en) Method for adjusting touch sensitivity and mobile device utilizing the same
US20230409000A1 (en) Programmable Logic Controller with Voice Control
CN121681346A (en) Test feedback method
CN116756142A (en) Data table collection method, device and electronic equipment based on work data
JP2026011341A (en) Application program inspection device, application program inspection program, and application program inspection method
WO2026058634A1 (en) Assistance terminal
CN117711407A (en) Voiceprint recognition method and system based on unmanned aerial vehicle noise detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230320

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241119

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20241219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20241219

R150 Certificate of patent or registration of utility model

Ref document number: 7624571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150