JP7753752B2 - Voice recording management system, voice recording management device, voice recording management method and program - Google Patents
Voice recording management system, voice recording management device, voice recording management method and programInfo
- Publication number
- JP7753752B2 JP7753752B2 JP2021156868A JP2021156868A JP7753752B2 JP 7753752 B2 JP7753752 B2 JP 7753752B2 JP 2021156868 A JP2021156868 A JP 2021156868A JP 2021156868 A JP2021156868 A JP 2021156868A JP 7753752 B2 JP7753752 B2 JP 7753752B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- recognition pattern
- identification information
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
Description
本発明は、音声記録管理システム、音声記録管理装置、音声記録管理方法及びプログラムに関する。 The present invention relates to an audio recording management system, an audio recording management device, an audio recording management method, and a program.
従来から、認識パターンに基づいて音声データを認識して、テキストに変換する技術が知られている。 Technology for recognizing voice data based on recognition patterns and converting it into text has been known for some time.
例えば、ユーザが発話した作業の内容を示す音声データをテキストに変換して、作業記録として管理する技術が知られている(例えば、特許文献1参照)。 For example, there is known technology that converts voice data indicating the content of a task spoken by a user into text and manages it as a work record (see, for example, Patent Document 1).
しかしながら、従来の技術では、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に関係なく限られた認識パターンで発話音声を与える必要があるため、利用者にとって柔軟性に欠けるという課題があった。 However, with conventional technology, when registering voice recording information from voice information based on spoken voice, the spoken voice must be provided using limited recognition patterns regardless of the tenant, group, etc. to which the user belongs, resulting in a lack of flexibility for the user.
上述した課題を解決するために、請求項1に係る発明は、発話音声を認識するための一以上の認識パターンを登録する登録管理用端末と、前記登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置と、を含む音声記録管理システムであって、前記登録管理用端末は、前記発話音声に基づく音声情報を解析してテキスト情報に変換する音声解析サーバが前記音声情報を解析可能となるように、前記一以上の認識パターンを送信する送信手段、を有し、前記音声記録管理装置は、前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信手段と、前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析結果を示す音声解析結果情報と、該特定の認識パターンを示す特定の認識パターン識別情報と、を含む音声解析応答を受信する受信手段と、受信した前記音声解析応答に含まれる前記音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録手段と、を有する、ことを特徴とする音声記録管理システムを提供する。 In order to solve the above-mentioned problems, the invention of claim 1 is a voice recording management system including a registration management terminal that registers one or more recognition patterns for recognizing uttered voices, and a voice recording management device that manages voice recording information obtained based on the one or more recognition patterns input to the registration management terminal, wherein the registration management terminal has a transmission means that transmits the one or more recognition patterns so that a voice analysis server that analyzes voice information based on the uttered voice and converts it into text information can analyze the voice information, and the voice recording management device receives, as a voice analysis request for requesting analysis of the voice information, tenant identification information of a tenant to which a user who uttered the uttered voice belongs and group identification information of a group to which the user belongs. The present invention provides a voice recording management system comprising: a transmitting means for transmitting to the voice analysis server one or more recognition pattern identification information that identifies the one or more recognition patterns associated with at least one of the identification information, and the voice information; a receiving means for receiving, in response to the voice analysis request , a voice analysis response that includes voice analysis result information that indicates the voice analysis result analyzed by the voice analysis server using a specific recognition pattern from among the one or more recognition patterns, and specific recognition pattern identification information that indicates the specific recognition pattern; and a registration means for registering voice recording information corresponding to the voice information based on the voice analysis result information and the specific recognition pattern identification information that indicates the specific recognition pattern included in the received voice analysis response.
以上説明したように本発明によれば、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に対応した認識パターンで発話音声を与えることができるので、利用者に対する柔軟性を向上させることが可能になるという効果を奏する。 As described above, according to the present invention, when registering voice recording information from voice information based on spoken voice, the spoken voice can be provided using a recognition pattern corresponding to the tenant, group, etc. to which the user belongs, thereby achieving the effect of improving flexibility for users.
以下、図面を用いて、発明を実施するための形態について説明する。なお、図面の説明において同一要素には同一符号を付し、重複する部分があればその説明を省略する。 The following describes the embodiments of the invention using the drawings. Note that identical elements in the description of the drawings are given the same reference numerals, and any overlapping parts will be omitted.
〔実施形態〕
図1乃至図25を用いて、実施形態について説明する。
[Embodiment]
The embodiment will be described with reference to FIGS. 1 to 25. FIG.
〔通信システムの全体構成〕
<<システム構成例>>
図1は、通信システムの全体構成の一例を示す図である。図1に示されているように、通信システム1は、登録管理用端末2、音声記録管理装置3、音声解析サーバ4、音声通信管理装置5、ユーザ端末6、通話機7、閲覧用端末9を含む各装置及びサーバを有している。登録管理用端末2、音声記録管理装置3、音声解析サーバ4、音声通信管理装置5、ユーザ端末6、通話機7及び閲覧用端末9は、通信ネットワーク100を介してそれぞれ互いに接続されている。ここで、通信ネットワーク100は、不特定多数の通信が行われる通信ネットワークであり、インターネット、イントラネット、LAN(Local Area Network)等によって構築されている。なお、通信ネットワーク100には、有線通信だけでなく、3G(3rd Generation)、4G(4th Generation)、5G(5th Generation)、WiMAX(Worldwide Interoperability for Microwave Access)、LTE(Long Term Evolution)等の無線通信による通信ネットワークが含まれてもよい。
[Overall configuration of communication system]
<<System configuration example>>
FIG. 1 is a diagram illustrating an example of the overall configuration of a communication system. As shown in FIG. 1, the communication system 1 includes various devices and servers, including a registration management terminal 2, a voice recording management device 3, a voice analysis server 4, a voice communication management device 5, a user terminal 6, a telephone 7, and a viewing terminal 9. The registration management terminal 2, the voice recording management device 3, the voice analysis server 4, the voice communication management device 5, the user terminal 6, the telephone 7, and the viewing terminal 9 are connected to each other via a communication network 100. Here, the communication network 100 is a communication network through which an unspecified number of communications are conducted, and is constructed using the Internet, an intranet, a local area network (LAN), or the like. Note that the communication network 100 may include not only wired communication, but also wireless communication networks such as 3G (3rd Generation), 4G (4th Generation), 5G (5th Generation), WiMAX (Worldwide Interoperability for Microwave Access), and LTE (Long Term Evolution).
通信システム1は、登録管理用端末2及び音声記録管理装置3によって構築された音声記録管理システム10を有している。なお、登録管理用端末2及び音声記録管理装置3は、専用の構内ネットワーク等で互いに接続されていてもよいし、通信ネットワーク100の内側に、ファイアウォール(Fire Wall)を介して互いに接続されていてもよい。 The communication system 1 has a voice recording management system 10 constructed by a registration management terminal 2 and a voice recording management device 3. The registration management terminal 2 and the voice recording management device 3 may be connected to each other via a dedicated local area network, or may be connected to each other via a firewall inside the communication network 100.
通信システム1は更に、登録管理用端末2及び音声記録管理装置3で構成される音声記録管理システム10に、入力端末8及び閲覧用端末9を加えた音声入力閲覧管理システム20を構築してもよい。また、本実施形態において、ユーザ端末6と通話機7とを総称して入力端末8と呼ぶ。以下、各装置及びサーバの基本的な機能については、以下に詳細を説明する。 The communication system 1 may further comprise a voice input/viewing management system 20, which adds an input terminal 8 and a viewing terminal 9 to the voice recording management system 10, which is comprised of the registration management terminal 2 and the voice recording management device 3. In this embodiment, the user terminal 6 and the telephone 7 are collectively referred to as the input terminal 8. The basic functions of each device and server are explained in detail below.
<登録管理用端末>
登録管理用端末2は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。また、登録管理用端末2は、音声記録管理システム10を構築する一つの装置である。また、登録管理用端末2は、発話音声を認識するための一以上の認識パターンを登録する。また、登録管理用端末2は、登録管理用端末2を管理する管理者によって入力された認識パターンの登録指示を受け付け、受け付けた認識パターンを、ネットワーク100を介して音声記録管理装置3に対して送信する。なお、登録管理用端末2は、一般的に使用されるPC(Personal Computer)、携帯型ノートPC、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末(サングラス型、腕時計型等)の通信機能を有する通信端末であってもよい。登録管理用端末2は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
<Registration management terminal>
The registration management terminal 2 is realized by one or more information processing devices (computer systems) equipped with a general server OS or the like. The registration management terminal 2 is one of the devices that constitute the voice recording management system 10. The registration management terminal 2 registers one or more recognition patterns for recognizing spoken voice. The registration management terminal 2 accepts a registration instruction for a recognition pattern input by an administrator managing the registration management terminal 2 and transmits the accepted recognition pattern to the voice recording management device 3 via the network 100. The registration management terminal 2 may be a communication terminal with communication functions, such as a commonly used personal computer (PC), portable notebook PC, mobile phone, smartphone, tablet terminal, or wearable terminal (sunglasses-type, wristwatch-type, etc.). The registration management terminal 2 may also be a communication device or communication terminal capable of running software such as browser software.
<音声記録管理装置>
音声記録管理装置3は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。また、音声記録管理装置3は、音声記録管理システム10を構築する一つの装置である。また、音声記録管理装置3は、登録管理用端末2に入力された一以上の認識パターンに基づいて得られた音声記録情報を管理する。なお、音声記録情報は、後述する解析結果管理DB3006で管理され、認識パターンごとに定義された項目名に対応する音声解析結果情報を含む。また、音声記録管理装置3は、音声通信アプリを記憶手段に記憶している。
<Audio Recording Management Device>
The voice recording management device 3 is realized by one or more information processing devices (computer systems) equipped with a general server OS or the like. The voice recording management device 3 is one of the devices that make up the voice recording management system 10. The voice recording management device 3 also manages voice recording information obtained based on one or more recognition patterns input to the registration management terminal 2. The voice recording information is managed in the analysis result management DB 3006 described below, and includes voice analysis result information corresponding to item names defined for each recognition pattern. The voice recording management device 3 also stores a voice communication app in a storage means.
なお、音声記録管理装置3は、単一のコンピュータによって構築されてもよいし、ストレージ等の各部(機能又は手段)を分割して任意に割り当てられた複数のコンピュータによって構築されてもよい。また、音声記録管理装置3の機能の全てまたは一部は、クラウド環境に存在するサーバコンピュータであってもよいし、オンプレミス環境に存在するサーバコンピュータであってもよい。 The audio recording management device 3 may be constructed using a single computer, or may be constructed using multiple computers to which each section (function or means) such as storage is divided and arbitrarily assigned. Furthermore, all or part of the functions of the audio recording management device 3 may be performed by a server computer in a cloud environment, or a server computer in an on-premise environment.
<音声解析サーバ>
音声解析サーバ4は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。音声解析サーバ4は、音声記録管理装置3が送信したテナント及びグループの少なくとも一方に関連付けられた一以上の認識パターンを登録する。また音声解析サーバ4は、利用者が発話した発話音声に基づく音声データ(音声情報)を音声認識エンジンによって解析し、テキストデータ(テキスト情報)に変換して音声記録管理装置3に応答する。つまり、本実施形態に係る通信システムでは、音声解析サーバ4が、音声情報からテキスト情報に変換するクラウドサービス機能を有している。具体的には、音声解析サーバは、音声認識を可能とする他社サービスを利用するようにしてもよく、例えば、汎用の音声認識エンジンサービスで提供されてよい。
<Speech analysis server>
The voice analysis server 4 is realized by one or more information processing devices (computer systems) equipped with a general server OS or the like. The voice analysis server 4 registers one or more recognition patterns associated with at least one of the tenant and the group transmitted by the voice recording management device 3. The voice analysis server 4 also analyzes voice data (voice information) based on the speech uttered by the user using a voice recognition engine, converts it into text data (text information), and responds to the voice recording management device 3. That is, in the communication system according to this embodiment, the voice analysis server 4 has a cloud service function for converting voice information into text information. Specifically, the voice analysis server may use a third-party service that enables voice recognition, and may be provided, for example, by a general-purpose voice recognition engine service.
<音声通信管理装置>
音声通信管理装置5は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。また、音声通信管理装置5は、入力端末が送信した音声データを所定の記憶手段に記憶し、音声記録管理装置3が送信した音声データの問合せに応じて、所定の記憶手段に記憶した音声データを音声記録管理装置3に送信する。また、音声通信管理装置5は、音声通信アプリを記憶手段に記憶し、入力端末8が送信した音声データ(音声情報)を音声記録管理装置3に送信する。また、音声通信管理装置5は、入力端末8と音声記録管理装置3との間を仲介して音声記録管理装置3が送信する各種通知情報、画面データ(画面情報)等を入力端末8に送信する仲介装置の機能も有する。なお、音声通信管理装置5は、他社サービスにより提供される。
<Voice communication management device>
The voice communication management device 5 is realized by one or more information processing devices (computer systems) equipped with a general server OS or the like. The voice communication management device 5 stores voice data transmitted from the input terminal in a predetermined storage means, and transmits the voice data stored in the predetermined storage means to the voice recording management device 3 in response to an inquiry about the voice data transmitted from the voice recording management device 3. The voice communication management device 5 also stores a voice communication application in a storage means, and transmits voice data (voice information) transmitted from the input terminal 8 to the voice recording management device 3. The voice communication management device 5 also functions as an intermediary device that acts as an intermediary between the input terminal 8 and the voice recording management device 3, transmitting various notification information, screen data (screen information), etc. transmitted by the voice recording management device 3 to the input terminal 8. The voice communication management device 5 is provided by a third-party service.
また、音声通信管理装置5は、後述する入力端末8に対してプッシュ通知(送信)によりデータ(情報)を通知(送信)してもよい。その場合、音声通信管理装置5は、例えば、プッシュ通知サーバの一例であるFCM(Firebase Cloud Messaging)を利用してプッシュ通知することで実現することが可能である。なお、音声通信管理装置5は、一般的に使用されるPC(Personal Computer)であってもよい。音声通信管理装置5は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。 The voice communication management device 5 may also notify (send) data (information) to the input terminal 8 (described below) via push notification (transmission). In this case, the voice communication management device 5 can achieve this by using, for example, FCM (Firebase Cloud Messaging), an example of a push notification server, to send push notifications. The voice communication management device 5 may also be a commonly used PC (Personal Computer). The voice communication management device 5 may also be a communication device or communication terminal capable of running software such as browser software.
<ユーザ端末>
ユーザ端末6は、一般的なOSなどが搭載された通信を行うための一以上の情報処理装置(コンピュータシステム)によって実現される。ユーザ端末6は、利用者の発話による発話音声を音声情報に変換して音声通信管理装置5に送信する。また、ユーザ端末6は、音声通信管理装置5が送信(転送)した、音声記録管理装置3が生成した各種通知情報、画面データ(画面情報)を受信してユーザ端末6のディスプレイ上に表示し、スピーカを介して通知音声を再生する。なお、ユーザ端末6は、一般的に使用されるPC(Personal Computer)、携帯型ノートPC、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末(サングラス型、腕時計型等)の通信機能を有する通信端末であってもよい。ユーザ端末6は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
<User terminal>
The user terminal 6 is realized by one or more information processing devices (computer systems) for communication, equipped with a general OS or the like. The user terminal 6 converts the user's speech into audio information and transmits it to the voice communication management device 5. The user terminal 6 also receives various notification information and screen data (screen information) generated by the voice recording management device 3 and transmitted (transferred) by the voice communication management device 5, displays them on the display of the user terminal 6, and plays the notification audio through a speaker. The user terminal 6 may be a communication terminal with communication functions, such as a commonly used PC (Personal Computer), portable notebook PC, mobile phone, smartphone, tablet device, or wearable device (sunglasses-type, wristwatch-type, etc.). The user terminal 6 may also be a communication device or communication terminal capable of running software such as browser software.
<通話機>
通話機7は、マイクを備え、通話機を利用する利用者が発話した発話音声を電気信号に変換して通信ネットワーク100に送信する機能を有する。また、通話機7は、通信ネットワーク100を介して送信された音声データを音声信号に変換してスピーカを介して再生する。なお、通話機7は、一般的に知られているインカムを一例とする通信機器である。
<Telephone>
The handset 7 is equipped with a microphone and has a function of converting the speech of a user using the handset into an electrical signal and transmitting it to the communication network 100. The handset 7 also converts voice data transmitted via the communication network 100 into an audio signal and plays it back through a speaker. The handset 7 is a communication device, an example of which is a commonly known intercom.
なお、本実施形態において、ユーザ端末6及び通話機7は、所定のテナント、グループ等に所属する利用者の発話音声によって与えられた音声データ(音声信号)を送信し、音声通信管理装置5が送信した各種通知情報及び画面データを表示、又は音声再生する入力端末8として機能する。 In this embodiment, the user terminal 6 and the telephone 7 function as an input terminal 8 that transmits voice data (voice signals) provided by the speech of users belonging to a specific tenant, group, etc., and displays various notification information and screen data transmitted by the voice communication management device 5, or plays back the voice.
<閲覧用端末>
閲覧用端末9は、一般的なOSなどが搭載された通信を行うための一以上の情報処理装置(コンピュータシステム)によって実現される。閲覧用端末9は、閲覧者の操作を受け付けることによって音声通信管理装置5が送信(転送)した、音声記録管理装置3が生成した各種通知情報、画面データをディスプレイ上に表示し、スピーカを介して通知音声を再生する。なお、閲覧用端末9は、一般的に使用されるPC(Personal Computer)、携帯型ノートPC、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末(サングラス型、腕時計型等)の通信機能を有する通信端末であってもよい。閲覧用端末9は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
<Viewing terminal>
The viewing terminal 9 is realized by one or more information processing devices (computer systems) for communication, equipped with a general OS or the like. The viewing terminal 9 displays various notification information and screen data generated by the voice recording management device 3 and transmitted (transferred) by the voice communication management device 5 on a display in response to a viewer's operation, and plays notification audio through a speaker. The viewing terminal 9 may also be a communication terminal with communication functions, such as a commonly used personal computer (PC), portable notebook PC, mobile phone, smartphone, tablet device, or wearable device (sunglasses, wristwatch, etc.). The viewing terminal 9 may also be a communication device or communication terminal capable of running software such as browser software.
●用語について●
本実施形態において利用者とは、以下に該当する者をいう。例えば、利用者には、所定のイベント、作業、医療行為等において発話する作業者、閲覧用端末を利用して各種情報を閲覧する閲覧者、人間が話す言語を生成可能なAIを搭載した機械、人型ロボット等が含まれる。本実施形態では、説明の便宜上、利用者という用語を使用する。
●About terminology●
In this embodiment, a user refers to any of the following: For example, users include workers who speak during specific events, tasks, medical procedures, etc., viewers who view various information using viewing terminals, machines equipped with AI that can generate human-spoken language, humanoid robots, etc. In this embodiment, the term "user" is used for the sake of convenience.
更に、本実施形態において音声情報とは、介護記録、又は、介護及び看護における申し送りに係る申送情報を含む。また、一以上の認識パターン情報とは、一以上の認識パターンを識別するための認識パターン識別情報と、認識パターンに含まれる一以上の項目と、を含む。 Furthermore, in this embodiment, audio information includes care records or handover information related to handovers in care and nursing. Furthermore, one or more pieces of recognition pattern information include recognition pattern identification information for identifying one or more recognition patterns and one or more items included in the recognition pattern.
更に、本実施形態においてテキスト(テキスト情報)とは、利用者が発話した音声に係る音声情報を、所定の辞書等によって認識された結果に基づいて、視認可能な文字で表される単語、熟語、数字、記号、文などに変換された各種情報をいう。 Furthermore, in this embodiment, text (text information) refers to various information that has been converted from audio information related to the voice spoken by the user into words, phrases, numbers, symbols, sentences, etc. expressed in visible characters based on the results of recognition using a specified dictionary, etc.
更に、本実施形態において音声記録とは、会議等の所定のイベントにおいて一以上のイベントへの参加者(利用者)が発話した発話音声に係る音声情報(データ)に基づいて得られたテキスト情報(データ)、画像、発話音声を含む議事録などで構成される記録をいう。 Furthermore, in this embodiment, an audio recording refers to a record consisting of text information (data), images, minutes including audio, etc. obtained based on audio information (data) related to the audio spoken by one or more event participants (users) at a specified event such as a conference.
そして、音声記録情報とは、後述する解析結果管理テーブルで管理され、認識パターン毎に定義された項目名に対応する解析結果情報を示す。 The audio recording information is managed in the analysis result management table described below, and indicates analysis result information corresponding to the item names defined for each recognition pattern.
〔ハードウエア構成〕
続いて、図2及び図3を用いて、実施形態に係る通信システムを構成する装置又は端末のハードウエア構成について説明する。なお、図2及び図3に示されている装置又は端末のハードウエア構成は、必要に応じて構成要素が追加又は削除されてもよい。
[Hardware configuration]
Next, the hardware configuration of the device or terminal constituting the communication system according to the embodiment will be described with reference to Figures 2 and 3. Note that components may be added or deleted from the hardware configuration of the device or terminal shown in Figures 2 and 3 as needed.
<登録管理用端末、音声記録管理装置、音声解析サーバ、音声通信管理装置のハードウエア構成>
図2は、登録管理用端末、音声記録管理装置、音声解析サーバ及び音声通信管理装置のハードウエア構成の一例を示す図である。図2に示されているように、登録管理用端末2は、例えばコンピュータによって構築されており、CPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220を備えている。
<Hardware configuration of registration management terminal, voice recording management device, voice analysis server, and voice communication management device>
2 is a diagram showing an example of the hardware configuration of a registration management terminal, a voice recording management device, a voice analysis server, and a voice communication management device. As shown in FIG. 2, the registration management terminal 2 is constructed, for example, by a computer, and includes a CPU 201, a ROM 202, a RAM 203, an EEPROM 204, a HD 205, a HDD (Hard Disk Drive) controller 206, a display 207, a short-range communication I/F 208, a CMOS sensor 209, an image sensor I/F 210, a network I/F 211, a keyboard 212, a pointing device 213, a media I/F 215, an external device connection I/F 216, an audio input/output I/F 217, a microphone 218, a speaker 219, and a bus line 220.
これらのうち、CPU201は、登録管理用端末2全体の動作を制御する。ROM202は、CPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。EEPROM204は、CPU201の制御にしたがって、アプリ等の各種データの読出し又は書込みを行う。HD205は、プログラム等の各種データを記憶する。HDDコントローラ206は、CPU201の制御にしたがってHD205に対する各種データの読出し又は書込みを制御する。ディスプレイ207は、カーソル、メニュー、ウィンドウ、文字又は画像などの各種情報を表示する。近距離通信I/F208は、NFC(Near Field Communication)、Bluetooth(登録商標。以下省略)、Wi-Fi(登録商標。以下省略)等の無線通信インターフェイスを備える通信装置、又は通信端末等とデータ通信を行うための通信回路である。CMOSセンサ209は、CPU201の制御にしたがって被写体を撮像して画像データ又は動画データを得る内蔵型の撮像手段の一種である。なお、撮像手段は、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等で構成される撮像手段であってもよい。撮像素子I/F210は、CMOSセンサ209の駆動を制御する回路である。 Of these, the CPU 201 controls the overall operation of the registration management terminal 2. The ROM 202 stores programs used to drive the CPU 201. The RAM 203 is used as a work area for the CPU 201. The EEPROM 204 reads and writes various data such as apps under the control of the CPU 201. The HD 205 stores various data such as programs. The HDD controller 206 controls the reading and writing of various data from and to the HD 205 under the control of the CPU 201. The display 207 displays various information such as a cursor, menus, windows, text, or images. The near-field communication I/F 208 is a communication circuit for performing data communication with a communication device or communication terminal equipped with a wireless communication interface such as NFC (Near Field Communication), Bluetooth (registered trademark, omitted below), or Wi-Fi (registered trademark, omitted below). The CMOS sensor 209 is a type of built-in imaging device that captures an image of a subject under the control of the CPU 201 to obtain image data or video data. Note that the imaging device may not be a CMOS sensor, but may instead be an imaging device configured as a CCD (Charge Coupled Device) sensor or the like. The imaging element I/F 210 is a circuit that controls the driving of the CMOS sensor 209.
ネットワークI/F211は、通信ネットワーク100を利用してデータ通信をするためのインターフェイスである。キーボード212は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス213は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。メディアI/F215は、フラッシュメモリ等の記録メディア214に対するデータの読出し又は書込み(記憶)を制御する。外部機器接続I/F216は、各種の外部機器を接続するためのインターフェイスである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリ等である。音入出力I/F217は、CPU201の制御にしたがってマイク218及びスピーカ219との間で音信号の入出力を処理する回路である。マイク218は、音を電気信号に変える内蔵型の回路であり、外部のスピーカ等から発する音声や音波を取得し電気信号を用いた情報を取得する。スピーカ219は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。バスライン220は、CPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。 The network I/F 211 is an interface for data communication using the communication network 100. The keyboard 212 is a type of input means equipped with multiple keys for inputting characters, numbers, various instructions, etc. The pointing device 213 is a type of input means for selecting and executing various instructions, selecting processing targets, moving the cursor, etc. The media I/F 215 controls the reading and writing (storage) of data from the recording medium 214, such as a flash memory. The external device connection I/F 216 is an interface for connecting various external devices. In this case, the external device is, for example, a USB (Universal Serial Bus) memory. The sound input/output I/F 217 is a circuit that processes the input and output of sound signals between the microphone 218 and speaker 219 under the control of the CPU 201. The microphone 218 is a built-in circuit that converts sound into an electrical signal, capturing voices and sound waves emitted from an external speaker, etc., and acquiring information using the electrical signal. The speaker 219 is a built-in circuit that converts electrical signals into physical vibrations to produce sounds such as music and voice. The bus line 220 is an address bus, data bus, etc. that electrically connects the CPU 201 and other components.
音声記録管理装置3は、例えばコンピュータによって構築されており、CPU301、ROM302、RAM303、EEPROM304、HD305、HDD(Hard Disk Drive)コントローラ306、ディスプレイ307、近距離通信I/F308、CMOSセンサ309、撮像素子I/F310、ネットワークI/F311、キーボード312、ポインティングデバイス313、メディアI/F315、外部機器接続I/F316、音入出力I/F317、マイク318、スピーカ319及びバスライン320を備えている。これらのハードウエア資源は、登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。 The audio recording management device 3 is constructed, for example, by a computer, and includes a CPU 301, ROM 302, RAM 303, EEPROM 304, HD 305, HDD (Hard Disk Drive) controller 306, display 307, short-range communication I/F 308, CMOS sensor 309, image sensor I/F 310, network I/F 311, keyboard 312, pointing device 313, media I/F 315, external device connection I/F 316, sound input/output I/F 317, microphone 318, speaker 319 and bus line 320. These hardware resources are similar to the respective hardware resources of the registration management terminal 2, including the CPU 201, ROM 202, RAM 203, EEPROM 204, HD 205, HDD (Hard Disk Drive) controller 206, display 207, short-range communication I/F 208, CMOS sensor 209, image sensor I/F 210, network I/F 211, keyboard 212, pointing device 213, media I/F 215, external device connection I/F 216, sound input/output I/F 217, microphone 218, speaker 219, and bus line 220, and therefore will not be described here.
音声解析サーバ4は、例えばコンピュータによって構築されており、CPU401、ROM402、RAM403、EEPROM404、HD405、HDD(Hard Disk Drive)コントローラ406、ディスプレイ407、近距離通信I/F408、CMOSセンサ409、撮像素子I/F410、ネットワークI/F411、キーボード412、ポインティングデバイス413、メディアI/F415、外部機器接続I/F416、音入出力I/F417、マイク418、スピーカ419及びバスライン420を備えている。これらのハードウエア資源は、登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。 The voice analysis server 4 is constructed, for example, by a computer, and includes a CPU 401, ROM 402, RAM 403, EEPROM 404, HD 405, HDD (Hard Disk Drive) controller 406, display 407, near-field communication I/F 408, CMOS sensor 409, image sensor I/F 410, network I/F 411, keyboard 412, pointing device 413, media I/F 415, external device connection I/F 416, sound input/output I/F 417, microphone 418, speaker 419 and bus line 420. These hardware resources are similar to the respective hardware resources of the registration management terminal 2, including the CPU 201, ROM 202, RAM 203, EEPROM 204, HD 205, HDD (Hard Disk Drive) controller 206, display 207, short-range communication I/F 208, CMOS sensor 209, image sensor I/F 210, network I/F 211, keyboard 212, pointing device 213, media I/F 215, external device connection I/F 216, sound input/output I/F 217, microphone 218, speaker 219, and bus line 220, and therefore will not be described here.
音声通信管理装置5は、例えばコンピュータによって構築されており、CPU501、ROM502、RAM503、EEPROM504、HD505、HDD(Hard Disk Drive)コントローラ506、ディスプレイ507、近距離通信I/F508、CMOSセンサ509、撮像素子I/F510、ネットワークI/F511、キーボード512、ポインティングデバイス513、メディアI/F515、外部機器接続I/F516、音入出力I/F517、マイク518、スピーカ519及びバスライン520を備えている。これらのハードウエア資源は、登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。 The voice communication management device 5 is constructed, for example, by a computer, and includes a CPU 501, ROM 502, RAM 503, EEPROM 504, HD 505, HDD (Hard Disk Drive) controller 506, display 507, short-range communication I/F 508, CMOS sensor 509, image sensor I/F 510, network I/F 511, keyboard 512, pointing device 513, media I/F 515, external device connection I/F 516, sound input/output I/F 517, microphone 518, speaker 519 and bus line 520. These hardware resources are similar to the respective hardware resources of the registration management terminal 2, including the CPU 201, ROM 202, RAM 203, EEPROM 204, HD 205, HDD (Hard Disk Drive) controller 206, display 207, short-range communication I/F 208, CMOS sensor 209, image sensor I/F 210, network I/F 211, keyboard 212, pointing device 213, media I/F 215, external device connection I/F 216, sound input/output I/F 217, microphone 218, speaker 219, and bus line 220, and therefore will not be described here.
<入力端末、閲覧用端末のハードウエア構成>
入力端末及び閲覧用端末のハードウエア構成の一例を示す図である。図3に示されているように、入力端末8は、例えばコンピュータによって構築されており、CPU801、ROM802、RAM803、EEPROM804、ディスプレイ807、近距離通信I/F808、CMOSセンサ809、撮像素子I/F810、ネットワークI/F811、ポインティングデバイス813、メディアI/F815、外部機器接続I/F816、音入出力I/F817、マイク818、スピーカ819及びバスライン820を備えている。これらのハードウエア資源は、図2に示した登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。なお、入力端末8は、ブラウザソフトウエア等のプログラムを動作させることが可能な通信装置又は通信端末が用いられてもよい。
<Hardware configuration of input terminal and viewing terminal>
3 is a diagram showing an example of the hardware configuration of an input terminal and a viewing terminal. As shown in Fig. 3, the input terminal 8 is constructed by, for example, a computer, and includes a CPU 801, a ROM 802, a RAM 803, an EEPROM 804, a display 807, a short-range communication I/F 808, a CMOS sensor 809, an image sensor I/F 810, a network I/F 811, a pointing device 813, a media I/F 815, an external device connection I/F 816, an audio input/output I/F 817, a microphone 818, a speaker 819, and a bus line 820. These hardware resources are similar to the respective hardware resources of the registration management terminal 2 shown in Fig. 2, namely, the CPU 201, ROM 202, RAM 203, EEPROM 204, display 207, short-range communication I/F 208, CMOS sensor 209, image sensor I/F 210, network I/F 211, pointing device 213, media I/F 215, external device connection I/F 216, sound input/output I/F 217, microphone 218, speaker 219, and bus line 220, and therefore will not be described here. Note that the input terminal 8 may be a communication device or communication terminal capable of running a program such as browser software.
閲覧用端末9は、例えばコンピュータによって構築されており、CPU901、ROM902、RAM903、EEPROM904、ディスプレイ907、近距離通信I/F908、CMOSセンサ909、撮像素子I/F910、ネットワークI/F911、ポインティングデバイス913、メディアI/F915、外部機器接続I/F916、音入出力I/F917、マイク918、スピーカ919及びバスライン920を備えている。これらのハードウエア資源は、図2に示した登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。なお、閲覧用端末9は、ブラウザソフトウエア等のプログラムを動作させることが可能な通信装置又は通信端末が用いられてもよい。 The viewing terminal 9 is constructed, for example, by a computer, and includes a CPU 901, ROM 902, RAM 903, EEPROM 904, display 907, short-range communication I/F 908, CMOS sensor 909, image sensor I/F 910, network I/F 911, pointing device 913, media I/F 915, external device connection I/F 916, sound input/output I/F 917, microphone 918, speaker 919, and bus line 920. These hardware resources are similar to the respective hardware resources of the registration management terminal 2 shown in FIG. 2 , including the CPU 201, ROM 202, RAM 203, EEPROM 204, display 207, short-range communication I/F 208, CMOS sensor 209, image sensor I/F 210, network I/F 211, pointing device 213, media I/F 215, external device connection I/F 216, sound input/output I/F 217, microphone 218, speaker 219, and bus line 220, and therefore will not be described here. The viewing terminal 9 may be a communication device or terminal capable of running programs such as browser software.
更に、上記プログラムは、インストール可能な形式又は実行可能な形式のファイルで、コンピュータで読取り可能な記録媒体に記録、又はネットワークを介してダウンロードを行い流通させるようにしてもよい。記録媒体の例として、CD-R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、Blu-ray Disc、SDカード、USBメモリ等が挙げられる。また、記録媒体は、プログラム製品(Program Product)として、国内又は国外へ提供されることができる。例えば、音声記録管理装置3は、本発明に係るプログラムが実行されることで、本発明に係る音声記録管理方法を実現する。 Furthermore, the above program may be recorded on a computer-readable recording medium as an installable or executable file, or may be distributed by downloading via a network. Examples of recording media include CD-Rs (Compact Disc Recordables), DVDs (Digital Versatile Disks), Blu-ray Discs, SD cards, and USB memory. Furthermore, the recording media may be provided domestically or internationally as a program product. For example, the audio recording management device 3 realizes the audio recording management method of the present invention by executing the program of the present invention.
〔通信システムの機能構成〕
次に、図4乃至図14を用いて、本実施形態の機能構成について説明する。図4は、通信システムの機能構成の一例を示す図である。
[Functional configuration of communication system]
Next, the functional configuration of this embodiment will be described with reference to Figures 4 to 14. Figure 4 is a diagram showing an example of the functional configuration of a communication system.
<登録管理用端末の機能構成>
図4Aに示されているように、登録管理用端末2は、送受信部21、操作受付部22、表示制御部24、登録部26、アプリ起動部28及び記憶読出部29を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM202、EEPROM204及びHD205のうち少なくとも一つからRAM203に展開された登録管理用端末2用のプログラムに従ったCPU201からの命令により動作することで実現される機能又は手段である。また、登録管理用端末2は、図2に示されているROM202、EEPROM204及びHD205のうち少なくとも一つにより構築される記憶部2000を有している。更に、記憶部2000には、各装置、各端末と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)、ブラウザアプリ等が記憶されている。
<Functional configuration of the registration management terminal>
As shown in Fig. 4A, the registration management terminal 2 includes a transmission/reception unit 21, an operation reception unit 22, a display control unit 24, a registration unit 26, an application launch unit 28, and a storage/readout unit 29. Each of these functional units is a function or means realized when any of the hardware resources shown in Fig. 2 operates in response to commands from the CPU 201 in accordance with a program for the registration management terminal 2 that is loaded from at least one of the ROM 202, EEPROM 204, and HD 205 to the RAM 203. The registration management terminal 2 also includes a memory unit 2000 constructed from at least one of the ROM 202, EEPROM 204, and HD 205 shown in Fig. 2. The memory unit 2000 also stores a communication program (communication application), a browser application, and the like for communicating with each device and each terminal via the communication network 100.
<<登録管理用端末の各機能構成>>
次に、登録管理用端末2の各機能構成について詳細に説明する。図4Aに示されている登録管理用端末2の送受信部21は、主に、ネットワークI/F211及び近距離通信I/F208に対するCPU201の処理によって実現され、通信ネットワーク100を介して各端末、各装置との間で各種データ(又は情報)の送受信を行う。また、送受信部21は、音声解析サーバ4が音声情報を解析可能となるように、登録管理用端末2に入力された一以上の認識パターンを送信する。本実施形態において、送受信部21は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
<<Functional configuration of the registration management terminal>>
Next, each functional component of the registration management terminal 2 will be described in detail. The transmission/reception unit 21 of the registration management terminal 2 shown in Fig. 4A is mainly realized by processing by the CPU 201 on the network I/F 211 and the short-range communication I/F 208, and transmits and receives various data (or information) between each terminal and each device via the communication network 100. The transmission/reception unit 21 also transmits one or more recognition patterns input to the registration management terminal 2 so that the voice analysis server 4 can analyze voice information. In this embodiment, the transmission/reception unit 21 functions as an example of at least one of a transmitting means and a receiving means.
操作受付部22は、主に、キーボード212、ポインティングデバイス213が受け付けた各種操作により生成された信号をCPU201が処理することによって実現される。なお、操作受付部22は、キーボード212、ポインティングデバイス213に代えて、タッチパネル321等の入力手段が用いられてもよい。本実施形態において、操作受付部22は、受付手段の一例として機能する。 The operation reception unit 22 is realized mainly by the CPU 201 processing signals generated by various operations received by the keyboard 212 and pointing device 213. Note that the operation reception unit 22 may use input means such as a touch panel 321 instead of the keyboard 212 and pointing device 213. In this embodiment, the operation reception unit 22 functions as an example of a reception means.
表示制御部24は、主に、ディスプレイ207に対するCPU201の処理によって実現され、登録管理用端末2における各種画面及び情報(データ)の表示制御を行う。また、表示制御部24は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、ディスプレイ207に表示させる。本実施形態において、表示制御部24は、表示制御手段の一例として機能する。 The display control unit 24 is mainly realized by the processing of the CPU 201 on the display 207, and controls the display of various screens and information (data) on the registration management terminal 2. The display control unit 24 also uses, for example, a browser to display a display screen created using HTML or the like on the display 207. In this embodiment, the display control unit 24 functions as an example of a display control means.
登録部26は、主にCPU201の処理によって実現され、登録管理用端末2に対して入力された認識パターン等の各種情報を、記憶部2000の所定領域に記憶、登録する。本実施形態において、登録部26は、登録手段の一例として機能する。 The registration unit 26 is realized mainly by processing of the CPU 201, and stores and registers various information, such as recognition patterns, input to the registration management terminal 2 in a predetermined area of the storage unit 2000. In this embodiment, the registration unit 26 functions as an example of a registration means.
アプリ起動部28は、主に、CPU201の処理によって実現され、各装置、各端末との間で通信ネットワーク100を介して各種アプリの起動を行う。また、アプリ起動部28は、音声通信管理装置5に対して各種テキスト情報をアップロードするためのアプリを、RAM303の所定の作業領域上で動作させる。本実施形態において、アプリ起動部28は、起動手段の一例として機能する。 The application launch unit 28 is mainly realized by the processing of the CPU 201, and launches various applications between each device and each terminal via the communication network 100. The application launch unit 28 also runs an application for uploading various text information to the voice communication management device 5 in a predetermined working area of the RAM 303. In this embodiment, the application launch unit 28 functions as an example of a launching means.
記憶読出部29は、主に、図2に示されているROM202、EEPROM204及びHD205のうち少なくとも一つに対するCPU201の処理によって実現され、記憶部2000に各種データ(又は情報)を記憶したり、記憶部2000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部29は、記憶読出手段の一例として機能する。 The memory/read unit 29 is mainly realized by the processing of the CPU 201 on at least one of the ROM 202, EEPROM 204, and HD 205 shown in FIG. 2, and stores various data (or information) in the memory unit 2000 and reads various data (or information) from the memory unit 2000. In this embodiment, the memory/read unit 29 functions as an example of a memory/reading means.
<入力端末の機能構成>
図4Aに示されているように、入力端末8は、送受信部81、操作受付部82、音・画像取得部83、表示制御部84、音声再生部86、アプリ起動部88及び記憶読出部89を有する。これら各機能部は、図3に示された各ハードウエア資源のいずれかが、ROM802及びEEPROM804のうち少なくとも一つからRAM803に展開された入力端末8用のプログラムに従ったCPU801からの命令により動作することで実現される機能又は手段である。また、入力端末8は、図3に示されているROM802及びEEPROM804のうち少なくとも一つにより構築される記憶部8000を有している。更に、記憶部8000には、各装置、各端末と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)、ブラウザアプリ等が記憶されている。
<Functional configuration of input terminal>
As shown in Fig. 4A, the input terminal 8 includes a transmission/reception unit 81, an operation reception unit 82, a sound/image acquisition unit 83, a display control unit 84, an audio playback unit 86, an application launch unit 88, and a storage/readout unit 89. Each of these functional units is a function or means realized when any of the hardware resources shown in Fig. 3 operates in response to an instruction from the CPU 801 in accordance with a program for the input terminal 8 that is loaded from at least one of the ROM 802 and the EEPROM 804 to the RAM 803. The input terminal 8 also includes a storage unit 8000 constructed from at least one of the ROM 802 and the EEPROM 804 shown in Fig. 3. The storage unit 8000 further stores a communication program (communication application), a browser application, and the like for communicating with each device and each terminal via the communication network 100.
<<入力端末の各機能構成>>
次に、入力端末8の各機能構成について詳細に説明する。図4Aに示されている入力端末8の送受信部81は、主に、ネットワークI/F811及び近距離通信I/F808に対するCPU801の処理によって実現され、通信ネットワーク100を介して各端末、各装置との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部81は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
<<Functional configuration of the input device>>
Next, a detailed description will be given of each functional configuration of the input terminal 8. The transmission/reception unit 81 of the input terminal 8 shown in Fig. 4A is mainly realized by processing of the CPU 801 on the network I/F 811 and the short-range communication I/F 808, and transmits and receives various data (or information) between each terminal and each device via the communication network 100. In this embodiment, the transmission/reception unit 81 functions as an example of at least one of a transmitting means and a receiving means.
操作受付部82は、主に、ポインティングデバイス813が受け付けた各種操作により生成された信号をCPU801が処理することによって実現される。なお、操作受付部22は、ポインティングデバイス813に代えて、キーボード、タッチパネル等の入力手段が用いられてもよい。本実施形態において、操作受付部82は、受付手段の一例として機能する。 The operation reception unit 82 is realized mainly by the CPU 801 processing signals generated by various operations received by the pointing device 813. Note that the operation reception unit 82 may use input means such as a keyboard or touch panel instead of the pointing device 813. In this embodiment, the operation reception unit 82 functions as an example of a reception means.
音・画像取得部83は、主に、マイク818、音入出力I/F817、CMOSセンサ809及び撮像素子I/F810に対するCPU801の処理によって実現され、入力端末8を利用する利用者が発話した発話音声等に係る音声(音)を集音して音声情報(音声データ)又は音情報(音データ)を取得する。音・画像取得部83は、更に、利用者の顔などの画像に係る画像を撮影して画像情報(画像データ)を取得する。本実施形態において、音・画像取得部83は、取得手段の一例として機能する。 The sound/image acquisition unit 83 is mainly realized by the CPU 801's processing of the microphone 818, sound input/output I/F 817, CMOS sensor 809, and image sensor I/F 810, and collects voice (sound) related to speech, etc., uttered by a user using the input terminal 8 to acquire voice information (voice data) or sound information (sound data). The sound/image acquisition unit 83 also captures images related to images of the user's face, etc., to acquire image information (image data). In this embodiment, the sound/image acquisition unit 83 functions as an example of an acquisition means.
表示制御部84は、主に、ディスプレイ807に対するCPU801の処理によって実現され、入力端末8における各種画面及び情報(データ)の表示制御を行う。また、表示制御部84は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、ディスプレイ807に表示させる。本実施形態において、表示制御部84は、表示制御手段の一例として機能する。 The display control unit 84 is mainly realized by the processing of the CPU 801 on the display 807, and controls the display of various screens and information (data) on the input terminal 8. The display control unit 84 also uses, for example, a browser to display a display screen created using HTML or the like on the display 807. In this embodiment, the display control unit 84 functions as an example of a display control means.
音声再生部86は、主に、スピーカ819及び音入出力I/F817に対するCPU801の処理によって実現され、入力端末8を利用する利用者に対して、音声記録管理装置3が生成した各種通知情報に係る音声(音)を、スピーカ819を介して出力(再生)する。本実施形態において、音声再生部86は、再生手段の一例として機能する。 The audio playback unit 86 is mainly realized by the CPU 801's processing of the speaker 819 and the audio input/output I/F 817, and outputs (plays) audio (sound) related to various notification information generated by the audio recording management device 3 to the user using the input terminal 8 via the speaker 819. In this embodiment, the audio playback unit 86 functions as an example of playback means.
アプリ起動部88は、主に、CPU801の処理によって実現され、各装置、各端末との間で通信ネットワーク100を介して各種アプリの起動を行う。また、アプリ起動部88は、音声通信管理装置5に対して各種テキスト情報をアップロードするためのアプリを、RAM803の所定の作業領域上で動作させる。本実施形態において、アプリ起動部88は、起動手段の一例として機能する。 The application launch unit 88 is mainly realized by the processing of the CPU 801, and launches various applications between each device and each terminal via the communication network 100. The application launch unit 88 also runs an application for uploading various text information to the voice communication management device 5 in a specified work area of the RAM 803. In this embodiment, the application launch unit 88 functions as an example of a launching means.
記憶読出部89は、主に、図3に示されているROM802及びEEPROM804のうち少なくとも一つに対するCPU801の処理によって実現され、記憶部8000に各種データ(又は情報)を記憶したり、記憶部8000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部89は、記憶読出手段の一例として機能する。 The memory/read unit 89 is mainly realized by the processing of the CPU 801 on at least one of the ROM 802 and EEPROM 804 shown in FIG. 3, and stores various data (or information) in the memory unit 8000 and reads various data (or information) from the memory unit 8000. In this embodiment, the memory/read unit 89 functions as an example of a memory/reading means.
<閲覧用端末の機能構成>
図4Aに示されているように、閲覧用端末9は、送受信部91、操作受付部92、表示制御部94、音声再生部96、アプリ起動部98及び記憶読出部99を有する。これら各機能部は、図3に示された各ハードウエア資源のいずれかが、ROM902及びEEPROM904のうち少なくとも一つからRAM903に展開された閲覧用端末9用のプログラムに従ったCPU901からの命令により動作することで実現される機能又は手段である。また、閲覧用端末9は、図3に示されているROM902及びEEPROM904のうち少なくとも一つにより構築される記憶部9000を有している。更に、記憶部9000には、各装置、各端末と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)、ブラウザアプリ等が記憶されている。
<Functional configuration of viewing terminal>
As shown in Fig. 4A, the viewing terminal 9 has a transmission/reception unit 91, an operation reception unit 92, a display control unit 94, an audio playback unit 96, an application launch unit 98, and a storage/readout unit 99. Each of these functional units is a function or means realized when any of the hardware resources shown in Fig. 3 operates in response to an instruction from the CPU 901 in accordance with a program for the viewing terminal 9 that is loaded from at least one of the ROM 902 and the EEPROM 904 to the RAM 903. The viewing terminal 9 also has a storage unit 9000 constructed from at least one of the ROM 902 and the EEPROM 904 shown in Fig. 3. Furthermore, the storage unit 9000 stores a communication program (communication application), a browser application, and the like for communicating with each device and each terminal via the communication network 100.
<<閲覧用端末の各機能構成>>
次に、閲覧用端末9の各機能構成について詳細に説明する。図4Aに示されている閲覧用端末9の送受信部91は、主に、ネットワークI/F911及び近距離通信I/F908に対するCPU901の処理によって実現され、通信ネットワーク100を介して各端末、各装置との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部91は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
<<Functional configuration of the viewing device>>
Next, a detailed description will be given of each functional configuration of the viewing terminal 9. The transmitting/receiving unit 91 of the viewing terminal 9 shown in Fig. 4A is mainly realized by processing of the CPU 901 on the network I/F 911 and the short-range communication I/F 908, and transmits and receives various data (or information) between each terminal and each device via the communication network 100. In this embodiment, the transmitting/receiving unit 91 functions as an example of at least one of a transmitting means and a receiving means.
操作受付部92は、主に、ポインティングデバイス913が受け付けた各種操作により生成された信号をCPU901が処理することによって実現される。なお、操作受付部92は、ポインティングデバイス913に代えて、キーボード、タッチパネル等の入力手段が用いられてもよい。本実施形態において、操作受付部92は、受付手段の一例として機能する。 The operation reception unit 92 is realized mainly by the CPU 901 processing signals generated by various operations received by the pointing device 913. Note that the operation reception unit 92 may use input means such as a keyboard or touch panel instead of the pointing device 913. In this embodiment, the operation reception unit 92 functions as an example of a reception means.
表示制御部94は、主に、ディスプレイ907に対するCPU901の処理によって実現され、閲覧用端末9における各種画面及び情報(データ)の表示制御を行う。また、表示制御部94は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、ディスプレイ907に表示させる。本実施形態において、表示制御部94は、表示制御手段の一例として機能する。 The display control unit 94 is mainly realized by the processing of the CPU 901 on the display 907, and controls the display of various screens and information (data) on the viewing terminal 9. The display control unit 94 also uses, for example, a browser to display a display screen created using HTML or the like on the display 907. In this embodiment, the display control unit 94 functions as an example of a display control means.
音声再生部96は、主に、スピーカ919及び音入出力I/F917に対するCPU901の処理によって実現され、閲覧用端末9を利用する利用者に対して、音声記録管理装置3が生成した各種通知情報に係る音声(音)を、スピーカ919を介して出力(再生)する。本実施形態において、音声再生部96は、再生手段の一例として機能する。 The audio playback unit 96 is mainly realized by the processing of the CPU 901 on the speaker 919 and the audio input/output I/F 917, and outputs (plays) audio (sound) related to various notification information generated by the audio recording management device 3 to the user using the viewing terminal 9 via the speaker 919. In this embodiment, the audio playback unit 96 functions as an example of playback means.
アプリ起動部98は、主に、CPU901の処理によって実現され、各装置、各端末との間で通信ネットワーク100を介して各種アプリの起動を行う。また、アプリ起動部98は、音声通信管理装置5に対して各種テキスト情報をアップロードするためのアプリを、RAM903の所定の作業領域上で動作させる。本実施形態において、アプリ起動部98は、起動手段の一例として機能する。 The application launch unit 98 is mainly realized by the processing of the CPU 901, and launches various applications between each device and each terminal via the communication network 100. The application launch unit 98 also runs an application for uploading various text information to the voice communication management device 5 in a specified work area of the RAM 903. In this embodiment, the application launch unit 98 functions as an example of a launching means.
記憶読出部99は、主に、図3に示されているROM902及びEEPROM904のうち少なくとも一つに対するCPU901の処理によって実現され、記憶部9000に各種データ(又は情報)を記憶したり、記憶部9000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部99は、記憶読出手段の一例として機能する。 The memory/read unit 99 is mainly realized by the processing of the CPU 901 on at least one of the ROM 902 and EEPROM 904 shown in FIG. 3, and stores various data (or information) in the memory unit 9000 and reads various data (or information) from the memory unit 9000. In this embodiment, the memory/read unit 99 functions as an example of a memory/reading means.
<音声記録管理装置の機能構成>
図4Bに示されているように、音声記録管理装置3は、送受信部31、表示制御部34、判断部35、登録部36、検索部37、生成部38及び記憶読出部39を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM302、EEPROM304及びHD305のうち少なくとも一つからRAM303に展開された音声記録管理装置3用のプログラムに従ったCPU301からの命令により動作することで実現される機能又は手段である。また、音声記録管理装置3は、図2に示されているROM302、EEPROM304及びHD305のうち少なくとも一方により構築される記憶部3000を有している。更に、記憶部3000には、核装置、各端末と通信ネットワーク100を介してそれぞれ通信を行うための通信プログラム(通信アプリ)と及びブラウザアプリと、記録管理アプリ等が記憶されている。
<Functional configuration of the voice recording management device>
As shown in FIG. 4B, the voice recording management device 3 includes a transmission/reception unit 31, a display control unit 34, a judgment unit 35, a registration unit 36, a search unit 37, a generation unit 38, and a storage/readout unit 39. Each of these functional units is a function or means realized by the operation of any of the hardware resources shown in FIG. 2 in response to commands from the CPU 301 in accordance with a program for the voice recording management device 3 that is loaded from at least one of the ROM 302, EEPROM 304, and HD 305 to the RAM 303. The voice recording management device 3 also includes a memory unit 3000 constructed from at least one of the ROM 302, EEPROM 304, and HD 305 shown in FIG. 2. The memory unit 3000 further stores a communication program (communication application) for communicating with the core device and each terminal via the communication network 100, a browser application, a recording management application, and the like.
●認識パターン項目管理テーブル●
図5は、認識パターン項目管理テーブルの一例を示す概念図である。記憶部3000には、図5に示されているような認識パターン項目管理テーブルによって構成された認識パターン項目管理DB3001が構築されている。認識パターン項目管理テーブルでは、後述する認識パターン識別情報ごとに、登録順序、項目名が関連付けられて記憶、管理されている。
●Recognition Pattern Item Management Table●
Fig. 5 is a conceptual diagram showing an example of a recognition pattern item management table. A recognition pattern item management DB 3001 configured by the recognition pattern item management table shown in Fig. 5 is constructed in the storage unit 3000. In the recognition pattern item management table, a registration order and an item name are associated with each piece of recognition pattern identification information described later, and are stored and managed.
これらのうち、認識パターン識別情報は、入力端末8が送信した音声情報を音声解析サーバ4が音声認識を行いテキスト情報に変換するために用いられる認識パターンを識別するための識別情報を表し、例えば、「R0001」、「R0002」等で与えられる。登録順序は、一つの認証パターンを構成する「記録種別」、「作業対象」、「作業項目」及び「作業結果」の各項目のうち、どの項目をどの順序で登録するかを示す順序情報である。このテーブルによって、管理者は所定のテナント、所定のグループごとに複数の認識パターンを登録することが可能になる。なお、項目名は、上述した一つの認証パターンを構成する各項目の名称である。本実施形態において、認識パターン項目管理DB3001は、一以上の認識パターンを、認識パターンを識別する認識パターン識別情報に対応付けて管理する認識パターン項目管理手段の一例である。 Of these, the recognition pattern identification information represents identification information for identifying the recognition pattern used by the voice analysis server 4 to perform voice recognition on the voice information sent by the input terminal 8 and convert it into text information, and is given as, for example, "R0001", "R0002", etc. The registration order is order information that indicates which of the items constituting one authentication pattern -- "record type", "task target", "task item", and "task result" -- are to be registered in what order. This table allows the administrator to register multiple recognition patterns for a specific tenant or group. The item names are the names of the items constituting one authentication pattern described above. In this embodiment, the recognition pattern item management DB 3001 is an example of a recognition pattern item management means that manages one or more recognition patterns in association with the recognition pattern identification information that identifies the recognition pattern.
●認識パターン識別管理テーブル●
図6は、認識パターン識別管理テーブルの一例を示す概念図である。記憶部3000には、図5に示されているような認識パターン項目管理テーブルによって構成された認識パターン項目管理DB3001が構築されている。認識パターン識別管理テーブルでは、テナント識別情報ごとに、グループ識別情報及び認識パターン識別情報が関連付けられて記憶、管理されている。
●Recognition pattern identification management table●
Fig. 6 is a conceptual diagram showing an example of a recognition pattern identification management table. A recognition pattern item management DB 3001 configured by the recognition pattern item management table as shown in Fig. 5 is constructed in the storage unit 3000. In the recognition pattern identification management table, group identification information and recognition pattern identification information are associated with each other and stored and managed for each tenant identification information.
これらのうち、テナント識別情報は、通信システム1を利用する利用者、管理者、閲覧者等が所属するテナントを識別するための識別情報であり、テナントは、会社、学校等の組織、団体等を一例とする。ここではテナント識別情報は、例えば、「T0001」、「T0115」等で与えられる。グループ識別情報は、所定のテナントに割り振られた所定のグループを識別するための識別情報である。ここではグループ識別情報は、例えば、「G0001」、「G0002」等で与えられる。認識パターン識別管理テーブルでは、テナント識別情報及びグループ識別情報に、どの認識パターンを示す認識パターン識別情報が対応付けられているかが管理されている。例えば、テナント識別情報「T0001」及びグループ識別情報「G0001」に対応付けられているのは、二つの認識パターン(「R0001」、「R0002」)であり、テナント識別情報「T0115」及びグループ識別情報「G0004」に対応付けられているのは、三つの認識パターン(「R1234」、「R1235」、「R1236」)であることを示している。本実施形態において、認識パターン識別管理DB3002は、一以上の認識パターンを示すそれぞれの認識パターン識別情報を、発話音声を発した利用者が所属する所定のテナントを識別するテナント識別情報及び利用者が所属する所定のグループを識別するグループ識別情報に対応付けて管理する認識パターン識別管理手段の一例である。 Of these, tenant identification information is identification information used to identify tenants to which users, administrators, viewers, etc. using communication system 1 belong. Examples of tenants include organizations and groups such as companies and schools. Here, tenant identification information is given as, for example, "T0001" or "T0115." Group identification information is identification information used to identify specific groups assigned to specific tenants. Here, group identification information is given as, for example, "G0001" or "G0002." The recognition pattern identification management table manages which recognition pattern identification information indicates which recognition pattern is associated with tenant identification information and group identification information. For example, two recognition patterns ("R0001" and "R0002") are associated with tenant identification information "T0001" and group identification information "G0001," while three recognition patterns ("R1234," "R1235," and "R1236") are associated with tenant identification information "T0001" and group identification information "G0001." In this embodiment, the recognition pattern identification management DB 3002 is an example of a recognition pattern identification management means that manages each piece of recognition pattern identification information indicating one or more recognition patterns in association with tenant identification information that identifies a specific tenant to which the user who uttered the speech belongs, and group identification information that identifies a specific group to which the user belongs.
●類義語管理テーブル●
図7は、類義語管理テーブルの一例を示す概念図である。記憶部3000には、図7に示されているような類義語管理テーブルによって構成された類義語管理DB3003が構築されている。類義語管理テーブルでは、項目識別情報ごとに、項目名キーワード、類義語1、類義語2、・・・が関連付けられて記憶、管理されている。
●Synonym Management Table●
Fig. 7 is a conceptual diagram showing an example of a synonym management table. A synonym management DB 3003 configured by the synonym management table shown in Fig. 7 is constructed in the storage unit 3000. In the synonym management table, an item name keyword, synonym 1, synonym 2, ... are associated with each item identification information, stored, and managed.
これらのうち、項目識別情報は類義語としての項目を識別するための識別情報(例えば通し番号)である。項目名キーワードは、認識パターンを構成する各項目において、キーワードとなるものが管理され、例えば、「体温」、「服薬」、「投薬」等で与えられる。類義語1、類義語2、・・・は、項目名キーワードに似たことばが管理され、例えば、「体温」に似たことばとして、「熱」、「お熱」などが管理される。これにより、利用者(作業者)は、介護、看護の場における発話時の言葉の制約を緩和させることができる。本実施形態において、類義語管理DB3003は、発話音声に含まれ、認識パターンを構成する各項目の類義語を、各項目を示すキーワードに対応付けて管理する類義語管理手段の一例である。 Of these, item identification information is identification information (e.g., a serial number) for identifying items as synonyms. Item name keywords are managed as keywords for each item that makes up the recognition pattern, and are given as, for example, "body temperature," "taking medication," and "administering medication." Synonym 1, synonym 2, ... are managed as words similar to the item name keywords; for example, "fever" and "fever" are managed as words similar to "body temperature." This allows users (workers) to relax restrictions on the words they use when speaking in caregiving and nursing settings. In this embodiment, the synonym management DB 3003 is an example of a synonym management means that manages synonyms for each item that makes up the recognition pattern, included in the spoken voice, in association with keywords indicating each item.
●テナントグループ管理テーブル●
図8は、テナントグループ管理テーブルの一例を示す概念図である。記憶部3000には、図8に示されているようなテナントグループ管理テーブルによって構成されたテナントグループ管理DB3004が構築されている。テナントグループ管理テーブルでは、テナント識別情報に対応付けられてグループ識別情報が記憶、管理されている。このように、テナントグループ管理テーブルは、テナントとグループとを対応付けるためのテーブルである。
●Tenant Group Management Table●
Fig. 8 is a conceptual diagram showing an example of a tenant group management table. A tenant group management DB 3004 configured by the tenant group management table shown in Fig. 8 is constructed in the storage unit 3000. In the tenant group management table, group identification information is stored and managed in association with tenant identification information. In this way, the tenant group management table is a table for associating tenants with groups.
●音声記録管理テーブル●
図9は、音声記録管理テーブルの一例を示す概念図である。記憶部3000には、図9に示されているような音声記録管理テーブルによって構成された音声記録管理DB3005が構築されている。音声記録管理テーブルでは、テナント識別情報及びグループ識別情報を一組のタブとするそれぞれのタブで分けられた音声記録識別情報ごとに、音声データのパス、利用者識別情報及び登録日時の各項目が関連付けられて記憶、管理されている。
●Audio Recording Management Table●
Fig. 9 is a conceptual diagram showing an example of a voice recording management table. A voice recording management DB 3005 configured by the voice recording management table shown in Fig. 9 is constructed in the storage unit 3000. In the voice recording management table, for each voice recording identification information separated by tabs, each set of tabs being tenant identification information and group identification information, the path of the voice data, user identification information, and registration date and time are associated with each other and stored and managed.
これらのうち、音声記録識別情報は、音声記録を管理するための識別情報で、例えば、「V0001」、「V0002」等で与えられる。音声データのパスは、保存される音声データの保存先、パスの情報が示される。この音声データのパスは、例えば、「https://aaa/0001.wav」等で与えられる。なお、音声データのパスで管理されているそれぞれの内容は、上述した音声情報管理テーブルで管理されている音声データのパスと同じ内容でもよい。利用者識別情報は、利用者(作業者)を識別するための情報で、例えば、「User001」、「User002」等で与えられる。登録日時は、音声記録を登録した日時情報であり、例えば、「2021/08/06 15:00:39」等の日付情報で与えられる。 Of these, the audio recording identification information is identification information used to manage audio recordings, and is given as, for example, "V0001", "V0002", etc. The audio data path indicates the destination and path information for the saved audio data. This audio data path is given as, for example, "https://aaa/0001.wav". Note that the content managed by the audio data path may be the same as the audio data path managed in the audio information management table described above. The user identification information is information used to identify the user (worker), and is given as, for example, "User001", "User002", etc. The registration date and time is the date and time when the audio recording was registered, and is given as date information, for example, "2021/08/06 15:00:39".
●解析結果管理テーブル●
図10は、解析結果管理テーブルの一例を示す概念図である。記憶部3000には、図10に示されているような解析結果管理テーブルによって構成された解析結果管理DB3006が構築されている。解析結果管理テーブルでは、音声記録識別情報ごとに、記録種別、作業対象、作業項目、作業日時及び利用者識別情報が関連付けられて記憶、管理されている。
●Analysis results management table●
Fig. 10 is a conceptual diagram showing an example of an analysis result management table. An analysis result management DB 3006 configured by the analysis result management table shown in Fig. 10 is constructed in the storage unit 3000. In the analysis result management table, the recording type, task target, task item, task date and time, and user identification information are associated with each piece of voice recording identification information, and are stored and managed.
これらのうち、記録種別、作業対象、作業項目、作業対象は、上述した認識パターン項目管理テーブルで説明した各項目名に対応する具体的な内容が、音声記録識別情報ごとに対応付けられて管理される。さらに、音声記録識別情報に対応付けられて、作業日時、利用者識別情報も管理される。解析結果管理テーブルでは、後述する音声解析サーバ4が解析した結果である音声解析結果情報を構成する各成分が管理される。本実施形態において、解析結果管理DB3006は、音声解析結果情報に含まれる各値を、認識パターン項目管理DB3001(図5参照)で管理されている各項目と対応付けた後、音声記録情報を識別する音声記録識別情報に対応付けて管理する解析結果管理手段の一例である。 Of these, the specific details of the record type, task target, task item, and task target corresponding to each item name described in the recognition pattern item management table above are managed in association with each voice recording identification information. Furthermore, the task date and time and user identification information are also managed in association with the voice recording identification information. The analysis result management table manages each component that makes up the voice analysis result information, which is the result of analysis by the voice analysis server 4, described below. In this embodiment, the analysis result management DB 3006 is an example of an analysis result management means that associates each value included in the voice analysis result information with each item managed in the recognition pattern item management DB 3001 (see Figure 5), and then manages the values in association with the voice recording identification information that identifies the voice recording information.
●通知情報管理テーブル●
図11は、通知情報管理テーブルの一例を示す概念図である。記憶部3000には、図11に示されているような通知情報管理テーブルによって構成された通知情報管理DB3007が構築されている。通知情報管理テーブルでは、記録種別に対応させて通知情報の音声データが管理されている。ここでは、記録種別として、「介護記録」、「申し送り」が与えられるが、これらに限らない。通知情報の音声データは、それぞれの記録種別に対応付けられ、入力端末8、閲覧用端末9に対して通知される通知情報の音声データのパス(「https://aaa.notice01.wav等」)が与えられる。
●Notification Information Management Table●
FIG. 11 is a conceptual diagram showing an example of a notification information management table. A notification information management DB 3007 configured by the notification information management table shown in FIG. 11 is constructed in the storage unit 3000. In the notification information management table, audio data of the notification information is managed in association with a record type. Here, the record types are given as "care record" and "handover," but are not limited to these. The audio data of the notification information is associated with each record type, and a path ("https://aaa.notice01.wav, etc.") of the audio data of the notification information to be notified to the input terminal 8 and the viewing terminal 9 is given.
<<音声記録管理装置の各機能構成>>
次に、音声記録管理装置3の各機能構成について詳細に説明する。図4Bに示されている音声記録管理装置3の送受信部31は、主に、ネットワークI/F311及び近距離通信I/F308に対するCPU301の処理によって実現され、通信ネットワーク100を介して音声解析サーバ4と音声通信管理装置5との間でそれぞれ各種データ(又は情報)の送受信を行う。また、送受信部31は、音声情報に対する解析を要求するための音声解析要求として、発話音声を発した利用者が所属するテナントのテナント識別情報及び利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた一以上の認識パターンを識別する一以上の認識パターン識別情報及び音声情報を、音声解析サーバ4に対して送信する。また、送受信部31は、音声記録情報が登録されたことを示す登録完了通知情報、及び登録完了通知情報を音声化した登録完了音声情報の少なくとも一方を、入力端末8が受信可能となるように音声通信管理装置5に対して送信する。送受信部31は更に、音声解析サーバ4が音声情報に対する解析ができなかったことを示す登録失敗通知を、入力端末8が受信可能とするように音声通信管理装置5に対して送信する。本実施形態において、送受信部31は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
<<Functional configuration of the voice recording management device>>
Next, each functional component of the voice recording management device 3 will be described in detail. The transmission/reception unit 31 of the voice recording management device 3 shown in FIG. 4B is mainly realized by processing by the CPU 301 on the network I/F 311 and the short-range communication I/F 308, and transmits and receives various data (or information) between the voice analysis server 4 and the voice communication management device 5 via the communication network 100. The transmission/reception unit 31 also transmits, as a voice analysis request for requesting analysis of the voice information, one or more recognition pattern identification information identifying one or more recognition patterns associated with at least one of the tenant identification information of the tenant to which the user who uttered the uttered voice belongs and the group identification information of the group to which the user belongs, and voice information to the voice analysis server 4. The transmission/reception unit 31 also transmits, to the voice communication management device 5, at least one of registration completion notification information indicating that the voice recording information has been registered and registration completion voice information obtained by vocalizing the registration completion notification information, so that the input terminal 8 can receive it. The transmitting/receiving unit 31 further transmits a registration failure notification indicating that the voice analysis server 4 was unable to analyze the voice information to the voice communication management device 5 so that the notification can be received by the input terminal 8. In this embodiment, the transmitting/receiving unit 31 functions as an example of at least one of a transmitting means and a receiving means.
表示制御部34は、主に、ディスプレイ307に対するCPU301の処理によって実現され、音声記録管理装置3における各種画面及び情報(データ)の表示制御を行う。また、表示制御部34は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、通信ネットワーク100を介して、入力端末8のディスプレイ807に表示させるように制御してもよい。本実施形態において、表示制御部34は、表示制御手段の一例として機能する。 The display control unit 34 is mainly realized by the processing of the CPU 301 on the display 307, and controls the display of various screens and information (data) in the audio recording management device 3. The display control unit 34 may also use a browser, for example, to control the display of a display screen created using HTML or the like on the display 807 of the input terminal 8 via the communication network 100. In this embodiment, the display control unit 34 functions as an example of a display control means.
判断部35は、主に、CPU301の処理によって実現され、音声記録管理装置3における各種判断を行う。また、判断部35は、音声解析サーバ4が送信した音声解析結果情報に合致する認識パターンがあるかを判断する。本実施形態において、判断部35は、与えられた所定の条件を満たすかを判断する判断手段の一例として機能する。なお、判断部が判断する内容は、与えられた所定の条件を満たすかを判断する以外に、与えられた所定の条件を満たすか否かを判断するようにしてもよい。 The judgment unit 35 is mainly realized by the processing of the CPU 301, and makes various judgments in the voice recording management device 3. The judgment unit 35 also determines whether there is a recognition pattern that matches the voice analysis result information sent by the voice analysis server 4. In this embodiment, the judgment unit 35 functions as an example of a judgment means that determines whether given predetermined conditions are met. Note that the judgment made by the judgment unit may be changed to determine whether given predetermined conditions are met, in addition to determining whether given predetermined conditions are met.
登録部36は、主にCPU301の処理によって実現され、音声記録管理装置3に対して送信された認識パターン、類義語、音声データ、解析結果、音声記録等の各種データ(情報)を、各種DB、又は記憶部3000の所定領域に記憶、登録する。また、登録部36は、音声解析サーバ4に対して送信した音声解析要求に対して、発話された音声情報に対応する音声記録情報を登録する。具体的には、登録部36は、音声解析サーバ4が一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び特定の認識パターン識別情報に基づいて、音声記録情報を登録する。なお、特定の認識パターン識別情報とは、特定の認識パターンを示す識別情報である。また、登録部36は、登録管理用端末2が送信した特定の認識パターンを含む一以上の認識パターンを、認識パターン項目管理DB3001(図5参照)に登録する。また、登録部36は、登録管理用端末2が送信した一以上の認識パターンを示すそれぞれの認識パターン識別情報を、認識パターン識別管理DB3002(図6参照)に登録する。また、登録部36は、発話音声に含まれ、認識パターンを構成する各項目の類義語を、類義語管理DB3003(図7参照)に登録する。また、登録部36は、音声データのパス、利用者識別情報、登録日時を含む音声記録情報を、音声記録管理DB3005(図9参照)に登録する。また、登録部36は、音声解析結果情報に含まれる各値を、解析結果管理DB3006(図10参照)に登録する。本実施形態において、登録部36は、登録手段の一例として機能する。 The registration unit 36 is mainly realized by processing of the CPU 301, and stores and registers various data (information) such as recognition patterns, synonyms, voice data, analysis results, and voice records transmitted to the voice recording management device 3 in various databases or in a specified area of the memory unit 3000. The registration unit 36 also registers voice recording information corresponding to spoken voice information in response to a voice analysis request transmitted to the voice analysis server 4. Specifically, the registration unit 36 registers voice recording information based on voice analysis result information and specific recognition pattern identification information contained in a voice analysis response analyzed by the voice analysis server 4 using a specific recognition pattern from one or more recognition patterns. The specific recognition pattern identification information is identification information that indicates a specific recognition pattern. The registration unit 36 also registers one or more recognition patterns, including the specific recognition pattern transmitted by the registration management terminal 2, in the recognition pattern item management DB 3001 (see Figure 5). The registration unit 36 also registers each piece of recognition pattern identification information indicating one or more recognition patterns transmitted by the registration management terminal 2 in a recognition pattern identification management DB 3002 (see FIG. 6). The registration unit 36 also registers synonyms for each item included in the spoken voice that constitutes the recognition pattern in a synonym management DB 3003 (see FIG. 7). The registration unit 36 also registers voice recording information including the voice data path, user identification information, and registration date and time in a voice recording management DB 3005 (see FIG. 9). The registration unit 36 also registers each value included in the voice analysis result information in an analysis result management DB 3006 (see FIG. 10). In this embodiment, the registration unit 36 functions as an example of a registration means.
検索部37は、主に、CPU301の処理によって実現され、例えば、閲覧用端末9が要求した音声記録情報に対する検索要求に基づいて、音声記録管理装置3で登録、管理している各種データ(情報)の検索を行う。本実施形態において、検索部37は、検索手段の一例として機能する。 The search unit 37 is mainly realized by the processing of the CPU 301, and searches various data (information) registered and managed by the voice recording management device 3, for example, based on a search request for voice recording information requested by the viewing terminal 9. In this embodiment, the search unit 37 functions as an example of a search means.
生成部38は、主に、CPU301の処理によって実現され、音声解析サーバが送信した音声解析結果情報に基づいて、入力端末8及び閲覧用端末9に表示させる画面データ、音声記録データ(音声記録情報)を生成する。本実施形態において、生成部38は、生成手段の一例として機能する。 The generation unit 38 is mainly realized by the processing of the CPU 301, and generates screen data and voice recording data (voice recording information) to be displayed on the input terminal 8 and the viewing terminal 9 based on the voice analysis result information transmitted by the voice analysis server. In this embodiment, the generation unit 38 functions as an example of a generation means.
記憶読出部39は、主に、ROM302、EEPROM304及びHD305のうち少なくとも一つに対するCPU301の処理によって実現され、記憶部3000に各種データ(又は情報)を記憶したり、記憶部3000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部39は、記憶読出手段の一例として機能する。 The memory/read unit 39 is mainly realized by the processing of the CPU 301 on at least one of the ROM 302, EEPROM 304, and HD 305, and stores various data (or information) in the memory unit 3000 and reads various data (or information) from the memory unit 3000. In this embodiment, the memory/read unit 39 functions as an example of a memory/reading means.
<音声解析サーバの機能構成>
図4Cに示されているように、音声解析サーバ4は、送受信部41、解析部45、登録部46及び記憶読出部49を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM402、EEPROM404及びHD405のうち少なくとも一つからRAM403に展開された音声解析サーバ4用のプログラムに従ったCPU401からの命令により動作することで実現される機能又は手段である。また、音声解析サーバ4は、図2に示されているROM402、EEPROM404及びHD405のうち少なくとも一つにより構築される記憶部4000を有している。更に、記憶部4000には、音声記録管理装置3と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)等が記憶されている。
<Functional configuration of the voice analysis server>
As shown in Figure 4C, the voice analysis server 4 has a transmission/reception unit 41, an analysis unit 45, a registration unit 46, and a storage/readout unit 49. Each of these functional units is a function or means realized by any of the hardware resources shown in Figure 2 operating in response to an instruction from the CPU 401 in accordance with a program for the voice analysis server 4 that is loaded from at least one of the ROM 402, EEPROM 404, and HD 405 to the RAM 403. The voice analysis server 4 also has a memory unit 4000 constructed from at least one of the ROM 402, EEPROM 404, and HD 405 shown in Figure 2. Furthermore, the memory unit 4000 stores a communication program (communication application) and the like for communicating with the voice recording management device 3 via the communication network 100.
●認識パターン●
図12は、認識パターンの一例を示す概念図である。記憶部4000には、図12に示されているような一以上の認識パターンが記憶、管理されている。本実施形態において、認識パターンは以下のようなデータ構造をもつ。例えば、認識パターン識別情報「R0001」、「R0002」等ごとに、(1)記録種別、(2)作業対象、(3)作業項目、(4)作業結果が対応付けられて管理される。具体的には、
・認識パターン識別情報「R0001」のとき、
(1)記録種別・・・[申し送り/介護記録]
(2)作業対象・・・<名前>[さん/様]
(3)作業項目・・・[項目名]
(4)作業結果・・・[項目値]
・認識パターン識別情報「R0002」のとき、
(1)記録種別・・・<名前>[さん/様]
(2)作業対象・・・[項目名]
(3)作業項目・・・[項目値]
(4)作業結果・・・[申し送り/介護記録]
とするそれぞれの対応付けで管理される。
●Recognition pattern●
FIG. 12 is a conceptual diagram showing an example of a recognition pattern. One or more recognition patterns as shown in FIG. 12 are stored and managed in the storage unit 4000. In this embodiment, the recognition pattern has the following data structure. For example, for each recognition pattern identification information "R0001", "R0002", etc., (1) record type, (2) work target, (3) work item, and (4) work result are associated and managed. Specifically,
・When the recognition pattern identification information is "R0001",
(1) Record type: [Transfer/care record]
(2) Work target: <Name> [san/sama]
(3) Work item... [item name]
(4) Work result... [item value]
・When the recognition pattern identification information is "R0002",
(1) Record type: <Name> [san/sama]
(2) Work target... [item name]
(3) Work item...[Item value]
(4) Work results: [Handover/Care Record]
The data is managed by associating each of these.
ここで、解析サーバ4が認識パターンを用いて所定の音声情報を解析する際の処理イメージの一例を以下に示す。例えば、介護士(作業者)が通話機7(インカム)を用いて、
「介護記録 理光さん、血圧 114の60」
と発話した場合に、解析サーバ4が行う処理について以下に説明する。まず、解析サーバ4は、
・発話された音声情報から、「介護記録」というキーワードを検出する。
・続いて、解析サーバ4は、「介護記録」というキーワードが、登録されている認識パターンの(1)記録種別に合致することを確認するので、
・次のキーワードである「理光さん」を検知し、「理光」を(2)作業対象の<名前>として認識する。
・更に、次のキーワードである「血圧」を検出し、「血圧」を(3)作業結果の<項目名>として認識する。
・更に、次のキーワードである「114の60」を検出し、「114の60」を(4)作業結果の<項目値>として認識する。
Here, an example of a processing image when the analysis server 4 analyzes predetermined voice information using a recognition pattern is shown below. For example, a caregiver (worker) uses a communication device 7 (intercom) to
"Nursing record: Rikiko, blood pressure 114/60"
The process performed by the analysis server 4 when the user utters the following will be described below.
- Detect the keyword "care record" from the spoken audio information.
Next, the analysis server 4 confirms that the keyword "care record" matches the (1) record type of the registered recognition pattern.
・Detects the next keyword, "Rikou-san," and recognizes "Rikou" as (2) the name of the work target.
・Furthermore, the next keyword, "blood pressure," is detected, and "blood pressure" is recognized as the <item name> of the work result (3).
・Furthermore, the next keyword, “60 of 114”, is detected, and “60 of 114” is recognized as the <item value> of the work result (4).
このように、解析サーバ4は、発話された音声情報をテキストに変換した後、変換されたキーワード(成分)を一つずつ解析したそれぞれの解析結果と、登録されている認識パターン中の各項目と、を評価して、音声解析結果情報を得る。 In this way, the analysis server 4 converts the spoken voice information into text, then analyzes each of the converted keywords (components) one by one, evaluates the analysis results, and each item in the registered recognition pattern, to obtain voice analysis result information.
<<音声解析サーバの各機能構成>>
次に、音声解析サーバ4の各機能構成について詳細に説明する。図4Cに示されている音声解析サーバ4の送受信部41は、主に、ネットワークI/F411及び近距離通信I/F408に対するCPU401の処理によって実現され、通信ネットワーク100を介して音声記録管理装置3との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部41は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
<<Functional configuration of the voice analysis server>>
Next, a detailed description will be given of each functional configuration of the voice analysis server 4. The transmission/reception unit 41 of the voice analysis server 4 shown in Fig. 4C is mainly realized by processing of the CPU 401 on the network I/F 411 and the short-range communication I/F 408, and transmits and receives various data (or information) to and from the voice recording management device 3 via the communication network 100. In this embodiment, the transmission/reception unit 41 functions as an example of at least one of a transmitting means and a receiving means.
解析部45は、主に、CPU401の処理によって実現され、音声記録管理装置3が送信した音声解析要求に対して、記憶部4000の所定領域に登録、管理された認識パターンを用いてテキスト情報に変換する。本実施形態において、解析部45は、解析手段の一例として機能する。 The analysis unit 45 is mainly realized by the processing of the CPU 401, and converts a voice analysis request sent by the voice recording management device 3 into text information using recognition patterns registered and managed in a specified area of the storage unit 4000. In this embodiment, the analysis unit 45 functions as an example of analysis means.
登録部46は、主にCPU401の処理によって実現され、音声解析サーバ4に対して送信された一以上の認識パターン、音声解析結果等の各種データ(情報)を、記憶部4000の所定領域に記憶、登録する。本実施形態において、登録部46は、登録手段の一例として機能する。 The registration unit 46 is realized mainly by processing by the CPU 401, and stores and registers various data (information) such as one or more recognition patterns and voice analysis results transmitted to the voice analysis server 4 in a predetermined area of the storage unit 4000. In this embodiment, the registration unit 46 functions as an example of a registration means.
記憶読出部49は、主に、ROM402、EEPROM404及びHD405のうち少なくとも一つに対するCPU401の処理によって実現され、記憶部4000に各種データ(又は情報)を記憶したり、記憶部4000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部49は、記憶読出手段の一例として機能する。 The memory/read unit 49 is mainly realized by the CPU 401's processing of at least one of the ROM 402, EEPROM 404, and HD 405, and stores various data (or information) in the memory unit 4000 and reads various data (or information) from the memory unit 4000. In this embodiment, the memory/read unit 49 functions as an example of a memory/reading means.
<音声通信管理装置の機能構成>
図4Cに示されているように、音声通信管理装置5は、送受信部51、取得部53、情報管理部56及び記憶読出部59を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM502、EEPROM504及びHD505のうち少なくとも一つからRAM503に展開された音声通信管理装置5用のプログラムに従ったCPU401からの命令により動作することで実現される機能又は手段である。また、音声通信管理装置5は、図2に示されているROM502、EEPROM504及びHD505のうち少なくとも一つにより構築される記憶部5000を有している。更に、記憶部5000には、音声記録管理装置3、入力端末8及び閲覧用端末9とそれぞれ通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)等が記憶されている。
<Functional configuration of the voice communication management device>
As shown in Figure 4C, the voice communication management device 5 has a transceiver unit 51, an acquisition unit 53, an information management unit 56, and a storage/readout unit 59. Each of these functional units is a function or means realized when any of the hardware resources shown in Figure 2 operates in response to commands from the CPU 401 in accordance with a program for the voice communication management device 5 that is loaded from at least one of the ROM 502, EEPROM 504, and HD 505 to the RAM 503. The voice communication management device 5 also has a memory unit 5000 constructed from at least one of the ROM 502, EEPROM 504, and HD 505 shown in Figure 2. Furthermore, the memory unit 5000 stores communication programs (communication applications) and the like for communicating with the voice recording management device 3, the input terminal 8, and the viewing terminal 9 via the communication network 100.
●ユーザ情報管理テーブル●
図13は、ユーザ情報管理テーブルの一例を示す概念図である。記憶部5000には、図13に示されているようなユーザ情報管理テーブルによって構成されたユーザ情報管理DB5001が構築されている。ユーザ情報管理テーブルでは、テナント識別情報及びグループ識別情報を一組のタブとするそれぞれのタブで分けられた利用者識別情報ごとに、パスワード、メールアドレスを含む各項目が関連付けられて記憶、管理されている。
●User information management table●
Fig. 13 is a conceptual diagram showing an example of a user information management table. A user information management DB 5001 configured by the user information management table shown in Fig. 13 is constructed in the storage unit 5000. In the user information management table, each item including a password and an email address is associated with and stored and managed for each user identification information grouped by tabs, each tab consisting of tenant identification information and group identification information.
これらのうち、パスワードは利用者識別情報を有する利用者が利用可能なパスワードであり、メールアドレスは利用者識別情報を有する利用者の電子メールの宛先情報であり、例えば、「u01@aaa.com」等で与えられる。 Of these, the password is a password that can be used by a user who has user identification information, and the email address is the email address information of a user who has user identification information, and is given as, for example, "u01@aaa.com".
●音声情報管理テーブル●
図14は、音声情報管理テーブルの一例を示す概念図である。記憶部5000には、図14に示されているような音声情報管理テーブルによって構成された音声情報管理DB5002が構築されている。音声情報管理テーブルでは、利用者識別情報ごとに、音声データのパス、発話日時が対応付けられて記憶、管理されている。
●Audio information management table●
Fig. 14 is a conceptual diagram showing an example of a voice information management table. A voice information management DB 5002 configured by the voice information management table shown in Fig. 14 is constructed in the storage unit 5000. In the voice information management table, the path of the voice data and the date and time of the speech are stored and managed in association with each piece of user identification information.
これらのうち、音声データのパスは、利用者は発話した発話内容を音声通信管理装置5で管理するためのデータ(ファイル)パスを示すもので、例えば、「<filepath>●●●.wav
」等で与えられる。発話日時は、利用者(作業者)が発話をした日時が管理され、日付情報で与えられる。
Among these, the voice data path indicates the data (file) path for managing the contents of the user's speech in the voice communication management device 5, and for example, "<filepath>●●●.wav
The utterance date and time is managed as the date and time when the user (worker) made an utterance, and is given as date information.
<<音声通信管理装置の各機能構成>>
次に、音声通信管理装置5の各機能構成について詳細に説明する。図4Cに示されている音声通信管理装置5の送受信部51は、主に、ネットワークI/F511及び近距離通信I/F508に対するCPU501の処理によって実現され、通信ネットワーク100を介して音声記録管理装置3、入力端末8及び閲覧用端末9との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部51は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
<<Functional configuration of the voice communication management device>>
Next, a detailed description will be given of each functional configuration of the voice communication management device 5. The transmission/reception unit 51 of the voice communication management device 5 shown in Fig. 4C is mainly realized by the processing of the CPU 501 on the network I/F 511 and the short-range communication I/F 508, and transmits and receives various data (or information) between the voice recording management device 3, the input terminal 8, and the viewing terminal 9 via the communication network 100. In this embodiment, the transmission/reception unit 51 functions as an example of at least one of a transmitting means and a receiving means.
取得部53は、主に、CPU501の処理によって実現され、音声記録管理装置3による音声データの定期的な問合せ(取得要求)に応じて、入力端末8により送信され、記憶部5000の所定領域に保存された音声データを取得する。本実施形態において、取得部53は、取得手段の一例として機能する。 The acquisition unit 53 is mainly realized by the processing of the CPU 501, and acquires audio data transmitted by the input terminal 8 and stored in a specified area of the storage unit 5000 in response to periodic inquiries (acquisition requests) for audio data from the audio recording management device 3. In this embodiment, the acquisition unit 53 functions as an example of an acquisition means.
情報管理部56は、主に、CPU501の処理によって実現され、入力端末8が送信した利用者識別情報に基づいて、ユーザ情報管理DB5001に登録、管理されたユーザ情報を管理、確認する。本実施形態において、情報管理部56は、管理手段の一例として機能する。 The information management unit 56 is primarily realized by the processing of the CPU 501, and manages and checks the user information registered and managed in the user information management DB 5001 based on the user identification information transmitted by the input terminal 8. In this embodiment, the information management unit 56 functions as an example of a management means.
記憶読出部59は、主に、ROM502、EEPROM504及びHD505のうち少なくとも一つに対するCPU501の処理によって実現され、記憶部5000に各種データ(又は情報)を記憶したり、記憶部5000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部59は、記憶読出手段の一例として機能する。 The memory/read unit 59 is mainly realized by the CPU 501's processing of at least one of the ROM 502, EEPROM 504, and HD 505, and stores various data (or information) in the memory unit 5000 and reads various data (or information) from the memory unit 5000. In this embodiment, the memory/read unit 59 functions as an example of a memory/reading means.
〔実施形態の処理又は動作〕
次に、図15乃至図25を用いて、実施形態に係る音声記録管理システムにおける各処理又は動作を説明する。なお、以降に説明する各シーケンス図において、各装置間での通信は、所定の手順による各種認証処理、セッション確立のための処理等が成功し、互いに通信可能な状態であることを前提とする。更に、各装置においては、通信ネットワーク100を介した通信におけるブラウザの起動処理、所定のアプリの起動処理等も実行済みであることを前提とする。
[Processing or Operation of the Embodiment]
Next, each process or operation in the voice recording management system according to the embodiment will be described using Figures 15 to 25. Note that in each sequence diagram described below, communication between each device is assumed to be in a state where communication is possible with each other after various authentication processes according to predetermined procedures, processes for establishing a session, etc. have been successfully completed. Furthermore, it is assumed that each device has already executed processes such as launching a browser and launching a predetermined application for communication via the communication network 100.
<認識パターンの登録処理>
まず、認識パターンの登録処理について説明する。図15は、認識パターンの登録処理の一例を示すシーケンス図である。登録管理用端末2の操作受付部22は、例えば管理者によってキーボード212及びポインティングデバイス213の少なくとも一方を用いて入力された、認識パターン登録指示を受け付ける(ステップS11)。具体的には、操作受付部22は、管理者の操作によってxml, csv等のファイルフォーマットが付与された認識パターン登録用ファイルのアップロード操作の受付、所定のURLの入力等による操作の受付を行う。上述した認識パターン登録用ファイルは、図5で示した認識パターン項目管理テーブルに記載された項目名を含み、この項目名の登録順序を変えた内容が、それぞれ記載パターン識別情報と対応付けて管理されることになる。なお、認識パターン登録用ファイルは、上述したファイル形式に限らず、例えば図5で示したようなデータテーブルの形式で保存、管理されてもよい。
<Recognition pattern registration process>
First, the recognition pattern registration process will be described. FIG. 15 is a sequence diagram showing an example of the recognition pattern registration process. The operation reception unit 22 of the registration management terminal 2 receives a recognition pattern registration instruction, for example, input by an administrator using at least one of the keyboard 212 and the pointing device 213 (step S11). Specifically, the operation reception unit 22 receives an operation to upload a recognition pattern registration file given a file format such as xml or csv by the administrator, and receives an operation such as input of a predetermined URL. The above-mentioned recognition pattern registration file includes the item names listed in the recognition pattern item management table shown in FIG. 5, and the contents of the item names with their registration order changed are managed in association with the respective written pattern identification information. Note that the recognition pattern registration file is not limited to the above-mentioned file format and may be saved and managed in the form of a data table, for example, as shown in FIG. 5.
次に、送受信部21は、ステップS11で受け付けた認識パターンを音声記録管理装置3に対して送信する(ステップS12)。これにより、音声記録管理装置3の送受信部31は、登録管理用端末2が送信した認識パターン登録用ファイルの内容としての認識パターンを受信する。このとき認識パターンには、認識パターン識別情報、並びに、認識パターンを構成する記録種別、作業対象、作業項目及び作業結果が含まれる。これらの認識パターンの内容は、介護記録、申し送り等の介護、医療等の現場で行われるさまざまな行為に関係する内容が含まれる。 Next, the transmitter/receiver 21 transmits the recognition pattern received in step S11 to the voice recording management device 3 (step S12). As a result, the transmitter/receiver 31 of the voice recording management device 3 receives the recognition pattern as the contents of the recognition pattern registration file transmitted by the registration management terminal 2. At this time, the recognition pattern includes recognition pattern identification information, as well as the record type, task target, task item, and task result that constitute the recognition pattern. The contents of these recognition patterns include content related to various actions performed in the field of nursing care, medical care, etc., such as care records and handovers.
次に、音声記録管理装置3の送受信部31は、音声解析サーバ4に対して認識パターン登録要求を送信する(ステップS13)。これにより、音声解析サーバ4の送受信部41は、音声記録管理装置3が送信した認識パターン登録要求を受信する。このとき、認識パターン登録要求には、ステップS12で受信した認識パターンを構成する記録種別、作業対象、作業項目及び作業結果が含まれる。 Next, the transmission/reception unit 31 of the voice recording management device 3 transmits a recognition pattern registration request to the voice analysis server 4 (step S13). As a result, the transmission/reception unit 41 of the voice analysis server 4 receives the recognition pattern registration request transmitted by the voice recording management device 3. At this time, the recognition pattern registration request includes the recording type, task target, task item, and task result that constitute the recognition pattern received in step S12.
次に、音声解析サーバ4の登録部46は、ステップS13で受信した認識パターンを記憶部4000の所定領域に登録する(ステップS14)。 Next, the registration unit 46 of the voice analysis server 4 registers the recognition pattern received in step S13 in a predetermined area of the memory unit 4000 (step S14).
続いて、送受信部41は、認識パターン登録要求に対する応答として、音声記録管理装置3に対して認識パターン登録応答を送信する(ステップS15)。これにより、音声記録管理装置3は、音声解析サーバ4が送信した認識パターン登録応答を受信する。この認識パターン登録応答は、一般的に使用される応答メッセージ、応答フラグ等を含み、認識パターン登録要求に対して正常に処理が行われたことを示す情報であれば特に制約は設けない。 Next, the transmitter/receiver 41 transmits a recognition pattern registration response to the voice recording management device 3 in response to the recognition pattern registration request (step S15). As a result, the voice recording management device 3 receives the recognition pattern registration response transmitted by the voice analysis server 4. This recognition pattern registration response includes commonly used response messages, response flags, etc., and there are no particular restrictions on the information as long as it indicates that the recognition pattern registration request has been successfully processed.
次に、音声記録管理装置3の登録部36は、ステップS12で受信した認識パターンに基づいて、認識パターン項目を登録する(ステップS16)。具体的には、登録部36は、認識パターン項目管理DB3001(図5参照)に対して、認識パターン識別情報に対応させて、受信した認識パターンを登録順序ごとに各項目名に分けて登録する。このステップS16で登録される認識パターン項目は、音声解析サーバ4が解析した結果に対して実行する際のキーワード定義と同義である。 Next, the registration unit 36 of the voice recording management device 3 registers recognition pattern items based on the recognition patterns received in step S12 (step S16). Specifically, the registration unit 36 registers the received recognition patterns in the recognition pattern item management DB 3001 (see Figure 5) by separating them into item names in the order of registration, corresponding to the recognition pattern identification information. The recognition pattern items registered in step S16 are synonymous with keyword definitions used when the voice analysis server 4 executes the analysis results.
続いて、登録部36は、認識パターン識別情報を登録する(ステップS17)。具体的には、登録部36は、認識パターン識別管理DB3002(図6参照)に対して、テナント識別情報及びグループ識別情報に対応させて、登録した認識パターンに対応付けられた認識パターン識別情報を登録する。認識パターン識別管理DB3002では、例えば、テナント識別情報「T0001」及びグループ識別情報「G0001」に対応して認識パターン識別情報「R0001」、「R0002」の二つが登録されている。これは、テナント識別情報「T0001」を有するテナント、及びグループ識別情報「G0001」を有するグループに所属する利用者が、「R0001」、「R0002」の二つの認識パターン識別情報を有する各認識パターンのいずれかを利用して、介護、看護等の現場における発話を解析させ、音声記録情報を登録することが可能となっていることを意味している。 The registration unit 36 then registers the recognition pattern identification information (step S17). Specifically, the registration unit 36 registers the recognition pattern identification information associated with the registered recognition pattern in the recognition pattern identification management DB 3002 (see FIG. 6) in association with the tenant identification information and group identification information. For example, in the recognition pattern identification management DB 3002, two pieces of recognition pattern identification information, "R0001" and "R0002," are registered in association with tenant identification information "T0001" and group identification information "G0001." This means that users belonging to a tenant with tenant identification information "T0001" and a group with group identification information "G0001," can use either of the recognition patterns with the two recognition pattern identification information "R0001" and "R0002" to analyze speech in caregiving, nursing, and other settings and register audio recording information.
次に、送受信部31は、ステップS12に対する通知として、登録管理用端末2に対して完了通知を送信する(ステップS18)。これにより、登録管理用端末2の送受信部21は、音声記録管理装置3が送信した完了通知を受信する。 Next, the transmitter/receiver unit 31 sends a completion notification to the registration management terminal 2 as a notification in response to step S12 (step S18). As a result, the transmitter/receiver unit 21 of the registration management terminal 2 receives the completion notification sent by the voice recording management device 3.
本実施形態に係る通信システムでは、例えば、上述したステップS12及びS18の処理が実行される場合、登録管理用端末2と音声記録管理装置3との間に他の装置等が存在してもよい。つまり、登録管理用端末2と音声記録管理装置3との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、登録管理用端末2と音声記録管理装置3との間に他の処理ステップが存在しても適用可能である。 In the communication system according to this embodiment, for example, when the processing of steps S12 and S18 described above is performed, other devices may exist between the registration management terminal 2 and the voice recording management device 3. In other words, each piece of information (data) sent and received between the registration management terminal 2 and the voice recording management device 3 may be configured to be sent and received once via another device. The above-described configuration is applicable even if other processing steps exist between the registration management terminal 2 and the voice recording management device 3.
本実施形態に係る通信システムでは更に、例えば、上述したステップS13及びS15の処理が実行される場合、音声記録管理装置3と音声解析サーバ4との間に他の装置等が存在してもよい。つまり、音声記録管理装置3と音声解析サーバ4との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声記録管理装置3と音声解析サーバ4との間に他の処理ステップが存在しても適用可能である。 Furthermore, in the communication system according to this embodiment, for example, when the processing of steps S13 and S15 described above is performed, other devices may exist between the voice recording management device 3 and the voice analysis server 4. In other words, each piece of information (data) sent and received between the voice recording management device 3 and the voice analysis server 4 may be configured to be sent and received once via another device. The above-described configuration is applicable even if other processing steps exist between the voice recording management device 3 and the voice analysis server 4.
<類義語の登録処理>
次に、類義語の登録処理について説明する。図16は、類義語の登録処理の一例を示すシーケンス図である。認識パターンの登録処理と同様に、登録管理用端末2の操作受付部22は、例えば管理者によってキーボード212及びポインティングデバイス213の少なくとも一方を用いて入力された類義語登録指示を受け付ける(ステップS21)。具体的には、操作受付部22は、管理者の操作によってxml, csv等のファイルフォーマットが付与された類義語登録用ファイルのアップロード操作の受付、所定のURLの入力等による操作の受付を行う。上述した類義語登録用ファイルは、図7で示した類義語項目管理テーブルに記載された項目識別情報ごとに対応付けられた項目名キーワードに対して、その項目名キーワードに似た類義語が複数含まれる。なお、類義語登録用ファイルは、上述したファイル形式に限らず、例えば図7で示したようなデータテーブルの形式で保存、管理されてもよい。
<Synonym registration process>
Next, the synonym registration process will be described. FIG. 16 is a sequence diagram showing an example of the synonym registration process. Similar to the recognition pattern registration process, the operation reception unit 22 of the registration management terminal 2 receives a synonym registration instruction input by, for example, an administrator using at least one of the keyboard 212 and the pointing device 213 (step S21). Specifically, the operation reception unit 22 receives an operation to upload a synonym registration file given a file format such as xml or csv by the administrator, and an operation such as input of a predetermined URL. The synonym registration file described above includes multiple synonyms similar to the item name keywords associated with each item identification information listed in the synonym item management table shown in FIG. 7. Note that the synonym registration file is not limited to the file format described above and may be stored and managed in the format of a data table, for example, as shown in FIG. 7.
次に、送受信部21は、ステップS21で受け付けた類義語に係る類義語情報を音声記録管理装置3に対して送信する(ステップS22)。これにより、音声記録管理装置3の送受信部31は、登録管理用端末2が送信した類義語情報を受信する。このとき類義語情報には、各項目名キーワードに似た複数の類義語が含まれる。これらの類義語の内容は、介護記録、申し送り等の介護、医療等の現場で行われるさまざまな行為に関係し、上述した認識パターンを構成する項目名に似た内容が含まれる。 Next, the transmitter/receiver 21 transmits synonym information relating to the synonyms received in step S21 to the voice recording management device 3 (step S22). As a result, the transmitter/receiver 31 of the voice recording management device 3 receives the synonym information transmitted by the registration management terminal 2. At this time, the synonym information includes multiple synonyms similar to each item name keyword. The content of these synonyms relates to various actions performed in the field of care, medical care, etc., such as nursing records and handovers, and includes content similar to the item names that make up the recognition patterns described above.
次に、音声記録管理装置3の送受信部31は、音声解析サーバ4に対して類義語登録要求を送信する(ステップS23)。これにより、音声解析サーバ4の送受信部41は、音声記録管理装置3が送信した類義語登録要求を受信する。このとき、類義語情報登録要求には、ステップS22で受信した類義語情報が含まれる。 Next, the transmission/reception unit 31 of the voice recording management device 3 transmits a synonym registration request to the voice analysis server 4 (step S23). As a result, the transmission/reception unit 41 of the voice analysis server 4 receives the synonym registration request transmitted by the voice recording management device 3. At this time, the synonym information registration request includes the synonym information received in step S22.
次に、音声解析サーバ4の登録部46は、ステップS23で受信した類義語を記憶部4000の所定領域に登録する(ステップS24)。 Next, the registration unit 46 of the voice analysis server 4 registers the synonyms received in step S23 in a specified area of the memory unit 4000 (step S24).
続いて、送受信部41は、類義語情報登録要求に対する応答として、音声記録管理装置3に対して類義語情報登録応答を送信する(ステップS25)。これにより、音声記録管理装置3は、音声解析サーバ4が送信した類義語情報登録応答を受信する。この類義語情報登録応答は、一般的に使用される応答メッセージ、応答フラグ等を含み、認識パターン登録要求に対して正常に処理が行われたことを示す情報であれば特に制約は設けない。 Next, the transmitter/receiver 41 transmits a synonym information registration response to the voice recording management device 3 as a response to the synonym information registration request (step S25). As a result, the voice recording management device 3 receives the synonym information registration response transmitted by the voice analysis server 4. This synonym information registration response includes commonly used response messages, response flags, etc., and there are no particular restrictions on the information as long as it indicates that the recognition pattern registration request has been successfully processed.
次に、音声記録管理装置3の登録部36は、ステップS22で受信した類義語に基づいて、類義語を登録する(ステップS26)。具体的には、登録部36は、類義語管理DB3003(図7参照)に対して、項目識別情報ごとに与えられた項目名キーワードに対応させて、受信した複数の類義語を登録する。このステップS26の処理が実行される理由は、後述する解析結果を検索する際に、音声記録管理装置3自身が使用するためである。 Next, the registration unit 36 of the voice recording management device 3 registers synonyms based on the synonyms received in step S22 (step S26). Specifically, the registration unit 36 registers the received multiple synonyms in the synonym management DB 3003 (see Figure 7) in association with the item name keywords assigned to each item identification information. The reason for executing this process in step S26 is that the voice recording management device 3 itself will use the synonyms when searching for the analysis results, which will be described later.
次に、送受信部31は、ステップS22に対する通知として、登録管理用端末2に対して完了通知を送信する(ステップS27)。これにより、登録管理用端末2の送受信部21は、音声記録管理装置3が送信した完了通知を受信する。 Next, the transmitter/receiver unit 31 sends a completion notification to the registration management terminal 2 as a notification in response to step S22 (step S27). As a result, the transmitter/receiver unit 21 of the registration management terminal 2 receives the completion notification sent by the voice recording management device 3.
<音声解析処理>
次に、音声解析処理について説明する。図17は、音声情報(データ)の格納までの処理の一例を示すシーケンス図である。まず、入力端末8の操作受付部82は、利用者による音声指示を受け付ける(ステップS101)。具体的には、操作受付部82は、入力端末8を構成するユーザ端末6又はインカム等の通話機7に対して利用者が発話した、発話音声による音声指示(コマンド)を受け付ける。なお、本実施形態において、利用者は登録した認識パターンにしたがったパターンで発話をする必要がある。仮に、利用者が認識パターンに従わない発話を行うと、後述する認識パターンに合致しない処理において、利用者が使用する入力端末にエラー通知が送信されてしまうためである。但し、本実施形態ではそのような不都合を解消するために、テナント、グループ等に対応させたさまざまな認識パターンを事前に登録させておくことが可能なシステムが構築されている。
<Audio analysis processing>
Next, the voice analysis process will be described. FIG. 17 is a sequence diagram showing an example of the process up to the storage of voice information (data). First, the operation reception unit 82 of the input terminal 8 receives a voice instruction from the user (step S101). Specifically, the operation reception unit 82 receives a voice instruction (command) by speech uttered by the user to the user terminal 6 or the intercom or other communication device 7 constituting the input terminal 8. Note that in this embodiment, the user must speak in a pattern that conforms to the registered recognition pattern. If the user makes an utterance that does not conform to the recognition pattern, an error notification will be sent to the input terminal used by the user in the process that does not match the recognition pattern, as described below. However, in this embodiment, to resolve such inconvenience, a system is constructed that allows various recognition patterns corresponding to tenants, groups, etc. to be registered in advance.
次に、送受信部81は、受け付けた音声指示を表す音声データ(音声情報ともいう)を音声通信管理装置5に対して送信する(ステップS102)。これにより、音声通信管理装置5の送受信部51は、入力端末8が送信した音声データ(音声情報)を受信する。このとき、音声データ(音声情報)には、利用者が所属するテナントのテナント識別情報、更に利用者が所属するグループのグループ識別情報、利用者を識別する利用者識別情報及び利用者が発話した音声に係る音声データ(音声情報)が含まれる。ここで、テナント識別情報、グループ識別情報、利用者識別情報は、入力端末8にインストールされた音声通信アプリに予め登録済みである(ログイン認証の際に入力済みである)ことが前提である。なお、入力端末8は、音声通信アプリにログインした利用者識別情報を含むグループ(ルーム)の全ての利用者識別情報を音声記録管理装置3に対して送信してもよいし、グループ識別情報を送信してもよい。 Next, the transmitter/receiver 81 transmits voice data (also referred to as voice information) representing the received voice instruction to the voice communication management device 5 (step S102). As a result, the transmitter/receiver 51 of the voice communication management device 5 receives the voice data (voice information) transmitted by the input terminal 8. At this time, the voice data (voice information) includes tenant identification information of the tenant to which the user belongs, group identification information of the group to which the user belongs, user identification information identifying the user, and voice data (voice information) related to the voice spoken by the user. Here, it is assumed that the tenant identification information, group identification information, and user identification information have been registered in advance in the voice communication app installed on the input terminal 8 (entered during login authentication). Note that the input terminal 8 may transmit all user identification information of the group (room) including the user identification information logged in to the voice communication app to the voice recording management device 3, or may transmit group identification information.
続いて、音声通信管理装置5の情報管理部56は、ユーザ情報の確認を行う(ステップS103)。具体的には、情報管理部56は、ステップS102で受信したテナント識別情報及びグループ識別情報を検索キーとしてユーザ情報管理DB5001(図13参照)を検索することにより、対応する利用者識別情報ごとのパスワード、メールアドレス等の情報を読み出す。 Next, the information management unit 56 of the voice communication management device 5 confirms the user information (step S103). Specifically, the information management unit 56 searches the user information management DB 5001 (see FIG. 13) using the tenant identification information and group identification information received in step S102 as search keys, and reads information such as the password and email address for each corresponding user identification information.
次に、記憶読出部59は、ステップS102で受信した音声データを利用者識別情報に対応付けて音声情報管理DB5002(図14参照)に保存する(ステップS104)。このとき、音声通信管理装置5の送受信部51は、セッションが確立している音声記録管理装置3に対して、ステップS102で受信した利用者識別情報を送信しておいてもよい。 Next, the storage/reading unit 59 associates the voice data received in step S102 with the user identification information and stores it in the voice information management DB 5002 (see Figure 14) (step S104). At this time, the transmission/reception unit 51 of the voice communication management device 5 may transmit the user identification information received in step S102 to the voice recording management device 3 with which a session has been established.
ここで、音声記録管理装置3の記憶読出部39は、音声通信管理装置5に保存された音声データを取得するために、テナントグループ管理DB3004(図8参照)から、それぞれテナント識別情報及びグループ識別情報を読み出す(ステップS105)。 Here, the storage/reading unit 39 of the voice recording management device 3 reads the tenant identification information and group identification information from the tenant group management DB 3004 (see Figure 8) to obtain the voice data stored in the voice communication management device 5 (step S105).
次に、音声記録管理装置3による音声データの取得処理について説明する。以下に説明するステップS106-S108までの処理は、音声記録管理装置3及び音声通信管理装置5との間でのループ処理、音声記録管理装置3による音声通信管理装置5へのポーリング処理等が行われる。つまり、音声記録管理装置3が定期的に、音声通信管理装置5に対して音声データを取得しにいく。 Next, we will explain the process of acquiring voice data by the voice recording management device 3. The process from step S106 to S108, which will be described below, involves loop processing between the voice recording management device 3 and the voice communication management device 5, and polling of the voice communication management device 5 by the voice recording management device 3. In other words, the voice recording management device 3 periodically requests voice data from the voice communication management device 5.
まず、音声記録管理装置3の送受信部31は、音声通信管理装置5に対して音声データの問合せに係る問合せ情報を送信する(ステップS106)。これにより、音声通信管理装置5の送受信部51は、音声記録管理装置3が送信した音声データの問合せに係る問合せ情報を受信する。このとき、音声データの問合せに係る問合せ情報には、ステップS105で読み出されたテナント識別情報、グループ識別情報及び利用者識別情報が含まれる。 First, the transmitter/receiver unit 31 of the voice recording management device 3 transmits inquiry information related to the inquiry about the voice data to the voice communication management device 5 (step S106). As a result, the transmitter/receiver unit 51 of the voice communication management device 5 receives the inquiry information related to the inquiry about the voice data transmitted by the voice recording management device 3. At this time, the inquiry information related to the inquiry about the voice data includes the tenant identification information, group identification information, and user identification information read in step S105.
次に、音声通信管理装置5の取得部53は、音声情報管理DB5002(図14参照)に保存された音声データを取得する(ステップS107)。具体的には、取得部53は、記憶読出部59と協働して、利用者識別情報を検索キーとして音声情報管理DB5002(図14参照)を検索することにより、対応する音声データのパス、発話日時を読み出す。 Next, the acquisition unit 53 of the voice communication management device 5 acquires the voice data stored in the voice information management DB 5002 (see FIG. 14) (step S107). Specifically, the acquisition unit 53, in cooperation with the storage and reading unit 59, searches the voice information management DB 5002 (see FIG. 14) using the user identification information as a search key, thereby reading the path and speech date and time of the corresponding voice data.
次に、送受信部51は、音声データの問合せ応答として、音声記録管理装置3に対して音声データを送信する(ステップS108)。これにより、音声記録管理装置3の送受信部31は、音声通信管理装置5が送信した音声データを受信する。このとき、音声データの問合せ応答に係る問合せ応答情報として、利用者録識別情報、発話日時、音声データ又は音声データのパス情報が含まれる。 Next, the transmitter/receiver unit 51 transmits the voice data to the voice recording management device 3 as a response to the voice data inquiry (step S108). As a result, the transmitter/receiver unit 31 of the voice recording management device 3 receives the voice data transmitted by the voice communication management device 5. At this time, the inquiry response information relating to the voice data inquiry response includes user record identification information, the date and time of the speech, and the voice data or path information for the voice data.
また、上述したステップS106-S108までの処理では、音声記録管理装置3は、音声通信管理装置5に対して、音声データを受信したら直ちに次の音声データの問合せを送信するようにしてもよい。このとき、ステップS106で説明した音声データの問合せに係る問合せ情報に含まれる情報のうち、テナント識別情報及びグループ識別情報のうちいずれかによって検索するような処理方法であってもよい。更に、ステップS106のように音声記録管理装置3が音声データの問合せを行うのではなく、音声通信管理装置5が音声データを受信したら、音声データの問合せを受信する前に音声記録管理装置3に対して受信した音声データを送信するようにしてもよい。 Furthermore, in the processing of steps S106-S108 described above, the voice recording management device 3 may be configured to send a query for the next voice data to the voice communication management device 5 immediately upon receiving the voice data. At this time, a processing method may be used in which a search is performed using either tenant identification information or group identification information included in the query information related to the voice data query described in step S106. Furthermore, rather than the voice recording management device 3 querying for voice data as in step S106, upon receiving voice data, the voice communication management device 5 may be configured to send the received voice data to the voice recording management device 3 before receiving the query for voice data.
次に、音声記録管理装置3の記憶読出部39は、ステップS108で受信した音声データを記憶部3000の所定領域に格納(保存)する(ステップS109)。 Next, the storage/readout unit 39 of the voice recording management device 3 stores (preserves) the voice data received in step S108 in a specified area of the memory unit 3000 (step S109).
本実施形態に係る通信システムでは、例えば、上述したステップS106及びS108の処理が実行される場合、音声通信管理装置5と音声記録管理装置3との間に他の装置等が存在してもよい。つまり、音声通信管理装置5と音声記録管理装置3との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声通信管理装置5と音声記録管理装置3との間に他の処理ステップが存在しても適用可能である。 In the communication system according to this embodiment, for example, when the processing of steps S106 and S108 described above is performed, other devices may exist between the voice communication management device 5 and the voice recording management device 3. In other words, each piece of information (data) sent and received between the voice communication management device 5 and the voice recording management device 3 may be configured to be sent and received once via another device. The above-described configuration is applicable even if other processing steps exist between the voice communication management device 5 and the voice recording management device 3.
<合致する認識パターンが無い場合の音声解析処理>
次に、音声解析サーバ4による音声データの解析において、解析結果に合致する認識パターンが無い場合について説明する。図18は、合致する認識パターンが無い場合の音声解析処理の一例を示すシーケンス図である。まず、音声記録管理装置3の登録部36は、ステップS108で受信した音声データ又は音声データのパスを、音声記録管理DB3005(図9参照)で管理されている利用者識別情報に対応させて登録する(ステップS111)。
<Speech analysis process when there is no matching recognition pattern>
Next, we will explain what happens when there is no recognition pattern that matches the analysis results in the analysis of voice data by the voice analysis server 4. Figure 18 is a sequence diagram showing an example of voice analysis processing when there is no matching recognition pattern. First, the registration unit 36 of the voice recording management device 3 registers the voice data or the path of the voice data received in step S108 in association with the user identification information managed in the voice recording management DB 3005 (see Figure 9) (step S111).
次に、記憶読出部39は、テナント識別情報又はグループ識別情報を検索キーとして認識パターン識別管理DB3002(図6参照)を検索することにより、対応する一以上の認識パターン識別情報を読み出す(ステップS112)。この処理は、音声記録管理装置3が、テナント識別情報に対応した認識パターン識別情報を読み出す必要があるためである。 Next, the storage and reading unit 39 searches the recognition pattern identification management DB 3002 (see FIG. 6) using the tenant identification information or group identification information as a search key to read out one or more corresponding recognition pattern identification information (step S112). This process is performed because the voice recording management device 3 needs to read out the recognition pattern identification information that corresponds to the tenant identification information.
次に、送受信部31は、音声解析サーバ4に対して音声解析要求を送信する(ステップS113)。これにより、音声解析サーバ4の送受信部41は、音声記録管理装置3が送信した音声解析要求を受信する。このとき、音声解析要求には、発話音声を発した利用者が所属するテナントのテナント識別情報及びその利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた認識パターン識別情報と、ステップS108で受信し、ステップS109で格納した音声データ(発話音声に基づく音声情報)が含まれる。このときに音声記録管理装置3が音声解析サーバ4に対して送信する音声データ(発話音声に基づく音声情報)は、例えば、
「介護記録 理光さん 血圧 114の60」
である。
Next, the transmitting/receiving unit 31 transmits a voice analysis request to the voice analysis server 4 (step S113). As a result, the transmitting/receiving unit 41 of the voice analysis server 4 receives the voice analysis request transmitted by the voice recording management device 3. At this time, the voice analysis request includes recognition pattern identification information associated with at least one of the tenant identification information of the tenant to which the user who uttered the uttered voice belongs and the group identification information of the group to which the user belongs, and the voice data (voice information based on the uttered voice) received in step S108 and stored in step S109. At this time, the voice data (voice information based on the uttered voice) transmitted by the voice recording management device 3 to the voice analysis server 4 may be, for example,
"Nursing record: Rikiko's blood pressure 114/60"
is.
次に、音声解析サーバ4の解析部45は、ステップS113で受信した認識パターン識別情報及び音声データに対して、ステップS14の処理において保存した、認識パターン識別情報に対応する認識パターンを参照して、受信した音声データの音声解析を行う(ステップS114)。具体的には、例えば、解析部45は、入力した発話音声を構成する一つの音声情報を全てテキスト情報に変換し、登録した認識パターンのうち、どの認識パターンに合致するかを一つずつ解析する。 Next, the analysis unit 45 of the voice analysis server 4 performs voice analysis of the received voice data by referencing the recognition pattern corresponding to the recognition pattern identification information stored in the processing of step S14 for the recognition pattern identification information and voice data received in step S113 (step S114). Specifically, for example, the analysis unit 45 converts each piece of voice information constituting the input speech voice into text information, and analyzes each piece of voice information to determine which of the registered recognition patterns it matches.
次に、送受信部41は、音声解析応答を音声記録管理装置3に対して送信する(ステップS115)。これにより、音声記録管理装置3の送受信部31は、音声解析サーバ4が送信した音声解析応答を受信する。このとき、音声解析応答には、音声解析結果を示す音声解析結果情報、認識パターン識別情報が含まれる。更に、音声解析応答には、テキストデータ及び予め登録された認識パターンで抽出され、順番情報が付与されたキーワードのセットが含まれる。但し、音声解析結果情報には、認識パターン項目管理DB3001(図5参照)で管理されている「項目名」は含まれず、単語若しくは簡単な文字列が含まれる。ここで、音声解析サーバ4が音声記録管理装置3に対して送信する音声解析結果情報は、例えば、
{介護記録,理光,血圧,114の60}
である。
Next, the transmitting/receiving unit 41 transmits the voice analysis response to the voice recording management device 3 (step S115). As a result, the transmitting/receiving unit 31 of the voice recording management device 3 receives the voice analysis response transmitted by the voice analysis server 4. At this time, the voice analysis response includes voice analysis result information indicating the voice analysis result, and recognition pattern identification information. Furthermore, the voice analysis response includes text data and a set of keywords extracted from pre-registered recognition patterns and assigned with order information. However, the voice analysis result information does not include the "item name" managed in the recognition pattern item management DB 3001 (see FIG. 5), but includes words or simple character strings. Here, the voice analysis result information transmitted by the voice analysis server 4 to the voice recording management device 3 may be, for example,
{Nursing record, Riko, Blood pressure, 114 of 60}
is.
なお、音声記録管理装置3は、音声解析要求を送信する際に認識パターン識別情報を記憶しておき、音声解析要求に対する音声解析応答を受信したタイミングで記憶しておいた認識パターン識別情報に対応付けられた認識パターン(認識パターン項目管理DB3001(図5参照))に基づいて対応付けを行ってもよい。その場合は、音声解析サーバ4が解析のために使用した認識パターン識別情報を音声解析応答に含めなくてもよい。 The voice recording management device 3 may store the recognition pattern identification information when sending a voice analysis request, and perform the association based on the recognition pattern (recognition pattern item management DB 3001 (see Figure 5)) associated with the stored recognition pattern identification information when receiving a voice analysis response to the voice analysis request. In this case, the recognition pattern identification information used by the voice analysis server 4 for analysis does not need to be included in the voice analysis response.
続いて、音声記録管理装置3の判断部35は、ステップS115で受信した音声解析結果情報に対して、合致する認識パターンがあったかを判断する(ステップS116)。合致する認識パターンが無い場合(ステップS116:NO)、送受信部31は、音声通信管理装置5に対して、登録失敗通知を送信する(ステップS117)。これにより、音声通信管理装置5は、音声記録管理装置3が送信した登録失敗通知を受信する。このとき、登録失敗通知には、テナント識別情報、グループ識別情報、利用者識別情報及び登録失敗を表す登録失敗通知情報が含まれる。なお、登録失敗通知の内容は予め用意されたメッセージ等でもよい。 Next, the judgment unit 35 of the voice recording management device 3 determines whether there is a matching recognition pattern for the voice analysis result information received in step S115 (step S116). If there is no matching recognition pattern (step S116: NO), the transmission/reception unit 31 sends a registration failure notification to the voice communication management device 5 (step S117). As a result, the voice communication management device 5 receives the registration failure notification sent by the voice recording management device 3. At this time, the registration failure notification includes tenant identification information, group identification information, user identification information, and registration failure notification information indicating that registration has failed. The content of the registration failure notification may be a pre-prepared message, etc.
次に、音声通信管理装置5の送受信部51は、ステップS117で受信した登録失敗通知に含まれる音声データ(音声情報)を入力端末8に対して送信(転送)する(ステップS118)。これにより、入力端末8の送受信部81は、音声通信管理装置5が送信した音声データを受信する。このとき、音声通信管理装置5は、入力端末8に対してプッシュ通知(送信)によりデータ(情報)を通知(送信)してもよい。その場合、音声通信管理装置5は、例えば、プッシュ通知サーバの一例であるFCM(Firebase Cloud Messaging)を利用してプッシュ通知することで実現することが可能である。 Next, the transmitter/receiver 51 of the voice communication management device 5 transmits (transfers) the voice data (voice information) included in the registration failure notification received in step S117 to the input terminal 8 (step S118). As a result, the transmitter/receiver 81 of the input terminal 8 receives the voice data transmitted by the voice communication management device 5. At this time, the voice communication management device 5 may notify (transmit) the data (information) to the input terminal 8 by push notification. In this case, the voice communication management device 5 can achieve this by using, for example, FCM (Firebase Cloud Messaging), which is an example of a push notification server, to transmit the push notification.
次に、入力端末8の表示制御部84は、ディスプレイ807に登録失敗通知情報を表示する。さらに入力端末8の音声再生部86は、スピーカ819を介して登録失敗通知を音声で再生してもよい(ステップS119)。なお、入力端末8にエラー通知が表示された場合は、入力端末8を利用する利用者は、他の認識パターンにしたがった発話音声を、入力端末8に対して再度入力してもよい。 Next, the display control unit 84 of the input terminal 8 displays registration failure notification information on the display 807. Furthermore, the audio playback unit 86 of the input terminal 8 may play the registration failure notification aloud via the speaker 819 (step S119). Note that if an error notification is displayed on the input terminal 8, the user of the input terminal 8 may re-input speech into the input terminal 8 that conforms to a different recognition pattern.
本実施形態に係る通信システムでは、例えば、上述したステップS102及びS119の処理が実行される場合、入力端末8と音声通信管理装置5との間に他の装置等が存在してもよい。つまり、入力端末8と音声通信管理装置5との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、入力端末8と音声通信管理装置5との間に他の処理ステップが存在しても適用可能である。 In the communication system according to this embodiment, for example, when the processing of steps S102 and S119 described above is executed, other devices may exist between the input terminal 8 and the voice communication management device 5. In other words, each piece of information (data) sent and received between the input terminal 8 and the voice communication management device 5 may be configured to be sent and received once via another device. The above-described configuration is applicable even if other processing steps exist between the input terminal 8 and the voice communication management device 5.
本実施形態に係る通信システムでは更に、例えば、上述したステップS113及びS115の処理が実行される場合、音声記録管理装置3と音声解析サーバ4との間に他の装置等が存在してもよい。つまり、音声記録管理装置3と音声解析サーバ4との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声記録管理装置3と音声解析サーバ4との間に他の処理ステップが存在しても適用可能である。 Furthermore, in the communication system according to this embodiment, for example, when the processing of steps S113 and S115 described above is executed, other devices may be present between the voice recording management device 3 and the voice analysis server 4. In other words, each piece of information (data) sent and received between the voice recording management device 3 and the voice analysis server 4 may be configured to be sent and received once via another device. The above-described configuration is applicable even if other processing steps exist between the voice recording management device 3 and the voice analysis server 4.
●画面表示例●
次に、入力端末8に表示される画面表示例を説明する。図20(a)は、入力端末における指示入力の失敗通知の画面表示例、(b)は、入力端末における指示入力の成功通知の画面表示例である。図20(a)に示されるように、入力端末8のディスプレイ807には、表示制御部84によって、登録失敗通知画面8101が表示される。登録失敗通知画面8101には、例えば、音声記録の記録種別である「介護記録」と、入力した音声情報に対する解析が失敗したことを示す「入力エラー通知」のテキスト情報が表示される。更に、合致する認識パターンがなかったことを示すメッセージと、別の認識パターンによる指示、若しくは新たな認識パターンの再登録を促すメッセージが表示される。
●Screen display example●
Next, an example of a screen display displayed on the input terminal 8 will be described. Fig. 20(a) is an example of a screen display for notifying the user that an instruction has been successfully input on the input terminal, and Fig. 20(b) is an example of a screen display for notifying the user that an instruction has been successfully input on the input terminal. As shown in Fig. 20(a), a registration failure notification screen 8101 is displayed on the display 807 of the input terminal 8 by the display control unit 84. The registration failure notification screen 8101 displays, for example, the recording type of the voice recording, "care record," and text information of "input error notification" indicating that analysis of the input voice information failed. Furthermore, a message indicating that no matching recognition pattern was found and a message prompting the user to give instructions using a different recognition pattern or to re-register a new recognition pattern are displayed.
<合致する認識パターンがある場合の音声解析処理>
次に、音声解析サーバ4による音声データの解析において、解析結果に合致する認識パターンがある場合について説明する。図19は、合致する認識パターンがある場合の音声解析処理の一例を示すシーケンス図である。上述したステップS116の判断処理において、判断部35により合致する認識パターンがあると判断された場合(ステップS116:YES)、検索部37は、以下の処理を実行する。具体的には、検索部37は、ステップS115で受信した音声解析応答に含まれる音声解析結果情報に対して、受信した認識パターン識別情報を検索キーとして認識パターン項目管理DB3001(図5参照)を検索する。その後、検索部37は、認識パターン識別情報に対応する項目名と登録順序とを参照して、受信した音声解析結果情報の各項目名と項目値とを対応付ける(ステップS121)。具体的には、音声記録管理装置3は、認識パターン項目管理DB3001(図5参照)と上述した利用者の発話音声に対応発話音声データ(発話音声情報)をもとに、解析結果管理DB3006(図10参照)で管理される結果を対応付ける。具体的には、検索部37は、以下の処理を行う。すなわち、検索部37は、ステップS115で受信した、
{介護記録,理光,血圧,114の60}
の音声解析結果情報に対して、
・まず、1番目の「介護記録」を認識パターン識別情報:「R0001」に対応付けられた1番目の項目名の「記録種別」と対応付ける。つまり、「記録種別」→「介護記録」として対応付ける。
・次に、2番目の「理光」を認識パターン識別情報:「R0001」に対応付けられた2番目の項目名の「作業対象」と対応付ける。つまり、「作業対象」→「理光」として対応付ける。
・次に、3番目の「血圧」を認識パターン識別情報:「R0001」に対応付けられた3番目の項目名の「作業項目」と対応付ける。つまり、「作業項目」→「血圧」として対応付ける。
・最後に、4番目の「114の60」を認識パターン識別情報:「R0001」に対応付けられた4番目の項目名の「作業結果」と対応付ける。つまり、「作業結果」→「114の60」として対応付ける。
<Speech analysis process when a matching recognition pattern exists>
Next, a case will be described in which, in the analysis of voice data by the voice analysis server 4, there is a recognition pattern that matches the analysis result. FIG. 19 is a sequence diagram showing an example of voice analysis processing when there is a matching recognition pattern. In the determination processing of step S116 described above, if the determination unit 35 determines that there is a matching recognition pattern (step S116: YES), the search unit 37 executes the following processing. Specifically, the search unit 37 searches the recognition pattern item management DB 3001 (see FIG. 5 ) for the voice analysis result information included in the voice analysis response received in step S115 using the received recognition pattern identification information as a search key. Thereafter, the search unit 37 associates each item name and item value of the received voice analysis result information with each other by referring to the item name and registration order corresponding to the recognition pattern identification information (step S121). Specifically, the voice recording management device 3 associates the results managed in the analysis result management DB 3006 (see FIG. 10) with the recognition pattern item management DB 3001 (see FIG. 5) and the speech data (speech information) corresponding to the user's speech. Specifically, the search unit 37 performs the following process. That is, the search unit 37 performs the following process on the basis of the recognition pattern item management DB 3001 (see FIG. 5) and the speech data (speech information) corresponding to the user's speech.
{Nursing record, Riko, Blood pressure, 114 of 60}
For the voice analysis result information,
First, the first item "care record" is associated with the first item name "record type" associated with the recognition pattern identification information: "R0001." In other words, the association is made as "record type" → "care record."
Next, the second item "Riko" is associated with the second item name "Work object" associated with the recognition pattern identification information: "R0001." In other words, the association is made between "Work object" and "Riko."
Next, the third item, "blood pressure," is associated with the third item name, "work item," associated with the recognition pattern identification information: "R0001." In other words, the association is made between "work item" and "blood pressure."
Finally, the fourth item, "60 of 114," is associated with the fourth item, "Work result," associated with the recognition pattern identification information: "R0001." In other words, the association is made between "Work result" and "60 of 114."
このようにして、検索部37は、音声解析サーバ4が送信した音声解析結果情報に対して、音声記録管理装置3で登録、管理している認識パターンに対応させることができる。但し、上述した対応付け処理は一例であり、システムの仕様、プログラムの構成等に応じて、対応付けの順番を入れ替えてもよい。 In this way, the search unit 37 can match the voice analysis result information sent by the voice analysis server 4 with the recognition patterns registered and managed by the voice recording management device 3. However, the above-mentioned matching process is just one example, and the order of matching may be changed depending on the system specifications, program configuration, etc.
続いて、登録部36は、ステップS121で対応付けをした解析結果を、解析結果管理DB3006(図10参照)で管理されている「記録種別」、「作業対象」、「作業項目」、「作業結果」に対応付け、最後に音声記録識別情報を付与して登録する(ステップS122)。登録部36は更に、音声記録識別情報に対応付けられて管理されている、作業日時及び作業者を表す利用者識別情報もあわせて登録する。なお、音声記録識別情報を付与する時期は、作業日時及び利用者識別情報を対応付けた後でもかまわない。 The registration unit 36 then associates the analysis results associated in step S121 with the "recording type," "task target," "task item," and "task result" managed in the analysis result management DB 3006 (see FIG. 10), and finally assigns and registers the voice recording identification information (step S122). The registration unit 36 also registers the user identification information, which indicates the date and time of the work and the worker, and which is managed in association with the voice recording identification information. Note that the voice recording identification information may be assigned after the date and time of the work and the user identification information have been associated.
次に、記憶読出部39は、通知情報を読み出す(ステップS123)。具体的には、記憶読出部39は、音声記録識別情報を検索キーとして音声記録管理DB3005(図9参照)を検索することにより、音声記録識別情報が登録されているテナント識別情報及びグループ識別情報のタブで管理された、音声データのパス、利用者識別情報、登録日時を含む通知情報を読み出す。続いて、記憶読出部39は、記録種別を検索キーとして通知情報管理DB3007(図11参照)を検索することにより、対応する通知情報の音声データを読み出す。 Next, the storage and reading unit 39 reads the notification information (step S123). Specifically, the storage and reading unit 39 searches the voice recording management DB 3005 (see FIG. 9) using the voice recording identification information as a search key, and reads the notification information including the voice data path, user identification information, and registration date and time, which is managed under the tabs for the tenant identification information and group identification information in which the voice recording identification information is registered. Next, the storage and reading unit 39 searches the notification information management DB 3007 (see FIG. 11) using the recording type as a search key, and reads the voice data of the corresponding notification information.
次に、生成部38は、入力端末8に表示させる表示画面を生成する(ステップS124)。具体的には、生成部38は記憶読出部39と協働して、音声記録識別情報を検索キーとして解析結果管理DB3006(図10参照)を検索することにより、対応する「記録種別」、「作業対象」、「作業項目」、「作業結果」、「作業日時」及び「利用者識別情報」で示される各内容を読み出す。これにより、生成部38は、読み出された各項目と各内容とを対応付けて表示画面を生成する。その際、表示画面のテンプレートは、記憶部3000の所定領域に予め用意したものを使用してよい。 Next, the generation unit 38 generates a display screen to be displayed on the input terminal 8 (step S124). Specifically, the generation unit 38 works in cooperation with the storage and reading unit 39 to search the analysis result management DB 3006 (see FIG. 10) using the voice recording identification information as a search key, and reads out the corresponding content indicated by "record type," "task target," "task item," "task result," "task date and time," and "user identification information." The generation unit 38 then generates a display screen by associating each of the read-out items with each content. At this time, a display screen template prepared in advance in a specified area of the storage unit 3000 may be used.
次に送受信部31は、音声通信管理装置5に対して登録完了通知を送信する(ステップS125)。これにより、音声通信管理装置5の送受信部51は、音声記録管理装置3が送信した登録完了通知を受信する。このとき、登録完了通知には、テナント識別情報、グループ識別情報、利用者識別情報、音声記録情報が登録されたことを示す登録完了通知情報及びステップS124で生成した入力端末8に表示させる画面の画面データが含まれる。さらに、登録完了通知には、ステップS123で読み出した通知情報の音声データがふくまれてもよい。 Next, the transmitter/receiver 31 transmits a registration completion notification to the voice communication management device 5 (step S125). As a result, the transmitter/receiver 51 of the voice communication management device 5 receives the registration completion notification transmitted by the voice recording management device 3. At this time, the registration completion notification includes registration completion notification information indicating that the tenant identification information, group identification information, user identification information, and voice recording information have been registered, as well as screen data for the screen to be displayed on the input terminal 8 generated in step S124. Furthermore, the registration completion notification may include the voice data of the notification information read in step S123.
次に、音声通信管理装置5の送受信部51は、入力端末8に対して音声データ及び画面データを送信する(ステップS126)。 Next, the transmitter/receiver unit 51 of the voice communication management device 5 transmits the voice data and screen data to the input terminal 8 (step S126).
次に、入力端末8の音声再生部86は、ステップS126で受信した音声データを、スピーカ819を介して音声出力(再生)する。また、表示制御部84は、ステップS126で受信した画面データを、ディスプレイ807に表示させる(ステップS127)。なお、入力端末8において、音声データの再生及び画面データの表示は、いずれか一方でもかまわない。また、音声データの再生時に、利用者(作業者)が発話したキーワードの数と同じ数の音を鳴動させるなどのアンサーバック機能を用いてもよい。 Next, the audio playback unit 86 of the input terminal 8 outputs (plays) the audio data received in step S126 via the speaker 819. The display control unit 84 also displays the screen data received in step S126 on the display 807 (step S127). Note that the input terminal 8 may either play the audio data or display the screen data. Furthermore, when playing back the audio data, an answerback function may be used, such as sounding the same number of sounds as the number of keywords spoken by the user (worker).
●画面表示例●
次に、入力端末8に表示される画面表示例を説明する。図20(b)は、入力端末における指示入力の成功通知の画面表示例である。図20(b)に示されるように、入力端末8のディスプレイ807には、表示制御部84によって、登録完了通知画面8102が表示される。登録完了通知画面8102には、例えば、音声記録の記録種別である「介護記録」と、入力した音声情報に対する解析が完了したことを示す「入力完了通知」のテキスト情報が表示される。更に、指示された認識パターンで介護記録の登録が完了したことを示すメッセージが表示される。
●Screen display example●
Next, an example of a screen display displayed on the input terminal 8 will be described. Fig. 20(b) is an example of a screen display for notifying the success of instruction input on the input terminal. As shown in Fig. 20(b), a registration completion notification screen 8102 is displayed on the display 807 of the input terminal 8 by the display control unit 84. The registration completion notification screen 8102 displays, for example, the recording type of the voice recording, "care record," and text information of "input completion notification" indicating that analysis of the input voice information has been completed. Furthermore, a message indicating that registration of the care record has been completed using the specified recognition pattern is displayed.
●画面表示例●
次に、閲覧用端末9に表示される画面表示例を説明する。図21は、閲覧用端末における介護記録確認通知の画面表示例である。図21に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、介護記録確認通知画面9101が表示される。介護記録確認通知画面9101には、例えば、介護の「作業対象」を示す「理光」の名前、「作業日時」を示す日付、「作業項目」を示す「血圧」及び「作業結果」を示す血圧値がそれぞれ表示される。この場合は、朝7:00と夜18:00の2回のデータが表示され、朝のデータの表示欄にはコピーボタン9151、夜のデータの表示欄にはコピーボタン9152がそれぞれ表示される。閲覧用端末9を閲覧する閲覧者は、これらの各コピーボタンを操作することで、「介護記録ソフトに転記」と表示されている処理が実行され、作業者(利用者)によって発話された介護記録に関する発話音声を音声記録情報として、介護記録ソフトに残すことができる。
●Screen display example●
Next, an example of a screen display displayed on the viewing terminal 9 will be described. FIG. 21 illustrates an example of a screen display of a care record confirmation notification on the viewing terminal. As shown in FIG. 21 , a care record confirmation notification screen 9101 is displayed by the display control unit 94 on the display 907 of the viewing terminal 9. The care record confirmation notification screen 9101 displays, for example, the name of "Rikou" indicating the "work target" of the care, the date indicating the "work date and time,""bloodpressure" indicating the "work item," and blood pressure values indicating the "work result." In this case, two sets of data, 7:00 a.m. and 6:00 p.m., are displayed. A copy button 9151 is displayed in the display field for the morning data, and a copy button 9152 is displayed in the display field for the evening data. A viewer viewing the viewing terminal 9 can operate each of these copy buttons to execute a process indicated as "transcribe to care record software," thereby saving the spoken voice of the worker (user) regarding the care record as voice recording information in the care record software.
●画面表示例●
次に、閲覧用端末9に表示される画面表示例を説明する。図22は、閲覧用端末における申し送り確認通知の画面表示例である。図22に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、申し送り確認通知画面9111が表示される。申し送り確認通知画面9111には、例えば、申し送りの内容として、「作業対象」を示す「理光」の名前、及び申し送り内容が表示される。この場合は、点滴をしたためシャワーにする内容が表示され、あわせてコピーボタン9161が表示される。閲覧用端末9を閲覧する閲覧者は、このコピーボタン9161を操作することで、「介護記録ソフトに転記」と表示されている処理が実行され、作業者(利用者)によって発話された申し送りに関する発話音声を音声記録情報として、介護記録ソフトに残すことができる。
●Screen display example●
Next, an example of a screen display displayed on the viewing terminal 9 will be described. FIG. 22 is an example of a screen display of a handover confirmation notice on the viewing terminal. As shown in FIG. 22 , a handover confirmation notice screen 9111 is displayed by the display control unit 94 on the display 907 of the viewing terminal 9. The handover confirmation notice screen 9111 displays, for example, the name of "Rikou" indicating the "work target" and the handover content as the handover content. In this case, the content that a shower will be performed after an IV drip is displayed, along with a copy button 9161. A viewer viewing the viewing terminal 9 can operate this copy button 9161 to execute a process displayed as "transcribe to nursing care record software," and the spoken voice of the worker (user) regarding the handover can be saved in the nursing care record software as audio recording information.
<検索処理>
次に、音声解析結果を検索する検索処理について説明する。図23は、検索処理及び音声記録処理の一例を示すシーケンス図である。まず、閲覧用端末9の操作受付部92は、利用者(閲覧者)の操作による検索条件入力を受け付ける(ステップS131)。
<Search processing>
Next, a search process for searching the voice analysis results will be described. Fig. 23 is a sequence diagram showing an example of the search process and the voice recording process. First, the operation accepting unit 92 of the browsing terminal 9 accepts search condition input by operation of the user (browser) (step S131).
次に、送受信部91は、音声記録管理装置3に対して、検索要求を送信する(ステップS132)。これにより、音声記録管理装置3の送受信部31は、検索要求を受信する。このとき、検索要求には、検索条件としての「記録種別」、「作業対象」、「作業項目」、「作業日時」が含まれる。 Next, the transmitter/receiver 91 transmits a search request to the audio recording management device 3 (step S132). As a result, the transmitter/receiver 31 of the audio recording management device 3 receives the search request. At this time, the search request includes the search conditions "recording type," "task target," "task item," and "task date and time."
次に、音声記録管理装置3の検索部37は、検索を実行する(ステップS133)。具体的には、検索部37は、ステップS132で受信した検索条件を検索キーとして解析結果管理DB3006(図10参照)を検索することにより、対応する解析結果を検索して読み出す。このとき、検索部37は更に、類義語管理DB3003(図7参照)を利用することで、検索条件の幅を広げるようにしてもよい。 Next, the search unit 37 of the audio recording management device 3 performs a search (step S133). Specifically, the search unit 37 searches the analysis result management DB 3006 (see FIG. 10) using the search conditions received in step S132 as a search key, thereby searching for and reading out the corresponding analysis results. At this time, the search unit 37 may also use the synonym management DB 3003 (see FIG. 7) to broaden the range of search conditions.
次に、送受信部31は、検索応答を閲覧用端末9に送信する(ステップS134)。これにより、閲覧用端末9は、音声記録管理装置3が送信した検索応答を受信する。このとき、検索応答には、ステップS133で実行した検索に係る検索結果としての検索結果画面データが含まれる。つまり、検索部37は、生成部38と協働して検索結果を含む検索結果画面データを生成する。 Next, the transmission/reception unit 31 transmits the search response to the viewing terminal 9 (step S134). As a result, the viewing terminal 9 receives the search response transmitted by the audio recording management device 3. At this time, the search response includes search result screen data as the search results related to the search performed in step S133. In other words, the search unit 37 cooperates with the generation unit 38 to generate search result screen data including the search results.
次に、閲覧用端末9の表示制御部94は、ステップS134で受信した検索結果画面データに基づいて、ディスプレイ907に検索結果画面を表示する(ステップS135)。 Next, the display control unit 94 of the viewing terminal 9 displays the search result screen on the display 907 based on the search result screen data received in step S134 (step S135).
次に、操作受付部92は、音声記録選択を受け付ける(ステップS141)。例えば、操作受付部22は、ディスプレイ907に表示された音声記録のうち、閲覧者が選択した特定の音声記録の選択を受け付けることで、この処理が実行されてもよい。 Next, the operation acceptance unit 92 accepts an audio recording selection (step S141). For example, this process may be performed by the operation acceptance unit 22 accepting the selection of a specific audio recording selected by the viewer from among the audio recordings displayed on the display 907.
次に、送受信部91は、音声データ取得要求を音声記録管理装置3に対して送信する(ステップS142)。これにより、音声記録管理装置3の送受信部31は、閲覧用端末9が送信した音声データ取得要求を受信する。このとき、音声データ取得要求には、記録された音声データに対応する音声記録識別情報が含まれる。 Next, the transmitter/receiver 91 transmits a voice data acquisition request to the voice recording management device 3 (step S142). As a result, the transmitter/receiver 31 of the voice recording management device 3 receives the voice data acquisition request transmitted by the viewing terminal 9. At this time, the voice data acquisition request includes voice recording identification information corresponding to the recorded voice data.
次に、音声記録管理装置3の記憶読出部39は、音声データを読み出す(ステップS143)。具体的には、記憶読出部39は、ステップS142で受信した音声記録識別情報を検索キーとして解析結果管理DB3006(図10参照)を検索することにより、対応する利用者識別情報を読み出す。続いて、記憶読出部39は、利用者識別情報を検索キーとして音声記録管理DB3005(図9参照)を検索することにより、対応する音声データのパスを読み出す。これにより、記憶読出部39は、音声データのパスに基づいて所望の音声データを検索することができる。なお、記憶読出部39は、音声記録識別情報を検索キーとして音声記録管理DB3005(図9参照)を検索することにより、対応する音声データのパスを直接読み出してもよい。 Next, the storage and reading unit 39 of the voice recording management device 3 reads the voice data (step S143). Specifically, the storage and reading unit 39 searches the analysis result management DB 3006 (see FIG. 10) using the voice recording identification information received in step S142 as a search key to read the corresponding user identification information. Next, the storage and reading unit 39 searches the voice recording management DB 3005 (see FIG. 9) using the user identification information as a search key to read the path of the corresponding voice data. This allows the storage and reading unit 39 to search for desired voice data based on the path of the voice data. Note that the storage and reading unit 39 may also directly read the path of the corresponding voice data by searching the voice recording management DB 3005 (see FIG. 9) using the voice recording identification information as a search key.
次に、送受信部31は、閲覧用端末9に対して音声データ取得応答を送信する(ステップS144)。これにより、閲覧用端末9の送受信部91は、音声記録管理装置3が送信した音声データ取得応答を受信する。 Next, the transmitter/receiver 31 transmits a voice data acquisition response to the viewing terminal 9 (step S144). As a result, the transmitter/receiver 91 of the viewing terminal 9 receives the voice data acquisition response transmitted by the voice recording management device 3.
次に、閲覧用端末9の表示制御部94は、ステップS144で受信した音声データを、スピーカ919を介して出力(再生)する(ステップS145)。このとき、表示制御部94は、スピーカ919を介して出力(再生)した音声に対応するテキスト情報を、ディスプレイ907に表示してもよい。以上説明したステップS131-S145までの処理により、閲覧者は、閲覧用端末9に対して入力した検索条件をもとに検索された音声記録を示す音声及び対応するテキスト情報を、閲覧用端末9で確認することができる。これにより、閲覧者が発話音声を行った利用者自身である場合は、自身で発話した作業内容を音声及びテキスト情報で確認することが可能になる。 Next, the display control unit 94 of the viewing terminal 9 outputs (plays) the audio data received in step S144 via the speaker 919 (step S145). At this time, the display control unit 94 may display text information corresponding to the audio output (played) via the speaker 919 on the display 907. By performing the processing of steps S131-S145 described above, the viewer can check, on the viewing terminal 9, the audio and corresponding text information indicating the audio recording searched based on the search criteria entered into the viewing terminal 9. As a result, if the viewer is the user who made the spoken audio, they can check the work content they spoke using the audio and text information.
本実施形態に係る通信システムでは更に、例えば、上述したステップS132及びS134、ステップS142及びS144の各処理が実行される場合、音声記録管理装置3と閲覧用端末9との間に他の装置等が存在してもよい。つまり、音声記録管理装置3と閲覧用端末9との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声記録管理装置3と閲覧用端末9との間に他の処理ステップが存在しても適用可能である。 Furthermore, in the communication system according to this embodiment, for example, when the processes of steps S132 and S134, and steps S142 and S144 described above are executed, other devices may be present between the voice recording management device 3 and the viewing terminal 9. In other words, each piece of information (data) transmitted and received between the voice recording management device 3 and the viewing terminal 9 may be transmitted and received once via another device. The above-described configuration is applicable even if other processing steps exist between the voice recording management device 3 and the viewing terminal 9.
●画面表示例●
次に、閲覧用端末9に表示される検索画面表示例を説明する。図24(a)は、閲覧用端末における申し送り検索時の画面表示例である。図24(a)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索キー入力画面9121が表示される。検索キー入力画面9121には、複数の入力欄が設けられている。閲覧者は、これらの入力欄に「作業日時」を検索するための期間情報、「作業対象」、「記録種別」及び「作業項目」を入力することができ、これらの入力欄に入力された情報が音声記録管理装置3に送信され、音声記録管理装置3で管理されている各種データテーブルを参照して検索した検索結果が返される。
●Screen display example●
Next, an example of a search screen display displayed on the viewing terminal 9 will be described. FIG. 24(a) is an example of a screen display during a handover search on the viewing terminal. As shown in FIG. 24(a), a search key input screen 9121 is displayed on the display 907 of the viewing terminal 9 by the display control unit 94. The search key input screen 9121 has multiple input fields. The viewer can input period information for searching for "work date and time,""worktarget,""recordingtype," and "work item" into these input fields. The information input into these input fields is sent to the voice recording management device 3, and search results are returned by referring to various data tables managed by the voice recording management device 3.
図24(b)は閲覧用端末における申し送り確認通知の他の画面表示例である。図24(b)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索結果表示画面9122が表示される。検索結果表示画面9122には、検索結果としての「作業対象」を示す「理光」の名前、及び検索した期間情報における「作業対象」に対する申し送り内容として、5月22日7時と18時における二つの申し送り内容が表示される。
●画面表示例●
次に、他の閲覧用端末9に表示される画面表示例を説明する。図25(a)は、他の閲覧用端末における申し送り検索時の画面表示例である。図25(a)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索キー入力画面9131が表示される。検索キー入力画面9131では、図24の検索キー入力画面9121に示した閲覧用端末9がタブレット端末を一例とするものであったのに対して、検索キー入力画面9131ではスマートフォンを一例とする通信端末に表示される画面例を示したものである。そのため、図25(a)の内容は、図24(a)に示した内容と同様となるため、詳細の説明を省略する。
24(b) is another example of a screen display of a handover confirmation notice on a viewing terminal. As shown in FIG. 24(b), a search result display screen 9122 is displayed on the display 907 of the viewing terminal 9 by the display control unit 94. The search result display screen 9122 displays the name "Rikou" indicating the "work object" as a search result, and two handover contents for May 22nd at 7:00 and 18:00 as handover contents for the "work object" in the searched period information.
●Screen display example●
Next, an example of a screen display displayed on another viewing terminal 9 will be described. FIG. 25(a) is an example of a screen display during a handover search on another viewing terminal. As shown in FIG. 25(a), a search key input screen 9131 is displayed on the display 907 of the viewing terminal 9 by the display control unit 94. While the viewing terminal 9 shown in the search key input screen 9121 of FIG. 24 is an example of a tablet terminal, the search key input screen 9131 shows an example of a screen displayed on a communication terminal, an example of which is a smartphone. Therefore, the content of FIG. 25(a) is the same as the content shown in FIG. 24(a), and therefore detailed description will be omitted.
図25(b)は他の閲覧用端末における申し送り確認通知の他の画面表示例である。図25(b)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索結果表示画面9132が表示される。検索結果表示画面9132では、図24(b)で示した申し送り内容に加えて、さらに利用者(作業者)が「作業対象」の「理光」様に対して実施した処置に関する情報がディスプレイ907に表示される。さらに、音声再生部96によって、検索結果表示画面9132に表示されたテキスト情報がスピーカ919を介して音声情報として再生される。 Figure 25(b) is another example of the screen display of the handover confirmation notification on another viewing terminal. As shown in Figure 25(b), the display control unit 94 displays a search result display screen 9132 on the display 907 of the viewing terminal 9. In addition to the handover content shown in Figure 24(b), the search result display screen 9132 also displays information on the procedure performed by the user (worker) on the "work target," Mr. Riko, on the display 907. Furthermore, the audio playback unit 96 plays the text information displayed on the search result display screen 9132 as audio information via the speaker 919.
〔実施形態の主な効果〕
以上説明したように本実施形態によれば、音声記録管理装置3は、利用者の発話音声に基づく音声情報と、発話音声を発した利用者が所属するテナントのテナント識別情報及びその利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた音声情報を解析するための認識パターンを識別する認識パターン識別情報と、を音声解析サーバ4に対して送信し(S113)、解析サーバ4が音声情報及び認識パターン識別情報に基づいて解析した解析結果を、解析結果管理DB3006で管理されている「記録種別」、「作業対象」、「作業項目」、「作業結果」に対応付けて登録する(S122)。これにより、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に対応した認識パターンで発話音声を与えることができるので、利用者に対する柔軟性を向上させることが可能になるという効果を奏する。
[Major Effects of the Embodiments]
As described above, according to this embodiment, the voice recording management device 3 transmits to the voice analysis server 4 voice information based on the user's voice utterance and recognition pattern identification information that identifies a recognition pattern for analyzing the voice information associated with at least one of the tenant identification information of the tenant to which the user who uttered the voice belongs and the group identification information of the group to which the user belongs (S113), and the analysis server 4 analyzes the voice information and the recognition pattern identification information, and registers the analysis results in association with the "recording type,""tasktarget,""taskitem," and "task result" managed in the analysis result management DB 3006 (S122). As a result, when registering voice recording information from voice information based on the voice utterance, the voice can be given using a recognition pattern that corresponds to the tenant, group, etc. to which the user belongs, thereby achieving the effect of improving flexibility for users.
更に、本実施形態によれば、利用者が所属するテナント、グループ等に対応した複数の認識パターンに加えて類義語情報を予め登録し、解析サーバ4に対して類義語情報も送信して解析が行われるので、介護、看護等の場における利用者(作業者)の出身地、アクセント等を気にせずに通常用いることばをそのまま発話して、介護記録、申し送り等の作業(業務)報告を行うことが可能になる。これにより、利用者(作業者)の作業効率をさらに向上させることが可能になるという効果を奏する。 Furthermore, according to this embodiment, synonym information is pre-registered in addition to multiple recognition patterns corresponding to the tenant, group, etc. to which the user belongs, and the synonym information is also sent to the analysis server 4 for analysis. This means that users (workers) in caregiving, nursing, and other settings can speak the words they normally use without worrying about their place of origin, accent, etc., and can report on tasks (jobs) such as care records and handovers. This has the effect of further improving the work efficiency of users (workers).
〔実施形態の補足〕
なお、本実施形態では、介護施設における介護士(作業者)による被介護者(作業対象)に対する作業、病院における看護師(作業者)による患者(作業対象)に対する作業を一例として説明したが、上述した実施の形態は、例えば、工事現場における作業員(作業者)による対象工事(作業対象)に対する作業、自動車整備工場における整備士(作業者)による自動車(作業対象)に対する作業、オフィスにおけるスタッフ(作業者)による書類(作業対象)に対する作業等、一以上の作業対象に対して一以上の作業者によって実施される他の作業に適用されてもよい。
[Supplementary explanation of the embodiment]
In this embodiment, work performed by a caregiver (worker) on a care recipient (work target) in a nursing facility and work performed by a nurse (worker) on a patient (work target) in a hospital have been described as examples, but the above-mentioned embodiment may also be applied to other work performed by one or more workers on one or more work targets, such as work performed by a worker (worker) on a construction project (work target) at a construction site, work performed by a mechanic (worker) on an automobile (work target) at an automobile repair shop, or work performed by staff (worker) on documents (work target) in an office.
更に、本実施形態では、日本語を用いた認識パターンを例に説明したが、認識パターンを外国語にも適用し、外国語の音声情報を解析可能な外部サーバを用いたシステムを構築してもよい。 Furthermore, while this embodiment has been described using recognition patterns using Japanese as an example, it is also possible to apply the recognition patterns to foreign languages and build a system using an external server that can analyze speech information in foreign languages.
また、上述した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウエアによって各機能を実行するようプログラミングされたデバイスを含むものとする。このデバイスとは、例えば、プロセッサ、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)、SOC(System on a chip)、GPU(Graphics Processing Unit)、及び従来の回路モジュール等をいう。 Furthermore, each function of the above-described embodiments can be realized by one or more processing circuits. Here, the term "processing circuit" as used herein includes devices programmed to perform each function by software, such as a processor implemented as an electronic circuit. Examples of such devices include processors, ASICs (Application Specific Integrated Circuits) designed to perform the functions described above, DSPs (Digital Signal Processors), FPGAs (Field Programmable Gate Arrays), SOCs (Systems on a Chip), GPUs (Graphics Processing Units), and conventional circuit modules.
更に、上述した実施形態により得られる各種テキスト及びテキスト情報は、人工知能(AI)を利用した機械学習の学習効果によって取得されたものでもよい。この場合、音声解析サーバが機械学習を用いて音声情報から各種テキスト及びテキスト情報を取得してもよいし、音声解析サーバと異なるデータベース等が機械学習を用いて音声情報から各種テキスト及びテキスト情報を取得してもよい。ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを事前に取り込まれる学習データから自律的に作成、新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよい、更に、機械学習のための学習方法は、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。 Furthermore, the various texts and text information obtained by the above-described embodiments may be obtained through the learning effects of machine learning using artificial intelligence (AI). In this case, the voice analysis server may use machine learning to obtain the various texts and text information from the voice information, or a database or the like different from the voice analysis server may use machine learning to obtain the various texts and text information from the voice information. Here, machine learning is a technology that enables a computer to acquire human-like learning capabilities, and refers to a technology in which a computer autonomously creates algorithms necessary for judgments such as data identification from previously acquired learning data, and applies these to new data to make predictions. The learning method for machine learning may be any of supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning, and deep learning. Furthermore, the learning method for machine learning may be a combination of these learning methods, and any learning method for machine learning is acceptable.
これまで本発明の一実施形態に係る音声記録管理システム、音声記録管理装置、音声記録管理方法及びプログラムについて説明してきたが、本発明は、上述した実施形態に限定されるものではなく、他の実施形態の追加、変更又は削除等、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。 So far, we have described an audio recording management system, audio recording management device, audio recording management method, and program according to one embodiment of the present invention. However, the present invention is not limited to the above-described embodiment, and other modifications, such as additions, changes, or deletions, can be made within the scope of what one skilled in the art can conceive. Any modification that achieves the functions and effects of the present invention is within the scope of the present invention.
1 通信システム
2 登録管理用端末
3 音声記録管理装置
4 音声解析サーバ(クラウドサービス)
5 音声通信管理装置(クラウドサービス)
6 ユーザ端末(利用者端末の一例)
7 通話機
8 入力端末
9 閲覧用端末
10 音声記録管理システム
21 送受信部(送信手段の一例、受信手段の一例)
31 送受信部(受信手段の一例、送信手段の一例)
3001 認識パターン項目管理DB(認識パターン項目管理手段の一例)
3002 認識パターン識別管理DB(認識パターン識別管理手段の一例)
3003 類義語管理DB(類義語管理手段の一例)
3006 解析結果管理DB(解析結果管理手段の一例)
35 判断部(判断手段の一例)
36 登録部(登録手段の一例)
1 Communication system 2 Registration management terminal 3 Voice recording management device 4 Voice analysis server (cloud service)
5. Voice communication management device (cloud service)
6. User terminal (an example of a user terminal)
7. Talking device 8. Input terminal 9. Viewing terminal 10. Voice recording management system 21. Transmitting/receiving unit (an example of a transmitting means, an example of a receiving means)
31 Transmitting/receiving unit (an example of a receiving means, an example of a transmitting means)
3001 Recognition pattern item management DB (an example of a recognition pattern item management means)
3002 Recognition pattern identification management DB (an example of recognition pattern identification management means)
3003 Synonym management DB (an example of a synonym management means)
3006 Analysis result management DB (an example of an analysis result management means)
35 Determination unit (an example of a determination means)
36 Registration unit (an example of a registration means)
Claims (12)
前記登録管理用端末は、
前記発話音声に基づく音声情報を解析してテキスト情報に変換する音声解析サーバが前記音声情報を解析可能となるように、前記一以上の認識パターンを送信する送信手段、
を有し、
前記音声記録管理装置は、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信手段と、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析結果を示す音声解析結果情報と、該特定の認識パターンを示す特定の認識パターン識別情報と、を含む音声解析応答を受信する受信手段と、
受信した前記音声解析応答に含まれる前記音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録手段と、
を有する、
ことを特徴とする音声記録管理システム。 A voice recording management system including a registration management terminal that registers one or more recognition patterns for recognizing spoken voices, and a voice recording management device that manages voice recording information obtained based on the one or more recognition patterns input to the registration management terminal,
The registration management terminal
a transmitting means for transmitting the one or more recognition patterns so that a voice analysis server that analyzes voice information based on the uttered voice and converts the voice information into text information can analyze the voice information;
and
The voice recording management device
a transmitting means for transmitting, as a voice analysis request for requesting analysis of the voice information, to the voice analysis server, one or more recognition pattern identification information for identifying the one or more recognition patterns associated with at least one of tenant identification information of a tenant to which the user who uttered the uttered voice belongs and group identification information of a group to which the user belongs; and the voice information;
a receiving means for receiving a voice analysis response in response to the voice analysis request, the voice analysis response including voice analysis result information indicating a voice analysis result obtained by the voice analysis server using a specific recognition pattern among the one or more recognition patterns , and specific recognition pattern identification information indicating the specific recognition pattern;
a registration means for registering voice recording information corresponding to the voice information based on the voice analysis result information and specific recognition pattern identification information indicating the specific recognition pattern included in the received voice analysis response ;
having
1. A voice recording management system comprising:
前記音声記録情報が登録されたことを示す登録完了通知情報、及び前記登録完了通知情報を音声化した登録完了音声情報の少なくとも一方を、前記発話音声が入力された入力端末が受信可能となるように音声通信管理装置に対して送信する、
ことを特徴とする請求項1に記載の音声記録管理システム。 The transmitting means of the voice recording management device
and transmitting at least one of registration completion notification information indicating that the voice recording information has been registered and registration completion voice information obtained by vocalizing the registration completion notification information to the voice communication management device so that the input terminal to which the uttered voice is input can receive the information.
2. The voice recording management system according to claim 1.
前記登録管理用端末が送信した前記特定の認識パターンを含む前記一以上の認識パターンを、前記認識パターンを識別する認識パターン識別情報に対応付けて管理する認識パターン項目管理手段に登録する、
を有する、
ことを特徴とする請求項1又は2に記載の音声記録管理システム。 The registration means
registering the one or more recognition patterns including the specific recognition pattern transmitted by the registration management terminal in a recognition pattern item management means that manages the recognition patterns in association with recognition pattern identification information that identifies the recognition patterns;
having
3. The voice recording management system according to claim 1 or 2.
前記一以上の認識パターンを示すそれぞれの認識パターン識別情報を、前記発話音声を発した利用者が所属する所定のテナントを識別するテナント識別情報及び前記利用者が所属する所定のグループを識別するグループ識別情報に対応付けて管理する認識パターン識別管理手段に登録する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の音声記録管理システム。 The registration means
registering each of the recognition pattern identification information indicating the one or more recognition patterns in a recognition pattern identification management means that manages the recognition pattern identification information in association with tenant identification information that identifies a predetermined tenant to which the user who uttered the speech voice belongs and group identification information that identifies a predetermined group to which the user belongs;
4. The voice recording management system according to claim 1, wherein the voice recording management system is a voice recording management system.
前記発話音声に含まれ、前記認識パターンを構成する各項目の類義語を、前記各項目を示すキーワードに対応付けて管理する類義語管理手段に登録する、
ことを特徴とする請求項1乃至4のいずれか一項に記載の音声記録管理システム。 The registration means
registering synonyms of each item included in the speech and constituting the recognition pattern in a synonym management means that manages the synonyms in association with keywords representing the items;
5. The voice recording management system according to claim 1, wherein the voice recording management system is a voice recording management system.
前記音声解析結果情報に含まれる各値を、前記認識パターン項目管理手段で管理されている各項目と対応付けた後、前記音声記録情報を識別する音声記録識別情報に対応付けて管理する解析結果管理手段に登録する、
ことを特徴とする請求項3に記載の音声記録管理システム。 The registration means
each value included in the voice analysis result information is associated with each item managed by the recognition pattern item management means, and then the associated value is registered in an analysis result management means that manages the voice recording information in association with voice recording identification information that identifies the voice recording information;
4. The voice recording management system according to claim 3 .
前記音声記録管理装置は、更に、
前記音声解析サーバが送信した前記音声解析結果情報に合致する認識パターンがあるかを判断する判断手段を有する、
ことを特徴とする音声記録管理システム。 7. The voice recording management system according to claim 1,
The voice recording management device further comprises:
a determination means for determining whether there is a recognition pattern that matches the voice analysis result information transmitted by the voice analysis server;
1. A voice recording management system.
前記音声解析サーバが前記音声情報に対する解析ができなかったことを示す登録失敗通知を、前記発話音声が入力された入力端末が受信可能とするように前記音声記録管理装置に対して送信する、
ことを特徴とする請求項7に記載の音声記録管理システム。 When the determination means determines that there is no recognition pattern that matches the voice analysis result information, the transmission means of the voice recording management device:
a registration failure notification indicating that the voice analysis server was unable to analyze the voice information is transmitted to the voice recording management device so that the notification can be received by the input terminal to which the uttered voice is input ;
8. The voice recording management system according to claim 7.
ことを特徴とする請求項1乃至8のいずれか一項に記載の音声記録管理システム。 The voice information includes a care record or handover information related to handover in care and nursing, and the one or more recognition pattern information includes recognition pattern identification information for identifying the one or more recognition patterns and one or more items included in the recognition pattern.
9. The voice recording management system according to claim 1, wherein the voice recording management system is a voice recording management system.
前記登録管理用端末が送信した前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析結果を示す音声解析結果情報と、該特定の認識パターンを示す特定の認識パターン識別情報と、を含む音声解析応答を受信する受信手段と、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信手段と、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録手段と、
を有する、
ことを特徴とする音声記録管理装置。 A voice recording management device connectable to a voice analysis server that manages voice recording information obtained based on one or more recognition patterns input to a registration management terminal that registers one or more recognition patterns for recognizing uttered voices, and analyzes the voice information based on the uttered voices and converts it into text information ,
a receiving means for receiving a voice analysis response including voice analysis result information indicating a voice analysis result obtained by analyzing using a specific recognition pattern among the one or more recognition patterns transmitted by the registration management terminal, and specific recognition pattern identification information indicating the specific recognition pattern;
a transmitting means for transmitting, as a voice analysis request for requesting analysis of the voice information, to the voice analysis server, one or more recognition pattern identification information for identifying the one or more recognition patterns associated with at least one of tenant identification information of a tenant to which the user who uttered the uttered voice belongs and group identification information of a group to which the user belongs; and the voice information;
a registration means for registering voice recording information corresponding to the voice information based on voice analysis result information included in a voice analysis response obtained by the voice analysis server analyzing the voice analysis request using a specific recognition pattern among the one or more recognition patterns and specific recognition pattern identification information indicating the specific recognition pattern;
having
1. A voice recording management device comprising:
前記登録管理用端末が送信した前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析結果を示す音声解析結果情報と、該特定の認識パターンを示す特定の認識パターン識別情報と、を含む音声解析応答を受信する受信ステップと、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信ステップと、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録ステップと、
を含む処理を実行することを特徴とする音声記録管理方法。 A voice recording management method executed by a voice recording management device connectable to a voice analysis server that manages voice recording information obtained based on one or more recognition patterns input to a registration management terminal that registers one or more recognition patterns for recognizing uttered voices, and analyzes the voice information based on the uttered voices and converts it into text information , comprising:
a receiving step of receiving a voice analysis response including voice analysis result information indicating a voice analysis result analyzed using a specific recognition pattern among the one or more recognition patterns transmitted by the registration management terminal, and specific recognition pattern identification information indicating the specific recognition pattern ;
a transmission step of transmitting, to the voice analysis server, one or more recognition pattern identification information identifying the one or more recognition patterns associated with at least one of tenant identification information of a tenant to which the user who uttered the uttered voice belongs and group identification information of a group to which the user belongs, as a voice analysis request for requesting analysis of the voice information;
a registration step of registering voice recording information corresponding to the voice information based on voice analysis result information included in a voice analysis response analyzed by the voice analysis server using a specific recognition pattern among the one or more recognition patterns in response to the voice analysis request and specific recognition pattern identification information indicating the specific recognition pattern;
A voice recording management method comprising the steps of:
前記発話音声を認識するための一以上の認識パターンを登録する登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置に、
前記登録管理用端末が送信した前記一以上の認識パターンを受信する受信ステップと、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信ステップと、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析結果を示す音声解析結果情報と、該特定の認識パターンを示す特定の認識パターン識別情報と、を含む音声解析応答を受信する受信ステップと、
受信した前記音声解析応答に含まれる前記音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録ステップと、
を含む処理を実行させるプログラム。 A voice recording management device connectable to a voice analysis server that manages voice recording information obtained based on voice information, analyzes the voice information based on uttered voices, and converts it into text information,
a voice recording management device that manages voice recording information obtained based on one or more recognition patterns input to a registration management terminal that registers one or more recognition patterns for recognizing the spoken voice,
a receiving step of receiving the one or more recognition patterns transmitted by the registration management terminal;
a transmission step of transmitting, to the voice analysis server, one or more recognition pattern identification information identifying the one or more recognition patterns associated with at least one of tenant identification information of a tenant to which the user who uttered the uttered voice belongs and group identification information of a group to which the user belongs, as a voice analysis request for requesting analysis of the voice information;
a receiving step of receiving a voice analysis response in response to the voice analysis request, the voice analysis response including voice analysis result information indicating a voice analysis result analyzed by the voice analysis server using a specific recognition pattern among the one or more recognition patterns , and specific recognition pattern identification information indicating the specific recognition pattern;
a registration step of registering voice recording information corresponding to the voice information based on the voice analysis result information and specific recognition pattern identification information indicating the specific recognition pattern included in the received voice analysis response ;
A program that executes processing including
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021156868A JP7753752B2 (en) | 2021-09-27 | 2021-09-27 | Voice recording management system, voice recording management device, voice recording management method and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021156868A JP7753752B2 (en) | 2021-09-27 | 2021-09-27 | Voice recording management system, voice recording management device, voice recording management method and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023047767A JP2023047767A (en) | 2023-04-06 |
| JP7753752B2 true JP7753752B2 (en) | 2025-10-15 |
Family
ID=85779288
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021156868A Active JP7753752B2 (en) | 2021-09-27 | 2021-09-27 | Voice recording management system, voice recording management device, voice recording management method and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7753752B2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017010506A1 (en) | 2015-07-13 | 2017-01-19 | 帝人株式会社 | Information processing apparatus, information processing method, and computer program |
| WO2017221916A1 (en) | 2016-06-21 | 2017-12-28 | 日本電気株式会社 | Work support system, management server, portable terminal, work support method and program |
| JP2019121206A (en) | 2018-01-09 | 2019-07-22 | 株式会社キャピタルメディカ | Patient information management system, patient information management method, information processing device, information processing program, communication terminal, communication terminal control program, and application program |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6772734B2 (en) * | 2016-09-30 | 2020-10-21 | 株式会社リコー | Language processing system, language processing device, language processing program and language processing method |
-
2021
- 2021-09-27 JP JP2021156868A patent/JP7753752B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017010506A1 (en) | 2015-07-13 | 2017-01-19 | 帝人株式会社 | Information processing apparatus, information processing method, and computer program |
| WO2017221916A1 (en) | 2016-06-21 | 2017-12-28 | 日本電気株式会社 | Work support system, management server, portable terminal, work support method and program |
| JP2019121206A (en) | 2018-01-09 | 2019-07-22 | 株式会社キャピタルメディカ | Patient information management system, patient information management method, information processing device, information processing program, communication terminal, communication terminal control program, and application program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023047767A (en) | 2023-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6738445B2 (en) | Long-distance extension of digital assistant service | |
| US8880406B2 (en) | Automatic determination of and response to a topic of a conversation | |
| US9280610B2 (en) | Crowd sourcing information to fulfill user requests | |
| US10244111B1 (en) | System for providing data to an interactive response system | |
| KR102309031B1 (en) | Apparatus and Method for managing Intelligence Agent Service | |
| US8682640B2 (en) | Self-configuring language translation device | |
| JP7059929B2 (en) | Information processing equipment | |
| US11790901B2 (en) | Task-oriented dialog suitable for a standalone device | |
| US20250124239A1 (en) | Method for providing conversation and system for processing the conversation | |
| US12418501B2 (en) | Information processing apparatus, information processing method, terminal device, and display method | |
| CN107463636A (en) | Data configuration method, device and the computer-readable recording medium of interactive voice | |
| JP2008310791A (en) | Information processing apparatus, menu generation method, and program | |
| KR20250048144A (en) | Selectable controls for interactive voice response systems | |
| EP3447765B1 (en) | Electronic device performing operation using voice command and method of operating electronic device | |
| CN112102836B (en) | Voice control screen display method and device, electronic equipment and medium | |
| US20190267002A1 (en) | Intelligent system for creating and editing work instructions | |
| JP7753752B2 (en) | Voice recording management system, voice recording management device, voice recording management method and program | |
| JP2023027001A (en) | Voice recording management system, voice recording management device, voice recording management method, and program | |
| CN115016708B (en) | Electronic device and control method thereof | |
| JP7661798B2 (en) | Voice management system, voice recording management device, voice recording management method and program | |
| JP2023016217A (en) | Text information management system, text information management device, text information management method, and program | |
| US20250348521A1 (en) | Memory Assistant System | |
| WO2022019145A1 (en) | Information processing device, information processing method, and information processing program | |
| JP2024135665A (en) | Work support device, work support system, work support method and program | |
| Chakraborty et al. | BumbleBee: The multi-purpose voice assistant |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231020 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240724 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250422 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250527 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250725 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250902 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250915 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7753752 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |