JP7699471B2 - Voice guidance device, voice guidance method, and voice guidance program - Google Patents
Voice guidance device, voice guidance method, and voice guidance program Download PDFInfo
- Publication number
- JP7699471B2 JP7699471B2 JP2021088998A JP2021088998A JP7699471B2 JP 7699471 B2 JP7699471 B2 JP 7699471B2 JP 2021088998 A JP2021088998 A JP 2021088998A JP 2021088998 A JP2021088998 A JP 2021088998A JP 7699471 B2 JP7699471 B2 JP 7699471B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- guidance
- user
- visually impaired
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
本発明は、音声案内装置、音声案内方法及び音声案内プログラムに関する。 The present invention relates to a voice guidance device, a voice guidance method, and a voice guidance program.
今日において、例えば駅、施設等の構内又は構外において、例えば「5m先に改札口があります」又は「3m先に横断歩道があります」等の音声案内が、視覚に障害のあるユーザ等に対して提供されている。 Nowadays, for example, inside or outside a station or facility, voice guidance such as "The ticket gate is 5 meters ahead" or "The pedestrian crossing is 3 meters ahead" is provided to visually impaired users.
また、特許文献1(特開2020-125907公報)には、駅構内を通行するユーザ(視覚障害者)に向けて、そのユーザの移動方向に応じた音声案内を行う視覚障害者用音声案内システムが開示されている。これにより、駅構内を通行するユーザに対して不要となる音声案内を行わないようにすることができ、無駄な音声案内の出力を軽減できる。 Patent Document 1 (JP Patent Publication 2020-125907A) discloses a voice guidance system for visually impaired people that provides voice guidance to a user (visually impaired person) passing through a station according to the direction of the user's movement. This makes it possible to avoid providing unnecessary voice guidance to a user passing through a station, thereby reducing the output of unnecessary voice guidance.
しかし、特許文献1の視覚障害者用音声案内システムを含め、従来の音声案内システムでは、視覚に障害のある複数のユーザが近い位置に存在していた場合、聴取した音声案内が、自分に対する音声案内なのか、又は、視覚に障害のある他のユーザに対する音声案内なのか、認識しづらいという問題があった。 However, with conventional voice guidance systems, including the voice guidance system for visually impaired people described in Patent Document 1, when multiple visually impaired users are located close to each other, it is difficult for them to know whether the voice guidance they are hearing is intended for them or for other visually impaired users.
例えば、視覚に障害のある複数のユーザが同じ場所に位置しており、一方のユーザと他方のユーザは、それぞれ異なる方向に歩行していたとする。この状況で、一方のユーザに対して「5m直進した場所に改札口があります」との音声案内を行ったとする。この一方のユーザに対して行った音声案内が、一方のユーザとは反対方向に向かって歩行している他方のユーザにより、自分に対する音声案内だと誤認識されると、他方のユーザは、5m直進しても改札口には到着できない不都合を生ずる。 For example, suppose multiple visually impaired users are located in the same place, and one user and the other user are walking in different directions. In this situation, suppose one user is given voice guidance such as "The ticket gate is five meters straight ahead." If the voice guidance given to one user is mistaken by the other user, who is walking in the opposite direction to the first user, as being intended for him/herself, the other user will be inconvenienced and will not be able to reach the ticket gate even if he/she walks five meters straight ahead.
本発明は、上述の課題に鑑みてなされたものであり、視覚に障害のあるユーザに対して、出力されている音声案内が自分に対する音声案内であることを認識させ、混同させることなく、ユーザ毎に音声案内を有効に機能させることを可能とした音声案内装置、音声案内方法及び音声案内プログラムの提供を目的とする。 The present invention was made in consideration of the above-mentioned problems, and aims to provide a voice guidance device, a voice guidance method, and a voice guidance program that enable visually impaired users to recognize that the voice guidance being output is intended for them, and to effectively provide voice guidance for each user without causing confusion.
上述した課題を解決し、目的を達成するために、本発明は、カメラ装置で撮像された撮像画像を解析することで、視覚に障害のあるユーザを検出すると共に、視覚に障害のあるユーザの少なくとも現在位置を検出する検出部と、検出部により、視覚に障害のあるユーザが複数検出された場合に、各ユーザに対して、それぞれ割り当てた異なる声質の案内音声データに基づいて案内音声を生成する割り当て部と、検出部により検出された、視覚に障害のある各ユーザの少なくとも現在位置に対応する音声出力装置を介して、各ユーザに割り当てた異なる声質の案内音声データに基づいて生成された案内音声を出力制御する出力制御部と、を備える。 In order to solve the above-mentioned problems and achieve the object, the present invention comprises a detection unit that detects visually impaired users and detects at least the current position of the visually impaired users by analyzing an image captured by a camera device, an assignment unit that generates guidance voices based on guidance voice data with different voice qualities assigned to each user when multiple visually impaired users are detected by the detection unit, and an output control unit that controls the output of the guidance voices generated based on the guidance voice data with different voice qualities assigned to each user via a voice output device corresponding to at least the current position of each visually impaired user detected by the detection unit.
本発明によれば、視覚に障害のあるユーザに対して、出力されている案内音声が自分に対する音声案内であることを認識させることができる。このため、混同させることなく、ユーザ毎に音声案内を有効に機能させることができる。 According to the present invention, visually impaired users can be made aware that the voice guidance being output is intended for them. This allows voice guidance to function effectively for each user without causing confusion.
以下、図面を参照して、本発明を提供した実施の形態の音声案内システムの説明をする。 The following describes an embodiment of the voice guidance system according to the present invention with reference to the drawings.
(システム構成)
図1は、実施の形態の音声案内システムのシステム構成を示す図である。この図1に示すように、音声案内システムは、複数の端末装置60と、例えば管理室等の設けられた管理者端末装置である解析装置3とを、インターネット等の広域網又はLAN(Local Area Network)等のプライベート網を介して相互に接続することで構成されている。
(System Configuration)
Fig. 1 is a diagram showing a system configuration of a voice guidance system according to an embodiment. As shown in Fig. 1, the voice guidance system is configured by connecting a plurality of terminal devices 60 and an analysis device 3, which is a manager terminal device installed in, for example, a management room, via a wide area network such as the Internet or a private network such as a LAN (Local Area Network).
端末装置60は、例えばユーザが通行する通路に沿って所定の間隔で設けられる等のように、地理的に異なる位置に設けられている。各端末装置60は、それぞれカメラ装置1及びスピーカ装置2を備えている。カメラ装置1は、例えば定点カメラ装置となっており、固定された撮像領域内の通路等を通行するユーザを撮像する。なお、カメラ装置1は、撮像領域を変更可能なカメラ装置でもよい。スピーカ装置2は、音声出力装置の一例であり、案内音声を出力する。 The terminal devices 60 are provided at different geographical locations, for example at predetermined intervals along a passageway through which users pass. Each terminal device 60 includes a camera device 1 and a speaker device 2. The camera device 1 is, for example, a fixed camera device, and captures images of users passing through a passageway or the like within a fixed imaging area. The camera device 1 may also be a camera device whose imaging area is changeable. The speaker device 2 is an example of an audio output device, and outputs audio guidance.
解析装置3は、各端末装置60のカメラ装置1の撮像画像を解析して、視覚に障害のあるユーザの特徴を解析する。そして、解析装置3は、視覚に障害のあるユーザ毎に異なる音声を割り当て、ユーザが移動する位置に設けられているスピーカ装置2から案内音声を出力する。これにより、近接する位置に視覚に障害のあるユーザが複数存在している場合でも、混同させることなくユーザ毎に音声案内を行うことができる。 The analysis device 3 analyzes the images captured by the camera device 1 of each terminal device 60 to analyze the characteristics of visually impaired users. The analysis device 3 then assigns a different voice to each visually impaired user and outputs a guidance voice from the speaker device 2 provided in the position where the user moves. This makes it possible to provide voice guidance to each user without confusion, even if there are multiple visually impaired users in close proximity.
(解析装置のハードウェア構成)
図2は、解析装置3のハードウェア構成を示すブロック図である。この図2に示すように、解析装置3は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、及び、通信部14を備えている。また、解析装置3は、HDD(Hard Disk Drive)15、入出力インターフェース(入出力I/F)16、及び、通信インターフェース(通信I/F)17を備えている。
(Hardware configuration of the analysis device)
Fig. 2 is a block diagram showing a hardware configuration of the analysis device 3. As shown in Fig. 2, the analysis device 3 includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, and a
通信部14は、インターネット又はLAN等のネットワークを介して有線通信の他、ブルートゥース(登録商標)又はWi-Fi(登録商標)等の無線通信を行う。HDD15には、視覚に障害があるユーザに対して音声案内を行うための音声案内プログラム、地図データ50、案内音声データ51、及び、ユーザ情報テーブル52が記憶されている。
The
地図データ50としては、図3に示すように、音声案内を行う地理的範囲(以降、同じ意味で「サービスエリア」という表現も併せて用いる)に位置する施設、テナント、改札口、エレベータ装置等の施設名又は名称を含む施設情報及び位置情報と、その施設に対する音声案内を行う際の条件を示す出力条件情報とが関連付けられて記憶されている。
As shown in FIG. 3, the
案内音声データ51は、地図データ50に基づいて音声案内を行うためのデータであり、聴覚上異なる複数の案内音声データ51が記憶されている。さらに具体的には、案内音声データ51は、例えば「わたくし」、「太郎」、「花子」、「5」、「メートル」、「先」、「に」、「改札」、「口」、「が」、「あります」、「黒」、「白」、「色」、「の」、「カーディガン」、「を」、「コート」、「野球」、「帽子」、「ロング」、「ショート」、「ヘアー」等の各種単語毎の音声データである分割音声データとして記憶されている。
The
一例ではあるが、図4に示すように、聴覚上異なる複数の案内音声データ51には、各々を一意に表す案内音声IDが付与され、話者が男性の案内音声データ51及び話者が女性の案内音声データ51に分けて記憶されている。また、話者の性別が同じものであっても、聴覚上、聞き分けが容易な案内音声データ51が記憶されている。また、話者が男性の各案内音声データ51には、音声周波数を示す情報、音圧、音高及び発話速度を示す情報が、それぞれ記憶されている。話者が女性の案内音声データ51も同様であり、聴覚上、聞き分けが容易な案内音声データ51が記憶されている。また、話者が女性の各案内音声データ51にも、音声周波数を示す情報、音圧、音高及び発話速度を示す情報が、それぞれ記憶されている。
As an example, as shown in FIG. 4, a plurality of aurally different
実施の形態の音声案内システムの場合、視覚に障害があるユーザが複数存在する場合、図4に示すような話者の性別、音声周波数、音圧、音高及び発話速度等をファクタとして用い、視覚に障害があるユーザがそれぞれ聞き分け容易な案内音声データ51を割り当てて音声案内を行う。
In the case of the voice guidance system of the embodiment, when there are multiple visually impaired users, factors such as the gender of the speaker, voice frequency, sound pressure, pitch, and speaking speed as shown in Figure 4 are used, and voice guidance is provided by assigning
図5に、ユーザ情報テーブル52の模式図を示す。この図5に示すように、ユーザ情報テーブル52は、視覚に障害があるユーザとそのユーザ毎に割り当てられた案内音声データ51との対応を記憶するテーブルである。詳しくは後述するが、ユーザID、そのユーザの特徴(人物特徴)の情報、及びそのユーザに割り当てた案内音声データ51のID(案内音声ID)の対応を記憶する。
Figure 5 shows a schematic diagram of the user information table 52. As shown in Figure 5, the user information table 52 is a table that stores the correspondence between visually impaired users and the
入出力I/F16には、必要な場合に、表示部18及び操作部19が接続される。通信I/F17は、必要な場合に、ネットワークケーブルを介してネットワーク5に接続される。
The input/output I/
(解析装置の機能構成)
図6は、CPU11がHDD15に記憶されている音声案内プログラムを実行することでソフトウェア的に実現される各機能の機能ブロック図である。この図6に示すように、CPU11は、音声案内プログラムを実行することで、映像取得部21、地図データ取得部22、画像解析部23、出力音声割り当て部24、通信制御部25、スピーカ切り替え部26及び緊急処理部27として機能する。
(Functional configuration of the analysis device)
6 is a functional block diagram of each function realized by software when the
映像取得部21は、各カメラ装置1で撮像されている地理的範囲を往来するユーザの撮像画像を取得する。地図データ取得部22は、各カメラ装置1で撮像されている地理的範囲の経緯度に対応する地図データ50をHDD15から取得する。画像解析部23は、検出部の一例であり、各カメラ装置1で撮像された撮像画像に基づいて、ユーザの人物特徴を解析し、また、視覚障害の有無等を判断する。
The video acquisition unit 21 acquires captured images of users traveling within the geographical area captured by each camera device 1. The map
画像解析部23は、視覚障害のあるユーザであると判断された場合に、解析されたそのユーザの特徴(人物特徴)の情報と一致する特徴(人物特徴)の情報が、ユーザ情報テーブル52に記憶されているか否かを判断する。ユーザ情報テーブル52に記憶されていない場合、画像解析部23は、解析したそのユーザを一意に表すユーザIDを発行し、発行したユーザIDと、解析したそのユーザの特徴(人物特徴)の情報とを対応付けて、ユーザ情報テーブル52に記憶する。 When it is determined that the user is visually impaired, the image analysis unit 23 determines whether or not information on characteristics (personal characteristics) that matches the analyzed information on the user's characteristics (personal characteristics) is stored in the user information table 52. If it is not stored in the user information table 52, the image analysis unit 23 issues a user ID that uniquely represents the analyzed user, and stores the issued user ID in the user information table 52 in association with the analyzed information on the user's characteristics (personal characteristics).
また、画像解析部23は、カメラ装置1で撮像されている撮像画像の各座標に対応する経緯度に基づいて、そのユーザの現在位置を検出する。さらに、画像解析部23は、例えば数フレームの一連の撮像画像に写っている同じユーザの現在位置の差から、そのユーザの移動方向を検出する。また、画像解析部23は、視覚に障害のあるユーザが、例えば白杖を頭上50cm程度に掲げる動作、又は、白杖をユーザの顔の前あたりで左右に振る動作等の、「助けを求める動き」の有無を検出する。 The image analysis unit 23 also detects the current position of the user based on the longitude and latitude corresponding to each coordinate of the captured image captured by the camera device 1. Furthermore, the image analysis unit 23 detects the direction of movement of the user from the difference in the current positions of the same user captured in a series of captured images over several frames, for example. The image analysis unit 23 also detects the presence or absence of a "movement calling for help" by a visually impaired user, such as raising a white cane about 50 cm above the head or waving the white cane from side to side in front of the user's face.
出力音声割り当て部24は、割り当て部の一例であり、画像解析部23により検出された、視覚に障害のあるユーザに対して、HDD15に記憶されている案内音声データ51を割り当てる。具体的には、画像解析部23により、新規にユーザが登録された場合、出力音声割り当て部24は、HDD15に記憶されている案内音声データ51のうち、既に割り当てられている案内音声とは異なる声質の別の案内音声データ51を割り当てる。そして、出力音声割り当て部24は、その案内音声データ51のID(案内音声ID)を新規ユーザの案内音声としてユーザ情報テーブル52に記憶する。さらに、出力音声割り当て部24は、ユーザ情報テーブル52を参照し、各ユーザに割り当てた、異なる声質の案内音声データ51に基づいて、各ユーザ用の案内音声を生成する。
The output
スピーカ切り替え部26は、出力制御部の一例であり、視覚に障害のあるユーザの現在位置に応じて、案内音声を出力するスピーカ装置2を切り替え制御し、そのユーザに割り当てられた声質の案内音声データ51で生成された案内音声を出力する。これにより、各ユーザ用に割り当てられた声質の案内音声で、各ユーザの移動に追従して音声案内が行われる。通信制御部25は、各端末装置60と通信を行い、カメラ装置1で撮像された撮像画像の取得及びスピーカ装置2に対する案内音声の送信等を行う。緊急処理部27は、画像解析部23において視覚に障害があるユーザ等から助けを求める動作が解析された際に、この解析結果に基づいて管理者等に緊急通知を行う。また、緊急処理部27は、助けを求めているユーザの位置に対応するスピーカ装置2を介して、係員が至急救助に向かう旨のメッセージの出力制御等を行う。
The
なお、この例では、映像取得部21~緊急処理部27は、音声案内プログラムにより、ソフトウェアで実現することとした。しかし、これらのうち全部又は一部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。 In this example, the video acquisition unit 21 to the emergency processing unit 27 are implemented as software using a voice guidance program. However, all or part of these may be implemented as hardware such as an integrated circuit (IC).
また、音声案内プログラムは、インストール可能な形式又は実行可能な形式のファイル情報でCD-ROM、フレキシブルディスク(FD)などのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、音声案内プログラムは、CD-R、DVD(Digital Versatile Disc)、ブルーレイ(登録商標)ディスク、半導体メモリ等のコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、音声案内プログラムは、インターネット等のネットワーク経由でインストールするかたちで提供してもよい。また、音声案内プログラムは、機器内のROM等に予め組み込んで提供してもよい。 The voice guidance program may be provided by recording it in the form of file information in an installable or executable format on a recording medium that can be read by a computer device, such as a CD-ROM or a flexible disk (FD). The voice guidance program may be provided by recording it on a recording medium that can be read by a computer device, such as a CD-R, a DVD (Digital Versatile Disc), a Blu-ray (registered trademark) disc, or a semiconductor memory. The voice guidance program may be provided by installing it via a network such as the Internet. The voice guidance program may be provided by being pre-installed in a ROM or the like within the device.
(音声案内動作)
図7及び図8は、実施の形態の音声案内システムにおける音声案内動作の流れを示すフローチャートである。このうち、図7は、音声案内動作の前半の流れを示すフローチャートである。また、図8は、音声案内動作の後半の流れを示すフローチャートである。
(Voice guidance operation)
7 and 8 are flowcharts showing the flow of the voice guidance operation in the voice guidance system of the embodiment. Of these, Fig. 7 is a flowchart showing the flow of the first half of the voice guidance operation, and Fig. 8 is a flowchart showing the flow of the second half of the voice guidance operation.
(ステップS1)
まず、図7のフローチャートにおいて、ステップS1では、映像取得部21が、各カメラ装置1で撮像されたユーザ(通行人)の撮像画像を取得する。
(Step S1)
First, in step S1 of the flowchart in FIG. 7, the video acquisition unit 21 acquires images of users (passersby) captured by each camera device 1.
(ステップS2)
ステップS1の後、ステップS2では、画像解析部23が、ステップS1で取得された撮像画像からユーザの特徴(人物特徴)、現在位置、移動方向を解析する。
(Step S2)
After step S1, in step S2, the image analysis unit 23 analyzes the user's features (personal features), current location, and moving direction from the captured image acquired in step S1.
ユーザの特徴としては、画像解析部23は、所定のアルゴリズムを用いて、そのユーザの年齢及び性別を検出する。また、画像解析部23は、撮像画像を解析することで、そのユーザの服装、服装の色、ハンドバッグ又はリュックサック等の所持品及び所持品の色等の特徴を検出する。これらの特徴を人物特徴と呼ぶ。 As for the user's characteristics, the image analysis unit 23 detects the user's age and gender using a predetermined algorithm. In addition, the image analysis unit 23 detects the user's characteristics such as clothing, clothing color, belongings such as a handbag or backpack, and the colors of the belongings by analyzing the captured image. These characteristics are called personal characteristics.
また、画像解析部23は、カメラ装置1で撮像されている撮像画像の各座標に対応する経緯度に基づいて、そのユーザの現在位置を検出する。また、画像解析部23は、例えば数フレームの一連の撮像画像に写っている同じユーザの現在位置の差から、そのユーザの移動方向を検出する。 The image analysis unit 23 also detects the current position of the user based on the longitude and latitude corresponding to each coordinate of the captured image captured by the camera device 1. The image analysis unit 23 also detects the direction of movement of the user from the difference in the current positions of the same user captured in a series of captured images, for example, several frames.
(ステップS3)
ステップS2の後、ステップS3において、画像解析部23が、撮像画像に写っているユーザが、健常者であるか、又は、視覚に障害のあるユーザであるかを判別する。
(Step S3)
After step S2, in step S3, the image analysis unit 23 determines whether the user shown in the captured image is a normal person or a visually impaired user.
一例ではあるが、視覚に障害のあるユーザは、白色の杖である盲人安全杖を所有している。これに対して、視覚に障害は無いが、歩行が困難な老人は、茶色又は黒色等の杖を使用している。このため、画像解析部23は、撮像画像に写っているユーザが所有している杖の色が白色であるか否かに基づいて、視覚に障害のあるユーザであるか否かを判別する。 As one example, a visually impaired user owns a blind safety cane, which is a white cane. In contrast, an elderly person who is not visually impaired but has difficulty walking uses a brown or black cane, etc. For this reason, the image analysis unit 23 determines whether or not a user in a captured image is visually impaired based on whether or not the cane owned by the user is white.
また、視覚に障害のあるユーザは、障害物の有無等を確認するために、盲人安全杖で地面等を軽く叩きながら歩行するという、独特の動きがある。画像解析部23は、このような独特な動きの有無も、視覚に障害のあるユーザであるか否かを判別するためのファクタとして用いる。 In addition, visually impaired users have a unique movement of lightly tapping the ground with a blind safety stick as they walk to check for the presence or absence of obstacles. The image analysis unit 23 uses the presence or absence of such a unique movement as a factor for determining whether or not a user is visually impaired.
また、視覚に障害のあるユーザは、盲導犬を連れている場合がある。通常の犬は、首輪又はハーネスに、1本の紐状のリードが取り付けられている。これに対して盲導犬の場合、「U字型ハーネス」又は「バーハンドル型ハーネス」と呼ばれる、独特の形状のハーネスが装着されている。画像解析部23は、このようなハーネスの形状も、視覚に障害のあるユーザであるか否かを判別するためのファクタとして用いる。 In addition, visually impaired users may be accompanied by guide dogs. Ordinary dogs are fitted with a collar or harness with a single string-like lead attached. Guide dogs, on the other hand, are fitted with a uniquely shaped harness called a "U-shaped harness" or "bar-handle harness." The image analysis unit 23 also uses the shape of such a harness as a factor for determining whether or not the user is visually impaired.
また、「U字型ハーネス」又は「バーハンドル型ハーネス」は、多くの場合、白色である。このため、画像解析部23は、犬に装着されているハーネスの色も、その犬を連れたユーザが、視覚に障害のあるユーザであるか否かを判別するためのファクタとして用いる。 Also, "U-shaped harnesses" or "bar-handle harnesses" are often white in color. For this reason, the image analysis unit 23 also uses the color of the harness worn by the dog as a factor for determining whether the user with the dog is visually impaired.
また、犬を連れての入場が制限される場所に対して、犬を連れて入場している場合、その犬は盲導犬であり、そのユーザは、視覚に障害のあるユーザである可能性が高い。このため、犬を連れての入場が制限される場所に対して、犬を連れているユーザを、画像解析部23は、視覚に障害のあるユーザとして判別する。 Furthermore, if a user enters a place where entry with dogs is restricted, the dog is likely to be a guide dog and the user is likely to be visually impaired. For this reason, the image analysis unit 23 determines that a user who is bringing a dog to a place where entry with dogs is restricted is a visually impaired user.
また、盲導犬は、多くの場合、ユーザの進行方向に対して左側を歩行することが多い。このため、画像解析部23は、ユーザの進行方向に対して左側を歩行している犬を連れているか否かということも、視覚に障害のあるユーザであるか否かを判別するためのファクタとして用いる。 In addition, guide dogs often walk on the left side of the user's direction of travel. For this reason, the image analysis unit 23 uses whether or not a user is accompanied by a dog that walks on the left side of the user's direction of travel as a factor for determining whether or not the user is visually impaired.
さらに、画像解析部23は、サングラスの着用の有無、身障者マークの有無等も、視覚に障害のあるユーザであるか否かを判別するためのファクタとして用いる。 In addition, the image analysis unit 23 also uses factors such as whether or not the user is wearing sunglasses, whether or not there is a handicapped mark, etc., to determine whether or not the user is visually impaired.
(ステップS3:No→ステップS1へ)
次に、撮像画像に写っているユーザが、健常者のみである場合(ステップS3:No)、処理がステップS1に戻り、画像解析部23により、ステップS1~ステップS3の処理が繰り返し行われる。これに対して、撮像画像に写っているユーザが、視覚に障害のあるユーザであると判別した場合(ステップS3:Yes)、ステップS4に処理が進む。
(Step S3: No → Go to step S1)
Next, if the users appearing in the captured image are all able-bodied individuals (step S3: No), the process returns to step S1, and the processes of steps S1 to S3 are repeatedly performed by the image analysis unit 23. On the other hand, if it is determined that the users appearing in the captured image are visually impaired users (step S3: Yes), the process proceeds to step S4.
(ステップS4)
ステップS4では、画像解析部23が、ステップS2において撮像画像を解析することで得た、その視覚に障害があると判別したユーザの特徴(人物特徴)をもとにユーザ情報テーブル52を参照し、同じ特徴(人物特徴)の情報がユーザIDおよび案内音声IDと対応付けて記憶されているか否かによって、そのユーザが既に登録されたユーザか否かを判別する。
(Step S4)
In step S4, the image analysis unit 23 refers to the user information table 52 based on the characteristics (personality characteristics) of the user determined to be visually impaired, obtained by analyzing the captured image in step S2, and determines whether the user is already a registered user based on whether information of the same characteristics (personality characteristics) is stored in correspondence with the user ID and guidance voice ID.
(ステップS4:No→ステップS14へ)
ユーザ情報テーブル52に登録された既知のユーザでない場合は(ステップS4:No)、ステップS14に処理が進む。
(Step S4: No → Go to step S14)
If the user is not a known user registered in the user information table 52 (step S4: No), the process proceeds to step S14.
(ステップS14:新規に案内音声IDの割り当て)
ステップS14では、ステップS4において既知のユーザでないと判断したユーザに対し、画像解析部23が新たにユーザIDを発行する。画像解析部23は、発行したユーザIDと解析したそのユーザの特徴(人物特徴)の情報を対応づけてユーザ情報テーブル52に記憶する。また、これと共に、出力音声割り当て部24が、現在、他のユーザに割り当てられていない声質の案内音声データ51を割り当てる。そして、出力音声割り当て部24は、その案内音声データ51のID(案内音声ID)、及び、そのユーザのユーザID及び特徴(人物特徴)を関連付けてユーザ情報テーブル52に記憶する。すなわち、出力音声割り当て部24は、各ユーザ用の案内音声データ51として、聴覚的に差異のある案内音声データ51を割り当てる。
(Step S14: Newly assign a guidance voice ID)
In step S14, the image analysis unit 23 issues a new user ID to the user determined in step S4 to be not a known user. The image analysis unit 23 associates the issued user ID with the analyzed information on the user's characteristics (personal characteristics) and stores them in the user information table 52. In addition, the output
(ステップS14の詳細説明)
聴覚的な差異は、性別、音声周波数(例えばフォルマント周波数)、音圧、音高、発話速度等のうち、いずれか一つ又は複数を異ならせることで生じさせる。具体的には、例えば視覚に障害のあるユーザが2名存在する場合、出力音声割り当て部24は、一方のユーザに対しては、男性の声の案内音声データ51を割り当て、他方のユーザに対しては、女性の声の音声データを割り当てる。または、出力音声割り当て部24は、一方のユーザに対しては、男性の声の案内音声データ51のうち、音声周波数が高く、発話速度が速い声質の案内音声データ51を割り当て、他方のユーザに対しては、同じ男性であっても、音声周波数が低く、発話速度が遅い声質の案内音声データ51を割り当てる。
(Detailed Description of Step S14)
The auditory difference is generated by making one or more of the following different: gender, voice frequency (e.g., formant frequency), sound pressure, pitch, speaking speed, etc. Specifically, for example, when there are two visually impaired users, the output
このように性別、音声周波数、音圧、音高、及び発話速度に基づいて、声質の異なる案内音声データ51を各ユーザに割り当てることで、各ユーザに対して、自分用の案内音声の声質を予め認識させ易くすることができる。
In this way, by assigning
(ステップS14→ステップS15;案内音声(事前認識用)の生成)
ステップS14の後、ステップS15において、出力音声割り当て部24は、ステップS13で割り当てられた案内音声IDに対応する案内音声データ51で、後述する「事前認識用音声案内」を内容とする案内音声を生成する。この際、出力音声割り当て部24は、案内音声データ51毎に対応づけられている、案内音声データ51の話者を示す固有名詞(例えば「太郎」又は「花子」など)を含む案内音声を生成する。このように生成した案内音声をユーザに対して出力することにより、これから自分に対して特定の話者の案内音声によって音声案内が行われることを、予め認識させることができる。
(Step S14 → Step S15: Generation of Guidance Voice (for Pre-recognition))
After step S14, in step S15, the output
(ステップS15の詳細説明)
出力音声割り当て部24は、割り当てられた案内音声IDに対応する案内音声データ51で、例えば「わたくし花子がご案内します」等の、「太郎」又は「花子」のような音声案内を行う話者を示す固有名詞を含む案内音声を生成する。これにより、自分に対しては、例えば「花子」の声質の案内音声で音声案内が行われることを、ユーザに対して予め認識させることができる。
(Detailed Description of Step S15)
The output
なお、この例は、「太郎」又は「花子」等の「名」の固有名詞を付加する例であった。この他、「氏」又は「氏名」の固有名詞を付加してもよいし、地名、国名、建物名等の他の固有名詞を付加してもよい。 Note that this example is an example of adding a proper noun "given name" such as "Taro" or "Hanako." In addition, a proper noun "surname" or "name" may be added, or other proper nouns such as place names, country names, building names, etc. may be added.
このようなステップS15の処理後、ステップS6へ処理が進む。 After step S15, the process proceeds to step S6.
(ステップS4:Yes)
一方、ステップS4において、既にユーザ情報テーブル52に登録された既知のユーザである場合は(ステップS4:Yes)、ステップS5に処理が進む。
(Step S4: Yes)
On the other hand, in step S4, if the user is a known user who has already been registered in the user information table 52 (step S4: Yes), the process proceeds to step S5.
(ステップS5:割り当てられた案内音声IDの取得)
ステップS5では、出力音声割り当て部24が、ユーザ情報テーブル52からそのユーザに割り当てられた案内音声IDを取得する。これにより、処理がステップS6へ進む。
(Step S5: Acquire assigned voice guidance ID)
In step S5, the output
ステップS6では、出力音声割り当て部24が、ステップS5で取得した、またはステップS13で割り当てた案内音声IDに対応する案内音声データ51で、ユーザの現在位置及び移動方向に対応する施設等の音声案内を含む案内音声を生成する。
In step S6, the output
(ステップS6の詳細説明)
具体的には、ユーザの現在位置が、例えば店舗の近くである場合、出力音声割り当て部24は、HDD15から「右手」、「に」、「店舗」、「A」、「が」、「ございます」等の各種単語毎に、割り当てられた案内音声IDに対応する案内音声データ51を読み出す。また、出力音声割り当て部24は、読み出した案内音声データ51を組み合わせることで、「右手に店舗Aがございます」等の、ユーザの現在位置及び移動方向に対応する音声案内を内容とする案内音声を生成する。
(Detailed Description of Step S6)
Specifically, when the user's current location is, for example, near a store, the output
(ステップS7~ステップS8:スピーカ装置の決定、案内音声出力)
ステップS6の後、ステップS7へ処理が進み、スピーカ切り替え部26が、各ユーザの現在位置、又は、現在位置及び移動方向に基づいて、案内音声を出力するスピーカ装置2を決定する。その後、ステップS8へ処理が進み、ステップS6において出力音声割り当て部24が生成した、ユーザの現在位置及び移動方向に対応する施設等の音声案内を内容とする案内音声を、スピーカ切り替え部26が、ステップS7において決定したスピーカ装置2を介して出力制御する。または、ステップS14において出力音声割り当て部24が生成した事前認識用音声案内、及び、ユーザの現在位置及び移動方向に対応する施設等の音声案内を内容とする案内音声を、ステップS7において決定したスピーカ装置2を介して、スピーカ切り替え部26が出力制御する。
(Steps S7 to S8: Determination of speaker device, output of guidance voice)
After step S6, the process proceeds to step S7, where the
(ステップS15~ステップS8の具体例)
ここで、「事前認識用音声案内」を含む案内音声を生成し、スピーカ装置2から出力するまでの流れについて、具体例を示して説明する。例えば、画像解析部23により解析されたユーザの特徴が、黒色のコートを着た女性である場合、出力音声割り当て部24は、HDD15から「黒」、「色」、「の」、「コート」、「を」、「着た」、「女性」、「の」、「方」等の各種単語毎に、そのユーザに割り当てた案内音声IDに対応する案内音声データ51を読み出す。また、出力音声割り当て部24は、読み出した案内音声データ51を組み合わせることで、「黒色のコートを着た女性の方」等の、解析されたユーザに対する音声案内であることをそのユーザに認識させるための音声案内(事前認識用音声案内)、およびそのユーザの現在位置及び移動方向に基づいた音声案内を含む案内音声を生成する。
(Specific example of steps S15 to S8)
Here, a flow of generating a guidance voice including the "pre-recognition voice guidance" and outputting it from the speaker device 2 will be described with a concrete example. For example, if the user's characteristics analyzed by the image analysis unit 23 are a woman wearing a black coat, the output
そして、スピーカ切り替え部26が、そのユーザの現在位置及び移動方向に基づいて、案内音声を出力するスピーカ装置を、例えば解析したそのユーザの撮像画像を撮像したカメラ装置1が設けられている端末装置60のスピーカ装置2に決定する。スピーカ切り替え部26は、決定したスピーカ装置2を介して、上述の案内音声を出力制御する。これにより、そのユーザに対して、上述の事前認識用音声案内を聞かせることができるので、今から出力される音声案内が、自分に対する音声案内であること、及び、その案内音声の声質を、そのユーザに対して予め認識させることができる。
Then, the
このようにして一人又は複数のユーザに対する音声案内が開始されると、スピーカ切り替え部26が、ユーザの現在位置及び移動方向に対応するスピーカ装置2を選択し、そのユーザに割り当てられた声質の案内音声を出力する。このように、ユーザに対する音声案内は、最初に割り当てられた声質の案内音声で、終始行われる。このため、視覚に障害のあるユーザが近接して複数存在した場合でも、異なる声質で各ユーザへの音声案内が行われるため、視覚に障害のある各ユーザは、出力されている音声案内が自分に対する音声案内であることを終始認識でき、混同することがない。よって、ユーザ毎に音声案内を有効に機能させることができる。
When voice guidance for one or more users is started in this manner, the
(ステップS9及びステップS10)
次に、ステップS8の後、図8のフローチャートのステップS9に処理が進み、出力音声割り当て部24が、サービスエリア外へユーザが移動したか否かを判定する。具体的には、出力音声割り当て部24は、ユーザ情報テーブル52への最終アクセス日時を参照し、現在時刻から一定時間(例えば1時間)以上前のものであれば、そのユーザはサービスエリア外へ移動したものと判定する。そのユーザはサービスエリア外へ移動したものと判定されると(ステップS9:Yes)、出力音声割り当て部24は、そのユーザに関する情報をユーザ情報テーブル52から消去する(ステップS10)。
(Steps S9 and S10)
Next, after step S8, the process proceeds to step S9 in the flowchart of Fig. 8, where the output
もしくは、画像解析部23が、施設出入口などのカメラ映像を解析することで、そのユーザが施設外へ移動したか否かを判定する(ステップS9)。カメラ映像により、そのユーザの施設外への移動が確認された場合(ステップS9:Yes)、出力音声割り当て部24は、そのユーザに関する情報をユーザ情報テーブル52から消去する(ステップS10)。
Alternatively, the image analysis unit 23 determines whether the user has moved outside the facility by analyzing camera footage of the facility entrance or exit (step S9). If the camera footage confirms that the user has moved outside the facility (step S9: Yes), the output
(複数のユーザに対する音声案内の具体例)
さらに、具体的に説明すると、図9~図12は、視覚に障害のあるユーザA及びユーザBに対して行う音声案内を模式的に示す図である。まず、図9に示すように店舗の第1の通路を、ユーザAが左方向から直進し、ユーザBが右方向から直進してきたとする。第1の通路に対しては、いわゆるT字路を形成するように第2の通路が設けられている。この第1の通路及び第2の通路に沿って、図1に示した端末装置60に相当する端末装置60a~60hが所定の間隔で配置されている。ユーザA及びユーザBは、各々端末装置60aのカメラ装置1及び端末装置60fのカメラ装置1で撮像され、ユーザAは「黒色のコートを着た女性」、ユーザBは「グレーのスーツを着た男性」の特徴を持つことが解析されたとする。
(Specific example of voice guidance for multiple users)
More specifically, Figs. 9 to 12 are diagrams that show voice guidance provided to visually impaired users A and B. First, as shown in Fig. 9, assume that user A goes straight from the left and user B goes straight from the right in a first aisle of a store. A second aisle is provided to the first aisle so as to form a so-called T-junction. Along the first and second aisles, terminal devices 60a to 60h corresponding to the terminal device 60 shown in Fig. 1 are placed at predetermined intervals. User A and user B are photographed by the camera device 1 of terminal device 60a and the camera device 1 of terminal device 60f, respectively, and it is analyzed that user A has the characteristics of "a woman wearing a black coat" and user B has the characteristics of "a man wearing a gray suit."
ユーザAは、第1の通路の端末装置60aのスピーカ装置2に近接した位置を歩行しており、ユーザBは、第1の通路の端末装置60fのスピーカ装置2に近接した位置を歩行している。この場合、スピーカ切り替え部26は、ユーザAに対する音声案内を出力するスピーカ装置として端末装置60aのスピーカ装置2を選択し、ユーザBに対する音声案内を出力するスピーカ装置として端末装置60fのスピーカ装置2を選択する。また、出力音声割り当て部24は、ユーザAに対しては、男性の話者の太郎さんの案内音声データ51(案内音声ID:M1)を割り当て、ユーザBに対しては、男性の話者の太郎さんとは異なる声質の、女性の話者の花子さんの案内音声データ51(案内音声ID:F1)を割り当てたものとする。
User A is walking near the speaker device 2 of terminal device 60a in the first passage, and user B is walking near the speaker device 2 of terminal device 60f in the first passage. In this case, the
スピーカ切り替え部26は、ユーザAに対して割り当てられた案内音声IDがM1の案内音声データ51で生成された、例えば「黒色のコートを着た女性の方、わたくし太郎がご案内します。」との事前認識用音声案内を含む案内音声を、端末装置60aのスピーカ装置2を介して出力する。これにより、ユーザAは、自分に対する音声案内は、男性の太郎さんの声で行われることを認識できる。なお、上述のように人物特徴に基づく事前認識用音声案内を行うことで、これから行われる音声案内が、自分用の音声案内であることを、ユーザAに対して、さらに認識させることができる。
The
同様に、スピーカ切り替え部26は、ユーザBに対して割り当てられた、案内音声IDがF1の案内音声データ51で生成された、例えば「グレーのスーツを着た男性の方、わたくし花子がご案内します。この先、左に店舗Bがございます。」との事前認識用音声案内を含む案内音声を、端末装置60fのスピーカ装置2を介して出力する。これにより、ユーザBは、自分に対する音声案内は、女性の花子さんの声で行われることを認識できる。なお、上述のように人物特徴に基づく事前認識用音声案内を行うことで、これから行われる音声案内が、自分用の音声案内であることを、ユーザBに対して、さらに認識させることができる。
Similarly, the
次に、図10に示すように、それぞれ直進するユーザA及びユーザBが、第2の通路に近い位置まで前進したとする。この場合、スピーカ切り替え部26は、ユーザAに対する案内音声を出力するスピーカ装置2として端末装置60bのスピーカ装置2を選択し、ユーザBに対する案内音声を出力するスピーカ装置2として端末装置60dのスピーカ装置2を選択する。
Next, as shown in FIG. 10, assume that user A and user B, who are moving straight ahead, advance to a position close to the second passage. In this case, the
そして、スピーカ切り替え部26は、ユーザAに対して割り当てられた案内音声IDがM1の案内音声データ51で生成された、例えば「この先、T字路です。店舗Aへは右折、店舗Bへは直進してください。」との案内音声を、端末装置60bのスピーカ装置2を介して出力する。また、スピーカ切り替え部26は、ユーザBに対して割り当てられた案内音声IDがF1の案内音声データ51で生成された、例えば「この先、T字路です。店舗Aへは左折してください。」との案内音声を、端末装置60dのスピーカ装置2を介して出力する。
The
次に、図11に示すように、ユーザAとユーザBが、ほぼ同時にT字路に差し掛かったとする。この場合、選択されるスピーカ装置は、同じ端末装置60cのスピーカ装置2となる。そして、スピーカ切り替え部26は、ユーザAに対して割り当てられた案内音声IDがM1の案内音声データ51で生成された、例えば「T字路です。店舗Aへは右折、店舗Bへは直進してください。」との案内音声を、端末装置60cのスピーカ装置2を介して出力する。また、スピーカ切り替え部26は、ユーザBに対して割り当てられた案内音声IDがF1の案内音声データ51で生成された、例えば「T字路です。店舗Aへは左折してください。」との案内音声を、端末装置60cのスピーカ装置2を介して出力する。
Next, as shown in FIG. 11, assume that user A and user B approach a T-junction at almost the same time. In this case, the speaker device selected is the speaker device 2 of the same terminal device 60c. The
図11の例では、各ユーザA、Bの位置は近接しているが、各ユーザA、Bは、事前に自分に対する案内音声の声質を認識している。また、ユーザAに対する音声案内で使用される案内音声IDがM1の声による案内音声と、ユーザBに対する音声案内で使用される案内音声IDがF1の声による案内音声とは、声質が異なるため、ユーザA及びユーザBは、自分に対する案内音声と、他方のユーザに対する案内音声を混同することなく聞き分けることができる。これにより、同じスピーカ装置2を介して、各ユーザA、Bに対する音声案内をほぼ同時に出力しても、それぞれ異なる声質の案内音声を、各ユーザA、Bが聞き分け、それぞれ自分に対する音声案内に従って行動することができる。このため、各ユーザA、Bに対する音声案内を有効に機能させることができる。 In the example of FIG. 11, users A and B are located close to each other, but each user A and B recognizes the voice quality of the guidance voice for them in advance. In addition, the guidance voice with the guidance voice ID M1 used in the voice guidance for user A and the guidance voice with the guidance voice ID F1 used in the voice guidance for user B have different voice qualities, so users A and B can distinguish the guidance voice for themselves from the guidance voice for the other user without confusing them. As a result, even if the voice guidance for users A and B is output almost simultaneously through the same speaker device 2, users A and B can distinguish the guidance voices with different voice qualities and act according to the voice guidance for themselves. This allows the voice guidance for users A and B to function effectively.
さらに、図12に示すように、第1の通路を直進することで、ユーザAが、端末装置60eのスピーカ装置2に近接した位置まで移動すると、スピーカ切り替え部26は、ユーザAに対して割り当てられた案内音声IDがM1の案内音声データ51で生成した、例えば「間も無く店舗Bに到着です。店舗Bは、右側にございます。」との案内音声を、端末装置60fのスピーカ装置2を介して出力する。これにより、ユーザAは、店舗Bまで自分が移動したことを認識できる。
Furthermore, as shown in FIG. 12, when user A moves straight down the first passage and reaches a position close to the speaker device 2 of terminal device 60e, the
また、第2の通路に進入したユーザB、端末装置60hのスピーカ装置2に近接した位置まで移動すると、ユーザBに対して割り当てられた案内音声IDがF1の案内音声データ51で生成した、例えば「間も無く店舗Aに到着です。店舗Aは、左側にございます。」との案内音声を、端末装置60hのスピーカ装置2を介して出力する。これにより、ユーザBは、店舗Aの近くまで自分が移動したことを認識できる。
When user B enters the second passage and moves to a position close to the speaker device 2 of the terminal device 60h, the guidance voice generated by the
このようにユーザの移動に応じてスピーカ装置2を切り替えながら、各ユーザに割り当てられた声質の異なる案内音声を出力することで、混同を生じさせることなく、各ユーザに対する音声案内を行うことができる。 In this way, by switching the speaker device 2 in response to the user's movement and outputting guidance voices with different voice qualities assigned to each user, it is possible to provide voice guidance to each user without causing confusion.
(緊急処理)
次に、図8のフローチャートのステップS11では、画像解析部23は、視覚に障害のあるユーザが、例えば白杖を頭上50cm程度に掲げる動作、又は、白杖をユーザの顔の前あたりで左右に振る動作等の、「助けを求める動き」の有無を検出する。このような「助けを求める動き」が検出されない場合(ステップS11:No)、処理がステップS1に戻る。
(Emergency Processing)
8, the image analysis unit 23 detects whether or not the visually impaired user is making a "movement calling for help," such as, for example, raising the white cane about 50 cm above the head or waving the white cane from side to side in front of the user's face. If such a "movement calling for help" is not detected (step S11: No), the process returns to step S1.
これに対して、「助けを求める動き」を検出した場合(ステップS11:Yes)、緊急処理部27が、視覚に障害のあるユーザが助けを求めていることを示す緊急通知を、例えば表示部18を介して行う(ステップS12)。
In contrast, if a "movement calling for help" is detected (step S11: Yes), the emergency processing unit 27 issues an emergency notification, for example via the
また、これと共に、ステップS13において、スピーカ切り替え部26は、助けを求めているユーザの現在位置に対応するスピーカ装置2を介して、例えば「管理者に緊急通知を行いました。すぐに助けが参りますので、しばらくお待ちください。」等の音声案内を行う。すなわち、スピーカ切り替え部26は、助けに応じて管理者に連絡した旨の音声案内、及び、しばらくの待機をお願いする音声案内を、そのユーザに対して割り当てられている声質の案内音声で行う。これにより、助けを求めた視覚に障害があるユーザに対して、自分の助けを求める要望に応じて管理者等が動いてくれていることを認識させることができ、安心感を与えることができる。また、この緊急通知を受信すると、管理者又は警備員等の補助者が、助けを求めているユーザの位置に直行して補助を行うなどの対応が可能となる。
In addition, in step S13, the
(実施の形態の効果)
以上の説明から明らかなように、実施の形態の音声案内システムは、視覚に障害のある複数のユーザが近接する位置に存在する場合、各ユーザに対して、それぞれ異なる声質の案内音声データ51を割り当てて案内音声を生成する。そして、割り当てた声質の案内音声を、各ユーザの移動位置に対応するスピーカ装置2を介して出力する。これにより、視覚に障害のあるユーザが同じ場所に複数存在する場合でも、各ユーザが自分に対する案内音声を容易に聞き分け可能となり、ユーザ毎に音声案内を有効に機能させることができる。
(Effects of the embodiment)
As is clear from the above description, when multiple visually impaired users are located close to each other, the voice guidance system of the embodiment generates a guidance voice by assigning
また、人物特徴を解析し、割り当てられた声質で、ユーザに対して自分に対する音声であることを認識させる音声案内(事前認識用音声案内)を行うことで、各ユーザに対して、自分用の案内音声を、他と区別してさらに認識させ易くすることができる。 In addition, by analyzing personal characteristics and providing voice guidance (pre-recognition voice guidance) in an assigned voice quality that helps the user recognize that the voice is directed at them, it becomes easier for each user to distinguish the voice guidance intended for them from others.
また、例えば「太郎」又は「花子」のように、音声案内を行う話者を示す固有名詞を音声案内に含めて出力することにより、各ユーザに対して、自分に対する音声案内を、より意識付けすることができる。 In addition, by including a proper noun indicating the speaker providing the audio guidance, such as "Taro" or "Hanako," in the audio guidance, each user can be made more aware of the audio guidance that is directed at them.
また、ユーザの移動に応じて、案内音声を出力するスピーカ装置2を切り替えるため、同じスピーカ装置2から、常時、案内音声が出力されることで音声案内が健常者、近隣の店舗の店員、近隣の居住者等に対するノイズとなる不都合を防止できる。 In addition, the speaker device 2 that outputs the guidance voice is switched according to the user's movement, so that the same speaker device 2 is always outputting the guidance voice, which can prevent the inconvenience of the voice guidance becoming a noise for able-bodied people, staff at nearby stores, nearby residents, etc.
なお、上述の実施の形態の例では、視覚に障害のある各ユーザ(通行人)の人物特徴をそれぞれ登録したユーザ情報テーブル52を用いることで、視覚に障害のある各ユーザ(通行人)を一意に識別することとした。しかし、これに限らず、下記のようにしてもよい。 In the above-described embodiment, each visually impaired user (passerby) is uniquely identified by using a user information table 52 in which the personal characteristics of each visually impaired user (passerby) are registered. However, this is not limiting, and the following may also be used.
例えば、視覚に障害のあるユーザ(通行人)に対して、自己の識別情報を含む電波を発信するBLEタグ等の無線タグを所持させる。BLEは、「Bluetooth(登録商標) Low Energy」の略語である。また、その無線タグが発信する自己の識別情報を含む電波の受信装置を、例えばカメラ装置1及びスピーカ装置2と共に端末装置60に設ける。 For example, a visually impaired user (passerby) is provided with a wireless tag such as a BLE tag that transmits radio waves including the user's own identification information. BLE is an abbreviation for "Bluetooth (registered trademark) Low Energy." In addition, a receiving device for the radio waves including the user's own identification information transmitted by the wireless tag is provided in the terminal device 60 together with the camera device 1 and the speaker device 2, for example.
受信装置は、無線タグからの電波を受信し、電波に含まれる識別情報を、ネットワーク5を介して解析装置3へ送信する。解析装置3は、識別情報を受信した受信装置と共に端末装置60に設けられているカメラ装置1で撮像された撮像画像を解析して検出したユーザの画像に、受信した識別情報を関連付けてデータベースに登録する。これにより、上述と同様に、視覚に障害のある各ユーザ(通行人)を一意に識別できる。 The receiving device receives radio waves from the wireless tag and transmits the identification information contained in the radio waves to the analysis device 3 via the network 5. The analysis device 3, together with the receiving device that received the identification information, analyzes the captured image captured by the camera device 1 provided in the terminal device 60, detects an image of the user, associates the received identification information with the detected image, and registers the image in a database. This allows each visually impaired user (passerby) to be uniquely identified, as described above.
最後に、上述の実施の形態は、一例として提示したものであり、本発明の範囲を限定することは意図していない。この新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことも可能である。また、実施の形態及び実施の形態の変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。 Finally, the above-described embodiment is presented as an example and is not intended to limit the scope of the present invention. This novel embodiment can be implemented in various other forms, and various omissions, substitutions, and modifications can be made without departing from the gist of the invention. Furthermore, the embodiment and modifications of the embodiment are included in the scope and gist of the invention, and are included in the scope of the invention and its equivalents described in the claims.
1 カメラ装置
2 スピーカ装置
3 解析装置
5 ネットワーク
11 CPU
12 ROM
13 RAM
14 通信部
15 HDD
16 入出力インターフェース(入出力I/F)
17 通信インターフェース(通信I/F)
18 表示部
19 操作部
21 映像取得部
22 地図データ取得部
23 画像解析部
24 出力音声割り当て部
25 通信制御部
26 スピーカ切り替え部
27 緊急処理部
50 地図データ
51 案内音声データ
52 ユーザ情報テーブル
Reference Signs List 1 Camera device 2 Speaker device 3 Analysis device 5
12 ROM
13 RAM
14
16 Input/Output Interface (Input/Output I/F)
17 Communication interface (communication I/F)
18
Claims (6)
前記検出部により、視覚に障害のあるユーザが複数検出された場合に、各ユーザに対して、それぞれ割り当てた異なる声質の案内音声データに基づいて案内音声を生成する割り当て部と、
前記検出部により検出された、視覚に障害のある各ユーザの少なくとも現在位置に対応する音声出力装置を介して、各ユーザに割り当てた異なる声質の案内音声データに基づいて生成された前記案内音声を出力制御する出力制御部と、
を備える音声案内装置。 a detection unit that detects a visually impaired user and detects at least a current location of the visually impaired user by analyzing an image captured by the camera device;
an allocation unit that generates a guidance voice based on guidance voice data of different voice qualities assigned to each user when a plurality of visually impaired users are detected by the detection unit;
an output control unit that controls output of the guidance voice generated based on the guidance voice data of different voice qualities assigned to each user via a voice output device corresponding to at least a current position of each visually impaired user detected by the detection unit;
A voice guidance device comprising:
を特徴とする請求項1に記載の音声案内装置。 The voice guidance device according to claim 1, wherein the allocation unit allocates guidance voice data that differs in at least one or more of gender, voice frequency, sound pressure, pitch, and speaking speed to each visually impaired user.
前記出力制御部は、各ユーザに対して割り当てられた声質の案内音声データで、検出した各ユーザの前記特徴を示す事前認識用音声案内を行うこと
を特徴とする請求項1又は請求項2に記載の音声案内装置。 The detection unit detects characteristics of each visually impaired user,
The voice guidance device according to claim 1 or 2, wherein the output control unit performs pre-recognition voice guidance indicating the characteristics of each detected user using guidance voice data of a voice quality assigned to each user.
を特徴とする請求項1から請求項3のうち、いずれか一項に記載の音声案内装置。 The voice guidance device according to claim 1 , wherein the allocation unit generates the guidance voice data including a proper noun indicating a speaker providing the voice guidance when generating the guidance voice data.
前記検出ステップで、視覚に障害のあるユーザが複数検出された場合に、割り当て部が、各ユーザに対して、それぞれ割り当てた異なる声質の案内音声データに基づいて案内音声を生成する割り当てステップと、
出力制御部が、前記検出ステップで検出された、視覚に障害のある各ユーザの少なくとも現在位置に対応する音声出力装置を介して、各ユーザに割り当てた異なる声質の案内音声データに基づいて生成された前記案内音声を出力制御する出力制御ステップと、
を備える音声案内方法。 a detection step in which a detection unit detects a visually impaired user by analyzing an image captured by the camera device, and detects at least a current position of the visually impaired user;
an allocation step in which, when a plurality of visually impaired users are detected in the detection step, an allocation unit generates a guidance voice based on guidance voice data of different voice qualities assigned to each user;
an output control step in which an output control unit controls output of the guidance voice generated based on the guidance voice data of different voice qualities assigned to each user via a voice output device corresponding to at least a current position of each visually impaired user detected in the detection step;
The voice guidance method includes:
カメラ装置で撮像された撮像画像を解析することで、視覚に障害のあるユーザを検出すると共に、視覚に障害のあるユーザの少なくとも現在位置を検出する検出部と、
前記検出部により、視覚に障害のあるユーザが複数検出された場合に、各ユーザに対して、それぞれ割り当てた異なる声質の案内音声データに基づいて案内音声を生成する割り当て部と、
前記検出部により検出された、視覚に障害のある各ユーザの少なくとも現在位置に対応する音声出力装置を介して、各ユーザに割り当てた異なる声質の案内音声データに基づいて生成された前記案内音声を出力制御する出力制御部として機能させること、
を特徴とする音声案内プログラム。 Computer,
a detection unit that detects a visually impaired user and detects at least a current location of the visually impaired user by analyzing an image captured by the camera device;
an allocation unit that generates a guidance voice based on guidance voice data of different voice qualities assigned to each user when a plurality of visually impaired users are detected by the detection unit;
functioning as an output control unit that controls output of the guidance voice generated based on guidance voice data of different voice qualities assigned to each user via a voice output device corresponding to at least the current position of each visually impaired user detected by the detection unit;
A voice guidance program that features:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021088998A JP7699471B2 (en) | 2021-05-27 | 2021-05-27 | Voice guidance device, voice guidance method, and voice guidance program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021088998A JP7699471B2 (en) | 2021-05-27 | 2021-05-27 | Voice guidance device, voice guidance method, and voice guidance program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022181825A JP2022181825A (en) | 2022-12-08 |
| JP7699471B2 true JP7699471B2 (en) | 2025-06-27 |
Family
ID=84328952
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021088998A Active JP7699471B2 (en) | 2021-05-27 | 2021-05-27 | Voice guidance device, voice guidance method, and voice guidance program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7699471B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7715768B2 (en) * | 2023-08-10 | 2025-07-30 | Toa株式会社 | A system and server that acquires and amplifies sensor information |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002336293A (en) | 2001-05-16 | 2002-11-26 | Matsushita Electric Ind Co Ltd | Guidance guidance system |
| US20180053498A1 (en) | 2016-08-22 | 2018-02-22 | International Business Machines Corporation | Social Networking with Assistive Technology Device |
| US20190333496A1 (en) | 2016-11-14 | 2019-10-31 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Spatialized verbalization of visual scenes |
-
2021
- 2021-05-27 JP JP2021088998A patent/JP7699471B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002336293A (en) | 2001-05-16 | 2002-11-26 | Matsushita Electric Ind Co Ltd | Guidance guidance system |
| US20180053498A1 (en) | 2016-08-22 | 2018-02-22 | International Business Machines Corporation | Social Networking with Assistive Technology Device |
| US20190333496A1 (en) | 2016-11-14 | 2019-10-31 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Spatialized verbalization of visual scenes |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022181825A (en) | 2022-12-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11030422B2 (en) | Information display device and information display system | |
| US20180172464A1 (en) | In-vehicle device and route information presentation system | |
| JP7139921B2 (en) | Vehicle and notification method | |
| KR102324740B1 (en) | Apparatus and method of speaking object location information for blind person | |
| WO2020075283A1 (en) | Abnormal person prediction system, abnormal person prediction method, and program | |
| JP2020052856A (en) | Rescue support server, rescue support system and program | |
| WO2021219920A1 (en) | A solution for generating a touchless elevator call | |
| JP7699471B2 (en) | Voice guidance device, voice guidance method, and voice guidance program | |
| US20220196428A1 (en) | Method, apparatus and computer readable recording medium for providing user-customized geographic information and analysis information using universal map | |
| JP2021039582A (en) | Guidance system, information processing device, guidance method, and program | |
| JP7574018B2 (en) | Interactive response device | |
| JP2025015811A (en) | Voice guidance system, voice guidance method and voice guidance program | |
| KR102526883B1 (en) | Barrier-free unmanned guidance device and control method thereof | |
| KR102507001B1 (en) | Bus information exchange system providing user interface means for the transportation vulnerable and method for providing user interface means for the transportation vulnerable | |
| JP7239013B2 (en) | GUIDING DEVICE, GUIDING METHOD, PROGRAM | |
| US20230230482A1 (en) | Boarding and alighting time informing method | |
| JP7643369B2 (en) | Voice Guidance Method | |
| KR102146918B1 (en) | Method, apparatus and computer readable recording medium for providing customized geographic information based on universal map | |
| JP7545267B2 (en) | Interactive response device | |
| KR20200073952A (en) | System and method for managing building evacuation | |
| KR20190066523A (en) | Method for directing personal route considering walk type and apparatus using the same | |
| JP2002163760A (en) | Guidance guidance system, guidance guidance device, guidance guidance method, and computer-readable recording medium recording a program for causing a computer to execute the method | |
| JP7823434B2 (en) | Guidance device, program, guidance system, and guidance method | |
| JP6662979B1 (en) | Visitor management system and visitor management program | |
| US20260049835A1 (en) | System |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240415 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250603 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250617 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7699471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |