JP7605582B2 - Object guidance control device, object guidance control method, and program - Google Patents
Object guidance control device, object guidance control method, and program Download PDFInfo
- Publication number
- JP7605582B2 JP7605582B2 JP2019144180A JP2019144180A JP7605582B2 JP 7605582 B2 JP7605582 B2 JP 7605582B2 JP 2019144180 A JP2019144180 A JP 2019144180A JP 2019144180 A JP2019144180 A JP 2019144180A JP 7605582 B2 JP7605582 B2 JP 7605582B2
- Authority
- JP
- Japan
- Prior art keywords
- vehicle
- guidance
- user
- guidance target
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Navigation (AREA)
Description
本発明は、対象案内制御装置、対象案内制御方法、およびプログラムに関する。 The present invention relates to a target guidance control device, a target guidance control method, and a program.
従来、車両において経路案内や周囲の施設の案内等を行うガイドシステムが普及している。当該ガイドシステムが搭載されたカーナビゲーション装置は、自動車等の車両における経路案内によく用いられている。また、当該ガイドシステムは、観光客に対する観光案内にも用いられている。 Traditionally, guidance systems that provide route guidance and guidance to surrounding facilities in vehicles have become widespread. Car navigation devices equipped with such guidance systems are often used for route guidance in vehicles such as automobiles. Such guidance systems are also used to provide tourist information to tourists.
例えば、下記特許文献1には、車内にバスガイド等の案内者がいなくても、観光客に対して観光案内を自動で行うことが可能なガイドシステムが開示されている。当該技術では、車外を撮像可能に設けられた撮像装置が観光案内の対象を撮像した場合、あらかじめ用意された音声データに基づく音声出力により観光案内が行われる。 For example, the following Patent Document 1 discloses a guide system that can automatically provide tourist information to tourists even when there is no guide such as a bus guide on board the vehicle. In this technology, when an imaging device that is installed to be able to capture images of the outside of the vehicle captures an image of a target for tourist information, tourist information is provided by audio output based on previously prepared audio data.
また、近年では、スマートフォンの普及に伴い、スマートフォンで経路案内や周囲の施設の案内が可能なアプリケーションが普及している。そのため、カーナビゲーション装置がスマートフォンで代用されることもある。さらに、音声認識技術の発展に伴い、音声により制御可能なスピーカ型の音声インタフェース装置(例えばスマートスピーカ)も普及してきている。そのため、将来的に、カーナビゲーション装置がスマートスピーカに置き換わり、ユーザの音声入力に基づき、スマートスピーカが経路案内や車両の周囲の施設の案内等を行う可能性がある。 In recent years, with the spread of smartphones, applications that can provide route guidance and guidance to nearby facilities on smartphones have also become widespread. As a result, car navigation devices are sometimes substituted with smartphones. Furthermore, with the development of voice recognition technology, speaker-type voice interface devices (e.g., smart speakers) that can be controlled by voice are also becoming popular. Therefore, in the future, car navigation devices may be replaced by smart speakers, which may provide route guidance and guidance to facilities around the vehicle based on the user's voice input.
しかしながら、従来のスマートスピーカが移動している車両の車内に設けられた場合、当該スマートスピーカは、車内の情報を取得することはできるが、車外の情報を取得することは困難である。例えば、ユーザが車外のランドマーク等を「あの建物は何?」等のランドマークの名称を特定しない方法で案内の対象として指定した場合、スマートスピーカは、ユーザから案内の要求があったことは認識し得る。しかしながら、ユーザが車外のどのランドマークを案内の対象として指定したかをスマートスピーカが認識することは困難である。そのため、スマートスピーカは、ユーザが指定したランドマークを正しく認識することが難しいため、誤った案内を行う可能性がある。 However, when a conventional smart speaker is installed inside a moving vehicle, the smart speaker can obtain information inside the vehicle, but has difficulty obtaining information outside the vehicle. For example, if a user specifies a landmark outside the vehicle as a guidance target in a manner that does not specify the name of the landmark, such as "What is that building?", the smart speaker can recognize that the user has requested guidance. However, it is difficult for the smart speaker to recognize which landmark outside the vehicle the user specified as the guidance target. Therefore, the smart speaker may provide erroneous guidance because it has difficulty correctly recognizing the landmark specified by the user.
上述の課題を鑑み、本発明の目的は、車両に乗車しているユーザが案内を求める対象として指定した案内対象に関する案内の精度を向上することが可能な対象案内制御装置、対象案内制御方法、およびプログラムを提供することにある。 In view of the above problems, the object of the present invention is to provide a target guidance control device, a target guidance control method, and a program that can improve the accuracy of guidance regarding a target designated by a user in a vehicle as a target for which guidance is requested.
上述の課題を解決するために、本発明の一態様に係る対象案内制御装置は、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、を備える。 In order to solve the above-mentioned problems, a target guidance control device according to one embodiment of the present invention includes a detection unit that detects candidates for a guidance target designated by a user based on the voice of a user riding in a vehicle, an in-vehicle image in which a pose of the user is captured to designate a guidance target for which the user requests guidance, and an image of the surroundings of the vehicle; an identification unit that identifies a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified orientation of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies the voice spoken by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined ; and an output control unit that outputs output information related to the guidance target based on the spatial information corresponding to the identified guidance target.
本発明の一態様に係る対象案内制御方法は、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出することと、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給することと、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させることと、を含み、プロセッサにより実行される。 A target guidance control method according to one aspect of the present invention includes: detecting candidates for a guidance target designated by a user based on a voice of a user riding in a vehicle, an in-vehicle image in which a pose of the user is captured to designate a guidance target for which the user requests guidance, and an image of the surroundings of the vehicle; identifying a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifying a direction of the guidance target in the spatial information based on the identified orientation of the vehicle , determining whether the guidance target can be uniquely determined from the candidates based on the identified direction , identifying the guidance target if it is possible to determine it, and supplying the voice spoken by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it is not possible to determine the guidance target, and is executed by a processor.
本発明の一態様に係るプログラムは、コンピュータを、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、として機能させる。
A program according to one aspect of the present invention causes a computer to function as: a detection unit that detects candidates for a guidance target designated by a user based on the voice of a user riding in a vehicle, an in-vehicle image in which a pose of the user is captured to designate a guidance target for which the user requests guidance, and an image of the surroundings of the vehicle; an identification unit that identifies a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified orientation of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies the voice spoken by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined; and an output control unit that outputs output information related to the guidance target based on the spatial information corresponding to the identified guidance target.
本発明によれば、車両に乗車しているユーザが案内を求める対象として指定した案内対象に関する案内の精度を向上することができる。 The present invention can improve the accuracy of guidance regarding a target specified by a user in a vehicle for which guidance is requested.
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の実施形態に係る対象案内制御システム1の概要を示す図である。対象案内制御システム1は、図1に示す対象案内制御装置10、車両20、およびネットワーク30で構成される。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
1 is a diagram showing an overview of an object guidance control system 1 according to an embodiment of the present invention. The object guidance control system 1 is composed of an object
対象案内制御装置10は、車両20のユーザ40が案内を求める対象として指定した案内対象に関する案内の制御(以下、「案内制御」とも称される)を行う装置である。対象案内制御装置10は、例えば、サーバ装置等のコンピュータにより実現される。
The target
対象案内制御装置10は、図1に示すように、ネットワーク30を介して車両20と接続されており、車両20と情報の送受信が可能である。本実施形態に係る対象案内制御装置10は、ネットワーク30を介して車両20から受信した情報に基づき、案内制御を行う。また、対象案内制御装置10は、ネットワーク30を介して、案内制御に関する情報を車両20へ送信する。
As shown in FIG. 1, the object
車両20は、搭乗者(例えばユーザ40)を乗せて移動する移動体である。本実施形態に係る車両20は、一例として、自動運転車で実現されるものとする。車両20が自動運転車である場合、ユーザ40は、必ずしも運転する必要はない。車両20は、非自動運転車であってもよい。
The
車両20には、各種情報を取得するためのセンサ装置が設けられている。例えば、図1に示すように、マイク212、車内カメラ214a、車内カメラ214b、車内カメラ214c、車外カメラ216a、車外カメラ216b、およびスピーカ242が車両20に設けられる。マイク212は、車両20の車内で生じた音声を取得可能に設けられる。車内カメラ214a~214c(以下、「車内カメラ214」とも称される)は、車両20の車内の様子を撮像可能に設けられる。例えば、車内カメラ214は、図1に示すように、それぞれ車両20の上部前方、上部中央、上部後方に設けられ、各々の位置から車両20の車内を撮像して撮像画像(静止画像または動画像)を取得する。車外カメラ216aおよび車外カメラ216b(以下、「車外カメラ216」とも称される)は、車両20の車外の様子を撮像可能に設けられる。例えば、車外カメラ216は、図1に示すように、それぞれ車両20の前方と後方に設けられ、各々の位置から車両20の車外を撮像する。なお、車両20に設けられるセンサ装置の種類、数、および位置は、図1に示す例に限定されない。
The
車両20には、出力情報を出力するための出力装置も設けられている。例えば、図1に示すように、スピーカ242が車両20に設けられる。スピーカ242は、出力情報として案内対象に関する情報(以下、「案内情報」とも称される)を車両20の車内に向けて出力可能に設けられる。なお、車両20に設けられる出力装置の種類、数、および位置は、図1に示す例に限定されない。また、出力装置は、ユーザ40が有する端末であってもよい。ユーザ40が有する端末は、例えば、スマートフォン、タブレット端末、ヒアラブル端末等である。
The
案内対象は、車両20の周囲に存在するランドマークの内、ユーザ40が指定したランドマークである。図1に示すように、車両20の周囲にはランドマークとしてビル50とビル51がある。進行方向が矢印22の方向である車両20の車内にいるユーザ40から見て、ビル50はユーザ40の右前方にあり、ビル51はユーザ40の左前方にある。なお、ランドマークはビルに限定されない。
案内情報は、案内対象の紹介情報、案内対象までの経路情報等を含む。
The guidance target is a landmark designated by the
The guidance information includes introduction information of the guidance target, route information to the guidance target, and the like.
図1では、ユーザ40は、吹き出し42に示されるように「右前のビル」と発話し、音声により案内対象を指定している。同時に、ユーザ40は、指で矢印44の方向(ユーザ40から見て右前方)を指す動作により案内対象を指定している。これより、図1における案内対象はビル50と特定される。なお、ユーザ40は、案内対象を指定する際に、質問形式の発話を行ってもよい。例えば、ユーザ40は、「右前のビルは何?」と発話してもよい。
In FIG. 1, the
このような案内対象を特定する処理(以下、「案内対象特定処理」とも称される)は、車両20にて取得される音声や、ユーザ40が案内対象を指定する動作に基づき、対象案内制御装置10により行われる。ユーザ40が案内対象を指定する動作は、例えば、指で指す動作、棒状の物(例えば指示棒、ペンなど)で指す動作、腕全体で指す動作などである。また、対象案内制御装置10は、ユーザ40の顔の向きや視線の方向を示す情報も用いて、案内対象特定処理を行ってもよい。なお、案内対象特定処理の詳細は後述される。
The process of identifying such a guidance target (hereinafter also referred to as "guidance target identification process") is performed by the target
なお、対象案内制御装置10は、その構成要素の一部または全部を、車両20に備えることが可能な装置として実現されてもよい。車両20に備えられた対象案内制御装置10の構成要素は、車両20が備える各装置と情報の送受信が可能になるように、各装置と有線または無線により接続され得る。一方、車両20に備えられなかった対象案内制御装置10の構成要素は、例えばサーバ装置等により実現され、ネットワーク30を介して、車両20に備えられた対象案内制御装置10の構成要素や、車両20が備える各装置と連携を行い得る。
The object
以上、本実施形態の概要について説明した。続いて、本実施形態に係る対象案内制御システム1の構成例について説明する。図2は、本実施形態に係る対象案内制御システム1の構成例を示すブロック図である。なお、以下では、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1の構成例について説明する。
The outline of this embodiment has been described above. Next, an example of the configuration of the object guidance control system 1 according to this embodiment will be described. FIG. 2 is a block diagram showing an example of the configuration of the object guidance control system 1 according to this embodiment. Note that, below, an example of the configuration of the object guidance control system 1 in the case where not all of the components of the object
(車両20の構成例)
図2に示すように、車両20は、取得部210、通信部220、制御部230、および案内情報出力部240を備える。
(Configuration example of vehicle 20)
As shown in FIG. 2 , the
(取得部210)
取得部210は、各種情報を取得する機能を有する。当該機能は、多様なセンサ装置により実現され得る。本実施形態に係る取得部210は、例えば、上述したマイク212、車内カメラ214、車外カメラ216等のセンサ装置を備える。また、取得部210は、車両20の位置情報を取得するセンサ装置を備えてもよい。一例として、取得部210は、GPS(Global Positioning System)を備える。これらのセンサ装置によるセンシング情報の取得後、取得部210は、センシング情報を通信部220へ出力する。
(Acquisition unit 210)
The
なお、取得部210が備えるセンサ装置はかかる例に限定されない。例えば、取得部210は、車両20の車内外の様子を示す情報を取得するセンサ装置として、LiDAR(Laser Imaging Detection and Ranging)等の測距センサを備えてもよい。
The sensor device equipped in the
(通信部220)
通信部220は、外部装置と通信を行う機能を有する。通信部220は、外部装置との通信にて受信する情報を制御部230へ出力する。一例として、通信部220は、ネットワーク30を介して対象案内制御装置10から受信した案内情報を、制御部230へ出力する。また、通信部220は、取得部210から入力される情報を対象案内制御装置10へ送信する。一例として、通信部220は、取得部210から入力されるセンシング情報を、ネットワーク30を介して対象案内制御装置10へ送信する。
(Communication unit 220)
The
(制御部230)
制御部230は、車両20の動作全般を制御する機能を有する。制御部230は、例えば、車両20がハードウェアとして備えるCPU(Central Processing Unit)にプログラムを実行させることによって実現される。例えば、制御部230は、取得部210が有する各センサ装置の動作を制御する。また、制御部230は、通信部220から入力される案内情報の案内情報出力部240への出力を制御する。また、車両20が自動運転車である場合、制御部230は、車両20の自動運転を制御する。
(Control unit 230)
The
(案内情報出力部240)
案内情報出力部240は、案内情報の出力を行う機能を有する。案内情報は、例えば、制御部230から入力され、多様な出力装置により出力され得る。例えば、案内情報出力部240がスピーカ等の音声出力装置を備える場合、案内情報出力部240は、音声に変換された案内情報をスピーカから出力する。また、案内情報出力部240がディスプレイ等の表示装置を備える場合、案内情報出力部240は、画像に変換された案内情報をディスプレイに表示する。
(Guidance Information Output Unit 240)
The guidance
(対象案内制御装置10の構成例)
図2に示すように、対象案内制御装置10は、通信部110、制御部120、および記憶部130を備える。
(Configuration example of the object guidance control device 10)
As shown in FIG. 2 , the object
(通信部110)
通信部110は、外部装置と通信を行う機能を有する。通信部110は、外部装置との通信にて受信する情報を制御部120へ出力する。一例として、通信部110は、ネットワーク30を介して車両20から受信したセンシング情報を、制御部120へ出力する。また、通信部110は、制御部120から入力される情報を車両20へ送信する。一例として、通信部110は、制御部120から入力される案内情報を、ネットワーク30を介して車両20へ送信する。
(Communication unit 110)
The
(制御部120)
制御部120は、対象案内制御装置10の動作全般を制御する機能を有する。制御部120は、例えば、対象案内制御装置10がハードウェアとして備えるCPUにプログラムを実行させることによって実現される。当該機能を実現するために、制御部120は、検出部122、特定部124、および出力制御部126を備える。
(Control unit 120)
The
(検出部122)
検出部122は、案内対象の候補を検出する機能を有する。例えば、検出部122は、車両20に乗車しているユーザ40の音声とユーザ40が案内対象を指定する動作と車両20の周囲の撮像画像とに基づき、案内対象の候補を検出する。具体的に、検出部122は、撮像画像を分析することで案内対象の候補群を検出し、音声を分析して検出する案内対象に関連する自然言語と、ユーザ40の動作を分析して検出する方向とに基づき、候補群の中から方向に存在する候補を検出する。
(Detection Unit 122)
The
ここで、図3を参照しながら、案内対象の候補の検出の例について説明する。図3は、本実施形態に係る案内対象の候補の検出の例の説明図である。まず、検出部122は、車両20のマイク212が取得する音声を分析することで、音声から自然言語を検出する。検出した自然言語から、ユーザ40が案内を求めていることを示すボイスコマンドが検出された場合、検出部122は、さらに音声を分析し、案内対象に関する自然言語を検出する。例えば、検出部122は、吹き出し42に示す「右前のビル」という音声を案内対象に関連する自然言語として検出する。図3に示す例では、ユーザ40は車両20の進行方向である矢印22の方向を向いているため、検出部122は、検出した自然言語から車両20の右前にあるビル50をユーザ40が指していることを検出できる。
Here, an example of detection of a candidate for guidance will be described with reference to FIG. 3. FIG. 3 is an explanatory diagram of an example of detection of a candidate for guidance according to this embodiment. First, the
さらに、検出部122は、車両20の車内カメラ214が取得する車内の撮像画像に写るユーザ40のポーズを分析することで、ユーザ40が矢印44の方向を指していることを検出する。また、検出部122は、車両20の車外カメラ216が取得する車外の撮像画像に写る車外風景を分析することで、図3に示すビル50とビル51を案内対象の候補群として検出する。以上の検出結果より、検出部122は、候補群の中から、車両20の右前かつ矢印44の方向にあるビル50を案内対象の候補として検出する。
Furthermore, the
以上説明したように、検出部122は、移動している車両20の車内のユーザ40の音声とユーザ40の動作に基づき、車両20の車外風景から検出された案内対象の候補群とユーザ40が指定した案内対象とを結び付けることができる。かかる構成により、検出部122は、移動している車両20の車外のランドマークを案内対象の候補として検出することができる。また、検出部122は、案内対象の候補の検出時に、車両20の車内のユーザ40の音声とユーザ40の動作の両方を用いるため、案内対象の候補の検出の精度を向上することができる。なお、検出部122は、候補群の中から、1つの案内対象の候補を検出してもよいし、複数の案内対象の候補を検出してもよい。
As described above, the
(特定部124)
特定部124は、検出部122が検出した案内対象の候補から、ユーザ40が指定した案内対象を特定する機能を有する。例えば、特定部124は、車両20の位置情報に基づき車両20の周囲の空間情報における車両20の位置と向きを特定し、特定した車両20の向きを基準に空間情報における案内対象の方向を特定し、特定した方向に基づいて案内対象の候補から案内対象を特定する。本実施形態に係る車両20の周囲の空間情報は、例えば、車両20の周囲の3次元地図、3次元地図上のランドマークのメタデータ等を含むランドマーク情報等である。なお、空間情報は、かかる例に限定されない。
(Identification unit 124)
The
ここで、図4を参照しながら、車両20の位置情報と3次元地図との対応付けについて説明する。図4は、本実施形態に係る車両20の位置情報と3次元地図との対応付けの例の説明図である。図4に示すように、3次元地図60は、ビル50、ビル51、および山52等のランドマークの3次元データを有するものとする。
Here, the correspondence between the position information of the
まず、特定部124は、車両20のGPSが取得する位置情報から3次元地図における車両20の位置と向きを特定し、車両20を3次元地図上にマッピングする。車両20の向きは、例えば、ジャイロセンサのセンシング情報や車両20の移動履歴等に基づき特定されてもよい。次いで、特定部124は、3次元地図上にて、矢印22が示す車両20の向きを基準に、ユーザ40が指定した案内対象の方向を特定する。そして、特定部124は、案内対象の候補から、特定した方向(矢印44)に存在する候補であるビル50を案内対象として特定する。
First, the
以上説明したように、特定部124は、車両20の位置情報と3次元地図に基づき、検出部122が検出した案内対象の候補から、ユーザ40が指定した案内対象を3次元地図上で一義的に特定することができる。かかる構成により、特定部124は、検出部122が1つの案内対象の候補を検出した場合には、案内対象であることの確度を高めることができる。また、特定部124は、検出部122が複数の案内対象の候補を検出した場合には、案内対象を絞り込むことができる。これにより、案内対象の特定精度が向上するため、ユーザ40が指定した案内対象に関する案内の精度も向上することが可能となる。
As described above, the
(出力制御部126)
出力制御部126は、車両20における出力を制御する機能を有する。例えば、出力制御部126は、特定した案内対象と対応する空間情報に基づき、案内対象に関する出力情報を車両20の出力装置に出力させる。具体的に、まず、出力制御部126は、特定した案内対象のメタデータをランドマーク情報から取得し、メタデータに基づき案内情報を生成する。そして、出力制御部126は、生成した案内情報を通信部110に車両20へ送信させ、車両20の出力装置に案内情報を出力させる。
(Output control unit 126)
The
案内対象がビルである場合、メタデータは、例えば、ビルの名称、住所、フロア数、各フロアのテナント情報等である。出力制御部126は、これらのメタデータに基づき、例えば、「あのビルはAAAビルです。」という紹介文を紹介情報として生成する。そして、出力制御部126は、車両20の出力装置に応じて、出力装置に紹介情報を出力させる。例えば、出力装置が音声出力装置である場合、出力制御部126は、紹介文を音声に変換して音声出力装置に出力させる。また、出力装置が表示装置である場合、出力制御部126は、紹介文を画像に変換して表示装置に出力させる。かかる構成により、ユーザ40に対して、案内対象の特定後に取得するランドマーク情報に基づき、特定した案内対象や取得したランドマーク情報に応じた柔軟な案内を行うことができる。
When the guidance target is a building, the metadata is, for example, the building's name, address, number of floors, tenant information for each floor, etc. Based on this metadata, the
案内情報の生成時、出力制御部126は、車両20やユーザ40の状況、ユーザ40のプロファイル情報に応じて、案内情報を生成してもよい。車両20の状況は、例えば、車両20の位置、向き、速度、移動経路等である。ユーザ40の状況は、例えば、ユーザ40の姿勢、車内におけるユーザ40の位置等である。ユーザ40のプロファイル情報は、例えば、ユーザ40の名前、性別、身長、体重、趣味、対象案内制御システムの使用履歴等である。出力制御部126は、ユーザ40のプロファイル情報に基づき、例えば、「あのビルはAAAビルです。ビルの中には、以前にご案内したBBBカフェがあります。」という紹介文を紹介情報として生成する。かかる構成により、ユーザ40に対して、車両20やユーザ40の状況、ユーザ40のプロファイル情報に応じた柔軟な案内を行うことができる。
When generating the guidance information, the
(記憶部130)
記憶部130は、各種情報を記憶する機能を有する。記憶部130は、記憶媒体、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、RAM(Random Access read/write Memory)、ROM(Read Only Memory)、またはこれらの記憶媒体の任意の組み合わせによって構成される。記憶部130は、例えば、不揮発性メモリを用いることができる。
(Memory unit 130)
The
記憶部130、例えば、3次元地図やランドマーク情報等の車両20の周囲の空間情報を記憶する。また、記憶部130は、車両20の取得部210が取得したセンシング情報、対象案内制御装置10の特定部124が案内対象として特定したランドマーク、出力制御部126が生成した出力情報、ユーザ40のプロファイル情報等を記憶してもよい。
The
以上、対象案内制御装置10の構成要素の全部が車両20には備えられずサーバ装置等により実現される場合の対象案内制御システム1の構成例について説明した。なお、対象案内制御システム1の構成例はかかる例に限定されない。例えば、対象案内制御装置10の構成要素の全部が車両20に備えられる場合、外部装置と通信を行う機能を有する構成要素として、通信部110または通信部220の少なくとも一方が車両20に設けられればよい。
The above describes an example configuration of the object guidance control system 1 in the case where not all of the components of the object
(対象案内制御システム1における処理の流れ)
続いて、本実施形態に係る対象案内制御システム1における処理の流れについて説明する。図5は、本実施形態に係る対象案内制御システム1における処理の流れを示すフローチャートである。なお、以下では、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1における処理の流れの例について説明する。
(Processing flow in the object guidance control system 1)
Next, a process flow in the object guidance control system 1 according to the present embodiment will be described. Fig. 5 is a flowchart showing a process flow in the object guidance control system 1 according to the present embodiment. Note that, below, an example of a process flow in the object guidance control system 1 in the case where not all of the components of the object
まず、車両20のマイク212は、車両20の車内における音声を取得する(S102)。マイク212が取得した音声は、ネットワーク30を介して対象案内制御装置10へ送信される。マイク212が音声を取得すると、車両20の制御部230は、車両20の車内カメラ214をオンにする(S104)。また、制御部230は、車両20の車外カメラ216もオンにする(S106)。
First, the
次いで、ユーザ40が発話すると(S108)、マイク212がユーザ40の発話を含む音声を取得し、当該音声がネットワーク30を介して対象案内制御装置10へ送信される。次いで、対象案内制御装置10の制御部120は、案内を求めるボイスコマンドが受信した音声に含まれるか否かを判定する(S110)。音声にボイスコマンドが含まれない場合(S110/NO)、対象案内制御システム1は、音声にボイスコマンドが含まれるまでS108とS110の処理を行う。音声にボイスコマンドが含まれる場合(S110/YES)、制御部120は、案内対象特定処理を行う(S112)。なお、案内対象特定処理の詳細は後述される。
Next, when the
案内対象特定処理後、制御部120は、案内対象として特定したランドマークを記録する(S114)。次いで、制御部120は、ランドマークのメタデータを3次元地図から取得する(S116)。次いで、制御部120は、車両20やユーザ40の状況とユーザ40のプロファイル情報に応じて紹介文を生成する(S118)。紹介文の生成後、制御部120は、紹介文を音声に変換し、変換した音声を車両20のスピーカ242に出力させることで、紹介文の読み上げを行う(S120)。紹介文の読み上げ後、制御部120は、次の対話があるか否かを判定する(S122)。次の対話がある場合(S122/YES)、制御部120は、S110から処理を繰り返す。次の対話がない場合(S122/NO)、制御部120は、次に音声が取得されるまで処理を終了する。
After the guidance target identification process, the
(案内対象特定処理の流れ)
続いて、S112の案内対象特定処理の詳細について説明する。図6は、本実施形態に係る案内対象特定処理の流れを示すフローチャートである。
(Flow of the guidance target specification process)
Next, the details of the guidance target specification process of S112 will be described below. Fig. 6 is a flowchart showing the flow of the guidance target specification process according to this embodiment.
まず、制御部120は、音声に含まれる自然言語を分析する(S202)。次いで、制御部120は、車両20からネットワーク30を介して受信する車内カメラ214の撮像画像に写るユーザ40のポーズを分析する(S204)。次いで、制御部120は、車両20からネットワーク30を介して受信する車外カメラ216の撮像画像に写る車外風景を分析する(S206)。
First, the
自然言語、ポーズ、および車外風景の分析後、制御部120は、案内対象を検出できたか否かを判定する(S208)。案内対象を検出できなかった場合(S208/NO)、制御部120は、ユーザ40に対して再度発話を促す(S220)。
After analyzing the natural language, the pause, and the scenery outside the vehicle, the
案内対象を検出できた場合(S208/YES)、制御部120は、車両20の位置と向きを取得する(S210)。次いで、制御部120は、車両20の位置と向きを3次元地図と対応付ける(S212)。次いで、制御部120は、ユーザ40のポーズの向きを車両20の向きと対応付ける(S214)。次いで、制御部120は、車両20の車外風景が写った撮像画像を3次元地図と対応付ける(S216)。
If the guidance target is detected (S208/YES), the
各対応付け後、制御部120は、案内対象が3次元地図上で一義的に決定できるか否かを判定する(S218)。案内対象を一義的に決定できなかった場合(S218/NO)、制御部120は、ユーザ40に対して、案内対象を絞り込むための発話を促す(S222)。案内対象を一義的に決定できた場合(S218/YES)、制御部120は、案内対象特定処理を終了する。
After each correspondence, the
以上、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1における処理の流れの例について説明した。なお、対象案内制御システム1における処理の流れはかかる例に限定されない。例えば、対象案内制御装置10の構成要素の全部が車両20に備えられる場合、対象案内制御システム1は、ネットワーク30を介さずに処理を行い得る。
The above describes an example of the processing flow in the object guidance control system 1 when not all of the components of the object
以上説明したように、本実施形態に係る対象案内制御装置10は、移動している車両20の車内のユーザ40の音声とユーザ40の動作に基づき、車両20の車外風景から検出された案内対象の候補群とユーザ40が指定した案内対象とを結び付ける。これにより、対象案内制御装置10は、移動している車両20の車外のランドマークを案内対象の候補として検出することができる。
また、本実施形態に係る対象案内制御装置10は、車両20の車内のユーザ40の音声とユーザ40の動作の両方を用いて案内対象の候補を検出する。これにより、対象案内制御装置10は、案内対象の検出の精度を向上することができる。
また、本実施形態に係る対象案内制御装置10は、車両20の位置情報と3次元地図に基づき、3次元地図上で案内対象を一義的に特定する。これにより、対象案内制御装置10は、案内対象の特定の精度を向上し、さらに、ユーザ40が指定した案内対象に関する案内の精度も向上することができる。
したがって、本実施形態に係る対象案内制御装置10は、車両20に乗車しているユーザ40が案内を求める対象として指定した案内対象に関する案内の精度を向上することができる。
As described above, the object
Furthermore, the object
Furthermore, the object
Therefore, the target
(変形例)
以上、本発明の実施形態について説明した。続いて、本発明の実施形態の変形例について説明する。なお、以下に説明する各変形例は、単独で本発明の実施形態に適用されてもよいし、組み合わせで本発明の実施形態に適用されてもよい。また、各変形例は、本発明の実施形態で説明した構成に代えて適用されてもよいし、本発明の各実施形態で説明した構成に対して追加的に適用されてもよい。
(Modification)
The embodiments of the present invention have been described above. Next, modified examples of the embodiments of the present invention will be described. Each modified example described below may be applied alone to the embodiments of the present invention, or may be applied in combination to the embodiments of the present invention. Furthermore, each modified example may be applied in place of the configuration described in the embodiments of the present invention, or may be applied in addition to the configuration described in each embodiment of the present invention.
(第1の変形例)
上述した実施形態では、対象案内制御装置10がユーザ40に指定された案内対象に関する案内の制御を行う例について説明したが、かかる例に限定されない。車両20の周囲にユーザ40が興味を持ちそうなランドマークがある場合、対象案内制御装置10は、ユーザ40からの指定がなくても当該ランドマークを案内対象として案内の制御を行ってもよい。ユーザ40が興味を持ちそうなランドマークは、例えば、車両20の位置情報やユーザ40のプロファイル情報等に基づき検出される。かかる構成により、ユーザ40に対して、ユーザ40に応じた柔軟な案内を行うことができる。
(First Modification)
In the above-described embodiment, an example has been described in which the target
(第2の変形例)
上述した実施形態では、対象案内制御装置10が車両20の出力装置に案内情報を出力させる例について説明したが、かかる例に限定されない。例えば、検出部122が検出した自然言語から、ユーザ40が経路変更を求めていることを示すボイスコマンドが検出された場合、案内情報は車両20の制御部230に対して出力されてもよい。この時、制御部230には、変更後の経路を示す経路情報が案内情報として入力される。そして、制御部230は、入力された経路情報に基づき、車両20が変更後の経路に沿って移動するように、車両20の自動運転を制御する。
(Second Modification)
In the above-described embodiment, an example has been described in which the object
(第3の変形例)
上述した実施形態では、出力制御部126がメタデータに基づき案内情報を生成する例について説明したが、係る例に限定されない。出力制御部126は、ウェブサービスから案内対象に関する情報を取得し、取得した情報に基づき案内情報を生成してもよい。
(Third Modification)
In the above embodiment, an example in which the
以上、本発明の実施形態の変形例について説明した。なお、上述した実施形態における対象案内制御装置10をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
The above describes a modified embodiment of the present invention. The object
以上、図面を参照してこの発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 The above describes in detail an embodiment of the present invention with reference to the drawings, but the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the present invention.
1…対象案内制御システム、10…対象案内制御装置、20…車両、30…ネットワーク、110…通信部、120…制御部、122…検出部、124…特定部、126…出力制御部、130…記憶部、210…取得部、212…マイク、214…車内カメラ、216…車外カメラ、220…通信部、230…制御部、240…案内情報出力部 1... object guidance control system, 10... object guidance control device, 20... vehicle, 30... network, 110... communication unit, 120... control unit, 122... detection unit, 124... identification unit, 126... output control unit, 130... storage unit, 210... acquisition unit, 212... microphone, 214... in-vehicle camera, 216... outside-vehicle camera, 220... communication unit, 230... control unit, 240... guidance information output unit
Claims (5)
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、
を備える、対象案内制御装置。 a detection unit that detects candidates for a guidance target designated by a user based on a voice of the user riding in the vehicle, an image captured inside the vehicle in which a pose of the user designating a guidance target for which the user requests guidance, and an image captured around the vehicle;
an identification unit that identifies a position and a direction of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified direction of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies a voice uttered by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined;
an output control unit that outputs output information related to the identified guidance target based on the spatial information corresponding to the identified guidance target;
An object guidance control device comprising:
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給することと、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させることと、
を含む、プロセッサにより実行される対象案内制御方法。 Detecting candidates for a guidance target designated by a user based on a voice of the user riding in the vehicle, an in-vehicle captured image in which a pose of the user designating a guidance target for which the user requests guidance is captured, and a captured image of the surroundings of the vehicle;
specifying a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, specifying a direction of the guidance target in the spatial information based on the specified orientation of the vehicle, determining whether or not the guidance target can be uniquely determined from the candidates based on the specified direction, specifying the guidance target if it can be determined, and supplying a voice uttered by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined ;
outputting output information related to the identified guidance target based on the spatial information corresponding to the guidance target;
23. An object guidance control method executed by a processor, comprising:
車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、
として機能させるためのプログラム。 Computer,
a detection unit that detects candidates for a guidance target designated by a user based on a voice of the user riding in the vehicle, an image captured inside the vehicle in which a pose of the user designating a guidance target for which the user requests guidance, and an image captured around the vehicle;
an identification unit that identifies a position and a direction of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified direction of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies a voice uttered by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined;
an output control unit that outputs output information related to the identified guidance target based on the spatial information corresponding to the identified guidance target;
A program to function as a
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019144180A JP7605582B2 (en) | 2019-08-06 | 2019-08-06 | Object guidance control device, object guidance control method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019144180A JP7605582B2 (en) | 2019-08-06 | 2019-08-06 | Object guidance control device, object guidance control method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021025884A JP2021025884A (en) | 2021-02-22 |
| JP7605582B2 true JP7605582B2 (en) | 2024-12-24 |
Family
ID=74662986
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019144180A Active JP7605582B2 (en) | 2019-08-06 | 2019-08-06 | Object guidance control device, object guidance control method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7605582B2 (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001330450A (en) | 2000-03-13 | 2001-11-30 | Alpine Electronics Inc | Navigation device |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005024313A (en) * | 2003-06-30 | 2005-01-27 | Alpine Electronics Inc | On-vehicle navigation device |
| JP4556586B2 (en) * | 2004-09-22 | 2010-10-06 | トヨタ自動車株式会社 | Driving assistance device |
| US10302444B2 (en) * | 2015-01-30 | 2019-05-28 | Sony Corporation | Information processing system and control method |
| JP6604151B2 (en) * | 2015-11-09 | 2019-11-13 | 三菱自動車工業株式会社 | Speech recognition control system |
-
2019
- 2019-08-06 JP JP2019144180A patent/JP7605582B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001330450A (en) | 2000-03-13 | 2001-11-30 | Alpine Electronics Inc | Navigation device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021025884A (en) | 2021-02-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101960140B1 (en) | System and method for providing augmented virtual reality content in autonomous vehicles | |
| EP3627180B1 (en) | Sensor calibration method and device, computer device, medium, and vehicle | |
| CN114175114B (en) | System and method for identifying points of interest from within an autonomous vehicle | |
| CN110390240B (en) | Lane post-processing in an autonomous vehicle | |
| EP2806335A1 (en) | Vehicle human machine interface with gaze direction and voice recognition | |
| US11906970B2 (en) | Information processing device and information processing method | |
| KR20170137636A (en) | Information-attainment system based on monitoring an occupant | |
| KR20170133234A (en) | System and method for providing content in autonomous vehicles based on real-time traffic information | |
| JP2023508778A (en) | A system for conducting scene-aware dialogue | |
| CN114664102A (en) | Navigation system with parking space recognition mechanism and operation method thereof | |
| JP6808064B2 (en) | Map information management device, map information management system, and map information management method | |
| CN113916241A (en) | Method and system for setting destination at vehicle navigation system | |
| CN113168535A (en) | Accumulated water depth determination method and device | |
| CN112883058A (en) | Calibration method, device, equipment, vehicle and medium for vehicle positioning | |
| CN111273652A (en) | Automatic driving device | |
| KR20200084446A (en) | Electronic apparatus for self driving of vehicles based on intersection node and thereof control method | |
| CN110023781B (en) | Method and apparatus for determining the exact location of a vehicle based on a radar signature of the vehicle's surroundings | |
| JP7605582B2 (en) | Object guidance control device, object guidance control method, and program | |
| US9638534B2 (en) | Arrival time notification system using smart glasses and method thereof | |
| JP7560593B2 (en) | Control system, control method, and program | |
| CN113677580A (en) | Electronic device and method for assisting vehicle driving | |
| JP7722856B2 (en) | Content generation device, content generation method, program, and storage medium | |
| US12504294B2 (en) | Information providing device, information providing method, and information providing program for acquiring guidance location information indicating distance between position of recipient and position of guidance location | |
| CN114127514B (en) | Provision and transmission of position data of the vehicle's surroundings | |
| CN115704696B (en) | Navigation system with traffic sign tracking and positioning mechanism based on monocular camera and operation method thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220627 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230426 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230626 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231004 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240123 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240419 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240426 |
|
| A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20240712 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7605582 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |