Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7605582B2 - Object guidance control device, object guidance control method, and program - Google Patents
[go: Go Back, main page]

JP7605582B2 - Object guidance control device, object guidance control method, and program - Google Patents

Object guidance control device, object guidance control method, and program Download PDF

Info

Publication number
JP7605582B2
JP7605582B2 JP2019144180A JP2019144180A JP7605582B2 JP 7605582 B2 JP7605582 B2 JP 7605582B2 JP 2019144180 A JP2019144180 A JP 2019144180A JP 2019144180 A JP2019144180 A JP 2019144180A JP 7605582 B2 JP7605582 B2 JP 7605582B2
Authority
JP
Japan
Prior art keywords
vehicle
guidance
user
guidance target
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019144180A
Other languages
Japanese (ja)
Other versions
JP2021025884A (en
Inventor
優 坪内
隆史 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimizu Corp
Original Assignee
Shimizu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimizu Corp filed Critical Shimizu Corp
Priority to JP2019144180A priority Critical patent/JP7605582B2/en
Publication of JP2021025884A publication Critical patent/JP2021025884A/en
Application granted granted Critical
Publication of JP7605582B2 publication Critical patent/JP7605582B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)

Description

本発明は、対象案内制御装置、対象案内制御方法、およびプログラムに関する。 The present invention relates to a target guidance control device, a target guidance control method, and a program.

従来、車両において経路案内や周囲の施設の案内等を行うガイドシステムが普及している。当該ガイドシステムが搭載されたカーナビゲーション装置は、自動車等の車両における経路案内によく用いられている。また、当該ガイドシステムは、観光客に対する観光案内にも用いられている。 Traditionally, guidance systems that provide route guidance and guidance to surrounding facilities in vehicles have become widespread. Car navigation devices equipped with such guidance systems are often used for route guidance in vehicles such as automobiles. Such guidance systems are also used to provide tourist information to tourists.

例えば、下記特許文献1には、車内にバスガイド等の案内者がいなくても、観光客に対して観光案内を自動で行うことが可能なガイドシステムが開示されている。当該技術では、車外を撮像可能に設けられた撮像装置が観光案内の対象を撮像した場合、あらかじめ用意された音声データに基づく音声出力により観光案内が行われる。 For example, the following Patent Document 1 discloses a guide system that can automatically provide tourist information to tourists even when there is no guide such as a bus guide on board the vehicle. In this technology, when an imaging device that is installed to be able to capture images of the outside of the vehicle captures an image of a target for tourist information, tourist information is provided by audio output based on previously prepared audio data.

また、近年では、スマートフォンの普及に伴い、スマートフォンで経路案内や周囲の施設の案内が可能なアプリケーションが普及している。そのため、カーナビゲーション装置がスマートフォンで代用されることもある。さらに、音声認識技術の発展に伴い、音声により制御可能なスピーカ型の音声インタフェース装置(例えばスマートスピーカ)も普及してきている。そのため、将来的に、カーナビゲーション装置がスマートスピーカに置き換わり、ユーザの音声入力に基づき、スマートスピーカが経路案内や車両の周囲の施設の案内等を行う可能性がある。 In recent years, with the spread of smartphones, applications that can provide route guidance and guidance to nearby facilities on smartphones have also become widespread. As a result, car navigation devices are sometimes substituted with smartphones. Furthermore, with the development of voice recognition technology, speaker-type voice interface devices (e.g., smart speakers) that can be controlled by voice are also becoming popular. Therefore, in the future, car navigation devices may be replaced by smart speakers, which may provide route guidance and guidance to facilities around the vehicle based on the user's voice input.

特開2017-194898号公報JP 2017-194898 A

しかしながら、従来のスマートスピーカが移動している車両の車内に設けられた場合、当該スマートスピーカは、車内の情報を取得することはできるが、車外の情報を取得することは困難である。例えば、ユーザが車外のランドマーク等を「あの建物は何?」等のランドマークの名称を特定しない方法で案内の対象として指定した場合、スマートスピーカは、ユーザから案内の要求があったことは認識し得る。しかしながら、ユーザが車外のどのランドマークを案内の対象として指定したかをスマートスピーカが認識することは困難である。そのため、スマートスピーカは、ユーザが指定したランドマークを正しく認識することが難しいため、誤った案内を行う可能性がある。 However, when a conventional smart speaker is installed inside a moving vehicle, the smart speaker can obtain information inside the vehicle, but has difficulty obtaining information outside the vehicle. For example, if a user specifies a landmark outside the vehicle as a guidance target in a manner that does not specify the name of the landmark, such as "What is that building?", the smart speaker can recognize that the user has requested guidance. However, it is difficult for the smart speaker to recognize which landmark outside the vehicle the user specified as the guidance target. Therefore, the smart speaker may provide erroneous guidance because it has difficulty correctly recognizing the landmark specified by the user.

上述の課題を鑑み、本発明の目的は、車両に乗車しているユーザが案内を求める対象として指定した案内対象に関する案内の精度を向上することが可能な対象案内制御装置、対象案内制御方法、およびプログラムを提供することにある。 In view of the above problems, the object of the present invention is to provide a target guidance control device, a target guidance control method, and a program that can improve the accuracy of guidance regarding a target designated by a user in a vehicle as a target for which guidance is requested.

上述の課題を解決するために、本発明の一態様に係る対象案内制御装置は、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、を備える。 In order to solve the above-mentioned problems, a target guidance control device according to one embodiment of the present invention includes a detection unit that detects candidates for a guidance target designated by a user based on the voice of a user riding in a vehicle, an in-vehicle image in which a pose of the user is captured to designate a guidance target for which the user requests guidance, and an image of the surroundings of the vehicle; an identification unit that identifies a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified orientation of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies the voice spoken by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined ; and an output control unit that outputs output information related to the guidance target based on the spatial information corresponding to the identified guidance target.

本発明の一態様に係る対象案内制御方法は、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出することと、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給することと、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させることと、を含み、プロセッサにより実行される。 A target guidance control method according to one aspect of the present invention includes: detecting candidates for a guidance target designated by a user based on a voice of a user riding in a vehicle, an in-vehicle image in which a pose of the user is captured to designate a guidance target for which the user requests guidance, and an image of the surroundings of the vehicle; identifying a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifying a direction of the guidance target in the spatial information based on the identified orientation of the vehicle , determining whether the guidance target can be uniquely determined from the candidates based on the identified direction , identifying the guidance target if it is possible to determine it, and supplying the voice spoken by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it is not possible to determine the guidance target, and is executed by a processor.

本発明の一態様に係るプログラムは、コンピュータを、車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、として機能させる。
A program according to one aspect of the present invention causes a computer to function as: a detection unit that detects candidates for a guidance target designated by a user based on the voice of a user riding in a vehicle, an in-vehicle image in which a pose of the user is captured to designate a guidance target for which the user requests guidance, and an image of the surroundings of the vehicle; an identification unit that identifies a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified orientation of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies the voice spoken by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined; and an output control unit that outputs output information related to the guidance target based on the spatial information corresponding to the identified guidance target.

本発明によれば、車両に乗車しているユーザが案内を求める対象として指定した案内対象に関する案内の精度を向上することができる。 The present invention can improve the accuracy of guidance regarding a target specified by a user in a vehicle for which guidance is requested.

本発明の実施形態に係る対象案内制御システムの概要を示す図である。1 is a diagram showing an overview of an object guidance control system according to an embodiment of the present invention. 同実施形態に係る対象案内制御システムの構成例を示すブロック図である。2 is a block diagram showing a configuration example of a target guidance control system according to the embodiment. FIG. 同実施形態に係る案内対象の候補の検出の例の説明図である。11 is an explanatory diagram of an example of detection of candidates for guidance targets according to the embodiment; FIG. 同実施形態に係る車両の位置情報と3次元地図との対応付けの例の説明図である。11 is an explanatory diagram of an example of association between vehicle position information and a three-dimensional map according to the embodiment; FIG. 同実施形態に係る対象案内制御システムにおける処理の流れを示すフローチャートである。10 is a flowchart showing a process flow in the object guidance control system according to the embodiment. 同実施形態に係る案内対象特定処理の流れを示すフローチャートである。13 is a flowchart showing a flow of a guidance target specification process according to the embodiment.

以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の実施形態に係る対象案内制御システム1の概要を示す図である。対象案内制御システム1は、図1に示す対象案内制御装置10、車両20、およびネットワーク30で構成される。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
1 is a diagram showing an overview of an object guidance control system 1 according to an embodiment of the present invention. The object guidance control system 1 is composed of an object guidance control device 10, a vehicle 20, and a network 30 shown in FIG.

対象案内制御装置10は、車両20のユーザ40が案内を求める対象として指定した案内対象に関する案内の制御(以下、「案内制御」とも称される)を行う装置である。対象案内制御装置10は、例えば、サーバ装置等のコンピュータにより実現される。 The target guidance control device 10 is a device that controls guidance (hereinafter also referred to as "guidance control") regarding a guidance target designated by a user 40 of a vehicle 20 as a target for which guidance is requested. The target guidance control device 10 is realized, for example, by a computer such as a server device.

対象案内制御装置10は、図1に示すように、ネットワーク30を介して車両20と接続されており、車両20と情報の送受信が可能である。本実施形態に係る対象案内制御装置10は、ネットワーク30を介して車両20から受信した情報に基づき、案内制御を行う。また、対象案内制御装置10は、ネットワーク30を介して、案内制御に関する情報を車両20へ送信する。 As shown in FIG. 1, the object guidance control device 10 is connected to the vehicle 20 via a network 30, and is capable of transmitting and receiving information to and from the vehicle 20. The object guidance control device 10 according to this embodiment performs guidance control based on information received from the vehicle 20 via the network 30. The object guidance control device 10 also transmits information related to guidance control to the vehicle 20 via the network 30.

車両20は、搭乗者(例えばユーザ40)を乗せて移動する移動体である。本実施形態に係る車両20は、一例として、自動運転車で実現されるものとする。車両20が自動運転車である場合、ユーザ40は、必ずしも運転する必要はない。車両20は、非自動運転車であってもよい。 The vehicle 20 is a moving body that moves with a passenger (e.g., a user 40) on board. As an example, the vehicle 20 according to this embodiment is realized as an autonomous vehicle. When the vehicle 20 is an autonomous vehicle, the user 40 does not necessarily need to drive it. The vehicle 20 may be a non-autonomous vehicle.

車両20には、各種情報を取得するためのセンサ装置が設けられている。例えば、図1に示すように、マイク212、車内カメラ214a、車内カメラ214b、車内カメラ214c、車外カメラ216a、車外カメラ216b、およびスピーカ242が車両20に設けられる。マイク212は、車両20の車内で生じた音声を取得可能に設けられる。車内カメラ214a~214c(以下、「車内カメラ214」とも称される)は、車両20の車内の様子を撮像可能に設けられる。例えば、車内カメラ214は、図1に示すように、それぞれ車両20の上部前方、上部中央、上部後方に設けられ、各々の位置から車両20の車内を撮像して撮像画像(静止画像または動画像)を取得する。車外カメラ216aおよび車外カメラ216b(以下、「車外カメラ216」とも称される)は、車両20の車外の様子を撮像可能に設けられる。例えば、車外カメラ216は、図1に示すように、それぞれ車両20の前方と後方に設けられ、各々の位置から車両20の車外を撮像する。なお、車両20に設けられるセンサ装置の種類、数、および位置は、図1に示す例に限定されない。 The vehicle 20 is provided with a sensor device for acquiring various information. For example, as shown in FIG. 1, the vehicle 20 is provided with a microphone 212, an in-vehicle camera 214a, an in-vehicle camera 214b, an in-vehicle camera 214c, an exterior camera 216a, an exterior camera 216b, and a speaker 242. The microphone 212 is provided so as to be able to acquire sounds generated inside the vehicle 20. The in-vehicle cameras 214a to 214c (hereinafter also referred to as "in-vehicle cameras 214") are provided so as to be able to capture images of the interior of the vehicle 20. For example, as shown in FIG. 1, the in-vehicle cameras 214 are provided at the upper front, upper center, and upper rear of the vehicle 20, respectively, and capture images (still images or moving images) of the interior of the vehicle 20 from each position. The exterior camera 216a and the exterior camera 216b (hereinafter also referred to as "exterior camera 216") are provided so as to be able to capture images of the exterior of the vehicle 20. For example, as shown in FIG. 1, the exterior cameras 216 are provided at the front and rear of the vehicle 20, respectively, and capture images of the outside of the vehicle 20 from their respective positions. Note that the type, number, and positions of the sensor devices provided on the vehicle 20 are not limited to the example shown in FIG. 1.

車両20には、出力情報を出力するための出力装置も設けられている。例えば、図1に示すように、スピーカ242が車両20に設けられる。スピーカ242は、出力情報として案内対象に関する情報(以下、「案内情報」とも称される)を車両20の車内に向けて出力可能に設けられる。なお、車両20に設けられる出力装置の種類、数、および位置は、図1に示す例に限定されない。また、出力装置は、ユーザ40が有する端末であってもよい。ユーザ40が有する端末は、例えば、スマートフォン、タブレット端末、ヒアラブル端末等である。 The vehicle 20 is also provided with an output device for outputting output information. For example, as shown in FIG. 1, a speaker 242 is provided in the vehicle 20. The speaker 242 is provided so as to be able to output information relating to a guidance target (hereinafter also referred to as "guidance information") as output information toward the interior of the vehicle 20. Note that the type, number, and location of the output device provided in the vehicle 20 are not limited to the example shown in FIG. 1. In addition, the output device may be a terminal owned by the user 40. The terminal owned by the user 40 is, for example, a smartphone, a tablet terminal, a hearable terminal, etc.

案内対象は、車両20の周囲に存在するランドマークの内、ユーザ40が指定したランドマークである。図1に示すように、車両20の周囲にはランドマークとしてビル50とビル51がある。進行方向が矢印22の方向である車両20の車内にいるユーザ40から見て、ビル50はユーザ40の右前方にあり、ビル51はユーザ40の左前方にある。なお、ランドマークはビルに限定されない。
案内情報は、案内対象の紹介情報、案内対象までの経路情報等を含む。
The guidance target is a landmark designated by the user 40 among the landmarks existing around the vehicle 20. As shown in Fig. 1, there are buildings 50 and 51 as landmarks around the vehicle 20. As seen from the user 40 inside the vehicle 20 traveling in the direction of the arrow 22, the building 50 is in front of the user 40 to the right, and the building 51 is in front of the user 40 to the left. Note that the landmarks are not limited to buildings.
The guidance information includes introduction information of the guidance target, route information to the guidance target, and the like.

図1では、ユーザ40は、吹き出し42に示されるように「右前のビル」と発話し、音声により案内対象を指定している。同時に、ユーザ40は、指で矢印44の方向(ユーザ40から見て右前方)を指す動作により案内対象を指定している。これより、図1における案内対象はビル50と特定される。なお、ユーザ40は、案内対象を指定する際に、質問形式の発話を行ってもよい。例えば、ユーザ40は、「右前のビルは何?」と発話してもよい。 In FIG. 1, the user 40 utters "the building ahead on the right" as shown in speech bubble 42, specifying the guidance target by voice. At the same time, the user 40 specifies the guidance target by pointing with his/her finger in the direction of arrow 44 (to the front right as seen by the user 40). As a result, the guidance target in FIG. 1 is identified as building 50. Note that the user 40 may utter a question when specifying the guidance target. For example, the user 40 may utter, "What building is ahead on the right?"

このような案内対象を特定する処理(以下、「案内対象特定処理」とも称される)は、車両20にて取得される音声や、ユーザ40が案内対象を指定する動作に基づき、対象案内制御装置10により行われる。ユーザ40が案内対象を指定する動作は、例えば、指で指す動作、棒状の物(例えば指示棒、ペンなど)で指す動作、腕全体で指す動作などである。また、対象案内制御装置10は、ユーザ40の顔の向きや視線の方向を示す情報も用いて、案内対象特定処理を行ってもよい。なお、案内対象特定処理の詳細は後述される。 The process of identifying such a guidance target (hereinafter also referred to as "guidance target identification process") is performed by the target guidance control device 10 based on the voice acquired by the vehicle 20 and the action of the user 40 designating the guidance target. The action of the user 40 designating the guidance target is, for example, a pointing action with a finger, a pointing action with a rod-shaped object (e.g., a pointer or pen), or a pointing action with the entire arm. The target guidance control device 10 may also perform the guidance target identification process using information indicating the direction of the user 40's face and the direction of their gaze. Details of the guidance target identification process will be described later.

なお、対象案内制御装置10は、その構成要素の一部または全部を、車両20に備えることが可能な装置として実現されてもよい。車両20に備えられた対象案内制御装置10の構成要素は、車両20が備える各装置と情報の送受信が可能になるように、各装置と有線または無線により接続され得る。一方、車両20に備えられなかった対象案内制御装置10の構成要素は、例えばサーバ装置等により実現され、ネットワーク30を介して、車両20に備えられた対象案内制御装置10の構成要素や、車両20が備える各装置と連携を行い得る。 The object guidance control device 10 may be realized as a device that can have some or all of its components installed in the vehicle 20. The components of the object guidance control device 10 installed in the vehicle 20 can be connected to each device installed in the vehicle 20 by wire or wirelessly so as to be able to send and receive information with each device. On the other hand, the components of the object guidance control device 10 that are not installed in the vehicle 20 can be realized by, for example, a server device, and can communicate with the components of the object guidance control device 10 installed in the vehicle 20 and each device installed in the vehicle 20 via the network 30.

以上、本実施形態の概要について説明した。続いて、本実施形態に係る対象案内制御システム1の構成例について説明する。図2は、本実施形態に係る対象案内制御システム1の構成例を示すブロック図である。なお、以下では、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1の構成例について説明する。 The outline of this embodiment has been described above. Next, an example of the configuration of the object guidance control system 1 according to this embodiment will be described. FIG. 2 is a block diagram showing an example of the configuration of the object guidance control system 1 according to this embodiment. Note that, below, an example of the configuration of the object guidance control system 1 in the case where not all of the components of the object guidance control device 10 are provided in the vehicle 20, but are realized by a server device or the like, will be described.

(車両20の構成例)
図2に示すように、車両20は、取得部210、通信部220、制御部230、および案内情報出力部240を備える。
(Configuration example of vehicle 20)
As shown in FIG. 2 , the vehicle 20 includes an acquisition unit 210 , a communication unit 220 , a control unit 230 , and a guidance information output unit 240 .

(取得部210)
取得部210は、各種情報を取得する機能を有する。当該機能は、多様なセンサ装置により実現され得る。本実施形態に係る取得部210は、例えば、上述したマイク212、車内カメラ214、車外カメラ216等のセンサ装置を備える。また、取得部210は、車両20の位置情報を取得するセンサ装置を備えてもよい。一例として、取得部210は、GPS(Global Positioning System)を備える。これらのセンサ装置によるセンシング情報の取得後、取得部210は、センシング情報を通信部220へ出力する。
(Acquisition unit 210)
The acquisition unit 210 has a function of acquiring various information. This function can be realized by various sensor devices. The acquisition unit 210 according to this embodiment includes, for example, sensor devices such as the above-mentioned microphone 212, the in-vehicle camera 214, and the outside-vehicle camera 216. The acquisition unit 210 may also include a sensor device that acquires position information of the vehicle 20. As an example, the acquisition unit 210 includes a GPS (Global Positioning System). After acquiring the sensing information by these sensor devices, the acquisition unit 210 outputs the sensing information to the communication unit 220.

なお、取得部210が備えるセンサ装置はかかる例に限定されない。例えば、取得部210は、車両20の車内外の様子を示す情報を取得するセンサ装置として、LiDAR(Laser Imaging Detection and Ranging)等の測距センサを備えてもよい。 The sensor device equipped in the acquisition unit 210 is not limited to this example. For example, the acquisition unit 210 may be equipped with a distance measurement sensor such as LiDAR (Laser Imaging Detection and Ranging) as a sensor device that acquires information indicating the state inside and outside the vehicle 20.

(通信部220)
通信部220は、外部装置と通信を行う機能を有する。通信部220は、外部装置との通信にて受信する情報を制御部230へ出力する。一例として、通信部220は、ネットワーク30を介して対象案内制御装置10から受信した案内情報を、制御部230へ出力する。また、通信部220は、取得部210から入力される情報を対象案内制御装置10へ送信する。一例として、通信部220は、取得部210から入力されるセンシング情報を、ネットワーク30を介して対象案内制御装置10へ送信する。
(Communication unit 220)
The communication unit 220 has a function of communicating with an external device. The communication unit 220 outputs information received through communication with the external device to the control unit 230. As an example, the communication unit 220 outputs guidance information received from the object guidance control device 10 via the network 30 to the control unit 230. The communication unit 220 also transmits information input from the acquisition unit 210 to the object guidance control device 10. As an example, the communication unit 220 transmits sensing information input from the acquisition unit 210 to the object guidance control device 10 via the network 30.

(制御部230)
制御部230は、車両20の動作全般を制御する機能を有する。制御部230は、例えば、車両20がハードウェアとして備えるCPU(Central Processing Unit)にプログラムを実行させることによって実現される。例えば、制御部230は、取得部210が有する各センサ装置の動作を制御する。また、制御部230は、通信部220から入力される案内情報の案内情報出力部240への出力を制御する。また、車両20が自動運転車である場合、制御部230は、車両20の自動運転を制御する。
(Control unit 230)
The control unit 230 has a function of controlling the overall operation of the vehicle 20. The control unit 230 is realized, for example, by causing a central processing unit (CPU) provided as hardware in the vehicle 20 to execute a program. For example, the control unit 230 controls the operation of each sensor device provided in the acquisition unit 210. In addition, the control unit 230 controls the output of guidance information input from the communication unit 220 to the guidance information output unit 240. In addition, when the vehicle 20 is an autonomous vehicle, the control unit 230 controls autonomous driving of the vehicle 20.

(案内情報出力部240)
案内情報出力部240は、案内情報の出力を行う機能を有する。案内情報は、例えば、制御部230から入力され、多様な出力装置により出力され得る。例えば、案内情報出力部240がスピーカ等の音声出力装置を備える場合、案内情報出力部240は、音声に変換された案内情報をスピーカから出力する。また、案内情報出力部240がディスプレイ等の表示装置を備える場合、案内情報出力部240は、画像に変換された案内情報をディスプレイに表示する。
(Guidance Information Output Unit 240)
The guidance information output unit 240 has a function of outputting guidance information. The guidance information may be input from the control unit 230, for example, and output by various output devices. For example, if the guidance information output unit 240 includes an audio output device such as a speaker, the guidance information output unit 240 outputs the guidance information converted into audio from the speaker. Also, if the guidance information output unit 240 includes a display device such as a display, the guidance information output unit 240 displays the guidance information converted into an image on the display.

(対象案内制御装置10の構成例)
図2に示すように、対象案内制御装置10は、通信部110、制御部120、および記憶部130を備える。
(Configuration example of the object guidance control device 10)
As shown in FIG. 2 , the object guidance control device 10 includes a communication unit 110, a control unit 120, and a storage unit 130.

(通信部110)
通信部110は、外部装置と通信を行う機能を有する。通信部110は、外部装置との通信にて受信する情報を制御部120へ出力する。一例として、通信部110は、ネットワーク30を介して車両20から受信したセンシング情報を、制御部120へ出力する。また、通信部110は、制御部120から入力される情報を車両20へ送信する。一例として、通信部110は、制御部120から入力される案内情報を、ネットワーク30を介して車両20へ送信する。
(Communication unit 110)
The communication unit 110 has a function of communicating with an external device. The communication unit 110 outputs information received through communication with the external device to the control unit 120. As an example, the communication unit 110 outputs sensing information received from the vehicle 20 via the network 30 to the control unit 120. The communication unit 110 also transmits information input from the control unit 120 to the vehicle 20. As an example, the communication unit 110 transmits guidance information input from the control unit 120 to the vehicle 20 via the network 30.

(制御部120)
制御部120は、対象案内制御装置10の動作全般を制御する機能を有する。制御部120は、例えば、対象案内制御装置10がハードウェアとして備えるCPUにプログラムを実行させることによって実現される。当該機能を実現するために、制御部120は、検出部122、特定部124、および出力制御部126を備える。
(Control unit 120)
The control unit 120 has a function of controlling the overall operation of the object guidance control device 10. The control unit 120 is realized, for example, by causing a CPU provided as hardware in the object guidance control device 10 to execute a program. To realize this function, the control unit 120 includes a detection unit 122, an identification unit 124, and an output control unit 126.

(検出部122)
検出部122は、案内対象の候補を検出する機能を有する。例えば、検出部122は、車両20に乗車しているユーザ40の音声とユーザ40が案内対象を指定する動作と車両20の周囲の撮像画像とに基づき、案内対象の候補を検出する。具体的に、検出部122は、撮像画像を分析することで案内対象の候補群を検出し、音声を分析して検出する案内対象に関連する自然言語と、ユーザ40の動作を分析して検出する方向とに基づき、候補群の中から方向に存在する候補を検出する。
(Detection Unit 122)
The detection unit 122 has a function of detecting candidates for guidance targets. For example, the detection unit 122 detects candidates for guidance targets based on the voice of the user 40 riding in the vehicle 20, the action of the user 40 specifying the guidance target, and a captured image of the surroundings of the vehicle 20. Specifically, the detection unit 122 detects a group of candidates for guidance targets by analyzing the captured image, and detects candidates that exist in a direction from the group of candidates based on a natural language related to the guidance target detected by analyzing the voice and a direction detected by analyzing the action of the user 40.

ここで、図3を参照しながら、案内対象の候補の検出の例について説明する。図3は、本実施形態に係る案内対象の候補の検出の例の説明図である。まず、検出部122は、車両20のマイク212が取得する音声を分析することで、音声から自然言語を検出する。検出した自然言語から、ユーザ40が案内を求めていることを示すボイスコマンドが検出された場合、検出部122は、さらに音声を分析し、案内対象に関する自然言語を検出する。例えば、検出部122は、吹き出し42に示す「右前のビル」という音声を案内対象に関連する自然言語として検出する。図3に示す例では、ユーザ40は車両20の進行方向である矢印22の方向を向いているため、検出部122は、検出した自然言語から車両20の右前にあるビル50をユーザ40が指していることを検出できる。 Here, an example of detection of a candidate for guidance will be described with reference to FIG. 3. FIG. 3 is an explanatory diagram of an example of detection of a candidate for guidance according to this embodiment. First, the detection unit 122 detects natural language from the voice by analyzing the voice acquired by the microphone 212 of the vehicle 20. When a voice command indicating that the user 40 is requesting guidance is detected from the detected natural language, the detection unit 122 further analyzes the voice and detects natural language related to the guidance target. For example, the detection unit 122 detects the voice "building in front to the right" shown in the speech bubble 42 as natural language related to the guidance target. In the example shown in FIG. 3, the user 40 is facing the direction of the arrow 22, which is the traveling direction of the vehicle 20, so the detection unit 122 can detect from the detected natural language that the user 40 is pointing to the building 50 in front to the right of the vehicle 20.

さらに、検出部122は、車両20の車内カメラ214が取得する車内の撮像画像に写るユーザ40のポーズを分析することで、ユーザ40が矢印44の方向を指していることを検出する。また、検出部122は、車両20の車外カメラ216が取得する車外の撮像画像に写る車外風景を分析することで、図3に示すビル50とビル51を案内対象の候補群として検出する。以上の検出結果より、検出部122は、候補群の中から、車両20の右前かつ矢印44の方向にあるビル50を案内対象の候補として検出する。 Furthermore, the detection unit 122 detects that the user 40 is pointing in the direction of the arrow 44 by analyzing the pose of the user 40 captured in the captured image inside the vehicle 20 acquired by the in-vehicle camera 214 of the vehicle 20. The detection unit 122 also detects buildings 50 and 51 shown in FIG. 3 as a group of candidates for guidance targets by analyzing the scenery outside the vehicle captured in the captured image outside the vehicle acquired by the exterior camera 216 of the vehicle 20. From the above detection results, the detection unit 122 detects building 50, which is located to the right of the vehicle 20 in the direction of the arrow 44, as a candidate for guidance targets from the group of candidates.

以上説明したように、検出部122は、移動している車両20の車内のユーザ40の音声とユーザ40の動作に基づき、車両20の車外風景から検出された案内対象の候補群とユーザ40が指定した案内対象とを結び付けることができる。かかる構成により、検出部122は、移動している車両20の車外のランドマークを案内対象の候補として検出することができる。また、検出部122は、案内対象の候補の検出時に、車両20の車内のユーザ40の音声とユーザ40の動作の両方を用いるため、案内対象の候補の検出の精度を向上することができる。なお、検出部122は、候補群の中から、1つの案内対象の候補を検出してもよいし、複数の案内対象の候補を検出してもよい。 As described above, the detection unit 122 can link the group of candidate guidance targets detected from the scenery outside the vehicle 20 with the guidance target specified by the user 40 based on the voice of the user 40 inside the moving vehicle 20 and the actions of the user 40. With this configuration, the detection unit 122 can detect landmarks outside the moving vehicle 20 as candidate guidance targets. In addition, when detecting candidate guidance targets, the detection unit 122 uses both the voice of the user 40 inside the vehicle 20 and the actions of the user 40, and therefore can improve the accuracy of detection of candidate guidance targets. Note that the detection unit 122 may detect one candidate guidance target from the group of candidates, or may detect multiple candidate guidance targets.

(特定部124)
特定部124は、検出部122が検出した案内対象の候補から、ユーザ40が指定した案内対象を特定する機能を有する。例えば、特定部124は、車両20の位置情報に基づき車両20の周囲の空間情報における車両20の位置と向きを特定し、特定した車両20の向きを基準に空間情報における案内対象の方向を特定し、特定した方向に基づいて案内対象の候補から案内対象を特定する。本実施形態に係る車両20の周囲の空間情報は、例えば、車両20の周囲の3次元地図、3次元地図上のランドマークのメタデータ等を含むランドマーク情報等である。なお、空間情報は、かかる例に限定されない。
(Identification unit 124)
The identification unit 124 has a function of identifying a guidance target designated by the user 40 from among the candidate guidance targets detected by the detection unit 122. For example, the identification unit 124 identifies the position and orientation of the vehicle 20 in spatial information around the vehicle 20 based on the position information of the vehicle 20, identifies the direction of the guidance target in the spatial information based on the identified orientation of the vehicle 20, and identifies the guidance target from the candidate guidance targets based on the identified direction. The spatial information around the vehicle 20 according to this embodiment is, for example, a three-dimensional map around the vehicle 20, landmark information including metadata of landmarks on the three-dimensional map, and the like. Note that the spatial information is not limited to such an example.

ここで、図4を参照しながら、車両20の位置情報と3次元地図との対応付けについて説明する。図4は、本実施形態に係る車両20の位置情報と3次元地図との対応付けの例の説明図である。図4に示すように、3次元地図60は、ビル50、ビル51、および山52等のランドマークの3次元データを有するものとする。 Here, the correspondence between the position information of the vehicle 20 and the three-dimensional map will be described with reference to FIG. 4. FIG. 4 is an explanatory diagram of an example of the correspondence between the position information of the vehicle 20 and the three-dimensional map according to this embodiment. As shown in FIG. 4, the three-dimensional map 60 has three-dimensional data of landmarks such as building 50, building 51, and mountain 52.

まず、特定部124は、車両20のGPSが取得する位置情報から3次元地図における車両20の位置と向きを特定し、車両20を3次元地図上にマッピングする。車両20の向きは、例えば、ジャイロセンサのセンシング情報や車両20の移動履歴等に基づき特定されてもよい。次いで、特定部124は、3次元地図上にて、矢印22が示す車両20の向きを基準に、ユーザ40が指定した案内対象の方向を特定する。そして、特定部124は、案内対象の候補から、特定した方向(矢印44)に存在する候補であるビル50を案内対象として特定する。 First, the identification unit 124 identifies the position and orientation of the vehicle 20 on a three-dimensional map from the position information acquired by the GPS of the vehicle 20, and maps the vehicle 20 on the three-dimensional map. The orientation of the vehicle 20 may be identified, for example, based on sensing information from a gyro sensor or the movement history of the vehicle 20. Next, the identification unit 124 identifies the direction of the guidance target specified by the user 40 on the three-dimensional map based on the orientation of the vehicle 20 indicated by the arrow 22. Then, the identification unit 124 identifies, from among the candidates for the guidance target, a building 50 that is a candidate located in the identified direction (arrow 44) as the guidance target.

以上説明したように、特定部124は、車両20の位置情報と3次元地図に基づき、検出部122が検出した案内対象の候補から、ユーザ40が指定した案内対象を3次元地図上で一義的に特定することができる。かかる構成により、特定部124は、検出部122が1つの案内対象の候補を検出した場合には、案内対象であることの確度を高めることができる。また、特定部124は、検出部122が複数の案内対象の候補を検出した場合には、案内対象を絞り込むことができる。これにより、案内対象の特定精度が向上するため、ユーザ40が指定した案内対象に関する案内の精度も向上することが可能となる。 As described above, the identification unit 124 can uniquely identify the guidance target specified by the user 40 on the 3D map from the candidate guidance targets detected by the detection unit 122 based on the position information of the vehicle 20 and the 3D map. With this configuration, when the detection unit 122 detects one candidate guidance target, the identification unit 124 can increase the certainty that the target is a guidance target. Furthermore, when the detection unit 122 detects multiple candidate guidance targets, the identification unit 124 can narrow down the guidance targets. This improves the accuracy of identifying the guidance target, and therefore makes it possible to improve the accuracy of guidance regarding the guidance target specified by the user 40.

(出力制御部126)
出力制御部126は、車両20における出力を制御する機能を有する。例えば、出力制御部126は、特定した案内対象と対応する空間情報に基づき、案内対象に関する出力情報を車両20の出力装置に出力させる。具体的に、まず、出力制御部126は、特定した案内対象のメタデータをランドマーク情報から取得し、メタデータに基づき案内情報を生成する。そして、出力制御部126は、生成した案内情報を通信部110に車両20へ送信させ、車両20の出力装置に案内情報を出力させる。
(Output control unit 126)
The output control unit 126 has a function of controlling the output in the vehicle 20. For example, the output control unit 126 causes an output device of the vehicle 20 to output output information related to the identified guidance target based on spatial information corresponding to the identified guidance target. Specifically, the output control unit 126 first acquires metadata of the identified guidance target from the landmark information, and generates guidance information based on the metadata. Then, the output control unit 126 causes the communication unit 110 to transmit the generated guidance information to the vehicle 20, and causes an output device of the vehicle 20 to output the guidance information.

案内対象がビルである場合、メタデータは、例えば、ビルの名称、住所、フロア数、各フロアのテナント情報等である。出力制御部126は、これらのメタデータに基づき、例えば、「あのビルはAAAビルです。」という紹介文を紹介情報として生成する。そして、出力制御部126は、車両20の出力装置に応じて、出力装置に紹介情報を出力させる。例えば、出力装置が音声出力装置である場合、出力制御部126は、紹介文を音声に変換して音声出力装置に出力させる。また、出力装置が表示装置である場合、出力制御部126は、紹介文を画像に変換して表示装置に出力させる。かかる構成により、ユーザ40に対して、案内対象の特定後に取得するランドマーク情報に基づき、特定した案内対象や取得したランドマーク情報に応じた柔軟な案内を行うことができる。 When the guidance target is a building, the metadata is, for example, the building's name, address, number of floors, tenant information for each floor, etc. Based on this metadata, the output control unit 126 generates an introduction text, for example, "That building is the AAA Building," as the introduction information. Then, the output control unit 126 causes the output device to output the introduction information according to the output device of the vehicle 20. For example, when the output device is an audio output device, the output control unit 126 converts the introduction text into audio and outputs it to the audio output device. Also, when the output device is a display device, the output control unit 126 converts the introduction text into an image and outputs it to the display device. With this configuration, flexible guidance can be provided to the user 40 according to the identified guidance target and the acquired landmark information, based on the landmark information acquired after the guidance target is identified.

案内情報の生成時、出力制御部126は、車両20やユーザ40の状況、ユーザ40のプロファイル情報に応じて、案内情報を生成してもよい。車両20の状況は、例えば、車両20の位置、向き、速度、移動経路等である。ユーザ40の状況は、例えば、ユーザ40の姿勢、車内におけるユーザ40の位置等である。ユーザ40のプロファイル情報は、例えば、ユーザ40の名前、性別、身長、体重、趣味、対象案内制御システムの使用履歴等である。出力制御部126は、ユーザ40のプロファイル情報に基づき、例えば、「あのビルはAAAビルです。ビルの中には、以前にご案内したBBBカフェがあります。」という紹介文を紹介情報として生成する。かかる構成により、ユーザ40に対して、車両20やユーザ40の状況、ユーザ40のプロファイル情報に応じた柔軟な案内を行うことができる。 When generating the guidance information, the output control unit 126 may generate the guidance information according to the status of the vehicle 20 and the user 40, and the profile information of the user 40. The status of the vehicle 20 is, for example, the position, direction, speed, and moving route of the vehicle 20. The status of the user 40 is, for example, the posture of the user 40, and the position of the user 40 in the vehicle. The profile information of the user 40 is, for example, the name, sex, height, weight, hobbies, and usage history of the target guidance control system of the user 40. Based on the profile information of the user 40, the output control unit 126 generates, for example, an introduction text such as "That building is the AAA building. Inside the building is the BBB cafe that we introduced previously." as the introduction information. With this configuration, flexible guidance can be provided to the user 40 according to the status of the vehicle 20 and the user 40, and the profile information of the user 40.

(記憶部130)
記憶部130は、各種情報を記憶する機能を有する。記憶部130は、記憶媒体、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、RAM(Random Access read/write Memory)、ROM(Read Only Memory)、またはこれらの記憶媒体の任意の組み合わせによって構成される。記憶部130は、例えば、不揮発性メモリを用いることができる。
(Memory unit 130)
The storage unit 130 has a function of storing various information. The storage unit 130 is configured by a storage medium, for example, a hard disk drive (HDD), a flash memory, an electrically erasable programmable read only memory (EEPROM), a random access read/write memory (RAM), a read only memory (ROM), or any combination of these storage media. The storage unit 130 may be, for example, a non-volatile memory.

記憶部130、例えば、3次元地図やランドマーク情報等の車両20の周囲の空間情報を記憶する。また、記憶部130は、車両20の取得部210が取得したセンシング情報、対象案内制御装置10の特定部124が案内対象として特定したランドマーク、出力制御部126が生成した出力情報、ユーザ40のプロファイル情報等を記憶してもよい。 The storage unit 130 stores spatial information about the surroundings of the vehicle 20, such as a three-dimensional map and landmark information. The storage unit 130 may also store sensing information acquired by the acquisition unit 210 of the vehicle 20, landmarks identified as guidance targets by the identification unit 124 of the target guidance control device 10, output information generated by the output control unit 126, profile information of the user 40, etc.

以上、対象案内制御装置10の構成要素の全部が車両20には備えられずサーバ装置等により実現される場合の対象案内制御システム1の構成例について説明した。なお、対象案内制御システム1の構成例はかかる例に限定されない。例えば、対象案内制御装置10の構成要素の全部が車両20に備えられる場合、外部装置と通信を行う機能を有する構成要素として、通信部110または通信部220の少なくとも一方が車両20に設けられればよい。 The above describes an example configuration of the object guidance control system 1 in the case where not all of the components of the object guidance control device 10 are provided in the vehicle 20 but are realized by a server device or the like. Note that the example configuration of the object guidance control system 1 is not limited to this example. For example, in the case where all of the components of the object guidance control device 10 are provided in the vehicle 20, at least one of the communication unit 110 or the communication unit 220 may be provided in the vehicle 20 as a component having a function of communicating with an external device.

(対象案内制御システム1における処理の流れ)
続いて、本実施形態に係る対象案内制御システム1における処理の流れについて説明する。図5は、本実施形態に係る対象案内制御システム1における処理の流れを示すフローチャートである。なお、以下では、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1における処理の流れの例について説明する。
(Processing flow in the object guidance control system 1)
Next, a process flow in the object guidance control system 1 according to the present embodiment will be described. Fig. 5 is a flowchart showing a process flow in the object guidance control system 1 according to the present embodiment. Note that, below, an example of a process flow in the object guidance control system 1 in the case where not all of the components of the object guidance control device 10 are provided in the vehicle 20 but are realized by a server device or the like will be described.

まず、車両20のマイク212は、車両20の車内における音声を取得する(S102)。マイク212が取得した音声は、ネットワーク30を介して対象案内制御装置10へ送信される。マイク212が音声を取得すると、車両20の制御部230は、車両20の車内カメラ214をオンにする(S104)。また、制御部230は、車両20の車外カメラ216もオンにする(S106)。 First, the microphone 212 of the vehicle 20 captures voice within the vehicle 20 (S102). The voice captured by the microphone 212 is transmitted to the target guidance control device 10 via the network 30. When the microphone 212 captures the voice, the control unit 230 of the vehicle 20 turns on the in-vehicle camera 214 of the vehicle 20 (S104). The control unit 230 also turns on the exterior camera 216 of the vehicle 20 (S106).

次いで、ユーザ40が発話すると(S108)、マイク212がユーザ40の発話を含む音声を取得し、当該音声がネットワーク30を介して対象案内制御装置10へ送信される。次いで、対象案内制御装置10の制御部120は、案内を求めるボイスコマンドが受信した音声に含まれるか否かを判定する(S110)。音声にボイスコマンドが含まれない場合(S110/NO)、対象案内制御システム1は、音声にボイスコマンドが含まれるまでS108とS110の処理を行う。音声にボイスコマンドが含まれる場合(S110/YES)、制御部120は、案内対象特定処理を行う(S112)。なお、案内対象特定処理の詳細は後述される。 Next, when the user 40 speaks (S108), the microphone 212 acquires voice including the user's utterance, and the voice is transmitted to the object guidance control device 10 via the network 30. Next, the control unit 120 of the object guidance control device 10 determines whether the received voice contains a voice command requesting guidance (S110). If the voice does not contain a voice command (S110/NO), the object guidance control system 1 performs the processes of S108 and S110 until the voice contains a voice command. If the voice contains a voice command (S110/YES), the control unit 120 performs a guidance target identification process (S112). Details of the guidance target identification process will be described later.

案内対象特定処理後、制御部120は、案内対象として特定したランドマークを記録する(S114)。次いで、制御部120は、ランドマークのメタデータを3次元地図から取得する(S116)。次いで、制御部120は、車両20やユーザ40の状況とユーザ40のプロファイル情報に応じて紹介文を生成する(S118)。紹介文の生成後、制御部120は、紹介文を音声に変換し、変換した音声を車両20のスピーカ242に出力させることで、紹介文の読み上げを行う(S120)。紹介文の読み上げ後、制御部120は、次の対話があるか否かを判定する(S122)。次の対話がある場合(S122/YES)、制御部120は、S110から処理を繰り返す。次の対話がない場合(S122/NO)、制御部120は、次に音声が取得されるまで処理を終了する。 After the guidance target identification process, the control unit 120 records the landmark identified as the guidance target (S114). Next, the control unit 120 acquires metadata of the landmark from the 3D map (S116). Next, the control unit 120 generates an introduction text according to the situation of the vehicle 20 and the user 40 and the profile information of the user 40 (S118). After generating the introduction text, the control unit 120 converts the introduction text into audio and reads out the converted audio from the speaker 242 of the vehicle 20 (S120). After reading out the introduction text, the control unit 120 determines whether there is a next dialogue (S122). If there is a next dialogue (S122/YES), the control unit 120 repeats the process from S110. If there is no next dialogue (S122/NO), the control unit 120 ends the process until the next voice is acquired.

(案内対象特定処理の流れ)
続いて、S112の案内対象特定処理の詳細について説明する。図6は、本実施形態に係る案内対象特定処理の流れを示すフローチャートである。
(Flow of the guidance target specification process)
Next, the details of the guidance target specification process of S112 will be described below. Fig. 6 is a flowchart showing the flow of the guidance target specification process according to this embodiment.

まず、制御部120は、音声に含まれる自然言語を分析する(S202)。次いで、制御部120は、車両20からネットワーク30を介して受信する車内カメラ214の撮像画像に写るユーザ40のポーズを分析する(S204)。次いで、制御部120は、車両20からネットワーク30を介して受信する車外カメラ216の撮像画像に写る車外風景を分析する(S206)。 First, the control unit 120 analyzes the natural language contained in the voice (S202). Next, the control unit 120 analyzes the pose of the user 40 shown in the image captured by the in-vehicle camera 214 and received from the vehicle 20 via the network 30 (S204). Next, the control unit 120 analyzes the scenery outside the vehicle shown in the image captured by the exterior camera 216 and received from the vehicle 20 via the network 30 (S206).

自然言語、ポーズ、および車外風景の分析後、制御部120は、案内対象を検出できたか否かを判定する(S208)。案内対象を検出できなかった場合(S208/NO)、制御部120は、ユーザ40に対して再度発話を促す(S220)。 After analyzing the natural language, the pause, and the scenery outside the vehicle, the control unit 120 determines whether or not the guidance target has been detected (S208). If the guidance target has not been detected (S208/NO), the control unit 120 prompts the user 40 to speak again (S220).

案内対象を検出できた場合(S208/YES)、制御部120は、車両20の位置と向きを取得する(S210)。次いで、制御部120は、車両20の位置と向きを3次元地図と対応付ける(S212)。次いで、制御部120は、ユーザ40のポーズの向きを車両20の向きと対応付ける(S214)。次いで、制御部120は、車両20の車外風景が写った撮像画像を3次元地図と対応付ける(S216)。 If the guidance target is detected (S208/YES), the control unit 120 acquires the position and orientation of the vehicle 20 (S210). Next, the control unit 120 associates the position and orientation of the vehicle 20 with the three-dimensional map (S212). Next, the control unit 120 associates the orientation of the pose of the user 40 with the orientation of the vehicle 20 (S214). Next, the control unit 120 associates a captured image showing the scenery outside the vehicle 20 with the three-dimensional map (S216).

各対応付け後、制御部120は、案内対象が3次元地図上で一義的に決定できるか否かを判定する(S218)。案内対象を一義的に決定できなかった場合(S218/NO)、制御部120は、ユーザ40に対して、案内対象を絞り込むための発話を促す(S222)。案内対象を一義的に決定できた場合(S218/YES)、制御部120は、案内対象特定処理を終了する。 After each correspondence, the control unit 120 determines whether the guidance target can be univocally determined on the three-dimensional map (S218). If the guidance target cannot be univocally determined (S218/NO), the control unit 120 prompts the user 40 to speak to narrow down the guidance targets (S222). If the guidance target can be univocally determined (S218/YES), the control unit 120 ends the guidance target identification process.

以上、対象案内制御装置10の構成要素の全部が車両20には備えられず、サーバ装置等により実現される場合の対象案内制御システム1における処理の流れの例について説明した。なお、対象案内制御システム1における処理の流れはかかる例に限定されない。例えば、対象案内制御装置10の構成要素の全部が車両20に備えられる場合、対象案内制御システム1は、ネットワーク30を介さずに処理を行い得る。 The above describes an example of the processing flow in the object guidance control system 1 when not all of the components of the object guidance control device 10 are provided in the vehicle 20, but are realized by a server device or the like. Note that the processing flow in the object guidance control system 1 is not limited to this example. For example, when all of the components of the object guidance control device 10 are provided in the vehicle 20, the object guidance control system 1 can perform processing without going through the network 30.

以上説明したように、本実施形態に係る対象案内制御装置10は、移動している車両20の車内のユーザ40の音声とユーザ40の動作に基づき、車両20の車外風景から検出された案内対象の候補群とユーザ40が指定した案内対象とを結び付ける。これにより、対象案内制御装置10は、移動している車両20の車外のランドマークを案内対象の候補として検出することができる。
また、本実施形態に係る対象案内制御装置10は、車両20の車内のユーザ40の音声とユーザ40の動作の両方を用いて案内対象の候補を検出する。これにより、対象案内制御装置10は、案内対象の検出の精度を向上することができる。
また、本実施形態に係る対象案内制御装置10は、車両20の位置情報と3次元地図に基づき、3次元地図上で案内対象を一義的に特定する。これにより、対象案内制御装置10は、案内対象の特定の精度を向上し、さらに、ユーザ40が指定した案内対象に関する案内の精度も向上することができる。
したがって、本実施形態に係る対象案内制御装置10は、車両20に乗車しているユーザ40が案内を求める対象として指定した案内対象に関する案内の精度を向上することができる。
As described above, the object guidance control device 10 according to this embodiment links a group of candidate guidance targets detected from the scenery outside the vehicle 20 with a guidance target designated by the user 40, based on the voice and actions of the user 40 inside the moving vehicle 20. This allows the object guidance control device 10 to detect landmarks outside the moving vehicle 20 as candidate guidance targets.
Furthermore, the object guidance control device 10 according to the present embodiment detects candidates for guidance targets using both the voice of the user 40 inside the vehicle 20 and the actions of the user 40. This allows the object guidance control device 10 to improve the accuracy of detection of guidance targets.
Furthermore, the object guidance control device 10 according to this embodiment uniquely identifies the guidance object on the 3D map based on the position information of the vehicle 20 and the 3D map. This enables the object guidance control device 10 to improve the accuracy of identifying the guidance object, and further improve the accuracy of guidance regarding the guidance object designated by the user 40.
Therefore, the target guidance control device 10 according to this embodiment can improve the accuracy of guidance regarding a guidance target designated by the user 40 in the vehicle 20 as a target for which guidance is requested.

(変形例)
以上、本発明の実施形態について説明した。続いて、本発明の実施形態の変形例について説明する。なお、以下に説明する各変形例は、単独で本発明の実施形態に適用されてもよいし、組み合わせで本発明の実施形態に適用されてもよい。また、各変形例は、本発明の実施形態で説明した構成に代えて適用されてもよいし、本発明の各実施形態で説明した構成に対して追加的に適用されてもよい。
(Modification)
The embodiments of the present invention have been described above. Next, modified examples of the embodiments of the present invention will be described. Each modified example described below may be applied alone to the embodiments of the present invention, or may be applied in combination to the embodiments of the present invention. Furthermore, each modified example may be applied in place of the configuration described in the embodiments of the present invention, or may be applied in addition to the configuration described in each embodiment of the present invention.

(第1の変形例)
上述した実施形態では、対象案内制御装置10がユーザ40に指定された案内対象に関する案内の制御を行う例について説明したが、かかる例に限定されない。車両20の周囲にユーザ40が興味を持ちそうなランドマークがある場合、対象案内制御装置10は、ユーザ40からの指定がなくても当該ランドマークを案内対象として案内の制御を行ってもよい。ユーザ40が興味を持ちそうなランドマークは、例えば、車両20の位置情報やユーザ40のプロファイル情報等に基づき検出される。かかる構成により、ユーザ40に対して、ユーザ40に応じた柔軟な案内を行うことができる。
(First Modification)
In the above-described embodiment, an example has been described in which the target guidance control device 10 controls guidance regarding a guidance target specified by the user 40, but the present invention is not limited to such an example. If there is a landmark around the vehicle 20 that is likely to interest the user 40, the target guidance control device 10 may control guidance to the landmark as a guidance target even if it is not specified by the user 40. The landmark that is likely to interest the user 40 is detected based on, for example, position information of the vehicle 20 or profile information of the user 40. With such a configuration, flexible guidance can be provided to the user 40 according to the user 40.

(第2の変形例)
上述した実施形態では、対象案内制御装置10が車両20の出力装置に案内情報を出力させる例について説明したが、かかる例に限定されない。例えば、検出部122が検出した自然言語から、ユーザ40が経路変更を求めていることを示すボイスコマンドが検出された場合、案内情報は車両20の制御部230に対して出力されてもよい。この時、制御部230には、変更後の経路を示す経路情報が案内情報として入力される。そして、制御部230は、入力された経路情報に基づき、車両20が変更後の経路に沿って移動するように、車両20の自動運転を制御する。
(Second Modification)
In the above-described embodiment, an example has been described in which the object guidance control device 10 causes the output device of the vehicle 20 to output guidance information, but the present invention is not limited to such an example. For example, when a voice command indicating that the user 40 is requesting a route change is detected from the natural language detected by the detection unit 122, the guidance information may be output to the control unit 230 of the vehicle 20. At this time, route information indicating the changed route is input to the control unit 230 as the guidance information. Then, the control unit 230 controls the automatic driving of the vehicle 20 based on the input route information so that the vehicle 20 moves along the changed route.

(第3の変形例)
上述した実施形態では、出力制御部126がメタデータに基づき案内情報を生成する例について説明したが、係る例に限定されない。出力制御部126は、ウェブサービスから案内対象に関する情報を取得し、取得した情報に基づき案内情報を生成してもよい。
(Third Modification)
In the above embodiment, an example in which the output control unit 126 generates guidance information based on metadata has been described, but the present invention is not limited to this example. The output control unit 126 may obtain information on the guidance target from a web service and generate guidance information based on the obtained information.

以上、本発明の実施形態の変形例について説明した。なお、上述した実施形態における対象案内制御装置10をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。 The above describes a modified embodiment of the present invention. The object guidance control device 10 in the above embodiment may be realized by a computer. In that case, a program for realizing this function may be recorded in a computer-readable recording medium, and the program recorded in the recording medium may be read into a computer system and executed to realize the function. Note that the term "computer system" here includes hardware such as an OS and peripheral devices. Furthermore, the term "computer-readable recording medium" refers to portable media such as flexible disks, optical magnetic disks, ROMs, and CD-ROMs, and storage devices such as hard disks built into a computer system. Furthermore, the term "computer-readable recording medium" may include a medium that dynamically holds a program for a short period of time, such as a communication line when a program is transmitted via a network such as the Internet or a communication line such as a telephone line, and a medium that holds a program for a certain period of time, such as a volatile memory inside a computer system that is a server or client in such a case. Furthermore, the above program may be a program for realizing a part of the above-mentioned function, or may be a program that can realize the above-mentioned function in combination with a program already recorded in the computer system, or may be a program that is realized using a programmable logic device such as an FPGA (Field Programmable Gate Array).

以上、図面を参照してこの発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 The above describes in detail an embodiment of the present invention with reference to the drawings, but the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the present invention.

1…対象案内制御システム、10…対象案内制御装置、20…車両、30…ネットワーク、110…通信部、120…制御部、122…検出部、124…特定部、126…出力制御部、130…記憶部、210…取得部、212…マイク、214…車内カメラ、216…車外カメラ、220…通信部、230…制御部、240…案内情報出力部 1... object guidance control system, 10... object guidance control device, 20... vehicle, 30... network, 110... communication unit, 120... control unit, 122... detection unit, 124... identification unit, 126... output control unit, 130... storage unit, 210... acquisition unit, 212... microphone, 214... in-vehicle camera, 216... outside-vehicle camera, 220... communication unit, 230... control unit, 240... guidance information output unit

Claims (5)

車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、
を備える、対象案内制御装置。
a detection unit that detects candidates for a guidance target designated by a user based on a voice of the user riding in the vehicle, an image captured inside the vehicle in which a pose of the user designating a guidance target for which the user requests guidance, and an image captured around the vehicle;
an identification unit that identifies a position and a direction of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified direction of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies a voice uttered by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined;
an output control unit that outputs output information related to the identified guidance target based on the spatial information corresponding to the identified guidance target;
An object guidance control device comprising:
前記検出部は、前記撮像画像を分析することで前記案内対象の候補群を検出し、前記音声を分析して検出する前記案内対象に関連する自然言語と、前記車内撮像画像に含まれる前記ユーザのポーズを分析して検出する前記方向とに基づき、前記候補群の中から前記方向に存在する前記候補を検出する、請求項1に記載の対象案内制御装置。 The object guidance control device according to claim 1, wherein the detection unit detects a group of candidates for the guidance target by analyzing the captured image, and detects the candidate that exists in the direction from the group of candidates based on a natural language related to the guidance target detected by analyzing the voice and the direction detected by analyzing a pose of the user included in the captured image inside the vehicle. 前記出力制御部は、特定した前記案内対象のメタデータを前記空間情報から取得し、前記メタデータに基づき前記出力情報を生成する、請求項1または2に記載の対象案内制御装置。 The target guidance control device according to claim 1 or 2, wherein the output control unit acquires metadata of the identified guidance target from the spatial information and generates the output information based on the metadata. 車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出することと、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給することと、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させることと、
を含む、プロセッサにより実行される対象案内制御方法。
Detecting candidates for a guidance target designated by a user based on a voice of the user riding in the vehicle, an in-vehicle captured image in which a pose of the user designating a guidance target for which the user requests guidance is captured, and a captured image of the surroundings of the vehicle;
specifying a position and orientation of the vehicle in spatial information around the vehicle based on position information of the vehicle, specifying a direction of the guidance target in the spatial information based on the specified orientation of the vehicle, determining whether or not the guidance target can be uniquely determined from the candidates based on the specified direction, specifying the guidance target if it can be determined, and supplying a voice uttered by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined ;
outputting output information related to the identified guidance target based on the spatial information corresponding to the guidance target;
23. An object guidance control method executed by a processor, comprising:
コンピュータを、
車両に乗車しているユーザの音声と前記ユーザが案内を求める対象である案内対象を指定する前記ユーザのポーズが撮像された車内撮像画像と前記車両の周囲の撮像画像とに基づき、前記ユーザが指定した案内対象の候補を検出する検出部と、
前記車両の位置情報に基づき前記車両の周囲の空間情報における前記車両の位置と向きを特定し、特定した前記車両の向きを基準に前記空間情報における前記案内対象の方向を特定し、特定した前記方向に基づいて前記候補から一義的に前記案内対象を決定できるか否かを判定し、決定できた場合は、前記案内対象を特定し、前記案内対象を決定できなかった場合は、前記ユーザに前記案内対象を絞りこむための発話を促すことによって前記ユーザから発話された音声を前記検出部に供給する特定部と、
特定した前記案内対象と対応する前記空間情報に基づき、前記案内対象に関する出力情報を出力させる出力制御部と、
として機能させるためのプログラム。
Computer,
a detection unit that detects candidates for a guidance target designated by a user based on a voice of the user riding in the vehicle, an image captured inside the vehicle in which a pose of the user designating a guidance target for which the user requests guidance, and an image captured around the vehicle;
an identification unit that identifies a position and a direction of the vehicle in spatial information around the vehicle based on position information of the vehicle, identifies a direction of the guidance target in the spatial information based on the identified direction of the vehicle, determines whether the guidance target can be uniquely determined from the candidates based on the identified direction, identifies the guidance target if it can be determined, and supplies a voice uttered by the user to the detection unit by prompting the user to speak to narrow down the guidance targets if it cannot be determined;
an output control unit that outputs output information related to the identified guidance target based on the spatial information corresponding to the identified guidance target;
A program to function as a
JP2019144180A 2019-08-06 2019-08-06 Object guidance control device, object guidance control method, and program Active JP7605582B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019144180A JP7605582B2 (en) 2019-08-06 2019-08-06 Object guidance control device, object guidance control method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019144180A JP7605582B2 (en) 2019-08-06 2019-08-06 Object guidance control device, object guidance control method, and program

Publications (2)

Publication Number Publication Date
JP2021025884A JP2021025884A (en) 2021-02-22
JP7605582B2 true JP7605582B2 (en) 2024-12-24

Family

ID=74662986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019144180A Active JP7605582B2 (en) 2019-08-06 2019-08-06 Object guidance control device, object guidance control method, and program

Country Status (1)

Country Link
JP (1) JP7605582B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001330450A (en) 2000-03-13 2001-11-30 Alpine Electronics Inc Navigation device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005024313A (en) * 2003-06-30 2005-01-27 Alpine Electronics Inc On-vehicle navigation device
JP4556586B2 (en) * 2004-09-22 2010-10-06 トヨタ自動車株式会社 Driving assistance device
US10302444B2 (en) * 2015-01-30 2019-05-28 Sony Corporation Information processing system and control method
JP6604151B2 (en) * 2015-11-09 2019-11-13 三菱自動車工業株式会社 Speech recognition control system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001330450A (en) 2000-03-13 2001-11-30 Alpine Electronics Inc Navigation device

Also Published As

Publication number Publication date
JP2021025884A (en) 2021-02-22

Similar Documents

Publication Publication Date Title
KR101960140B1 (en) System and method for providing augmented virtual reality content in autonomous vehicles
EP3627180B1 (en) Sensor calibration method and device, computer device, medium, and vehicle
CN114175114B (en) System and method for identifying points of interest from within an autonomous vehicle
CN110390240B (en) Lane post-processing in an autonomous vehicle
EP2806335A1 (en) Vehicle human machine interface with gaze direction and voice recognition
US11906970B2 (en) Information processing device and information processing method
KR20170137636A (en) Information-attainment system based on monitoring an occupant
KR20170133234A (en) System and method for providing content in autonomous vehicles based on real-time traffic information
JP2023508778A (en) A system for conducting scene-aware dialogue
CN114664102A (en) Navigation system with parking space recognition mechanism and operation method thereof
JP6808064B2 (en) Map information management device, map information management system, and map information management method
CN113916241A (en) Method and system for setting destination at vehicle navigation system
CN113168535A (en) Accumulated water depth determination method and device
CN112883058A (en) Calibration method, device, equipment, vehicle and medium for vehicle positioning
CN111273652A (en) Automatic driving device
KR20200084446A (en) Electronic apparatus for self driving of vehicles based on intersection node and thereof control method
CN110023781B (en) Method and apparatus for determining the exact location of a vehicle based on a radar signature of the vehicle's surroundings
JP7605582B2 (en) Object guidance control device, object guidance control method, and program
US9638534B2 (en) Arrival time notification system using smart glasses and method thereof
JP7560593B2 (en) Control system, control method, and program
CN113677580A (en) Electronic device and method for assisting vehicle driving
JP7722856B2 (en) Content generation device, content generation method, program, and storage medium
US12504294B2 (en) Information providing device, information providing method, and information providing program for acquiring guidance location information indicating distance between position of recipient and position of guidance location
CN114127514B (en) Provision and transmission of position data of the vehicle's surroundings
CN115704696B (en) Navigation system with traffic sign tracking and positioning mechanism based on monocular camera and operation method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240419

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240426

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20240712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241212

R150 Certificate of patent or registration of utility model

Ref document number: 7605582

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150