Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7825005B2 - system - Google Patents
[go: Go Back, main page]

JP7825005B2 - system - Google Patents

system

Info

Publication number
JP7825005B2
JP7825005B2 JP2024161775A JP2024161775A JP7825005B2 JP 7825005 B2 JP7825005 B2 JP 7825005B2 JP 2024161775 A JP2024161775 A JP 2024161775A JP 2024161775 A JP2024161775 A JP 2024161775A JP 7825005 B2 JP7825005 B2 JP 7825005B2
Authority
JP
Japan
Prior art keywords
user
generative
prompt
input
authentication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024161775A
Other languages
Japanese (ja)
Other versions
JP2025044192A (en
Inventor
英治 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Group Corp
Original Assignee
SoftBank Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Group Corp filed Critical SoftBank Group Corp
Publication of JP2025044192A publication Critical patent/JP2025044192A/en
Application granted granted Critical
Publication of JP7825005B2 publication Critical patent/JP7825005B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Description

本開示の技術は、システムに関する。 The technology disclosed herein relates to a system.

特許文献1には、少なくとも一つのプロセッサにより遂行される、ペルソナチャットボット制御方法であって、ユーザ発話を受信するステップと、前記ユーザ発話を、チャットボットのキャラクターに関する説明と関連した指示文を含むプロンプトに追加するステップと前記プロンプトをエンコードするステップと、前記エンコードしたプロンプトを言語モデルに入力して、前記ユーザ発話に応答するチャットボット発話を生成するステップ、を含む、方法が開示されている。 Patent document 1 discloses a persona chatbot control method executed by at least one processor, the method including the steps of receiving a user utterance, adding the user utterance to a prompt including an instruction sentence related to a description of the chatbot's character, encoding the prompt, and inputting the encoded prompt into a language model to generate a chatbot utterance in response to the user utterance.

特開2022-180282号公報Japanese Patent Application Laid-Open No. 2022-180282

生成系AIを活用する際に、プロンプト入力までの手間が煩わしく、特に高齢者などサービスを使うことにハードルがある方に対するデジタルデバイドが存在する。 When using generative AI, the time required to enter prompts is cumbersome, creating a digital divide for people who have difficulty using the service, particularly the elderly.

スマートフォンに接続可能なアクセサリー装置を提供する。この装置は、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段を含む。ユーザー認証手段は指紋認証手段であり、操作手段はワンクリック操作手段である。これにより、スマートフォンからすぐに生成系AIにプロンプト入力できるようにし、よりスマートな生成系AI活用を実現できる。また、高齢者などサービスを使うことにハードルがある方に対するデジタルデバイドにも貢献する。 We provide an accessory device that can be connected to a smartphone. This device includes a means for enabling prompt input to generative AI, a user authentication means for operating the accessory device, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. The user authentication means is a fingerprint authentication means, and the operation means is a one-click operation means. This allows prompt input to the generative AI immediately from a smartphone, realizing smarter use of generative AI. It also contributes to bridging the digital divide for people who have difficulty using services, such as the elderly.

第1実施形態に係るデータ処理システムの構成の一例を示す概念図である。1 is a conceptual diagram illustrating an example of the configuration of a data processing system according to a first embodiment. 第1実施形態に係るデータ処理装置及びスマートデバイスの要部機能の一例を示す概念図である。1 is a conceptual diagram showing an example of main functions of a data processing device and a smart device according to a first embodiment. 第2実施形態に係るデータ処理システムの構成の一例を示す概念図である。FIG. 10 is a conceptual diagram illustrating an example of the configuration of a data processing system according to a second embodiment. 第2実施形態に係るデータ処理装置及びスマート眼鏡の要部機能の一例を示す概念図である。FIG. 10 is a conceptual diagram showing an example of main functions of a data processing device and smart glasses according to a second embodiment. 第3実施形態に係るデータ処理システムの構成の一例を示す概念図である。FIG. 10 is a conceptual diagram illustrating an example of the configuration of a data processing system according to a third embodiment. 第3実施形態に係るデータ処理装置及びヘッドセット型端末の要部機能の一例を示す概念図である。FIG. 11 is a conceptual diagram showing an example of main functions of a data processing device and a headset-type terminal according to a third embodiment. 第4実施形態に係るデータ処理システムの構成の一例を示す概念図である。FIG. 10 is a conceptual diagram showing an example of the configuration of a data processing system according to a fourth embodiment. 第4実施形態に係るデータ処理装置及びロボットの要部機能の一例を示す概念図である。FIG. 10 is a conceptual diagram showing an example of main functions of a data processing device and a robot according to a fourth embodiment. 複数の感情がマッピングされる感情マップを示す。1 shows an emotion map onto which multiple emotions are mapped. 複数の感情がマッピングされる感情マップを示す。1 shows an emotion map onto which multiple emotions are mapped. 形態例1の実施例1におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing a flow of processing in the data processing system according to the first embodiment of the first form example. 形態例1の応用例1におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing a processing flow of the data processing system in Application Example 1 of Form Example 1. 形態例2の実施例2におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing a processing flow of a data processing system in a second embodiment of the second form example. 形態例2の応用例2におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing the flow of processing in the data processing system in Application Example 2 of Form Example 2. 形態例3の実施例3におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing a processing flow of a data processing system in a third embodiment of the third form example. 形態例3の応用例3におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 13 is a sequence diagram showing the flow of processing in the data processing system in Application Example 3 of Form Example 3. 感情エンジンを組み合わせた場合の形態例1の実施例1におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing the flow of processing in the data processing system in the first embodiment of the first form example when an emotion engine is combined. 感情エンジンを組み合わせた場合の形態例1の応用例1におけるデータ処理システムの処理の流れを示すシーケンス図である。FIG. 10 is a sequence diagram showing the flow of processing in the data processing system in Application Example 1 of Form Example 1 when an emotion engine is combined.

以下、添付図面に従って本開示の技術に係るシステムの実施形態の一例について説明す Below, an example of an embodiment of a system relating to the technology disclosed herein will be described with reference to the accompanying drawings.

る。

先ず、以下の説明で使用される文言について説明する。 First, let me explain the terminology used in the following explanation.

以下の実施形態において、符号付きのプロセッサ(以下、単に「プロセッサ」と称する)は、1つの演算装置であってもよいし、複数の演算装置の組み合わせであってもよい。また、プロセッサは、1種類の演算装置であってもよいし、複数種類の演算装置の組み合わせであってもよい。演算装置の一例としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、GPGPU(General-Purpose computing on Graphics Processing Units)、APU(Accelerated Processing Unit)、又はTPU(TENSOR PROCESSING UNIT(登録商標))等が挙げられる。 In the following embodiments, a coded processor (hereinafter simply referred to as a "processor") may be a single arithmetic unit or a combination of multiple arithmetic units. Furthermore, a processor may be a single type of arithmetic unit or a combination of multiple types of arithmetic units. Examples of arithmetic units include a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), a GPGPU (General-Purpose Computing on Graphics Processing Units), an APU (Accelerated Processing Unit), or a TPU (TENSOR PROCESSING UNIT (registered trademark)).

以下の実施形態において、符号付きのRAM(Random Access Memory)は、一時的に情報が格納されるメモリであり、プロセッサによってワークメモリとして用いられる。 In the following embodiments, coded random access memory (RAM) is memory in which information is temporarily stored and is used by the processor as work memory.

以下の実施形態において、符号付きのストレージは、各種プログラム及び各種パラメータ等を記憶する1つ又は複数の不揮発性の記憶装置である。不揮発性の記憶装置の一例としては、フラッシュメモリ(SSD(Solid State Drive))、磁気ディスク(例えば、ハードディスク)、又は磁気テープ等が挙げられる。 In the following embodiments, the coded storage refers to one or more non-volatile storage devices that store various programs, parameters, etc. Examples of non-volatile storage devices include flash memory (SSD (Solid State Drive)), magnetic disks (e.g., hard disks), and magnetic tapes.

以下の実施形態において、符号付きの通信I/F(Interface)は、通信プロセッサ及びアンテナ等を含むインタフェースである。通信I/Fは、複数のコンピュータ間での通信を司る。通信I/Fに対して適用される通信規格の一例としては、5G(5th Generation Mobile Communication System)、Wi-Fi(登録商標)、又はBluetooth(登録商標)等を含む無線通信規格が挙げられる。 In the following embodiments, a communication I/F (Interface) with a symbol is an interface that includes a communication processor, an antenna, etc. The communication I/F controls communication between multiple computers. Examples of communication standards that can be applied to the communication I/F include wireless communication standards such as 5G (5th Generation Mobile Communication System), Wi-Fi (registered trademark), or Bluetooth (registered trademark).

以下の実施形態において、「A及び/又はB」は、「A及びBのうちの少なくとも1つ」と同義である。つまり、「A及び/又はB」は、Aだけであってもよいし、Bだけであってもよいし、A及びBの組み合わせであってもよい、という意味である。また、本明細書において、3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「A及び/又はB」と同様の考え方が適用される。 In the following embodiments, "A and/or B" is synonymous with "at least one of A and B." In other words, "A and/or B" means that it may be just A, just B, or a combination of A and B. Furthermore, in this specification, the same concept as "A and/or B" also applies when three or more things are expressed connected by "and/or."

[第1実施形態] [First embodiment]

図1には、第1実施形態に係るデータ処理システム10の構成の一例が示されている。 Figure 1 shows an example of the configuration of a data processing system 10 according to the first embodiment.

図1に示すように、データ処理システム10は、データ処理装置12及びスマートデバイス14を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 1, the data processing system 10 includes a data processing device 12 and a smart device 14. An example of the data processing device 12 is a server.

データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).

スマートデバイス14は、コンピュータ36、受付装置38、出力装置40、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、受付装置38、出力装置40、及びカメラ42も、バス52に接続されている。 The smart device 14 includes a computer 36, a reception device 38, an output device 40, a camera 42, and a communication I/F 44. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The reception device 38, output device 40, and camera 42 are also connected to the bus 52.

受付装置38は、タッチパネル38A及びマイクロフォン38B等を備えており、ユーザ入力を受け付ける。タッチパネル38Aは、指示体(例えば、ペン又は指等)の接触を検出することにより、指示体の接触によるユーザ入力を受け付ける。マイクロフォン38Bは、ユーザの音声を検出することにより、音声によるユーザ入力を受け付ける。制御部46Aは、タッチパネル38A及びマイクロフォン38Bによって受け付けたユーザ入力を示すデータをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が、ユーザ入力を示すデータを取得する。 The reception device 38 is equipped with a touch panel 38A, a microphone 38B, etc., and receives user input. The touch panel 38A detects contact with an indicator (e.g., a pen or finger) to receive user input via the indicator. The microphone 38B detects the user's voice to receive user input via voice. The control unit 46A transmits data indicating the user input received by the touch panel 38A and the microphone 38B to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the data indicating the user input.

出力装置40は、ディスプレイ40A及びスピーカ40B等を備えており、データをユーザ20が知覚可能な表現形(例えば、音声及び/又はテキスト)で出力することでデータをユーザ20に対して提示する。ディスプレイ40Aは、プロセッサ46からの指示に従ってテキスト及び画像等の可視情報を表示する。スピーカ40Bは、プロセッサ46からの指示に従って音声を出力する。カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラである。 The output device 40 is equipped with a display 40A and a speaker 40B, and presents data to the user 20 by outputting the data in a form perceptible by the user 20 (e.g., audio and/or text). The display 40A displays visible information such as text and images in accordance with instructions from the processor 46. The speaker 40B outputs audio in accordance with instructions from the processor 46. The camera 42 is a compact digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor.

通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54.

図2には、データ処理装置12及びスマートデバイス14の要部機能の一例が示されている。 Figure 2 shows an example of the main functions of the data processing device 12 and smart device 14.

図2に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って特定処理部290として動作することによって実現される。 As shown in FIG. 2, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32. The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as a specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.

ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.

スマートデバイス14では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。受付出力プログラム60は、データ処理システム10によって特定処理プログラム56と併用される。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the smart device 14, the processor 46 performs the reception output processing. The storage 50 stores a reception output program 60. The reception output program 60 is used in conjunction with the specific processing program 56 by the data processing system 10. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output processing is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.

次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段を含む。具体的には、アクセサリー装置はBluetooth等の無線通信手段を用いてスマートフォンと接続され、生成系AIへのプロンプト入力はスマートフォン上で動作するアプリケーションを通じて行われる。ユーザー認証手段としては、指紋認証センサーが装置に組み込まれ、登録されたユーザーの指紋情報と照合することで認証を行う。操作手段としては、装置に設けられたボタンをユーザーが押すことで、生成系AIへのプロンプト入力が行われる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to generative AI, a user authentication means for operating the accessory device, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. Specifically, the accessory device is connected to the smartphone using a wireless communication means such as Bluetooth, and prompt input to the generative AI is performed through an application running on the smartphone. The user authentication means includes a fingerprint authentication sensor built into the device, which performs authentication by comparing the fingerprint information with the registered user's fingerprint. The operation means involves the user pressing a button on the device, which inputs prompts to the generative AI.

「形態例2」 "Example 2"

具体的な使用例としては、ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行い、認証が成功すると、装置のボタンが有効化される。ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 As a specific example of use, a user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device, and if authentication is successful, the button on the device is enabled. When the user presses the button, an application on the smartphone is launched and a prompt input is sent to the generative AI. This allows the user to easily utilize generative AI without having to operate the smartphone.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置をBluetooth等の無線通信手段を用いてスマートフォンと接続する。 Step 1: The user connects an accessory device that can be connected to a smartphone to the smartphone using a wireless communication method such as Bluetooth.

ステップ2:ユーザーがアクセサリー装置の指紋認証センサーに指を当て、指紋認証センサーが登録されたユーザーの指紋情報と照合することでユーザー認証を行う。 Step 2: The user places their finger on the fingerprint authentication sensor on the accessory device, and the fingerprint authentication sensor authenticates the user by matching it with the registered user's fingerprint information.

ステップ3:認証が成功すると、装置のボタンが有効化される。 Step 3: If authentication is successful, the device's buttons will be enabled.

ステップ4:ユーザーが装置のボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 4: When the user presses a button on the device, an application on the smartphone is launched and prompts are input to the generative AI.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行う。 Step 1: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device.

ステップ2:認証が成功すると、装置のボタンが有効化される。 Step 2: If authentication is successful, the device's buttons will be enabled.

ステップ3:ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 3: When the user presses the button, an application on the smartphone is launched and prompt input is sent to the generative AI.

ステップ4:これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 Step 4: This allows users to easily utilize generative AI without having to operate their smartphone.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来の生成系AIモデルを利用するシステムでは、ユーザーがプロンプト文を入力する際に、複雑な操作や多段階の認証が必要であり、ユーザーエクスペリエンスが低下する問題があった。また、生成結果を迅速かつ正確に取得するための効率的な手段が不足していた。これにより、ユーザーが生成系AIモデルを活用する際の利便性が損なわれていた。 In systems that use conventional generative AI models, users are required to perform complex operations and undergo multi-step authentication when entering prompt text, resulting in a poor user experience. Furthermore, there is a lack of efficient means for quickly and accurately obtaining generated results. This reduces the convenience for users when using generative AI models.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、該生成系AIへのプロンプト入力を行うためのアプリケーションをスマートフォン上で動作させる手段と、該生成系AIモデルにプロンプト文を送信し、生成結果を受信する手段と、を含む。これにより、ユーザーは簡単な操作で生成系AIモデルにプロンプト文を入力し、迅速かつ正確に生成結果を取得することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for running an application on the smartphone for inputting prompts to the generative AI; and means for sending prompts to the generative AI model and receiving generation results. This allows the user to input prompts to the generative AI model with simple operations and quickly and accurately obtain generation results.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持ち、アプリケーションをインストールして多様な機能を利用できる携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer, and can be used with a variety of functions by installing applications.

「アクセサリー装置」とは、スマートフォンに接続して追加の機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AI」とは、入力されたプロンプト文に基づいてテキストや画像などの生成を行う人工知能モデルである。 "Generative AI" is an artificial intelligence model that generates text, images, etc. based on input prompts.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為である。 "Prompt input" is the act of inputting instructions or questions to a generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術や装置である。 "User authentication means" refers to technology or devices used to verify a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーの身元を確認する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and verify the user's identity based on that information.

「操作手段」とは、ユーザーがアクセサリー装置やスマートフォンを操作するためのインターフェースや装置である。 "Operation means" refers to the interface or device that allows the user to operate the accessory device or smartphone.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースや装置である。 A "one-click operation means" is an interface or device that allows a user to perform a specific function with a single click.

「アプリケーション」とは、スマートフォン上で動作し、特定の機能やサービスを提供するソフトウェアである。 An "application" is software that runs on a smartphone and provides specific functions or services.

「生成結果」とは、生成系AIがプロンプト文に基づいて生成したテキストや画像などの出力物である。 "Generation results" are output such as text and images generated by the generative AI based on the prompt text.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を簡便に行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to easily input prompts into a generative AI model. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置: Accessory equipment:

アクセサリー装置は、スマートフォンに接続される外部デバイスであり、以下の主要な機能を持つ。 Accessory devices are external devices that connect to your smartphone and have the following main functions:

ユーザー認証手段: 指紋認証センサーを搭載し、ユーザーの指紋情報を読み取る。 User authentication method: Equipped with a fingerprint authentication sensor that reads the user's fingerprint information.

操作手段: ワンクリック操作が可能なボタンを備え、ユーザーが簡単に操作できる。 Operation method: Equipped with a one-click button, making it easy for users to operate.

スマートフォン: Smartphone:

スマートフォンは、アクセサリー装置とBluetooth等の無線通信手段を用いて接続される。スマートフォン上には、生成系AIモデルへのプロンプト入力を行うためのアプリケーションがインストールされている。 The smartphone is connected to the accessory device using wireless communication means such as Bluetooth. An application for providing prompt input to the generative AI model is installed on the smartphone.

生成系AIモデル: Generative AI model:

生成系AIモデルは、サーバ上で動作し、スマートフォンから送信されたプロンプト文に基づいてテキストや画像を生成する。 The generative AI model runs on a server and generates text and images based on prompts sent from the smartphone.

システムの動作 System Operation

ユーザー認証: User authentication:

ユーザは、アクセサリー装置に設置された指紋認証センサーに指を置く。アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。認証が成功すると、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 The user places their finger on the fingerprint authentication sensor installed on the accessory device. The accessory device reads the fingerprint information and compares it with the fingerprint information stored in its internal database. If authentication is successful, the accessory device sends a signal indicating successful authentication to the smartphone.

プロンプト入力: Prompt Input:

認証が成功した後、ユーザはアクセサリー装置のボタンを押す。スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。ユーザは、生成系AIモデルに対するプロンプト文を入力する。 After successful authentication, the user presses a button on the accessory device. The smartphone application launches and a prompt input screen appears. The user enters a prompt statement for the generative AI model.

生成AIモデルへの送信: Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 The smartphone sends the input prompt to the generative AI model. The server operates the generative AI model based on the received prompt and creates the generated results.

生成結果の表示: Displaying the generated results:

サーバは、生成された結果をスマートフォンに送信する。スマートフォンは、受け取った生成結果をユーザに表示する。ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 The server sends the generated results to the smartphone. The smartphone displays the received results to the user. The user can check the displayed results and save or share them as needed.

具体例 Specific examples

ユーザが新しい詩を生成系AIに作成させたい場合の具体的な手順は以下の通りである。 If a user wants to have a generative AI create a new poem, the specific steps are as follows:

1. ユーザー認証: 1. User authentication:

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。 The user places their finger on the fingerprint authentication sensor on the accessory device.

アクセサリー装置は、指紋を読み取り、認証を行う。 The accessory device reads the fingerprint and performs authentication.

認証が成功すると、スマートフォンに認証成功の信号が送信される。 If authentication is successful, a signal indicating successful authentication will be sent to your smartphone.

2. プロンプト入力: 2. Prompt input:

ユーザは、アクセサリー装置のボタンを押す。 The user presses a button on the accessory device.

スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。 The smartphone application will launch and a prompt input screen will appear.

ユーザは、「新しい詩を作成してください」というプロンプト文を入力する。 The user enters the prompt text "Create a new poem."

3. 生成AIモデルへの送信: 3. Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。 The smartphone sends the entered prompt to the generative AI model.

サーバは、プロンプト文を基に生成AIモデルを動作させ、詩を生成する。 The server runs a generative AI model based on the prompt text to generate the poem.

4. 生成結果の表示: 4. Displaying the generated results:

サーバは、生成された詩をスマートフォンに送信する。 The server sends the generated poem to your smartphone.

スマートフォンは、受け取った詩をユーザに表示する。 The smartphone will then display the received poem to the user.

ユーザは、表示された詩を確認し、必要に応じて保存や共有を行う。 Users can review the displayed poems and save or share them as needed.

このようにして、ユーザはアクセサリー装置とスマートフォンを用いて生成系AIモデルに対するプロンプト入力を行い、生成結果を得ることができる。 In this way, users can use the accessory device and smartphone to provide prompt input to the generative AI model and obtain generated results.

実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.

ステップ1:アクセサリー装置の接続 Step 1: Connecting Accessory Devices

入力: ユーザがスマートフォンのBluetooth設定を開き、アクセサリー装置を選択する。 Input: User opens their smartphone's Bluetooth settings and selects an accessory device.

動作: スマートフォンは、Bluetoothを用いてアクセサリー装置と接続を確立する。 How it works: Your smartphone establishes a connection with the accessory device using Bluetooth.

出力: スマートフォンは、接続が成功したことを通知する。 Output: The smartphone notifies you that the connection was successful.

ステップ2:ユーザー認証 Step 2: User Authentication

入力: ユーザがアクセサリー装置の指紋認証センサーに指を置く。 Input: The user places their finger on the fingerprint sensor on the accessory device.

動作: アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。 How it works: The accessory device reads your fingerprint and compares it with the fingerprint information stored in its internal database.

出力: 認証が成功した場合、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 Output: If authentication is successful, the accessory device sends a signal to the smartphone indicating successful authentication.

ステップ3:プロンプト入力準備 Step 3: Prepare for prompt input

入力: スマートフォンが認証成功の信号を受け取る。 Input: The smartphone receives a signal indicating successful authentication.

動作: スマートフォンは、生成系AIへのプロンプト入力画面を表示する。 How it works: The smartphone displays a prompt input screen for the generative AI.

出力: ユーザは、プロンプト入力画面を確認し、プロンプト文の入力を開始する。 Output: The user sees the prompt input screen and begins entering the prompt statement.

ステップ4:プロンプト入力 Step 4: Enter the prompt

入力: ユーザがスマートフォンのアプリケーションを通じて生成系AIに対するプロンプト文を入力する。 Input: The user enters a prompt for the generative AI through a smartphone application.

動作: スマートフォンは、入力されたプロンプト文を受け取り、内部でデータ形式を整える。 How it works: The smartphone receives the entered prompt text and formats the data internally.

出力: 整えたプロンプト文が生成系AIモデルに送信される準備が整う。 Output: The prepared prompt is ready to be sent to the generative AI model.

ステップ5:生成AIモデルへの送信 Step 5: Send to the generative AI model

入力: スマートフォンが整えたプロンプト文を生成系AIモデルに送信する。 Input: The smartphone sends the prepared prompt to the generative AI model.

動作: サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 Operation: The server runs the generative AI model based on the received prompt text and creates the generated results.

出力: 生成された結果がサーバからスマートフォンに送信される。 Output: The generated results are sent from the server to the smartphone.

ステップ6:生成結果の表示 Step 6: View the generated results

入力: スマートフォンがサーバから生成結果を受け取る。 Input: The smartphone receives the generated results from the server.

動作: スマートフォンは、受け取った生成結果をユーザに表示する。 How it works: The smartphone displays the generated results to the user.

出力: ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 Output: The user checks the displayed generated results and saves or shares them as needed.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

工場内のロボットを効率的かつ安全に管理・操作するためには、迅速かつ正確な指示をロボットに伝達する必要がある。しかし、従来の方法では、操作が複雑であり、ユーザー認証のセキュリティも十分ではないため、誤操作や不正アクセスのリスクが存在する。これにより、工場の生産性や安全性が低下する可能性がある To efficiently and safely manage and operate robots in factories, it is necessary to transmit instructions to the robots quickly and accurately. However, conventional methods involve complex operations and lack sufficient user authentication security, creating the risk of operational errors and unauthorized access. This can potentially reduce factory productivity and safety.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、工場内のロボットを管理・操作するための指示を生成する手段と、該指示を無線通信手段を用いてロボットに送信する手段と、を含む。これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for generating instructions for managing and operating robots in a factory; and means for transmitting the instructions to the robots using wireless communication means. This makes it possible to efficiently and safely manage and operate robots in a factory.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続され、追加の機能を提供する装置である。 An "accessory device connectable to a smartphone" is a device that connects to a smartphone using wireless communication means and provides additional functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて指示や情報を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates instructions and information based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions and questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認し、認証するための機能である。 "User authentication means" is a function for verifying and authenticating a user's identity.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を用いてユーザーを認証する機能である。 "Fingerprint authentication means" is a function that scans a user's fingerprint and uses that information to authenticate the user.

「操作手段」とは、ユーザーが生成系AIに対してプロンプト入力を行うためのインターフェースである。 "Operation means" is an interface that allows the user to input prompts to the generative AI.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で生成系AIにプロンプト入力を行うための機能である。 "One-click operation means" is a function that allows the user to input prompts to the generative AI with a single click.

「工場内のロボットを管理・操作するための指示を生成する手段」とは、工場内のロボットに対して具体的な作業指示を生成するための機能である。 "Means for generating instructions for managing and operating robots within a factory" refers to a function for generating specific work instructions for robots within a factory.

「無線通信手段」とは、BluetoothやWi-Fiなどの無線通信技術を用いてデバイス間でデータを送受信するための機能である。 "Wireless communication means" refers to a function for sending and receiving data between devices using wireless communication technologies such as Bluetooth and Wi-Fi.

「ロボットに送信する手段」とは、生成された指示を無線通信手段を用いてロボットに送信するための機能である。 "Means for transmitting to robot" is a function for transmitting the generated instructions to the robot using wireless communication means.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、工場内のロボットを効率的かつ安全に管理・操作するシステムである。以下に、このシステムの具体的な実施形態について説明する。 This invention is a system that efficiently and safely manages and operates robots in a factory using accessory devices that can be connected to a smartphone. A specific embodiment of this system is described below.

システム構成 System Configuration

システムは、スマートフォン、アクセサリー装置、生成系AIモデル、無線通信手段、指紋認証手段、操作手段、工場ロボットから構成される。 The system consists of a smartphone, accessory devices, a generative AI model, wireless communication means, fingerprint authentication means, operation means, and a factory robot.

ハードウェア Hardware

スマートフォン: ユーザーインターフェースとして機能し、アクセサリー装置と無線通信手段を介して接続される。 Smartphone: Functions as a user interface and connects to accessory devices via wireless communication means.

アクセサリー装置: スマートフォンに接続され、指紋認証手段と操作手段を含む。 Accessory device: Connects to a smartphone and includes fingerprint authentication means and operation means.

指紋認証手段: ユーザーの指紋をスキャンし、認証を行う。 Fingerprint authentication method: Scans the user's fingerprint for authentication.

無線通信手段: BluetoothやWi-Fiなどを用いて、スマートフォンと工場ロボット間でデータを送受信する。 Wireless communication method: Data is sent and received between smartphones and factory robots using Bluetooth, Wi-Fi, etc.

工場ロボット: 指示を受けて動作を行う。 Factory robot: Receives instructions and performs actions.

ソフトウェア Software

生成系AIモデル: ユーザーからのプロンプト入力に基づいて、工場ロボットに対する具体的な指示を生成する。 Generative AI model: Generates specific instructions for factory robots based on prompt input from the user.

スマートフォンアプリケーション: ユーザーインターフェースを提供し、生成系AIモデルとの通信を管理する。 Smartphone application: Provides the user interface and manages communication with the generative AI model.

動作手順 Operating Procedure

1. ユーザー認証: ユーザーがアクセサリー装置に指を置き、指紋認証手段で認証を行う。認証が成功すると、ユーザーはプロンプト入力を行うことができる。 1. User authentication: The user places their finger on the accessory device and authenticates using the fingerprint authentication method. If authentication is successful, the user can enter prompts.

2. プロンプト入力: 認証されたユーザーが操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 2. Prompt input: An authenticated user uses an operation method (one-click operation method) to input a prompt to the generative AI model.

3. 指示生成: 生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 3. Instruction generation: Based on the prompts, the generative AI model generates specific instructions for the factory robot.

4. 指示送信: 生成された指示は、無線通信手段を用いて工場ロボットに送信される。 4. Instruction transmission: The generated instructions are transmitted to the factory robot using wireless communication means.

5. ロボット動作: 工場ロボットは受信した指示に従って動作を行う。 5. Robot operation: The factory robot operates according to the instructions it receives.

具体例 Specific examples

例えば、工場内でロボットが特定の作業を行う際に、管理者がスマートフォンとアクセサリー装置を使ってロボットに指示を出す。以下はプロンプト文の具体例である。 For example, when a robot needs to perform a specific task in a factory, a manager can use a smartphone and accessory devices to give the robot instructions. Below are some example prompts:

「組立ライン3に移動して溶接を開始する」 "Move to assembly line 3 and begin welding."

「検査エリアに移動して品質チェックを行う」 "Move to the inspection area to perform quality checks."

「部品Aを取りに行って、組立ライン2に運ぶ」 "Go get part A and take it to assembly line 2."

これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。システムは、ユーザー認証と生成系AIを活用して、誤操作や不正アクセスのリスクを低減し、工場の生産性と安全性を向上させる。 This makes it possible to efficiently and safely manage and operate robots within factories. The system utilizes user authentication and generative AI to reduce the risk of incorrect operation and unauthorized access, improving factory productivity and safety.

応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.

ステップ1: Step 1:

ユーザがアクセサリー装置に指を置き、指紋認証手段で認証を行う。 The user places their finger on the accessory device and is authenticated using the fingerprint authentication means.

入力:ユーザの指紋 Input: User's fingerprint

データ加工:指紋認証手段が指紋をスキャンし、登録された指紋データと照合する。 Data processing: The fingerprint authentication device scans the fingerprint and compares it with registered fingerprint data.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

具体的な動作:指紋認証センサーがユーザの指紋をスキャンし、内部データベースと照合して認証を行う。 Specific operation: The fingerprint authentication sensor scans the user's fingerprint and compares it with an internal database for authentication.

ステップ2: Step 2:

認証が成功すると、ユーザは操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 If authentication is successful, the user uses the operation means (one-click operation means) to input a prompt to the generative AI model.

入力:認証結果(成功)、ユーザのプロンプト文 Input: Authentication result (success), user prompt

データ加工:認証結果が成功の場合、プロンプト文を生成系AIモデルに送信する。 Data processing: If the authentication result is successful, a prompt text is sent to the generative AI model.

出力:生成系AIモデルへのプロンプト入力 Output: Prompt input to the generative AI model

具体的な動作:ユーザがボタンを押すと、スマートフォンアプリケーションがプロンプト文を生成系AIモデルに送信する。 Specific operation: When the user presses the button, the smartphone application sends a prompt statement to the generative AI model.

ステップ3: Step 3:

生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 Based on the prompts, a generative AI model generates specific instructions for the factory robot.

入力:ユーザのプロンプト文 Input: User prompt

データ加工:生成系AIモデルがプロンプト文を解析し、適切な指示を生成する。 Data processing: The generative AI model analyzes the prompt and generates appropriate instructions.

出力:工場ロボットへの指示 Output: Instructions to factory robots

具体的な動作:生成系AIモデルがプロンプト文を解析し、例えば「組立ライン3に移動して溶接を開始する」といった具体的な指示を生成する。 Specific actions: The generative AI model analyzes the prompt and generates specific instructions, such as "Move to assembly line 3 and start welding."

ステップ4: Step 4:

生成された指示は、無線通信手段を用いて工場ロボットに送信される。 The generated instructions are sent to the factory robot using wireless communication means.

入力:生成系AIモデルからの指示 Input: Instructions from a generative AI model

データ加工:指示を無線通信手段を介して工場ロボットに送信する。 Data processing: Send instructions to factory robots via wireless communication means.

出力:工場ロボットへの指示送信 Output: Send instructions to factory robots

具体的な動作:BluetoothやWi-Fiを用いて、スマートフォンから工場ロボットに指示を送信する。 Specific operation: Instructions are sent from a smartphone to a factory robot using Bluetooth or Wi-Fi.

ステップ5: Step 5:

工場ロボットは受信した指示に従って動作を行う。 The factory robot will act according to the instructions it receives.

入力:工場ロボットへの指示 Input: Instructions for factory robots

データ加工:工場ロボットが指示を解析し、対応する動作を実行する。 Data processing: Factory robots analyze instructions and perform corresponding actions.

出力:ロボットの動作 Output: Robot movement

具体的な動作:工場ロボットが「組立ライン3に移動して溶接を開始する」といった指示に従って動作を行う。 Specific operation: The factory robot operates according to instructions such as "move to assembly line 3 and start welding."

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来の生成AIモデルを利用するためには、ユーザーがスマートデバイスを直接操作し、プロンプト文を入力する必要があった。この操作は手間がかかり、特に手がふさがっている場合や、迅速な応答が求められる状況では不便である。また、セキュリティの観点からも、ユーザー認証が不十分な場合があり、第三者による不正利用のリスクが存在する。これらの課題を解決し、より手軽で安全に生成AIモデルを利用できるシステムが求められている To use conventional generative AI models, users had to manually operate their smart devices and input prompts. This was time-consuming and inconvenient, especially when their hands were full or when a quick response was required. Furthermore, from a security perspective, user authentication was sometimes insufficient, creating a risk of unauthorized use by third parties. A system that solves these issues and allows users to use generative AI models more easily and safely is needed.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、認証されたユーザーが操作するための操作手段と、操作手段を用いてスマートデバイスに信号を送信し、特定のアプリケーションを起動する手段と、起動したアプリケーションが生成AIモデルにプロンプト文を送信する手段と、生成AIモデルがプロンプト文に基づいて応答を生成し、スマートデバイスに応答を送信する手段と、を含む。これにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能となり、さらにユーザー認証手段によりセキュリティも向上する。 In this invention, the server includes a user authentication means, an operation means for operation by an authenticated user, a means for using the operation means to send a signal to the smart device and launch a specific application, a means for the launched application to send a prompt sentence to the generative AI model, and a means for the generative AI model to generate a response based on the prompt sentence and send the response to the smart device. This allows the user to easily use the generative AI model without having to directly operate the smart device, and the user authentication means also improves security.

「ユーザー認証手段」とは、ユーザーの身元を確認し、システムへのアクセスを許可するための手段である。 "User authentication means" refers to the means used to verify a user's identity and grant access to a system.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやデバイスである。 "Operation means" refers to the interface or device that allows the user to operate the system.

「スマートデバイス」とは、インターネットに接続可能で、アプリケーションを実行する機能を持つ電子機器である。 A "smart device" is an electronic device that can connect to the Internet and has the ability to run applications.

「信号を送信する手段」とは、操作手段からスマートデバイスに対して特定の指示やデータを送信するための手段である。 "Means for transmitting signals" refers to means for transmitting specific instructions or data from the operating means to the smart device.

「特定のアプリケーション」とは、特定の機能やサービスを提供するために設計されたソフトウェアプログラムである。 A "specific application" is a software program designed to provide a specific function or service.

「生成AIモデル」とは、入力されたプロンプト文に基づいて応答を生成する人工知能のモデルである。 A "generative AI model" is an artificial intelligence model that generates a response based on an input prompt.

「プロンプト文」とは、生成AIモデルに対して指示や質問を行うためのテキスト入力である。 A "prompt" is text input used to give instructions or ask questions to a generative AI model.

「応答を生成する手段」とは、生成AIモデルがプロンプト文に基づいて適切な応答を作成するための手段である。 "Means for generating a response" refers to the means by which a generative AI model creates an appropriate response based on a prompt.

「応答を送信する手段」とは、生成された応答をスマートデバイスに送信するための手段である。 "Means for sending a response" refers to means for sending the generated response to a smart device.

発明を実施するための形態 Form for implementing the invention

この発明は、ユーザーがスマートデバイスを直接操作することなく、生成AIモデルを利用するためのシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that allows users to use generative AI models without directly operating a smart device. Specific embodiments of this system are described below.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: アクセサリー装置(指紋認証センサー付き)、スマートデバイス(スマートフォンなど) Hardware: Accessory devices (with fingerprint authentication sensors), smart devices (smartphones, etc.)

ソフトウェア: 指紋認証システム、スマートデバイス用アプリケーション、生成AIモデル Software: Fingerprint authentication system, smart device application, generative AI model

システムの構成 System Configuration

1. ユーザー認証手段: 1. User authentication method:

ユーザーがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

指紋認証システムが指紋データをキャプチャし、ユーザーの認証を行う。 The fingerprint authentication system captures fingerprint data and authenticates the user.

2. 操作手段: 2. Operating means:

認証が成功すると、アクセサリー装置のボタンが有効化される。 If authentication is successful, the buttons on the accessory device will be enabled.

ユーザーが有効化されたボタンを押す。 The user presses the enabled button.

3. 信号送信手段: 3. Signal transmission method:

ボタンが押されると、アクセサリー装置がスマートデバイスに信号を送信する。 When the button is pressed, the accessory device sends a signal to the smart device.

スマートデバイスが信号を受信し、特定のアプリケーションを起動する。 The smart device receives the signal and launches a specific application.

4. プロンプト文送信手段: 4. Prompt sending method:

起動したアプリケーションが生成AIモデルにプロンプト文を送信する。 The launched application sends a prompt to the generative AI model.

プロンプト文は事前に設定されたものであり、ユーザーが生成AIモデルに対して行いたい指示や質問を含む。 Prompts are pre-defined and contain the instructions or questions the user wants to ask the generated AI model.

5. 応答生成手段: 5. Response generation method:

サーバが生成AIモデルを用いて、受信したプロンプト文に基づいて応答を生成する。 The server uses a generative AI model to generate a response based on the received prompt.

6. 応答送信手段: 6. Response sending method:

サーバが生成した応答をスマートデバイスに送信する。 The server generates a response and sends it to the smart device.

スマートデバイスが応答を受信し、ユーザーに表示する。 The smart device receives the response and displays it to the user.

具体例 Specific examples

ユーザーがアクセサリー装置の指紋認証センサーに指を当てると、端末が指紋データをキャプチャし、認証を行う。認証が成功すると、端末のボタンが有効化される。ユーザーがボタンを押すと、端末がスマートデバイスに信号を送信し、アプリケーションを起動する。アプリケーションが起動し、「今日の天気を教えて」というプロンプト文を生成AIモデルに送信する。サーバが生成AIモデルを用いて「今日の天気は晴れです」という応答を生成し、スマートデバイスに送信する。スマートデバイスが応答を表示し、ユーザーは画面で「今日の天気は晴れです」という情報を確認することができる。 When a user places their finger on the fingerprint authentication sensor on the accessory device, the terminal captures the fingerprint data and performs authentication. If authentication is successful, the button on the terminal is enabled. When the user presses the button, the terminal sends a signal to the smart device, which launches an application. The application launches and sends a prompt sentence, "Tell me what the weather is today," to the generative AI model. The server uses the generative AI model to generate a response, "Today's weather is sunny," and sends it to the smart device. The smart device displays the response, and the user can see the information, "Today's weather is sunny," on the screen.

プロンプト文の例 Example prompt

「今日の天気を教えて」 "Tell me what the weather is like today."

「次の会議の予定を確認して」 "Check the schedule for the next meeting."

「最新のニュースを教えて」 "Tell me the latest news."

このシステムにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能であり、さらにユーザー認証手段によりセキュリティも向上する。 This system allows users to easily use generated AI models without having to directly operate a smart device, and also improves security through user authentication measures.

実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.

プログラムの処理の流れ Program processing flow

ステップ1: Step 1:

ユーザがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

入力: ユーザの指紋 Input: User fingerprint

データ加工: 指紋認証センサーが指紋データをキャプチャする。 Data processing: The fingerprint sensor captures fingerprint data.

出力: キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、認証を行う。 The device captures the fingerprint data and performs authentication.

入力: キャプチャされた指紋データ Input: Captured fingerprint data

データ演算: 指紋認証システムが指紋データを解析し、ユーザの認証を行う。 Data calculation: The fingerprint authentication system analyzes the fingerprint data and authenticates the user.

出力: 認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ3: Step 3:

認証が成功すると、端末のボタンが有効化される。 If authentication is successful, the device's buttons will be enabled.

入力: 認証結果(成功) Input: Authentication result (success)

データ加工: 認証が成功した場合、端末のボタンを有効化する。 Data processing: If authentication is successful, enable the device button.

出力: 有効化されたボタン Output: Enabled button

ステップ4: Step 4:

ユーザがボタンを押す。 The user presses the button.

入力: 有効化されたボタン Input: Enabled button

データ加工: ボタンが押されたことを端末が検知する。 Data processing: The device detects that a button has been pressed.

出力: ボタン押下の信号 Output: Button press signal

ステップ5: Step 5:

端末がスマートデバイスに信号を送信し、アプリケーションを起動する。 The terminal sends a signal to the smart device to launch the application.

入力: ボタン押下の信号 Input: Button press signal

データ加工: 端末がスマートデバイスに信号を送信し、特定のアプリケーションを起動する。 Data processing: The terminal sends a signal to the smart device to launch a specific application.

出力: 起動されたアプリケーション Output: Launched application

ステップ6: Step 6:

アプリケーションが生成AIモデルにプロンプト文を送信する。 The application sends a prompt to the generative AI model.

入力: 起動されたアプリケーション Input: Launched application

データ加工: アプリケーションが事前に設定されたプロンプト文を生成AIモデルに送信する。 Data processing: The application sends pre-defined prompts to the generative AI model.

出力: 生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ7: Step 7:

サーバが生成AIモデルを用いて応答を生成する。 The server generates a response using a generative AI model.

入力: 生成AIモデルに送信されたプロンプト文 Input: Prompt sent to the generative AI model

データ演算: 生成AIモデルがプロンプト文を解析し、適切な応答を生成する。 Data calculation: The generative AI model analyzes the prompt and generates an appropriate response.

出力: 生成された応答 Output: Generated response

ステップ8: Step 8:

サーバが応答をスマートデバイスに送信する。 The server sends the response to the smart device.

入力: 生成された応答 Input: Generated response

データ加工: サーバが生成された応答をスマートデバイスに送信する。 Data processing: The server sends the generated response to the smart device.

出力: スマートデバイスに送信された応答 Output: Response sent to smart device

ステップ9: Step 9:

スマートデバイスが応答を表示する。 Your smart device will display the response.

入力: スマートデバイスに送信された応答 Input: Response sent to smart device

データ加工: スマートデバイスが受信した応答をユーザに表示する。 Data processing: The smart device displays the response received to the user.

出力: ユーザに表示された応答 Output: Response displayed to the user

このようにして、ユーザはスマートデバイスを直接操作することなく、生成AIモデルを利用することができる。 In this way, users can use generative AI models without directly operating their smart devices.

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来のフードデリバリーシステムでは、ユーザーがスマートフォンを操作して注文を行う必要があり、操作が煩雑であるという問題があった。また、ユーザー認証が不十分であるため、セキュリティ上のリスクも存在していた。さらに、音声認識を利用した注文システムが普及していないため、ユーザーの利便性が低かった。これらの問題を解決し、ユーザーが簡単かつ安全にフードデリバリーを利用できるシステムを提供することが求められている Traditional food delivery systems require users to use their smartphones to place orders, making them cumbersome to operate. In addition, insufficient user authentication poses security risks. Furthermore, voice recognition-based ordering systems are not widespread, resulting in low user convenience. There is a need to solve these problems and provide a system that allows users to use food delivery services easily and safely.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

スマートデバイスに接続可能な付属装置は、指紋認証により該付属装置を操作するユーザを認証する利用者認証手段と、前記付属装置に設けられたボタンであって、該利用者認証手段により認証されたユーザが前記生成系AIへの指示入力を行うために押下されるボタンと、前記ボタンの押下に応じて、ユーザの音声を認識する音声認識手段と、を含む。サーバは、該音声認識手段により取得された音声データを含むプロンプト文と、前記生成系AIとを用いて、前記生成系AIの出力を取得する手段を含む。前記プロンプト文は、フードデリバリーサービスで注文することを指示し、前記取得する手段は、フードデリバリーAPIを使用した注文の結果を取得する。これにより、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能となる。 An accessory device connectable to a smart device includes a user authentication means that authenticates a user operating the accessory device through fingerprint authentication, a button provided on the accessory device that a user authenticated by the user authentication means presses to input instructions to the generative AI, and a voice recognition means that recognizes the user's voice in response to the button being pressed. The server includes a means for acquiring the output of the generative AI using a prompt statement including voice data acquired by the voice recognition means and the generative AI. The prompt statement instructs the user to place an order through a food delivery service, and the acquiring means acquires the results of the order using a food delivery API. This allows users to easily and safely use food delivery services using only their voice, without having to operate their smartphone.

「スマートデバイス」とは、スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器である。 A "smart device" is a portable electronic device, such as a smartphone or tablet, that has internet connectivity and can run applications.

「付属装置」とは、スマートデバイスに接続して使用する追加のハードウェアであり、特定の機能を提供するための装置である。 An "accessory device" is additional hardware that is connected to a smart device to provide specific functionality.

「生成系AI」とは、ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術である。 "Generative AI" is an artificial intelligence technology that generates text and other content based on user instructions and prompts.

「指示入力」とは、ユーザーが生成系AIに対して行う命令や要求の入力である。 "Instruction input" refers to commands or requests that a user inputs to a generative AI.

「利用者認証手段」とは、ユーザーの身元を確認し、認証するための技術や装置である。 "User authentication means" refers to technology or devices used to verify and authenticate a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーを認証する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and authenticate the user based on that information.

「操作手段」とは、ユーザーが付属装置やスマートデバイスを操作するためのインターフェースやボタンである。 "Operation means" refers to the interface or buttons that users use to operate accessory devices or smart devices.

「音声認識手段」とは、ユーザーの音声を解析し、テキストデータに変換する技術や装置である。 "Voice recognition means" refers to technology or devices that analyze the user's voice and convert it into text data.

「音声データ」とは、ユーザーが発した音声をデジタル形式で記録したデータである。 "Voice data" refers to data that has been digitally recorded from the user's voice.

「送信手段」とは、データを他の装置やシステムに送信するための技術や装置である。 "Transmission means" refers to the technology or equipment used to transmit data to other devices or systems.

この発明は、スマートデバイスに接続可能な付属装置を用いて、ユーザーが生成系AIを簡単かつ安全に利用できるシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that allows users to easily and safely use generative AI using an accessory device that can be connected to a smart device. Specific embodiments of this system are described below.

システムの構成 System Configuration

システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートデバイス:スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器。 1. Smart device: A portable electronic device such as a smartphone or tablet that has internet connectivity and can run applications.

2. 付属装置:スマートデバイスに接続して使用する追加のハードウェアであり、指紋認証手段、操作手段、音声認識手段を含む。 2. Accessory device: Additional hardware that is connected to a smart device and used, including fingerprint authentication means, operation means, and voice recognition means.

3. 生成系AI:ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術。 3. Generative AI: Artificial intelligence technology that generates text and other content based on user instructions and prompts.

プログラムの処理 Program processing

ハードウェア Hardware

指紋認証センサー:ユーザーの指紋を読み取り、その情報を基にユーザーを認証する。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates the user based on that information.

スマートデバイス:アプリケーションの実行環境として機能する。 Smart device: Functions as the application execution environment.

マイクロフォン:音声認識手段としてユーザーの音声を取得する。 Microphone: Captures the user's voice as a means of voice recognition.

ソフトウェア Software

指紋認証ライブラリ:指紋認証を行うためのソフトウェアモジュール。 Fingerprint authentication library: A software module for performing fingerprint authentication.

音声認識ライブラリ:音声をテキストデータに変換するためのソフトウェアモジュール(例:Google(登録商標) Speech-to-Text)。 Speech recognition library: A software module for converting speech into text data (e.g., Google® Speech-to-Text).

生成系AIモデル:ユーザーのプロンプトに基づいて応答を生成するAIモデル(例:GPT-3(登録商標))。 Generative AI model: An AI model that generates responses based on user prompts (e.g., GPT-3 (registered trademark)).

フードデリバリーAPI:フードデリバリーサービスのAPIを使用して注文を行う。 Food delivery API: Place orders using the food delivery service's API.

処理の流れ Processing flow

1. ユーザー認証:ユーザーが付属装置の指紋認証センサーに指を当てることで認証を行う。認証が成功すると、次のステップに進む。 1. User authentication: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device. If authentication is successful, the device proceeds to the next step.

2. 音声入力:ユーザーが付属装置の操作手段(ワンクリックボタン)を押しながら、音声で注文内容を伝える。マイクロフォンが音声を取得し、音声認識ライブラリがこれをテキストデータに変換する。 2. Voice input: The user presses the operation means (one-click button) of the attached device and verbally states the order details. The microphone picks up the voice, and the voice recognition library converts it into text data.

3. プロンプト生成:取得されたテキストデータを基に、生成系AIに対するプロンプト文を生成する。 3. Prompt generation: Generate a prompt sentence for the generative AI based on the acquired text data.

4. AI応答生成:生成系AIモデルがプロンプト文に基づいて最適な応答を生成する。 4. AI response generation: The generative AI model generates the optimal response based on the prompt.

5. 注文実行:生成された応答を基に、フードデリバリーAPIを使用して注文を完了する。 5. Order execution: Based on the generated response, the order is completed using the food delivery API.

具体例 Specific examples

ユーザーが指紋認証センサーに指を当てて認証し、「ピザを注文したい」と音声で伝えると、音声認識ライブラリがこれをテキストデータに変換する。生成系AIモデルに「ユーザーが注文したいのは: ピザ」というプロンプト文を入力すると、生成系AIモデルが最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 When a user places their finger on the fingerprint sensor for authentication and says "I want to order pizza," the speech recognition library converts this into text data. When the generative AI model receives the prompt "The user wants to order: pizza," the generative AI model suggests the most suitable pizza restaurant and menu item, and completes the order using a food delivery API.

プロンプト文の例 Example prompt

「ユーザーが注文したいのは: ピザ」 "User wants to order: Pizza"

このようにして、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能である。 In this way, users can easily and safely use food delivery services using only their voice, without having to operate their smartphone.

応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋データ。 Input: User's fingerprint data.

処理:指紋認証ライブラリが指紋データを解析し、登録された指紋データと照合する。 Processing: The fingerprint authentication library analyzes the fingerprint data and compares it with registered fingerprint data.

出力:認証結果(成功または失敗)。 Output: Authentication result (success or failure).

具体的な動作:指紋認証センサーがユーザの指紋を読み取り、指紋認証ライブラリがそのデータを解析して認証を行う。 Specific operation: The fingerprint authentication sensor reads the user's fingerprint, and the fingerprint authentication library analyzes the data to perform authentication.

ステップ2: Step 2:

ユーザが付属装置の操作手段(ワンクリックボタン)を押す。 The user presses the operating means (one-click button) of the accessory device.

入力:ユーザの操作(ボタン押下)。 Input: User operation (button press).

処理:操作手段が押下されたことを検知し、音声認識モードを起動する。 Processing: Detects that the operating means has been pressed and activates voice recognition mode.

出力:音声認識モードの起動。 Output: Activate voice recognition mode.

具体的な動作:ボタンが押されたことをセンサーが検知し、音声認識ライブラリが音声入力の準備を開始する。 Specific operation: The sensor detects that a button has been pressed, and the voice recognition library begins preparing for voice input.

ステップ3: Step 3:

ユーザが音声で注文内容を伝える。 The user verbally communicates the order details.

入力:ユーザの音声データ。 Input: User's voice data.

処理:マイクロフォンが音声データを取得し、音声認識ライブラリがこれをテキストデータに変換する。 Processing: The microphone captures the audio data, and the speech recognition library converts it into text data.

出力:テキストデータ(注文内容)。 Output: Text data (order details).

具体的な動作:マイクロフォンがユーザの音声をキャプチャし、音声認識ライブラリがその音声を解析してテキストに変換する。 Specific operation: The microphone captures the user's voice, and the speech recognition library analyzes the voice and converts it into text.

ステップ4: Step 4:

端末が取得されたテキストデータを基にプロンプト文を生成する。 The device generates a prompt based on the acquired text data.

入力:テキストデータ(注文内容)。 Input: Text data (order details).

処理:テキストデータを「ユーザーが注文したいのは: [注文内容]」という形式のプロンプト文に変換する。 Processing: Convert the text data into a prompt in the format "The user would like to order: [Order details]".

出力:プロンプト文。 Output: Prompt statement.

具体的な動作:テキストデータをフォーマットに従ってプロンプト文に変換する。 Specific operation: Converts text data into prompt text according to the format.

ステップ5: Step 5:

端末が生成系AIモデルにプロンプト文を送信する。 The device sends a prompt to the generative AI model.

入力:プロンプト文。 Input: Prompt text.

処理:生成系AIモデルがプロンプト文を解析し、最適な応答を生成する。 Processing: The generative AI model analyzes the prompt and generates the optimal response.

出力:AI応答(最適な注文内容)。 Output: AI response (optimal order content).

具体的な動作:プロンプト文を生成系AIモデルに送信し、AIが応答を生成する。 Specific operation: The prompt sentence is sent to the generative AI model, and the AI generates a response.

ステップ6: Step 6:

端末が生成された応答を基にフードデリバリーAPIを使用して注文を完了する。 The device uses the food delivery API based on the generated response to complete the order.

入力:AI応答(最適な注文内容)。 Input: AI response (optimal order content).

処理:フードデリバリーAPIを使用して注文を実行する。 Processing: Fulfill orders using the food delivery API.

出力:注文確認(注文が正常に完了したことを示すデータ)。 Output: Order confirmation (data indicating the order was completed successfully).

具体的な動作:AI応答をフードデリバリーAPIに送信し、注文を確定する。 Specific operation: Sends the AI response to the food delivery API and confirms the order.

なお、サーバは、後述する感情エンジンを用いてユーザの感情を認識する手段を更に含み、該音声認識手段により取得された音声データ、及び前記ユーザの感情を含むプロンプト文と、前記生成系AIとを用いて、生成系AIの出力を取得するようにしてもよい。例えば、ユーザの感情が、「悲しみ」であると認識された場合には、「ユーザーが注文したいのは: ピザ、ユーザの感情:悲しみ」というプロンプト文を生成し、生成系AIモデルが、ユーザの感情を考慮した最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 The server may further include means for recognizing the user's emotions using an emotion engine, which will be described later, and may obtain the output of the generative AI using the voice data acquired by the voice recognition means, a prompt statement including the user's emotion, and the generative AI. For example, if the user's emotion is recognized as "sadness," a prompt statement such as "User wants to order: pizza, user's emotion: sadness" may be generated, and the generative AI model may suggest the optimal pizza restaurant and menu item taking the user's emotion into consideration, and the order may be completed using a food delivery API.

更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 Furthermore, an emotion engine that estimates the user's emotion may be combined. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段、ユーザー認証手段、およびユーザー認証手段により認証されたユーザーが生成系AIへのプロンプト入力を行うための操作手段を含む。さらに、この装置はユーザーの感情を認識する感情エンジンを含む。具体的には、ユーザーの声のトーンや顔の表情から感情を認識し、その情報を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to the generative AI, a user authentication means, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. The device also includes an emotion engine that recognizes the user's emotions. Specifically, it recognizes emotions from the user's tone of voice and facial expression, and feeds this information back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotions.

「形態例2」 "Example 2"

本発明の別の実施形態として、感情エンジンがユーザーの声のトーンから感情を認識するシステムが提供される。具体的には、ユーザーがアクセサリー装置に話しかけると、装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。感情エンジンは音声データのトーンからユーザーの感情を分析し、その結果を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 Another embodiment of the present invention provides a system in which an emotion engine recognizes emotions from the tone of a user's voice. Specifically, when a user speaks to an accessory device, a microphone within the device captures the user's voice and transmits the voice data to the emotion engine. The emotion engine analyzes the user's emotion from the tone of the voice data and feeds the results back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotion.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置を操作する。 Step 1: The user operates an accessory device that can be connected to a smartphone.

ステップ2:装置のユーザー認証手段がユーザーを認証する。認証方法としては、例えば指紋認証が考えられる。 Step 2: The device's user authentication means authenticates the user. One possible authentication method is fingerprint authentication.

ステップ3:認証されたユーザーが生成系AIへのプロンプト入力を行う。 Step 3: The authenticated user provides prompt input to the generative AI.

ステップ4:装置の感情エンジンがユーザーの声のトーンや顔の表情から感情を認識する。 Step 4: The device's emotion engine recognizes emotions from the user's tone of voice and facial expressions.

ステップ5:感情エンジンがその情報を生成系AIにフィードバックする。 Step 5: The emotion engine feeds that information back to the generative AI.

ステップ6:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 6: The generative AI generates an appropriate response based on the user's emotions.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置に話しかける。 Step 1: The user speaks to the accessory device.

ステップ2:装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。 Step 2: The device's microphone captures the user's voice and sends the audio data to the emotion engine.

ステップ3:感情エンジンが音声データのトーンからユーザーの感情を分析する。 Step 3: The emotion engine analyzes the user's emotions from the tone of the voice data.

ステップ4:感情エンジンがその結果を生成系AIにフィードバックする。 Step 4: The emotion engine feeds the results back to the generative AI.

ステップ5:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 5: The generative AI generates an appropriate response based on the user's emotions.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来のスマートフォンに接続可能なアクセサリー装置では、生成系AIモデルへのプロンプト入力が可能であるが、ユーザーの感情状態を考慮したレスポンスを生成することができないという課題があった。これにより、ユーザーの意図や感情に応じた適切なレスポンスを得ることが難しく、ユーザーエクスペリエンスが向上しないという問題が生じていた Existing smartphone accessory devices allow prompt input to generative AI models, but they have the problem of being unable to generate responses that take the user's emotional state into account. This makes it difficult to obtain appropriate responses based on the user's intentions and emotions, resulting in a lack of improvement in the user experience.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIモデルへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIモデルにフィードバックする手段と、を含む。これにより、ユーザーの感情状態を考慮した適切なレスポンスを生成系AIモデルから得ることが可能となる。 In this invention, the server is an accessory device connectable to a smartphone, and includes: means for enabling prompt input to the generative AI model; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI model; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI model. This makes it possible to obtain an appropriate response from the generative AI model that takes into account the user's emotional state.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持つ携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer.

「アクセサリー装置」とは、スマートフォンに接続して追加機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AIモデル」とは、入力されたプロンプトに基づいてテキストや音声などの出力を生成する人工知能システムである。 A "generative AI model" is an artificial intelligence system that generates output such as text or voice based on input prompts.

「プロンプト入力」とは、ユーザーが生成系AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術手段である。 "User authentication means" refers to technical means for verifying a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基に認証を行う技術手段である。 "Fingerprint authentication means" refers to a technical means that reads a user's fingerprint and performs authentication based on that information.

「操作手段」とは、ユーザーがアクセサリー装置を操作するためのインターフェースである。 "Operation means" refers to the interface that allows the user to operate the accessory device.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できるインターフェースである。 A "one-click operation method" is an interface that allows users to complete an operation with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を解析して感情を認識する技術手段である。 "Emotion recognition means" refers to a technical means for recognizing emotions by analyzing the user's tone of voice and facial expressions.

「感情情報」とは、感情認識手段によって取得されたユーザーの感情状態に関するデータである。 "Emotion information" is data regarding the user's emotional state obtained by emotion recognition means.

「フィードバック手段」とは、取得された感情情報を生成系AIモデルに送信する技術手段である。 "Feedback means" refers to the technical means for transmitting acquired emotional information to the generative AI model.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を行い、ユーザーの感情状態を考慮したレスポンスを得るシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to provide prompt input to a generative AI model and obtain a response that takes into account the user's emotional state. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置 Accessory equipment

アクセサリー装置は、スマートフォンにBluetoothなどの無線通信手段を用いて接続される。この装置には、以下の主要なコンポーネントが含まれる: The accessory device connects to your smartphone using wireless communication methods such as Bluetooth. The device includes the following main components:

指紋認証センサー:ユーザーの指紋を読み取り、認証を行う。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates them.

操作ボタン:ユーザーがプロンプト入力を開始するためのインターフェース。 Action button: An interface that allows the user to start prompt input.

感情認識エンジン:ユーザーの声のトーンや顔の表情を解析し、感情情報を取得する。 Emotion recognition engine: Analyzes the user's tone of voice and facial expressions to obtain emotional information.

スマートフォン Smartphone

スマートフォンは、アクセサリー装置と連携して動作する専用アプリケーションを実行する。このアプリケーションは、以下の機能を提供する: The smartphone runs a dedicated application that works in conjunction with the accessory device. This application provides the following functions:

プロンプト入力インターフェース:ユーザーが生成系AIモデルに対して指示や質問を入力するための画面。 Prompt input interface: A screen where users can enter instructions or questions for the generative AI model.

データ送信機能:プロンプトと感情情報をサーバに送信する。 Data transmission function: Sends prompts and emotion information to the server.

サーバ Server

サーバは、スマートフォンと生成系AIモデルの間でデータ通信を行うバックエンドサービスを提供する。サーバは、以下の機能を持つ: The server provides backend services that handle data communication between smartphones and generative AI models. The server has the following functions:

データ中継機能:スマートフォンから受信したプロンプトと感情情報を生成系AIモデルに送信する。 Data relay function: Sends prompts and emotional information received from a smartphone to the generative AI model.

レスポンス受信機能:生成系AIモデルからのレスポンスを受信し、スマートフォンに転送する。 Response reception function: Receives responses from the generative AI model and forwards them to the smartphone.

具体例 Specific examples

ユーザがスマートフォンに接続されたアクセサリー装置を使用して、生成系AIモデルに対して質問を行うシナリオを考える。 Consider a scenario in which a user uses an accessory device connected to a smartphone to ask a generative AI model questions.

1. ユーザ認証 1. User authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置き、認証を行う。端末(スマートフォン)は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。認証が成功すると、ユーザは次のステップに進むことができる。 The user places their finger on the accessory device's fingerprint authentication sensor to authenticate. The terminal (smartphone) receives the fingerprint data from the accessory device and compares it with registered fingerprint data. If authentication is successful, the user can proceed to the next step.

2. プロンプト入力 2. Prompt Input

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。 The user opens a dedicated application on their smartphone and enters a prompt. For example, they might enter, "What's the weather like today?" The device then prepares to send this prompt to the generative AI model.

3. 感情認識 3. Emotion recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。端末は、この感情データを生成系AIモデルに送信するために準備する。 The accessory device analyzes the user's emotional state using an emotion engine that senses the user's tone of voice and facial expressions. The device prepares this emotion data to send to the generative AI model.

4. 生成系AIモデルへのプロンプト送信 4. Sending prompts to generative AI models

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。サーバは、これらのデータを生成系AIモデルに送信する。生成系AIモデルは、プロンプトと感情データを基に適切なレスポンスを生成する。 The device sends the prompt and emotion data entered by the user to the server. The server then sends this data to the generative AI model. The generative AI model generates an appropriate response based on the prompt and emotion data.

5. 生成系AIモデルからのレスポンス受信 5. Receiving responses from generative AI models

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。端末は、このレスポンスをユーザに表示する準備を行う。 The server receives the response from the generative AI model and forwards it to the device. The device then prepares to display this response to the user.

6. レスポンスの表示 6. Displaying the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it might say, "It's sunny today. Have a nice day." The user can review this response and enter further prompts if necessary.

プロンプト文の例 Example prompt

「今日の天気はどうですか?」 "What's the weather like today?"

「次の会議の予定を教えてください。」 "Please let me know when the next meeting is scheduled."

「最近のニュースを教えてください。」 "Please tell me the latest news."

このようにして、ユーザはアクセサリー装置を通じて生成系AIモデルと自然な対話を行うことができる。 In this way, users can naturally interact with generative AI models through accessory devices.

実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.

ステップ1:ユーザ認証 Step 1: User Authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。端末は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。入力はユーザの指紋データであり、出力は認証結果である。端末は、指紋データを解析し、登録データと一致するかどうかを確認する。認証が成功すると、端末は「認証成功」と表示する。 The user places their finger on the fingerprint authentication sensor on the accessory device. The terminal receives the fingerprint data from the accessory device and compares it with registered fingerprint data. The input is the user's fingerprint data, and the output is the authentication result. The terminal analyzes the fingerprint data and checks whether it matches the registered data. If authentication is successful, the terminal displays "Authentication successful."

ステップ2:アクセサリー装置とスマートフォンの接続 Step 2: Connect your accessory device to your smartphone

端末は、Bluetooth通信を介してアクセサリー装置と接続を確立する。入力はBluetooth接続要求であり、出力は接続状態である。端末は、アクセサリー装置からの接続要求を受け取り、接続を確立する。サーバは、この接続を監視し、必要に応じてデータの中継を行う。接続が成功すると、端末は「接続成功」と表示する。 The terminal establishes a connection with an accessory device via Bluetooth communication. The input is a Bluetooth connection request and the output is the connection status. The terminal receives a connection request from the accessory device and establishes the connection. The server monitors this connection and relays data as necessary. If the connection is successful, the terminal displays "Connection successful."

ステップ3:プロンプト入力 Step 3: Enter the prompt

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。入力はユーザのプロンプト文であり、出力はプロンプトデータである。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。ユーザが入力を完了すると、端末は「プロンプト入力完了」と表示する。 The user opens a dedicated application on their smartphone and inputs a prompt. For example, they might input "What's the weather like today?" The input is the user's prompt, and the output is the prompt data. The device prepares to send this prompt to the generative AI model. When the user has completed their input, the device displays "Prompt input completed."

ステップ4:感情認識 Step 4: Emotion Recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。入力はユーザの声のトーンや顔の表情データであり、出力は感情データである。端末は、この感情データを生成系AIモデルに送信するために準備する。感情データが取得されると、端末は「感情データ取得成功」と表示する。 The accessory device uses an emotion engine that senses the user's vocal tone and facial expressions to analyze the user's emotional state. The input is the user's vocal tone and facial expression data, and the output is emotion data. The device prepares this emotion data to send to the generative AI model. Once the emotion data is acquired, the device displays "Emotion data acquisition successful."

ステップ5:生成系AIモデルへのプロンプト送信 Step 5: Send prompts to the generative AI model

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。入力はプロンプトデータと感情データであり、出力はサーバへの送信結果である。サーバは、これらのデータを生成系AIモデルに送信する。データ送信が成功すると、端末は「データ送信成功」と表示する。 The device sends the prompt and emotion data entered by the user to the server. The input is the prompt data and emotion data, and the output is the result of transmission to the server. The server then sends this data to the generative AI model. If the data transmission is successful, the device displays "Data transmission successful."

ステップ6:生成系AIモデルからのレスポンス受信 Step 6: Receive a response from the generative AI model

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。入力は生成系AIモデルからのレスポンスデータであり、出力は端末への転送結果である。端末は、このレスポンスをユーザに表示する準備を行う。レスポンスが受信されると、端末は「レスポンス受信成功」と表示する。 The server receives the response from the generative AI model and forwards it to the device. The input is the response data from the generative AI model, and the output is the result of forwarding to the device. The device prepares to display this response to the user. Once the response is received, the device displays "Response received successfully."

ステップ7:レスポンスの表示 Step 7: View the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。入力は生成系AIモデルからのレスポンスデータであり、出力はユーザへの表示結果である。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it displays "It's sunny today. Have a nice day." The input is the response data from the generative AI model, and the output is the display result to the user. The user can review this response and enter further prompts if necessary.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来のフードデリバリーサービスでは、ユーザーの感情や状況に応じたカスタマイズされた提案を行うことが難しかった。また、ユーザーが生成系AIを利用して注文プロセスを簡素化するための手段が不足していた。これにより、ユーザーエクスペリエンスが低下し、サービスの利用頻度が減少する可能性があった Traditional food delivery services struggled to provide customized recommendations based on users' emotions and circumstances. They also lacked a means for users to use generative AI to simplify the ordering process. This could result in a poor user experience and reduced frequency of service use.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIにフィードバックする手段と、を含む。これにより、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI. This makes it possible to propose customized food delivery according to the user's emotions.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続される外部デバイスであり、特定の機能を提供するものである。 An "accessory device connectable to a smartphone" is an external device that connects to a smartphone using wireless communication means and provides specific functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて応答や提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates responses and suggestions based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions and questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術であり、特定のユーザーのみがシステムを操作できるようにするものである。 "User authentication means" refers to technology used to verify a user's identity, ensuring that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を基にユーザーを認証する技術である。 "Fingerprint authentication" is a technology that scans a user's fingerprint and authenticates the user based on that information.

「操作手段」とは、ユーザーがシステムを操作するための物理的またはソフトウェア的なインターフェースである。 "Operation means" refers to the physical or software interface that allows the user to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースである。 A "one-click operation means" is an interface that allows users to perform a specific function with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を分析し、その感情を認識する技術である。 "Emotion recognition means" is a technology that analyzes the user's tone of voice and facial expressions to recognize their emotions.

「感情情報を生成系AIにフィードバックする手段」とは、認識された感情情報を生成系AIに送信し、生成系AIがその情報を基に応答や提案を生成するための機能である。 "Means for feeding back emotional information to the generative AI" is a function that sends recognized emotional information to the generative AI, allowing the generative AI to generate responses and suggestions based on that information.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、ユーザーが生成系AIを通じてフードデリバリーサービスを利用する際に、注文プロセスを簡素化し、ユーザーの感情に応じたカスタマイズされた提案を行うシステムである。 This invention is a system that uses an accessory device connectable to a smartphone to simplify the ordering process when a user uses a food delivery service through generative AI and makes customized suggestions based on the user's emotions.

システムの構成 System Configuration

このシステムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートフォンに接続可能なアクセサリー装置 1. Accessory devices that can be connected to smartphones

無線通信手段: Bluetoothなどを用いてスマートフォンと接続される。 Wireless communication method: Connects to a smartphone using Bluetooth or other means.

ユーザー認証手段: 指紋認証センサーを用いてユーザーを認証する。 User authentication method: User authentication is performed using a fingerprint sensor.

操作手段: ワンクリック操作手段を用いて、ユーザーが生成系AIへのプロンプト入力を行う。 Operation method: The user uses a one-click operation method to input prompts to the generative AI.

感情認識手段: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 Emotion recognition: Analyzes the user's tone of voice and facial expressions to recognize emotions.

2. 生成系AI 2. Generative AI

プロンプト入力: ユーザーからの指示や質問を受け取り、応答や提案を生成する。 Prompt Input: Receives instructions or questions from the user and generates responses or suggestions.

感情情報のフィードバック: 認識された感情情報を基に、カスタマイズされた応答や提案を生成する。 Emotional feedback: Generate customized responses and suggestions based on recognized emotional information.

プログラムの処理 Program processing

サーバは、以下のような処理を行う: The server performs the following process:

1. Bluetooth接続: スマートフォンとアクセサリー装置をBluetoothを用いて接続する。 1. Bluetooth connection: Connect your smartphone and accessory device using Bluetooth.

2. ユーザー認証: 指紋認証センサーを用いてユーザーの指紋をスキャンし、認証を行う。 2. User authentication: The fingerprint sensor scans the user's fingerprint for authentication.

3. 感情認識: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 3. Emotion recognition: Analyze the user's tone of voice and facial expressions to recognize emotions.

4. プロンプト生成: 認識された感情に基づいて、生成系AIへのプロンプトを生成する。 4. Prompt generation: Generate prompts for the generative AI based on the recognized emotions.

5. AI応答生成: 生成系AIを用いて、プロンプトに対する応答や提案を生成する。 5. AI Response Generation: Use generative AI to generate responses and suggestions to prompts.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: Bluetoothモジュール、指紋認証センサー、カメラ(顔認識用)、マイク(音声認識用) Hardware: Bluetooth module, fingerprint sensor, camera (for facial recognition), microphone (for voice recognition)

ソフトウェア: Bluetooth接続ライブラリ、指紋認証ライブラリ、感情認識エンジン、生成系AIモデル Software: Bluetooth connection library, fingerprint authentication library, emotion recognition engine, generative AI model

具体例 Specific examples

ユーザーが疲れていると認識された場合、生成系AIは「疲れているときにおすすめのフードデリバリー」を提案する。例えば、以下のようなプロンプト文が生成される: If the generative AI recognizes that the user is tired, it will suggest "food delivery options recommended for when you're tired." For example, it might generate a prompt like this:

ユーザーは疲れている気分です。おすすめのフードデリバリーを提案してください。 The user is feeling tired. Please suggest some food delivery options.

このようにして、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this way, it becomes possible to offer customized food delivery suggestions based on the user's emotions.

応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.

ステップ1: Step 1:

サーバは、Bluetoothモジュールを用いてスマートフォンとアクセサリー装置を接続する。入力はスマートフォンとアクセサリー装置のペアリング情報であり、出力は接続の確立である。具体的には、Bluetooth接続ライブラリを使用して、スマートフォンとアクセサリー装置間の通信を確立する。 The server connects the smartphone and accessory device using a Bluetooth module. The input is pairing information between the smartphone and accessory device, and the output is the establishment of the connection. Specifically, it uses the Bluetooth connection library to establish communication between the smartphone and accessory device.

ステップ2: Step 2:

端末は、指紋認証センサーを用いてユーザーの指紋をスキャンし、ユーザー認証を行う。入力はユーザーの指紋データであり、出力は認証結果である。具体的には、指紋認証ライブラリを使用して、スキャンされた指紋データを登録済みのデータと照合し、認証の成否を判断する。 The device uses a fingerprint authentication sensor to scan the user's fingerprint and perform user authentication. The input is the user's fingerprint data, and the output is the authentication result. Specifically, the fingerprint authentication library is used to compare the scanned fingerprint data with registered data to determine whether authentication was successful.

ステップ3: Step 3:

端末は、マイクとカメラを用いてユーザーの声のトーンと顔の表情をキャプチャし、感情認識を行う。入力は音声データと画像データであり、出力は認識された感情情報である。具体的には、感情認識エンジンを使用して、音声データと画像データを解析し、ユーザーの感情を特定する。 The device uses a microphone and camera to capture the user's tone of voice and facial expressions to perform emotion recognition. The input is voice data and image data, and the output is recognized emotional information. Specifically, an emotion recognition engine is used to analyze the voice data and image data to identify the user's emotions.

ステップ4: Step 4:

サーバは、認識された感情情報を基に生成系AIへのプロンプトを生成する。入力は感情情報であり、出力はプロンプト文である。具体的には、感情情報をテキスト形式に変換し、生成系AIに適したプロンプト文を作成する。 The server generates a prompt for the generative AI based on the recognized emotional information. The input is emotional information, and the output is a prompt. Specifically, the emotional information is converted into text format and a prompt suitable for the generative AI is created.

ステップ5: Step 5:

サーバは、生成系AIモデルを用いてプロンプト文に対する応答や提案を生成する。入力はプロンプト文であり、出力は生成された応答や提案である。具体的には、生成系AIモデルにプロンプト文を入力し、AIが応答や提案を生成する。 The server uses a generative AI model to generate responses and suggestions in response to prompts. The input is the prompt, and the output is the generated response or suggestion. Specifically, the prompt is input into the generative AI model, and the AI generates the response or suggestion.

ステップ6: Step 6:

端末は、生成された応答や提案をユーザーに提示する。入力は生成された応答や提案であり、出力はユーザーへの表示である。具体的には、スマートフォンのディスプレイに応答や提案を表示し、ユーザーが確認できるようにする。 The device presents the generated response or suggestion to the user. The input is the generated response or suggestion, and the output is what is displayed to the user. Specifically, the response or suggestion is displayed on the smartphone display so that the user can check it.

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来の生成AIモデルを利用するシステムでは、ユーザーがスマートフォンを操作する必要があり、手軽に利用することが難しかった。また、ユーザーの感情に応じた適切なレスポンスを生成することができず、ユーザー体験が限定されていた。これにより、ユーザーが生成AIモデルを効果的に活用することが困難であった。 Conventional systems using generative AI models required users to operate their smartphones, making them difficult to use. They also were unable to generate appropriate responses based on the user's emotions, limiting the user experience. This made it difficult for users to effectively utilize generative AI models.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが生成AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの音声データをキャプチャし、感情を分析する感情認識手段と、該感情認識手段により分析された感情情報を生成AIモデルにフィードバックする手段と、を含む。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成AIモデルを利用でき、さらにユーザーの感情に応じた適切なレスポンスを得ることが可能となる。 In this invention, the server includes a user authentication means, an operation means for a user authenticated by the user authentication means to input prompts to the generative AI model, an emotion recognition means for capturing the user's voice data and analyzing their emotions, and a means for feeding back the emotion information analyzed by the emotion recognition means to the generative AI model. This allows the user to easily use the generative AI model without operating a smartphone, and further enables the user to obtain an appropriate response according to their emotions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、指紋認証や顔認証などの生体認証技術を含む。 "User authentication means" refers to a means for verifying a user's identity, and includes biometric authentication technologies such as fingerprint authentication and facial recognition.

「操作手段」とは、ユーザーが生成AIモデルへのプロンプト入力を行うための手段であり、ボタンやタッチスクリーンなどのインターフェースを含む。 "Operation means" refers to the means by which a user inputs prompts to the generated AI model, and includes interfaces such as buttons and touchscreens.

「感情認識手段」とは、ユーザーの音声データをキャプチャし、そのトーンや内容からユーザーの感情を分析するための手段である。 "Emotion recognition means" is a means for capturing a user's voice data and analyzing the user's emotions from its tone and content.

「生成AIモデル」とは、ユーザーからのプロンプトに基づいて適切なレスポンスを生成する人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates appropriate responses based on prompts from the user.

「プロンプト入力」とは、ユーザーが生成AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「フィードバック手段」とは、感情認識手段により分析された感情情報を生成AIモデルに送信するための手段である。 The "feedback means" is a means for transmitting the emotional information analyzed by the emotion recognition means to the generative AI model.

この発明は、ユーザー認証手段、操作手段、感情認識手段、フィードバック手段を含むシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that includes a user authentication means, an operation means, an emotion recognition means, and a feedback means. Specific embodiments of this system are described below.

まず、ユーザはアクセサリー装置の指紋認証センサーに指を当てる。指紋認証センサーは、ユーザーの指紋データをキャプチャし、端末に送信する。端末はこのデータをサーバに送信し、サーバは指紋データを既存のデータベースと照合してユーザーの認証を行う。認証が成功すると、端末のボタンが有効化される。 First, the user places their finger on the accessory device's fingerprint authentication sensor. The fingerprint authentication sensor captures the user's fingerprint data and sends it to the device. The device then sends this data to the server, which compares the fingerprint data with an existing database to authenticate the user. If authentication is successful, the device's buttons are enabled.

次に、ユーザが有効化されたボタンを押すと、端末はスマートフォン上の専用アプリケーションを起動する。このアプリケーションは、生成AIモデルに対してプロンプト文を入力する機能を持つ。例えば、「今日の天気について教えてください」というプロンプト文を生成AIモデルに入力する。 Next, when the user presses the enabled button, the device launches a dedicated application on the smartphone. This application has the function of inputting prompt sentences to the generative AI model. For example, the prompt sentence "Please tell me about today's weather" is input to the generative AI model.

さらに、ユーザがアクセサリー装置に話しかけると、端末内のマイクロフォンが音声データをキャプチャする。この音声データは感情認識手段に送信され、感情認識手段は音声データのトーンを解析してユーザの感情を分析する。分析結果はフィードバック手段を通じて生成AIモデルに送信される。生成AIモデルは、この感情情報に基づいて適切なレスポンスを生成する。例えば、「ユーザは少し疲れているようです。元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。 Furthermore, when the user speaks to the accessory device, the microphone in the terminal captures voice data. This voice data is sent to the emotion recognition means, which analyzes the tone of the voice data to analyze the user's emotions. The analysis results are sent to the generative AI model via the feedback means. The generative AI model generates an appropriate response based on this emotional information. For example, in response to the prompt "The user seems a little tired. Please generate an encouraging message," it generates the response "Let's take a break today and refresh ourselves."

このシステムにより、ユーザはスマートフォンを操作することなく、手軽に生成AIモデルを利用できる。また、ユーザの感情に応じた適切なレスポンスを得ることが可能となるため、ユーザ体験が向上する。 This system allows users to easily use generative AI models without having to operate a smartphone. It also improves the user experience by enabling appropriate responses based on the user's emotions.

具体例として、ユーザがアクセサリー装置の指紋認証センサーに指を当て、認証が成功した後にボタンを押すと、スマートフォン上のアプリケーションが起動し、以下のプロンプト文が生成AIモデルに入力される: For example, when a user places their finger on the fingerprint authentication sensor on an accessory device and presses a button after successful authentication, an application on the smartphone launches and the following prompt is input into the generative AI model:

「今日の天気について教えてください。」 "Can you tell me about today's weather?"

別の具体例として、ユーザがアクセサリー装置に「今日はどんな気分?」と話しかけると、感情認識手段がユーザの声のトーンから感情を認識し、生成AIモデルに以下のプロンプト文を入力する: As another example, when a user asks an accessory device, "How are you feeling today?", the emotion recognition means recognizes the emotion from the user's tone of voice and inputs the following prompt sentence into the generative AI model:

「ユーザは少し疲れているようです。元気づけるメッセージを生成してください。」 "The user seems a little tired. Please generate an encouraging message."

これにより、ユーザはスマートフォンを操作することなく、手軽に生成AIを活用することが可能となる。 This allows users to easily utilize generative AI without having to operate their smartphone.

実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋 Input: User's fingerprint

具体的な動作:ユーザがアクセサリー装置の指紋認証センサーに指を当てると、センサーが青く光る。 Specific operation: When the user places their finger on the fingerprint authentication sensor on the accessory device, the sensor will glow blue.

出力:キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、サーバに送信する。 The device captures fingerprint data and sends it to the server.

入力:キャプチャされた指紋データ Input: Captured fingerprint data

具体的な動作:端末は指紋認証センサーから指紋データをキャプチャし、そのデータをサーバに送信する際、端末の画面に「認証中...」と表示される。 Specific operation: The device captures fingerprint data from the fingerprint authentication sensor and, when sending that data to the server, displays "Authentication in progress..." on the device screen.

出力:サーバに送信された指紋データ Output: Fingerprint data sent to the server

ステップ3: Step 3:

サーバが指紋データを認証する。 The server authenticates the fingerprint data.

入力:サーバに送信された指紋データ Input: Fingerprint data sent to the server

具体的な動作:サーバは受信した指紋データを既存のデータベースと照合し、ユーザの認証を行う。 Specific operation: The server compares the received fingerprint data with an existing database and authenticates the user.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ4: Step 4:

認証が成功すると、端末のボタンを有効化する。 If authentication is successful, the device's buttons will be enabled.

入力:認証結果(成功) Input: Authentication result (success)

具体的な動作:サーバが認証に成功すると、端末に信号を送り、ボタンを有効化する。端末のボタンが緑色に点灯する。 Specific operation: If the server successfully authenticates, it sends a signal to the device to activate the button. The button on the device will light up green.

出力:有効化されたボタン Output: Enabled button

ステップ5: Step 5:

ユーザがボタンを押す。 The user presses the button.

入力:有効化されたボタン Input: Enabled button

具体的な動作:ユーザは有効化されたボタンを押す。これにより、次のステップがトリガーされる。 Specific Action: The user presses the enabled button, which triggers the next step.

出力:ボタン押下の信号 Output: Button press signal

ステップ6: Step 6:

端末がスマートフォン上のアプリケーションを起動する。 The device launches the application on the smartphone.

入力:ボタン押下の信号 Input: Button press signal

具体的な動作:端末はスマートフォン上の専用アプリケーションを起動する。スマートフォンの画面にアプリケーションのロゴが表示される。 Specific operation: The device launches a dedicated application on the smartphone. The application logo will appear on the smartphone screen.

出力:起動されたアプリケーション Output: Launched application

ステップ7: Step 7:

アプリケーションが生成AIモデルへのプロンプト入力を行う。 The application prompts input to the generative AI model.

入力:起動されたアプリケーション Input: Launched application

具体的な動作:アプリケーションは生成AIモデルに対してプロンプト文を入力する。画面に「プロンプトを送信中...」と表示される。例えば、「今日の天気について教えてください」というプロンプト文を入力する。 Specific operation: The application inputs a prompt to the generative AI model. The screen displays "Sending prompt...". For example, the prompt input is "Tell me about the weather today."

出力:生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ8: Step 8:

ユーザがアクセサリー装置に話しかける。 The user speaks to the accessory device.

入力:ユーザの音声 Input: User's voice

具体的な動作:ユーザはアクセサリー装置に向かって話しかける。例えば、「今日はどんな気分?」と話す。端末のマイクロフォンが赤く点灯し、音声データをキャプチャしていることを示す。 Specific operation: The user speaks to the accessory device. For example, "How are you feeling today?" The device's microphone lights up red, indicating that it is capturing audio data.

出力:キャプチャされた音声データ Output: Captured audio data

ステップ9: Step 9:

端末が音声データをキャプチャし、感情エンジンに送信する。 The device captures voice data and sends it to the emotion engine.

入力:キャプチャされた音声データ Input: Captured audio data

具体的な動作:端末は内蔵マイクロフォンを使用して音声データをキャプチャし、そのデータを感情エンジンに送信する。 Specific operation: The device uses the built-in microphone to capture audio data and sends that data to the emotion engine.

出力:感情エンジンに送信された音声データ Output: Audio data sent to the emotion engine

ステップ10: Step 10:

感情エンジンが音声データのトーンからユーザの感情を分析する。 The emotion engine analyzes the user's emotions from the tone of the voice data.

入力:感情エンジンに送信された音声データ Input: Audio data sent to the emotion engine

具体的な動作:感情エンジンは音声データのトーンを解析し、ユーザの感情を分析する。端末の画面に「感情を解析中...」と表示される。 Specific operation: The emotion engine analyzes the tone of the voice data and determines the user's emotions. The device screen will display "Analyzing emotions..."

出力:分析された感情情報 Output: Analyzed emotional information

ステップ11: Step 11:

感情エンジンが分析結果を生成AIモデルにフィードバックする。 The emotion engine feeds the analysis results back into the generative AI model.

入力:分析された感情情報 Input: Analyzed emotional information

具体的な動作:感情エンジンは分析結果を生成AIモデルにフィードバックする。例えば、「ユーザは少し疲れているようです」という情報を送信する。 Specific operation: The emotion engine feeds the analysis results back to the generative AI model. For example, it sends information such as "The user seems a little tired."

出力:生成AIモデルに送信された感情情報 Output: Emotional information sent to the generative AI model

ステップ12: Step 12:

生成AIモデルがユーザの感情に応じたレスポンスを生成する。 The generative AI model generates responses based on the user's emotions.

入力:生成AIモデルに送信された感情情報 Input: Emotional information sent to the generative AI model

具体的な動作:生成AIモデルはフィードバックされた感情情報に基づいて、適切なレスポンスを生成する。例えば、「元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。スマートフォンの画面にレスポンスが表示される。 Specific operation: The generative AI model generates an appropriate response based on the emotional information fed back. For example, in response to the prompt "Generate an encouraging message," it generates the response "Take a break today to refresh yourself." The response is displayed on the smartphone screen.

出力:生成されたレスポンス Output: Generated response

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."

従来のフードデリバリーサービスにおいて、ユーザーがスマートフォンを操作して注文を行う際、操作が煩雑であることや、ユーザーの感情に応じた適切な提案が行われないことが課題であった。特に、疲れているユーザーやストレスを感じているユーザーに対して、リラックスできる食事の提案が不足しているため、ユーザー体験が向上しないという問題があった With conventional food delivery services, when users order using their smartphones, the process is cumbersome and they don't offer appropriate suggestions based on the user's mood. In particular, there are issues with the lack of relaxing meal suggestions for tired or stressed users, which hinders the user experience.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

この発明では、サーバは、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの音声をキャプチャし、感情を認識するための音声キャプチャ手段と、該音声キャプチャ手段によりキャプチャされた音声データを分析し、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情に基づいて生成系AIが適切なレスポンスを生成するための手段と、を含む。これにより、ユーザーがスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 In this invention, the server includes means for enabling prompt input to the generative AI, user authentication means for operating the accessory device, operation means for a user authenticated by the user authentication means to input prompts to the generative AI, voice capture means for capturing the user's voice and recognizing their emotions, emotion recognition means for analyzing the voice data captured by the voice capture means and recognizing the user's emotions, and means for the generative AI to generate an appropriate response based on the emotions recognized by the emotion recognition means. This enables the user to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate a smartphone.

「生成系AI」とは、ユーザーからの入力に基づいて適切なレスポンスや提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates appropriate responses and suggestions based on user input.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為を指す。 "Prompt input" refers to the act of inputting instructions or questions to generative AI.

「アクセサリー装置」とは、スマートフォンに接続可能な外部デバイスであり、特定の機能を提供するための装置である。 An "accessory device" is an external device that can be connected to a smartphone to provide specific functions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、特定のユーザーのみがシステムを操作できるようにするためのものである。 "User authentication means" refers to a means for verifying a user's identity and ensuring that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋を読み取って認証を行う手段である。 "Fingerprint authentication means" refers to a means of authenticating a user by reading their fingerprint.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやボタンなどの手段である。 "Operation means" refers to the interface, buttons, and other means that users use to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できる手段である。 A "one-click operation method" is a method that allows the user to complete an operation with a single click.

「音声キャプチャ手段」とは、ユーザーの音声を録音またはキャプチャするための手段である。 "Audio capture means" means for recording or capturing a user's voice.

「感情認識手段」とは、キャプチャされた音声データを分析し、ユーザーの感情を認識するための手段である。 "Emotion recognition means" refers to a means for analyzing captured voice data and recognizing the user's emotions.

「レスポンス」とは、生成系AIがユーザーの入力に対して生成する応答や提案を指す。 "Response" refers to the response or suggestion that generative AI generates in response to user input.

この発明を実施するためのシステムは、以下のように構成される。まず、ユーザーはスマートフォンに接続されたアクセサリー装置を使用する。このアクセサリー装置には指紋認証手段が搭載されており、ユーザーが指を当てることで認証が行われる。認証が成功すると、アクセサリー装置の操作手段が有効化され、ユーザーはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行うことができる。 A system for implementing this invention is configured as follows: First, a user uses an accessory device connected to a smartphone. This accessory device is equipped with a fingerprint authentication means, and authentication is performed by the user placing their finger on it. If authentication is successful, the operation means of the accessory device is enabled, and the user can use the one-click operation means to input prompts to the generative AI.

次に、音声キャプチャ手段がユーザーの音声をキャプチャする。この音声データは感情認識手段に送信され、ユーザーの感情が分析される。感情認識手段は音声データのトーンや内容からユーザーの感情を認識し、その結果を生成系AIにフィードバックする。生成系AIは、認識された感情に基づいて適切なレスポンスを生成する。 Next, the voice capture means captures the user's voice. This voice data is sent to the emotion recognition means, which analyzes the user's emotions. The emotion recognition means recognizes the user's emotions from the tone and content of the voice data and feeds the results back to the generative AI. The generative AI generates an appropriate response based on the recognized emotions.

具体的には、以下のようなハードウェアおよびソフトウェアが使用される。指紋認証手段としては、指紋センサーが用いられる。音声キャプチャ手段としては、マイクロフォンと音声認識ソフトウェア(例:speech_recognitionライブラリ)が使用される。感情認識手段としては、感情エンジン(例:EmotionEngine)が使用される。生成系AIとしては、AI生成モデル(例:AIGenerator)が使用される。 Specifically, the following hardware and software are used: A fingerprint sensor is used as the fingerprint authentication method. A microphone and voice recognition software (e.g., speech_recognition library) are used as the voice capture method. An emotion engine (e.g., EmotionEngine) is used as the emotion recognition method. An AI generation model (e.g., AIGenerator) is used as the generative AI.

例えば、ユーザーが「今日は疲れた」と話しかけた場合、音声キャプチャ手段がその音声をキャプチャし、感情認識手段が「疲労」を感知する。生成系AIはこの感情に基づいて、「リラックスできる食事」を提案するレスポンスを生成する。このようにして、ユーザーの感情に応じた適切なフードデリバリーの提案が行われる。 For example, if a user says, "I'm tired today," the voice capture means captures the voice and the emotion recognition means detects "fatigue." Based on this emotion, the generative AI generates a response suggesting a "relaxing meal." In this way, appropriate food delivery suggestions are made according to the user's emotions.

生成AIモデルへ入力するプロンプト文の例としては、以下のようなものがある: Examples of prompts to input to a generative AI model include:

ユーザーの感情: 疲労 User Emotion: Fatigue

生成系AIへのプロンプト: "疲れているユーザーにおすすめのリラックスできる食事を提案してください。" Prompt for generative AI: "Please recommend a relaxing meal for a tired user."

このシステムにより、ユーザーはスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 This system allows users to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate their smartphone.

応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 is explained using Figure 18.

ステップ1: Step 1:

ユーザがスマートフォンに接続されたアクセサリー装置の指紋認証センサーに指を当てる。入力はユーザの指紋データであり、出力は認証結果である。アクセサリー装置は指紋データを読み取り、内部のデータベースと照合して認証を行う。認証が成功すると、次のステップに進む。 The user places their finger on the fingerprint authentication sensor of an accessory device connected to their smartphone. The input is the user's fingerprint data, and the output is the authentication result. The accessory device reads the fingerprint data and compares it with its internal database for authentication. If authentication is successful, the device proceeds to the next step.

ステップ2: Step 2:

認証が成功した場合、アクセサリー装置の操作手段が有効化される。ユーザはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行う。入力はユーザのクリック操作であり、出力はプロンプト入力のトリガーである。アクセサリー装置はクリック操作を検知し、生成系AIへのプロンプト入力を開始する。 If authentication is successful, the accessory device's operation means is enabled. The user uses the one-click operation means to input a prompt to the generative AI. The input is the user's click operation, and the output is the trigger for the prompt input. The accessory device detects the click operation and begins prompt input to the generative AI.

ステップ3: Step 3:

端末の音声キャプチャ手段がユーザの音声をキャプチャする。入力はユーザの音声データであり、出力はキャプチャされた音声データである。端末のマイクロフォンがユーザの音声を録音し、音声認識ソフトウェアがそのデータをデジタル形式に変換する。 The device's voice capture means captures the user's voice. The input is the user's voice data and the output is the captured voice data. The device's microphone records the user's voice and voice recognition software converts the data into digital form.

ステップ4: Step 4:

キャプチャされた音声データが感情認識手段に送信される。入力はキャプチャされた音声データであり、出力は認識された感情データである。感情エンジンが音声データを分析し、トーンや内容からユーザの感情を認識する。 The captured voice data is sent to the emotion recognition means. The input is the captured voice data and the output is the recognized emotion data. The emotion engine analyzes the voice data and recognizes the user's emotion from the tone and content.

ステップ5: Step 5:

認識された感情データが生成系AIにフィードバックされる。入力は認識された感情データであり、出力は生成系AIへのプロンプト文である。生成系AIは感情データに基づいて適切なレスポンスを生成するためのプロンプト文を作成する。 The recognized emotional data is fed back to the generative AI. The input is the recognized emotional data, and the output is a prompt sentence to the generative AI. The generative AI creates a prompt sentence to generate an appropriate response based on the emotional data.

ステップ6: Step 6:

生成系AIがプロンプト文に基づいて適切なレスポンスを生成する。入力はプロンプト文であり、出力は生成されたレスポンスである。生成系AIはプロンプト文を解析し、ユーザの感情に応じたフードデリバリーの提案を生成する。 The generative AI generates an appropriate response based on the prompt. The input is the prompt and the output is the generated response. The generative AI analyzes the prompt and generates food delivery suggestions based on the user's emotions.

ステップ7: Step 7:

生成されたレスポンスがユーザに提供される。入力は生成されたレスポンスであり、出力はユーザへの提案である。端末のディスプレイや音声出力装置を通じて、ユーザに適切なフードデリバリーの提案が表示または音声で伝えられる。 The generated response is provided to the user. The input is the generated response, and the output is a suggestion to the user. Appropriate food delivery suggestions are displayed or spoken to the user via the terminal's display or audio output device.

特定処理部290は、特定処理の結果をスマートデバイス14に送信する。スマートデバイス14では、制御部46Aが、出力装置40に対して特定処理の結果を出力させる。マイクロフォン38Bは、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン38Bによって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the smart device 14. In the smart device 14, the control unit 46A causes the output device 40 to output the results of the specific processing. The microphone 38B acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 38B to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.

データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(登録商標)(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (registered trademark) (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is

、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 These results are obtained by performing deep learning on a neural network. A prompt containing instructions is input to the data generation model 58, and inference data such as voice data indicating speech, text data indicating text, and image data indicating an image is also input. The data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.

生成AIの他の例としては、Gemini(登録商標)(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (registered trademark) (Internet search <URL: https://gemini.google.com/?hl=ja>).

上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマートデバイス14によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the smart device 14.

[第2実施形態] [Second embodiment]

図3には、第2実施形態に係るデータ処理システム210の構成の一例が示されている。 Figure 3 shows an example of the configuration of a data processing system 210 according to the second embodiment.

図3に示すように、データ処理システム210は、データ処理装置12及びスマート眼鏡214を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 3, the data processing system 210 includes a data processing device 12 and smart glasses 214. An example of the data processing device 12 is a server.

データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).

スマート眼鏡214は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、及びカメラ42も、バス52に接続されている。 The smart glasses 214 include a computer 36, a microphone 238, a speaker 240, a camera 42, and a communication I/F 44. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, speaker 240, and camera 42 are also connected to the bus 52.

マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.

カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).

通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.

図4には、データ処理装置12及びスマート眼鏡214の要部機能の一例が示されている。図4に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 4 shows an example of the main functions of the data processing device 12 and smart glasses 214. As shown in Figure 4, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.

特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.

ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.

スマート眼鏡214では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the smart glasses 214, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.

次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段を含む。具体的には、アクセサリー装置はBluetooth等の無線通信手段を用いてスマートフォンと接続され、生成系AIへのプロンプト入力はスマートフォン上で動作するアプリケーションを通じて行われる。ユーザー認証手段としては、指紋認証センサーが装置に組み込まれ、登録されたユーザーの指紋情報と照合することで認証を行う。操作手段としては、装置に設けられたボタンをユーザーが押すことで、生成系AIへのプロンプト入力が行われる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to generative AI, a user authentication means for operating the accessory device, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. Specifically, the accessory device is connected to the smartphone using a wireless communication means such as Bluetooth, and prompt input to the generative AI is performed through an application running on the smartphone. The user authentication means includes a fingerprint authentication sensor built into the device, which performs authentication by comparing the fingerprint information with the registered user's fingerprint. The operation means involves the user pressing a button on the device, which inputs prompts to the generative AI.

「形態例2」 "Example 2"

具体的な使用例としては、ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行い、認証が成功すると、装置のボタンが有効化される。ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 As a specific example of use, a user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device, and if authentication is successful, the button on the device is enabled. When the user presses the button, an application on the smartphone is launched and a prompt input is sent to the generative AI. This allows the user to easily utilize generative AI without having to operate the smartphone.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置をBluetooth等の無線通信手段を用いてスマートフォンと接続する。 Step 1: The user connects an accessory device that can be connected to a smartphone to the smartphone using a wireless communication method such as Bluetooth.

ステップ2:ユーザーがアクセサリー装置の指紋認証センサーに指を当て、指紋認証センサーが登録されたユーザーの指紋情報と照合することでユーザー認証を行う。 Step 2: The user places their finger on the fingerprint authentication sensor on the accessory device, and the fingerprint authentication sensor authenticates the user by matching it with the registered user's fingerprint information.

ステップ3:認証が成功すると、装置のボタンが有効化される。 Step 3: If authentication is successful, the device's buttons will be enabled.

ステップ4:ユーザーが装置のボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 4: When the user presses a button on the device, an application on the smartphone is launched and prompts are input to the generative AI.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行う。 Step 1: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device.

ステップ2:認証が成功すると、装置のボタンが有効化される。 Step 2: If authentication is successful, the device's buttons will be enabled.

ステップ3:ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 3: When the user presses the button, an application on the smartphone is launched and prompt input is sent to the generative AI.

ステップ4:これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 Step 4: This allows users to easily utilize generative AI without having to operate their smartphone.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来の生成系AIモデルを利用するシステムでは、ユーザーがプロンプト文を入力する際に、複雑な操作や多段階の認証が必要であり、ユーザーエクスペリエンスが低下する問題があった。また、生成結果を迅速かつ正確に取得するための効率的な手段が不足していた。これにより、ユーザーが生成系AIモデルを活用する際の利便性が損なわれていた。 In systems that use conventional generative AI models, users are required to perform complex operations and undergo multi-step authentication when entering prompt text, resulting in a poor user experience. Furthermore, there is a lack of efficient means for quickly and accurately obtaining generated results. This reduces the convenience for users when using generative AI models.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、該生成系AIへのプロンプト入力を行うためのアプリケーションをスマートフォン上で動作させる手段と、該生成系AIモデルにプロンプト文を送信し、生成結果を受信する手段と、を含む。これにより、ユーザーは簡単な操作で生成系AIモデルにプロンプト文を入力し、迅速かつ正確に生成結果を取得することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for running an application on the smartphone for inputting prompts to the generative AI; and means for sending prompts to the generative AI model and receiving generation results. This allows the user to input prompts to the generative AI model with simple operations and quickly and accurately obtain generation results.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持ち、アプリケーションをインストールして多様な機能を利用できる携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer, and can be used to install applications and utilize a variety of functions.

「アクセサリー装置」とは、スマートフォンに接続して追加の機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AI」とは、入力されたプロンプト文に基づいてテキストや画像などの生成を行う人工知能モデルである。 "Generative AI" is an artificial intelligence model that generates text, images, etc. based on input prompts.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為である。 "Prompt input" is the act of inputting instructions or questions to a generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術や装置である。 "User authentication means" refers to technology or devices used to verify a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーの身元を確認する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and verify the user's identity based on that information.

「操作手段」とは、ユーザーがアクセサリー装置やスマートフォンを操作するためのインターフェースや装置である。 "Operation means" refers to the interface or device that allows the user to operate the accessory device or smartphone.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースや装置である。 A "one-click operation means" is an interface or device that allows a user to perform a specific function with a single click.

「アプリケーション」とは、スマートフォン上で動作し、特定の機能やサービスを提供するソフトウェアである。 An "application" is software that runs on a smartphone and provides specific functions or services.

「生成結果」とは、生成系AIがプロンプト文に基づいて生成したテキストや画像などの出力物である。 "Generation results" are output such as text and images generated by the generative AI based on the prompt text.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を簡便に行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to easily input prompts into a generative AI model. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置: Accessory equipment:

アクセサリー装置は、スマートフォンに接続される外部デバイスであり、以下の主要な機能を持つ。 Accessory devices are external devices that connect to your smartphone and have the following main functions:

ユーザー認証手段: 指紋認証センサーを搭載し、ユーザーの指紋情報を読み取る。 User authentication method: Equipped with a fingerprint authentication sensor that reads the user's fingerprint information.

操作手段: ワンクリック操作が可能なボタンを備え、ユーザーが簡単に操作できる。 Operation method: Equipped with a one-click button, making it easy for users to operate.

スマートフォン: Smartphone:

スマートフォンは、アクセサリー装置とBluetooth等の無線通信手段を用いて接続される。スマートフォン上には、生成系AIモデルへのプロンプト入力を行うためのアプリケーションがインストールされている。 The smartphone is connected to the accessory device using wireless communication means such as Bluetooth. An application for providing prompt input to the generative AI model is installed on the smartphone.

生成系AIモデル: Generative AI model:

生成系AIモデルは、サーバ上で動作し、スマートフォンから送信されたプロンプト文に基づいてテキストや画像を生成する。 The generative AI model runs on a server and generates text and images based on prompts sent from the smartphone.

システムの動作 System Operation

ユーザー認証: User authentication:

ユーザは、アクセサリー装置に設置された指紋認証センサーに指を置く。アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。認証が成功すると、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 The user places their finger on the fingerprint authentication sensor installed on the accessory device. The accessory device reads the fingerprint information and compares it with the fingerprint information stored in its internal database. If authentication is successful, the accessory device sends a signal indicating successful authentication to the smartphone.

プロンプト入力: Prompt Input:

認証が成功した後、ユーザはアクセサリー装置のボタンを押す。スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。ユーザは、生成系AIモデルに対するプロンプト文を入力する。 After successful authentication, the user presses a button on the accessory device. The smartphone application launches and a prompt input screen appears. The user enters a prompt statement for the generative AI model.

生成AIモデルへの送信: Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 The smartphone sends the input prompt to the generative AI model. The server operates the generative AI model based on the received prompt and creates the generated results.

生成結果の表示: Display generated results:

サーバは、生成された結果をスマートフォンに送信する。スマートフォンは、受け取った生成結果をユーザに表示する。ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 The server sends the generated results to the smartphone. The smartphone displays the received results to the user. The user can check the displayed results and save or share them as needed.

具体例 Specific examples

ユーザが新しい詩を生成系AIに作成させたい場合の具体的な手順は以下の通りである。 If a user wants to have a generative AI create a new poem, the specific steps are as follows:

1. ユーザー認証: 1. User authentication:

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。 The user places their finger on the fingerprint authentication sensor on the accessory device.

アクセサリー装置は、指紋を読み取り、認証を行う。 The accessory device reads the fingerprint and performs authentication.

認証が成功すると、スマートフォンに認証成功の信号が送信される。 If authentication is successful, a signal indicating successful authentication will be sent to your smartphone.

2. プロンプト入力: 2. Prompt input:

ユーザは、アクセサリー装置のボタンを押す。 The user presses a button on the accessory device.

スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。 The smartphone application will launch and a prompt input screen will appear.

ユーザは、「新しい詩を作成してください」というプロンプト文を入力する。 The user enters the prompt text "Create a new poem."

3. 生成AIモデルへの送信: 3. Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。 The smartphone sends the entered prompt to the generative AI model.

サーバは、プロンプト文を基に生成AIモデルを動作させ、詩を生成する。 The server runs a generative AI model based on the prompt text to generate the poem.

4. 生成結果の表示: 4. Displaying the generated results:

サーバは、生成された詩をスマートフォンに送信する。 The server sends the generated poem to your smartphone.

スマートフォンは、受け取った詩をユーザに表示する。 The smartphone will then display the received poem to the user.

ユーザは、表示された詩を確認し、必要に応じて保存や共有を行う。 Users can review the displayed poems and save or share them as needed.

このようにして、ユーザはアクセサリー装置とスマートフォンを用いて生成系AIモデルに対するプロンプト入力を行い、生成結果を得ることができる。 In this way, users can use the accessory device and smartphone to provide prompt input to the generative AI model and obtain generated results.

実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.

ステップ1:アクセサリー装置の接続 Step 1: Connecting Accessory Devices

入力: ユーザがスマートフォンのBluetooth設定を開き、アクセサリー装置を選択する。 Input: User opens their smartphone's Bluetooth settings and selects an accessory device.

動作: スマートフォンは、Bluetoothを用いてアクセサリー装置と接続を確立する。 How it works: Your smartphone establishes a connection with the accessory device using Bluetooth.

出力: スマートフォンは、接続が成功したことを通知する。 Output: The smartphone notifies you that the connection was successful.

ステップ2:ユーザー認証 Step 2: User Authentication

入力: ユーザがアクセサリー装置の指紋認証センサーに指を置く。 Input: The user places their finger on the fingerprint sensor on the accessory device.

動作: アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。 How it works: The accessory device reads your fingerprint and compares it with the fingerprint information stored in its internal database.

出力: 認証が成功した場合、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 Output: If authentication is successful, the accessory device sends a signal to the smartphone indicating successful authentication.

ステップ3:プロンプト入力準備 Step 3: Prepare for prompt input

入力: スマートフォンが認証成功の信号を受け取る。 Input: The smartphone receives a signal indicating successful authentication.

動作: スマートフォンは、生成系AIへのプロンプト入力画面を表示する。 How it works: The smartphone displays a prompt input screen for the generative AI.

出力: ユーザは、プロンプト入力画面を確認し、プロンプト文の入力を開始する。 Output: The user sees the prompt input screen and begins entering the prompt statement.

ステップ4:プロンプト入力 Step 4: Enter the prompt

入力: ユーザがスマートフォンのアプリケーションを通じて生成系AIに対するプロンプト文を入力する。 Input: The user enters a prompt for the generative AI through a smartphone application.

動作: スマートフォンは、入力されたプロンプト文を受け取り、内部でデータ形式を整える。 How it works: The smartphone receives the entered prompt text and formats the data internally.

出力: 整えたプロンプト文が生成系AIモデルに送信される準備が整う。 Output: The prepared prompt is ready to be sent to the generative AI model.

ステップ5:生成AIモデルへの送信 Step 5: Send to the generative AI model

入力: スマートフォンが整えたプロンプト文を生成系AIモデルに送信する。 Input: The smartphone sends the prepared prompt to the generative AI model.

動作: サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 Operation: The server runs the generative AI model based on the received prompt text and creates the generated results.

出力: 生成された結果がサーバからスマートフォンに送信される。 Output: The generated results are sent from the server to the smartphone.

ステップ6:生成結果の表示 Step 6: View the generated results

入力: スマートフォンがサーバから生成結果を受け取る。 Input: The smartphone receives the generated results from the server.

動作: スマートフォンは、受け取った生成結果をユーザに表示する。 How it works: The smartphone displays the generated results to the user.

出力: ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 Output: The user checks the displayed generated results and saves or shares them as needed.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

工場内のロボットを効率的かつ安全に管理・操作するためには、迅速かつ正確な指示をロボットに伝達する必要がある。しかし、従来の方法では、操作が複雑であり、ユーザー認証のセキュリティも十分ではないため、誤操作や不正アクセスのリスクが存在する。これにより、工場の生産性や安全性が低下する可能性がある To efficiently and safely manage and operate robots in factories, it is necessary to transmit instructions to the robots quickly and accurately. However, conventional methods involve complex operations and lack sufficient user authentication security, creating the risk of operational errors and unauthorized access. This can potentially reduce factory productivity and safety.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、工場内のロボットを管理・操作するための指示を生成する手段と、該指示を無線通信手段を用いてロボットに送信する手段と、を含む。これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for generating instructions for managing and operating robots in a factory; and means for transmitting the instructions to the robots using wireless communication means. This makes it possible to efficiently and safely manage and operate robots in a factory.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続され、追加の機能を提供する装置である。 An "accessory device connectable to a smartphone" is a device that connects to a smartphone using wireless communication means and provides additional functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて指示や情報を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates instructions and information based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions or questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認し、認証するための機能である。 "User authentication means" is a function for verifying and authenticating a user's identity.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を用いてユーザーを認証する機能である。 "Fingerprint authentication means" is a function that scans a user's fingerprint and uses that information to authenticate the user.

「操作手段」とは、ユーザーが生成系AIに対してプロンプト入力を行うためのインターフェースである。 "Operation means" is an interface that allows the user to input prompts to the generative AI.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で生成系AIにプロンプト入力を行うための機能である。 "One-click operation means" is a function that allows the user to input prompts to the generative AI with a single click.

「工場内のロボットを管理・操作するための指示を生成する手段」とは、工場内のロボットに対して具体的な作業指示を生成するための機能である。 "Means for generating instructions for managing and operating robots within a factory" refers to a function for generating specific work instructions for robots within a factory.

「無線通信手段」とは、BluetoothやWi-Fiなどの無線通信技術を用いてデバイス間でデータを送受信するための機能である。 "Wireless communication means" refers to a function for sending and receiving data between devices using wireless communication technologies such as Bluetooth and Wi-Fi.

「ロボットに送信する手段」とは、生成された指示を無線通信手段を用いてロボットに送信するための機能である。 "Means for transmitting to robot" is a function for transmitting the generated instructions to the robot using wireless communication means.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、工場内のロボットを効率的かつ安全に管理・操作するシステムである。以下に、このシステムの具体的な実施形態について説明する。 This invention is a system that efficiently and safely manages and operates robots in a factory using accessory devices that can be connected to a smartphone. A specific embodiment of this system is described below.

システム構成 System Configuration

システムは、スマートフォン、アクセサリー装置、生成系AIモデル、無線通信手段、指紋認証手段、操作手段、工場ロボットから構成される。 The system consists of a smartphone, accessory devices, a generative AI model, wireless communication means, fingerprint authentication means, operation means, and a factory robot.

ハードウェア Hardware

スマートフォン: ユーザーインターフェースとして機能し、アクセサリー装置と無線通信手段を介して接続される。 Smartphone: Functions as a user interface and connects to accessory devices via wireless communication means.

アクセサリー装置: スマートフォンに接続され、指紋認証手段と操作手段を含む。 Accessory device: Connects to a smartphone and includes fingerprint authentication means and operation means.

指紋認証手段: ユーザーの指紋をスキャンし、認証を行う。 Fingerprint authentication method: Scans the user's fingerprint for authentication.

無線通信手段: BluetoothやWi-Fiなどを用いて、スマートフォンと工場ロボット間でデータを送受信する。 Wireless communication method: Data is sent and received between smartphones and factory robots using Bluetooth, Wi-Fi, etc.

工場ロボット: 指示を受けて動作を行う。 Factory robot: Receives instructions and performs actions.

ソフトウェア Software

生成系AIモデル: ユーザーからのプロンプト入力に基づいて、工場ロボットに対する具体的な指示を生成する。 Generative AI model: Generates specific instructions for factory robots based on prompt input from the user.

スマートフォンアプリケーション: ユーザーインターフェースを提供し、生成系AIモデルとの通信を管理する。 Smartphone application: Provides the user interface and manages communication with the generative AI model.

動作手順 Operating Procedure

1. ユーザー認証: ユーザーがアクセサリー装置に指を置き、指紋認証手段で認証を行う。認証が成功すると、ユーザーはプロンプト入力を行うことができる。 1. User authentication: The user places their finger on the accessory device and authenticates using the fingerprint authentication method. If authentication is successful, the user can enter prompts.

2. プロンプト入力: 認証されたユーザーが操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 2. Prompt input: An authenticated user uses an operation method (one-click operation method) to input a prompt to the generative AI model.

3. 指示生成: 生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 3. Instruction generation: Based on the prompts, the generative AI model generates specific instructions for the factory robot.

4. 指示送信: 生成された指示は、無線通信手段を用いて工場ロボットに送信される。 4. Instruction transmission: The generated instructions are transmitted to the factory robot using wireless communication means.

5. ロボット動作: 工場ロボットは受信した指示に従って動作を行う。 5. Robot operation: The factory robot operates according to the instructions it receives.

具体例 Specific examples

例えば、工場内でロボットが特定の作業を行う際に、管理者がスマートフォンとアクセサリー装置を使ってロボットに指示を出す。以下はプロンプト文の具体例である。 For example, when a robot needs to perform a specific task in a factory, a manager can use a smartphone and accessory devices to give the robot instructions. Below are some example prompts:

「組立ライン3に移動して溶接を開始する」 "Move to assembly line 3 and begin welding."

「検査エリアに移動して品質チェックを行う」 "Move to the inspection area to perform quality checks."

「部品Aを取りに行って、組立ライン2に運ぶ」 "Go get part A and take it to assembly line 2."

これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。システムは、ユーザー認証と生成系AIを活用して、誤操作や不正アクセスのリスクを低減し、工場の生産性と安全性を向上させる。 This makes it possible to efficiently and safely manage and operate robots within factories. The system utilizes user authentication and generative AI to reduce the risk of incorrect operation and unauthorized access, improving factory productivity and safety.

応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.

ステップ1: Step 1:

ユーザがアクセサリー装置に指を置き、指紋認証手段で認証を行う。 The user places their finger on the accessory device and is authenticated using the fingerprint authentication means.

入力:ユーザの指紋 Input: User's fingerprint

データ加工:指紋認証手段が指紋をスキャンし、登録された指紋データと照合する。 Data processing: The fingerprint authentication device scans the fingerprint and compares it with registered fingerprint data.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

具体的な動作:指紋認証センサーがユーザの指紋をスキャンし、内部データベースと照合して認証を行う。 Specific operation: The fingerprint authentication sensor scans the user's fingerprint and compares it with an internal database for authentication.

ステップ2: Step 2:

認証が成功すると、ユーザは操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 If authentication is successful, the user uses the operation means (one-click operation means) to input a prompt to the generative AI model.

入力:認証結果(成功)、ユーザのプロンプト文 Input: Authentication result (success), user prompt

データ加工:認証結果が成功の場合、プロンプト文を生成系AIモデルに送信する。 Data processing: If the authentication result is successful, a prompt text is sent to the generative AI model.

出力:生成系AIモデルへのプロンプト入力 Output: Prompt input to the generative AI model

具体的な動作:ユーザがボタンを押すと、スマートフォンアプリケーションがプロンプト文を生成系AIモデルに送信する。 Specific operation: When the user presses the button, the smartphone application sends a prompt statement to the generative AI model.

ステップ3: Step 3:

生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 Based on the prompts, a generative AI model generates specific instructions for the factory robot.

入力:ユーザのプロンプト文 Input: User prompt

データ加工:生成系AIモデルがプロンプト文を解析し、適切な指示を生成する。 Data processing: The generative AI model analyzes the prompt and generates appropriate instructions.

出力:工場ロボットへの指示 Output: Instructions to factory robots

具体的な動作:生成系AIモデルがプロンプト文を解析し、例えば「組立ライン3に移動して溶接を開始する」といった具体的な指示を生成する。 Specific actions: The generative AI model analyzes the prompt and generates specific instructions, such as "Move to assembly line 3 and start welding."

ステップ4: Step 4:

生成された指示は、無線通信手段を用いて工場ロボットに送信される。 The generated instructions are sent to the factory robot using wireless communication means.

入力:生成系AIモデルからの指示 Input: Instructions from a generative AI model

データ加工:指示を無線通信手段を介して工場ロボットに送信する。 Data processing: Send instructions to factory robots via wireless communication means.

出力:工場ロボットへの指示送信 Output: Send instructions to factory robots

具体的な動作:BluetoothやWi-Fiを用いて、スマートフォンから工場ロボットに指示を送信する。 Specific operation: Instructions are sent from a smartphone to a factory robot using Bluetooth or Wi-Fi.

ステップ5: Step 5:

工場ロボットは受信した指示に従って動作を行う。 The factory robot will act according to the instructions it receives.

入力:工場ロボットへの指示 Input: Instructions for factory robots

データ加工:工場ロボットが指示を解析し、対応する動作を実行する。 Data processing: Factory robots analyze instructions and perform corresponding actions.

出力:ロボットの動作 Output: Robot movement

具体的な動作:工場ロボットが「組立ライン3に移動して溶接を開始する」といった指示に従って動作を行う。 Specific operation: The factory robot operates according to instructions such as "move to assembly line 3 and start welding."

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来の生成AIモデルを利用するためには、ユーザーがスマートデバイスを直接操作し、プロンプト文を入力する必要があった。この操作は手間がかかり、特に手がふさがっている場合や、迅速な応答が求められる状況では不便である。また、セキュリティの観点からも、ユーザー認証が不十分な場合があり、第三者による不正利用のリスクが存在する。これらの課題を解決し、より手軽で安全に生成AIモデルを利用できるシステムが求められている To use conventional generative AI models, users had to manually operate their smart devices and input prompts. This was time-consuming and inconvenient, especially when their hands were full or when a quick response was required. Furthermore, from a security perspective, user authentication was sometimes insufficient, creating a risk of unauthorized use by third parties. A system that solves these issues and allows users to use generative AI models more easily and safely is needed.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、認証されたユーザーが操作するための操作手段と、操作手段を用いてスマートデバイスに信号を送信し、特定のアプリケーションを起動する手段と、起動したアプリケーションが生成AIモデルにプロンプト文を送信する手段と、生成AIモデルがプロンプト文に基づいて応答を生成し、スマートデバイスに応答を送信する手段と、を含む。これにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能となり、さらにユーザー認証手段によりセキュリティも向上する。 In this invention, the server includes a user authentication means, an operation means for operation by an authenticated user, a means for using the operation means to send a signal to the smart device and launch a specific application, a means for the launched application to send a prompt sentence to the generative AI model, and a means for the generative AI model to generate a response based on the prompt sentence and send the response to the smart device. This allows the user to easily use the generative AI model without having to directly operate the smart device, and the user authentication means also improves security.

「ユーザー認証手段」とは、ユーザーの身元を確認し、システムへのアクセスを許可するための手段である。 "User authentication means" refers to the means used to verify a user's identity and grant access to a system.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやデバイスである。 "Operation means" refers to the interface or device that allows the user to operate the system.

「スマートデバイス」とは、インターネットに接続可能で、アプリケーションを実行する機能を持つ電子機器である。 A "smart device" is an electronic device that can connect to the Internet and has the ability to run applications.

「信号を送信する手段」とは、操作手段からスマートデバイスに対して特定の指示やデータを送信するための手段である。 "Means for transmitting signals" refers to means for transmitting specific instructions or data from the operating means to the smart device.

「特定のアプリケーション」とは、特定の機能やサービスを提供するために設計されたソフトウェアプログラムである。 A "specific application" is a software program designed to provide a specific function or service.

「生成AIモデル」とは、入力されたプロンプト文に基づいて応答を生成する人工知能のモデルである。 A "generative AI model" is an artificial intelligence model that generates a response based on an input prompt.

「プロンプト文」とは、生成AIモデルに対して指示や質問を行うためのテキスト入力である。 A "prompt" is text input used to give instructions or ask questions to a generative AI model.

「応答を生成する手段」とは、生成AIモデルがプロンプト文に基づいて適切な応答を作成するための手段である。 "Means for generating a response" refers to the means by which a generative AI model creates an appropriate response based on a prompt.

「応答を送信する手段」とは、生成された応答をスマートデバイスに送信するための手段である。 "Means for sending a response" refers to means for sending the generated response to a smart device.

発明を実施するための形態 Form for implementing the invention

この発明は、ユーザーがスマートデバイスを直接操作することなく、生成AIモデルを利用するためのシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that allows users to use generative AI models without directly operating a smart device. Specific embodiments of this system are described below.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: アクセサリー装置(指紋認証センサー付き)、スマートデバイス(スマートフォンなど) Hardware: Accessory devices (with fingerprint authentication sensors), smart devices (smartphones, etc.)

ソフトウェア: 指紋認証システム、スマートデバイス用アプリケーション、生成AIモデル Software: Fingerprint authentication system, smart device application, generative AI model

システムの構成 System Configuration

1. ユーザー認証手段: 1. User authentication method:

ユーザーがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

指紋認証システムが指紋データをキャプチャし、ユーザーの認証を行う。 The fingerprint authentication system captures fingerprint data and authenticates the user.

2. 操作手段: 2. Operating means:

認証が成功すると、アクセサリー装置のボタンが有効化される。 If authentication is successful, the buttons on the accessory device will be enabled.

ユーザーが有効化されたボタンを押す。 The user presses the enabled button.

3. 信号送信手段: 3. Signal transmission method:

ボタンが押されると、アクセサリー装置がスマートデバイスに信号を送信する。 When the button is pressed, the accessory device sends a signal to the smart device.

スマートデバイスが信号を受信し、特定のアプリケーションを起動する。 The smart device receives the signal and launches a specific application.

4. プロンプト文送信手段: 4. Prompt sending method:

起動したアプリケーションが生成AIモデルにプロンプト文を送信する。 The launched application sends a prompt to the generative AI model.

プロンプト文は事前に設定されたものであり、ユーザーが生成AIモデルに対して行いたい指示や質問を含む。 Prompts are pre-defined and contain the instructions or questions the user wants to ask the generated AI model.

5. 応答生成手段: 5. Response generation method:

サーバが生成AIモデルを用いて、受信したプロンプト文に基づいて応答を生成する。 The server uses a generative AI model to generate a response based on the received prompt.

6. 応答送信手段: 6. Response sending method:

サーバが生成した応答をスマートデバイスに送信する。 The server generates a response and sends it to the smart device.

スマートデバイスが応答を受信し、ユーザーに表示する。 The smart device receives the response and displays it to the user.

具体例 Specific examples

ユーザーがアクセサリー装置の指紋認証センサーに指を当てると、端末が指紋データをキャプチャし、認証を行う。認証が成功すると、端末のボタンが有効化される。ユーザーがボタンを押すと、端末がスマートデバイスに信号を送信し、アプリケーションを起動する。アプリケーションが起動し、「今日の天気を教えて」というプロンプト文を生成AIモデルに送信する。サーバが生成AIモデルを用いて「今日の天気は晴れです」という応答を生成し、スマートデバイスに送信する。スマートデバイスが応答を表示し、ユーザーは画面で「今日の天気は晴れです」という情報を確認することができる。 When a user places their finger on the fingerprint authentication sensor on the accessory device, the terminal captures the fingerprint data and performs authentication. If authentication is successful, the button on the terminal is enabled. When the user presses the button, the terminal sends a signal to the smart device, which launches an application. The application launches and sends a prompt sentence, "Tell me what the weather is today," to the generative AI model. The server uses the generative AI model to generate a response, "Today's weather is sunny," and sends it to the smart device. The smart device displays the response, and the user can see the information, "Today's weather is sunny," on the screen.

プロンプト文の例 Example prompt

「今日の天気を教えて」 "Tell me what the weather is like today."

「次の会議の予定を確認して」 "Check the schedule for the next meeting."

「最新のニュースを教えて」 "Tell me the latest news."

このシステムにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能であり、さらにユーザー認証手段によりセキュリティも向上する。 This system allows users to easily use generated AI models without having to directly operate a smart device, and also improves security through user authentication measures.

実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.

プログラムの処理の流れ Program processing flow

ステップ1: Step 1:

ユーザがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

入力: ユーザの指紋 Input: User fingerprint

データ加工: 指紋認証センサーが指紋データをキャプチャする。 Data processing: The fingerprint sensor captures fingerprint data.

出力: キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、認証を行う。 The device captures the fingerprint data and performs authentication.

入力: キャプチャされた指紋データ Input: Captured fingerprint data

データ演算: 指紋認証システムが指紋データを解析し、ユーザの認証を行う。 Data calculation: The fingerprint authentication system analyzes the fingerprint data and authenticates the user.

出力: 認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ3: Step 3:

認証が成功すると、端末のボタンが有効化される。 If authentication is successful, the device's buttons will be enabled.

入力: 認証結果(成功) Input: Authentication result (success)

データ加工: 認証が成功した場合、端末のボタンを有効化する。 Data processing: If authentication is successful, enable the device button.

出力: 有効化されたボタン Output: Enabled button

ステップ4: Step 4:

ユーザがボタンを押す。 The user presses the button.

入力: 有効化されたボタン Input: Enabled button

データ加工: ボタンが押されたことを端末が検知する。 Data processing: The device detects that a button has been pressed.

出力: ボタン押下の信号 Output: Button press signal

ステップ5: Step 5:

端末がスマートデバイスに信号を送信し、アプリケーションを起動する。 The terminal sends a signal to the smart device to launch the application.

入力: ボタン押下の信号 Input: Button press signal

データ加工: 端末がスマートデバイスに信号を送信し、特定のアプリケーションを起動する。 Data processing: The terminal sends a signal to the smart device to launch a specific application.

出力: 起動されたアプリケーション Output: Launched application

ステップ6: Step 6:

アプリケーションが生成AIモデルにプロンプト文を送信する。 The application sends a prompt to the generative AI model.

入力: 起動されたアプリケーション Input: Launched application

データ加工: アプリケーションが事前に設定されたプロンプト文を生成AIモデルに送信する。 Data processing: The application sends pre-defined prompts to the generative AI model.

出力: 生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ7: Step 7:

サーバが生成AIモデルを用いて応答を生成する。 The server generates a response using a generative AI model.

入力: 生成AIモデルに送信されたプロンプト文 Input: Prompt sent to the generative AI model

データ演算: 生成AIモデルがプロンプト文を解析し、適切な応答を生成する。 Data calculation: The generative AI model analyzes the prompt and generates an appropriate response.

出力: 生成された応答 Output: Generated response

ステップ8: Step 8:

サーバが応答をスマートデバイスに送信する。 The server sends the response to the smart device.

入力: 生成された応答 Input: Generated response

データ加工: サーバが生成された応答をスマートデバイスに送信する。 Data processing: The server sends the generated response to the smart device.

出力: スマートデバイスに送信された応答 Output: Response sent to smart device

ステップ9: Step 9:

スマートデバイスが応答を表示する。 Your smart device will display the response.

入力: スマートデバイスに送信された応答 Input: Response sent to smart device

データ加工: スマートデバイスが受信した応答をユーザに表示する。 Data processing: The smart device displays the response received to the user.

出力: ユーザに表示された応答 Output: Response displayed to the user

このようにして、ユーザはスマートデバイスを直接操作することなく、生成AIモデルを利用することができる。 In this way, users can use generative AI models without directly operating their smart devices.

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来のフードデリバリーシステムでは、ユーザーがスマートフォンを操作して注文を行う必要があり、操作が煩雑であるという問題があった。また、ユーザー認証が不十分であるため、セキュリティ上のリスクも存在していた。さらに、音声認識を利用した注文システムが普及していないため、ユーザーの利便性が低かった。これらの問題を解決し、ユーザーが簡単かつ安全にフードデリバリーを利用できるシステムを提供することが求められている Traditional food delivery systems require users to use their smartphones to place orders, making them cumbersome to operate. In addition, insufficient user authentication poses security risks. Furthermore, voice recognition-based ordering systems are not widespread, resulting in low user convenience. There is a need to solve these problems and provide a system that allows users to use food delivery services easily and safely.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

スマートデバイスに接続可能な付属装置は、指紋認証により該付属装置を操作するユーザを認証する利用者認証手段と、前記付属装置に設けられたボタンであって、該利用者認証手段により認証されたユーザが前記生成系AIへの指示入力を行うために押下されるボタンと、前記ボタンの押下に応じて、ユーザの音声を認識する音声認識手段と、を含む。サーバは、該音声認識手段により取得された音声データを含むプロンプト文と、前記生成系AIとを用いて、前記生成系AIの出力を取得する手段を含む。前記プロンプト文は、フードデリバリーサービスで注文することを指示し、前記取得する手段は、フードデリバリーAPIを使用した注文の結果を取得する。これにより、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能となる。 An accessory device connectable to a smart device includes a user authentication means that authenticates a user operating the accessory device through fingerprint authentication, a button provided on the accessory device that a user authenticated by the user authentication means presses to input instructions to the generative AI, and a voice recognition means that recognizes the user's voice in response to the button being pressed. The server includes a means for acquiring the output of the generative AI using a prompt statement including voice data acquired by the voice recognition means and the generative AI. The prompt statement instructs the user to place an order through a food delivery service, and the acquiring means acquires the results of the order using a food delivery API. This allows users to easily and safely use food delivery services using only their voice, without having to operate their smartphone.

「スマートデバイス」とは、スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器である。 A "smart device" is a portable electronic device, such as a smartphone or tablet, that has internet connectivity and can run applications.

「付属装置」とは、スマートデバイスに接続して使用する追加のハードウェアであり、特定の機能を提供するための装置である。 An "accessory device" is additional hardware that is connected to a smart device to provide specific functionality.

「生成系AI」とは、ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術である。 "Generative AI" is an artificial intelligence technology that generates text and other content based on user instructions and prompts.

「指示入力」とは、ユーザーが生成系AIに対して行う命令や要求の入力である。 "Instruction input" refers to commands or requests that a user inputs to a generative AI.

「利用者認証手段」とは、ユーザーの身元を確認し、認証するための技術や装置である。 "User authentication means" refers to technology or devices used to verify and authenticate a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーを認証する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and authenticate the user based on that information.

「操作手段」とは、ユーザーが付属装置やスマートデバイスを操作するためのインターフェースやボタンである。 "Operation means" refers to the interface or buttons that users use to operate accessory devices or smart devices.

「音声認識手段」とは、ユーザーの音声を解析し、テキストデータに変換する技術や装置である。 "Voice recognition means" refers to technology or devices that analyze the user's voice and convert it into text data.

「音声データ」とは、ユーザーが発した音声をデジタル形式で記録したデータである。 "Voice data" refers to data that has been digitally recorded from the user's voice.

「送信手段」とは、データを他の装置やシステムに送信するための技術や装置である。 "Transmission means" refers to the technology or equipment used to transmit data to other devices or systems.

この発明は、スマートデバイスに接続可能な付属装置を用いて、ユーザーが生成系AIを簡単かつ安全に利用できるシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that allows users to easily and safely use generative AI using an accessory device that can be connected to a smart device. Specific embodiments of this system are described below.

システムの構成 System Configuration

システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートデバイス:スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器。 1. Smart device: A portable electronic device such as a smartphone or tablet that has internet connectivity and can run applications.

2. 付属装置:スマートデバイスに接続して使用する追加のハードウェアであり、指紋認証手段、操作手段、音声認識手段を含む。 2. Accessory device: Additional hardware that is connected to a smart device and used, including fingerprint authentication means, operation means, and voice recognition means.

3. 生成系AI:ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術。 3. Generative AI: Artificial intelligence technology that generates text and other content based on user instructions and prompts.

プログラムの処理 Program processing

ハードウェア Hardware

指紋認証センサー:ユーザーの指紋を読み取り、その情報を基にユーザーを認証する。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates the user based on that information.

スマートデバイス:アプリケーションの実行環境として機能する。 Smart device: Functions as the application execution environment.

マイクロフォン:音声認識手段としてユーザーの音声を取得する。 Microphone: Captures the user's voice as a means of voice recognition.

ソフトウェア Software

指紋認証ライブラリ:指紋認証を行うためのソフトウェアモジュール。 Fingerprint authentication library: A software module for performing fingerprint authentication.

音声認識ライブラリ:音声をテキストデータに変換するためのソフトウェアモジュール(例:Google(登録商標) Speech-to-Text)。 Speech recognition library: A software module for converting speech into text data (e.g., Google® Speech-to-Text).

生成系AIモデル:ユーザーのプロンプトに基づいて応答を生成するAIモデル(例:GPT-3(登録商標))。 Generative AI model: An AI model that generates responses based on user prompts (e.g., GPT-3 (registered trademark)).

フードデリバリーAPI:フードデリバリーサービスのAPIを使用して注文を行う。 Food delivery API: Place orders using the food delivery service's API.

処理の流れ Processing flow

1. ユーザー認証:ユーザーが付属装置の指紋認証センサーに指を当てることで認証を行う。認証が成功すると、次のステップに進む。 1. User authentication: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device. If authentication is successful, the device proceeds to the next step.

2. 音声入力:ユーザーが付属装置の操作手段(ワンクリックボタン)を押しながら、音声で注文内容を伝える。マイクロフォンが音声を取得し、音声認識ライブラリがこれをテキストデータに変換する。 2. Voice input: The user presses the operation means (one-click button) of the attached device and verbally states the order details. The microphone picks up the voice, and the voice recognition library converts it into text data.

3. プロンプト生成:取得されたテキストデータを基に、生成系AIに対するプロンプト文を生成する。 3. Prompt generation: Generate a prompt sentence for the generative AI based on the acquired text data.

4. AI応答生成:生成系AIモデルがプロンプト文に基づいて最適な応答を生成する。 4. AI response generation: The generative AI model generates the optimal response based on the prompt.

5. 注文実行:生成された応答を基に、フードデリバリーAPIを使用して注文を完了する。 5. Order execution: Based on the generated response, the order is completed using the food delivery API.

具体例 Specific examples

ユーザーが指紋認証センサーに指を当てて認証し、「ピザを注文したい」と音声で伝えると、音声認識ライブラリがこれをテキストデータに変換する。生成系AIモデルに「ユーザーが注文したいのは: ピザ」というプロンプト文を入力すると、生成系AIモデルが最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 When a user places their finger on the fingerprint sensor for authentication and says "I want to order pizza," the speech recognition library converts this into text data. When the generative AI model receives the prompt "The user wants to order: pizza," the generative AI model suggests the most suitable pizza restaurant and menu item, and completes the order using a food delivery API.

プロンプト文の例 Example prompt

「ユーザーが注文したいのは: ピザ」 "User wants to order: Pizza"

このようにして、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能である。 In this way, users can easily and safely use food delivery services using only their voice, without having to operate their smartphone.

応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋データ。 Input: User's fingerprint data.

処理:指紋認証ライブラリが指紋データを解析し、登録された指紋データと照合する。 Processing: The fingerprint authentication library analyzes the fingerprint data and compares it with registered fingerprint data.

出力:認証結果(成功または失敗)。 Output: Authentication result (success or failure).

具体的な動作:指紋認証センサーがユーザの指紋を読み取り、指紋認証ライブラリがそのデータを解析して認証を行う。 Specific operation: The fingerprint authentication sensor reads the user's fingerprint, and the fingerprint authentication library analyzes the data to perform authentication.

ステップ2: Step 2:

ユーザが付属装置の操作手段(ワンクリックボタン)を押す。 The user presses the operating means (one-click button) of the accessory device.

入力:ユーザの操作(ボタン押下)。 Input: User operation (button press).

処理:操作手段が押下されたことを検知し、音声認識モードを起動する。 Processing: Detects that the operating means has been pressed and activates voice recognition mode.

出力:音声認識モードの起動。 Output: Activate voice recognition mode.

具体的な動作:ボタンが押されたことをセンサーが検知し、音声認識ライブラリが音声入力の準備を開始する。 Specific operation: The sensor detects that a button has been pressed, and the voice recognition library begins preparing for voice input.

ステップ3: Step 3:

ユーザが音声で注文内容を伝える。 The user verbally communicates the order details.

入力:ユーザの音声データ。 Input: User's voice data.

処理:マイクロフォンが音声データを取得し、音声認識ライブラリがこれをテキストデータに変換する。 Processing: The microphone captures the audio data, and the speech recognition library converts it into text data.

出力:テキストデータ(注文内容)。 Output: Text data (order details).

具体的な動作:マイクロフォンがユーザの音声をキャプチャし、音声認識ライブラリがその音声を解析してテキストに変換する。 Specific operation: The microphone captures the user's voice, and the speech recognition library analyzes the voice and converts it into text.

ステップ4: Step 4:

端末が取得されたテキストデータを基にプロンプト文を生成する。 The device generates a prompt based on the acquired text data.

入力:テキストデータ(注文内容)。 Input: Text data (order details).

処理:テキストデータを「ユーザーが注文したいのは: [注文内容]」という形式のプロンプト文に変換する。 Processing: Convert the text data into a prompt in the format "The user would like to order: [Order details]".

出力:プロンプト文。 Output: Prompt statement.

具体的な動作:テキストデータをフォーマットに従ってプロンプト文に変換する。 Specific operation: Converts text data into prompt text according to the format.

ステップ5: Step 5:

端末が生成系AIモデルにプロンプト文を送信する。 The device sends a prompt to the generative AI model.

入力:プロンプト文。 Input: Prompt text.

処理:生成系AIモデルがプロンプト文を解析し、最適な応答を生成する。 Processing: The generative AI model analyzes the prompt and generates the optimal response.

出力:AI応答(最適な注文内容)。 Output: AI response (optimal order content).

具体的な動作:プロンプト文を生成系AIモデルに送信し、AIが応答を生成する。 Specific operation: The prompt sentence is sent to the generative AI model, and the AI generates a response.

ステップ6: Step 6:

端末が生成された応答を基にフードデリバリーAPIを使用して注文を完了する。 The device uses the food delivery API based on the generated response to complete the order.

入力:AI応答(最適な注文内容)。 Input: AI response (optimal order content).

処理:フードデリバリーAPIを使用して注文を実行する。 Processing: Fulfill orders using the food delivery API.

出力:注文確認(注文が正常に完了したことを示すデータ)。 Output: Order confirmation (data indicating the order was completed successfully).

具体的な動作:AI応答をフードデリバリーAPIに送信し、注文を確定する。 Specific operation: Sends the AI response to the food delivery API and confirms the order.

なお、サーバは、後述する感情エンジンを用いてユーザの感情を認識する手段を更に含み、該音声認識手段により取得された音声データ、及び前記ユーザの感情を含むプロンプト文と、前記生成系AIとを用いて、生成系AIの出力を取得するようにしてもよい。例えば、ユーザの感情が、「悲しみ」であると認識された場合には、「ユーザーが注文したいのは: ピザ、ユーザの感情:悲しみ」というプロンプト文を生成し、生成系AIモデルが、ユーザの感情を考慮した最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 The server may further include means for recognizing the user's emotions using an emotion engine, which will be described later, and may obtain the output of the generative AI using the voice data acquired by the voice recognition means, a prompt statement including the user's emotion, and the generative AI. For example, if the user's emotion is recognized as "sadness," a prompt statement such as "User wants to order: pizza, user's emotion: sadness" may be generated, and the generative AI model may suggest the optimal pizza restaurant and menu item taking the user's emotion into consideration, and the order may be completed using a food delivery API.

なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段、ユーザー認証手段、およびユーザー認証手段により認証されたユーザーが生成系AIへのプロンプト入力を行うための操作手段を含む。さらに、この装置はユーザーの感情を認識する感情エンジンを含む。具体的には、ユーザーの声のトーンや顔の表情から感情を認識し、その情報を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to the generative AI, a user authentication means, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. The device also includes an emotion engine that recognizes the user's emotions. Specifically, it recognizes emotions from the user's tone of voice and facial expression, and feeds this information back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotions.

「形態例2」 "Example 2"

本発明の別の実施形態として、感情エンジンがユーザーの声のトーンから感情を認識するシステムが提供される。具体的には、ユーザーがアクセサリー装置に話しかけると、装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。感情エンジンは音声データのトーンからユーザーの感情を分析し、その結果を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 Another embodiment of the present invention provides a system in which an emotion engine recognizes emotions from the tone of a user's voice. Specifically, when a user speaks to an accessory device, a microphone within the device captures the user's voice and transmits the voice data to the emotion engine. The emotion engine analyzes the user's emotion from the tone of the voice data and feeds the results back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotion.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置を操作する。 Step 1: The user operates an accessory device that can be connected to a smartphone.

ステップ2:装置のユーザー認証手段がユーザーを認証する。認証方法としては、例えば指紋認証が考えられる。 Step 2: The device's user authentication means authenticates the user. One possible authentication method is fingerprint authentication.

ステップ3:認証されたユーザーが生成系AIへのプロンプト入力を行う。 Step 3: The authenticated user provides prompt input to the generative AI.

ステップ4:装置の感情エンジンがユーザーの声のトーンや顔の表情から感情を認識する。 Step 4: The device's emotion engine recognizes emotions from the user's tone of voice and facial expressions.

ステップ5:感情エンジンがその情報を生成系AIにフィードバックする。 Step 5: The emotion engine feeds that information back to the generative AI.

ステップ6:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 6: The generative AI generates an appropriate response based on the user's emotions.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置に話しかける。 Step 1: The user speaks to the accessory device.

ステップ2:装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。 Step 2: The device's microphone captures the user's voice and sends the audio data to the emotion engine.

ステップ3:感情エンジンが音声データのトーンからユーザーの感情を分析する。 Step 3: The emotion engine analyzes the user's emotions from the tone of the voice data.

ステップ4:感情エンジンがその結果を生成系AIにフィードバックする。 Step 4: The emotion engine feeds the results back to the generative AI.

ステップ5:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 5: The generative AI generates an appropriate response based on the user's emotions.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来のスマートフォンに接続可能なアクセサリー装置では、生成系AIモデルへのプロンプト入力が可能であるが、ユーザーの感情状態を考慮したレスポンスを生成することができないという課題があった。これにより、ユーザーの意図や感情に応じた適切なレスポンスを得ることが難しく、ユーザーエクスペリエンスが向上しないという問題が生じていた Existing smartphone accessory devices allow prompt input to generative AI models, but they have the problem of being unable to generate responses that take the user's emotional state into account. This makes it difficult to obtain appropriate responses based on the user's intentions and emotions, resulting in a lack of improvement in the user experience.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIモデルへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIモデルにフィードバックする手段と、を含む。これにより、ユーザーの感情状態を考慮した適切なレスポンスを生成系AIモデルから得ることが可能となる。 In this invention, the server is an accessory device connectable to a smartphone, and includes: means for enabling prompt input to the generative AI model; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI model; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI model. This makes it possible to obtain an appropriate response from the generative AI model that takes into account the user's emotional state.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持つ携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer.

「アクセサリー装置」とは、スマートフォンに接続して追加機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AIモデル」とは、入力されたプロンプトに基づいてテキストや音声などの出力を生成する人工知能システムである。 A "generative AI model" is an artificial intelligence system that generates output such as text or voice based on input prompts.

「プロンプト入力」とは、ユーザーが生成系AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術手段である。 "User authentication means" refers to technical means for verifying a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基に認証を行う技術手段である。 "Fingerprint authentication means" refers to a technical means that reads a user's fingerprint and performs authentication based on that information.

「操作手段」とは、ユーザーがアクセサリー装置を操作するためのインターフェースである。 "Operation means" refers to the interface that allows the user to operate the accessory device.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できるインターフェースである。 A "one-click operation method" is an interface that allows users to complete an operation with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を解析して感情を認識する技術手段である。 "Emotion recognition means" refers to a technical means for recognizing emotions by analyzing the user's tone of voice and facial expressions.

「感情情報」とは、感情認識手段によって取得されたユーザーの感情状態に関するデータである。 "Emotion information" is data regarding the user's emotional state obtained by emotion recognition means.

「フィードバック手段」とは、取得された感情情報を生成系AIモデルに送信する技術手段である。 "Feedback means" refers to the technical means for transmitting acquired emotional information to the generative AI model.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を行い、ユーザーの感情状態を考慮したレスポンスを得るシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to provide prompt input to a generative AI model and obtain a response that takes into account the user's emotional state. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置 Accessory equipment

アクセサリー装置は、スマートフォンにBluetoothなどの無線通信手段を用いて接続される。この装置には、以下の主要なコンポーネントが含まれる: The accessory device connects to your smartphone using wireless communication methods such as Bluetooth. The device includes the following main components:

指紋認証センサー:ユーザーの指紋を読み取り、認証を行う。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates them.

操作ボタン:ユーザーがプロンプト入力を開始するためのインターフェース。 Action button: An interface that allows the user to start prompt input.

感情認識エンジン:ユーザーの声のトーンや顔の表情を解析し、感情情報を取得する。 Emotion recognition engine: Analyzes the user's tone of voice and facial expressions to obtain emotional information.

スマートフォン Smartphone

スマートフォンは、アクセサリー装置と連携して動作する専用アプリケーションを実行する。このアプリケーションは、以下の機能を提供する: The smartphone runs a dedicated application that works in conjunction with the accessory device. This application provides the following functions:

プロンプト入力インターフェース:ユーザーが生成系AIモデルに対して指示や質問を入力するための画面。 Prompt input interface: A screen where users can enter instructions or questions for the generative AI model.

データ送信機能:プロンプトと感情情報をサーバに送信する。 Data transmission function: Sends prompts and emotion information to the server.

サーバ Server

サーバは、スマートフォンと生成系AIモデルの間でデータ通信を行うバックエンドサービスを提供する。サーバは、以下の機能を持つ: The server provides backend services that handle data communication between smartphones and generative AI models. The server has the following functions:

データ中継機能:スマートフォンから受信したプロンプトと感情情報を生成系AIモデルに送信する。 Data relay function: Sends prompts and emotional information received from a smartphone to the generative AI model.

レスポンス受信機能:生成系AIモデルからのレスポンスを受信し、スマートフォンに転送する。 Response reception function: Receives responses from the generative AI model and forwards them to the smartphone.

具体例 Specific examples

ユーザがスマートフォンに接続されたアクセサリー装置を使用して、生成系AIモデルに対して質問を行うシナリオを考える。 Consider a scenario in which a user uses an accessory device connected to a smartphone to ask a generative AI model questions.

1. ユーザ認証 1. User authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置き、認証を行う。端末(スマートフォン)は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。認証が成功すると、ユーザは次のステップに進むことができる。 The user places their finger on the accessory device's fingerprint authentication sensor to authenticate. The terminal (smartphone) receives the fingerprint data from the accessory device and compares it with registered fingerprint data. If authentication is successful, the user can proceed to the next step.

2. プロンプト入力 2. Prompt Input

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。 The user opens a dedicated application on their smartphone and enters a prompt. For example, they might enter, "What's the weather like today?" The device then prepares to send this prompt to the generative AI model.

3. 感情認識 3. Emotion recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。端末は、この感情データを生成系AIモデルに送信するために準備する。 The accessory device analyzes the user's emotional state using an emotion engine that senses the user's tone of voice and facial expressions. The device prepares this emotion data to send to the generative AI model.

4. 生成系AIモデルへのプロンプト送信 4. Sending prompts to generative AI models

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。サーバは、これらのデータを生成系AIモデルに送信する。生成系AIモデルは、プロンプトと感情データを基に適切なレスポンスを生成する。 The device sends the prompt and emotion data entered by the user to the server. The server then sends this data to the generative AI model. The generative AI model generates an appropriate response based on the prompt and emotion data.

5. 生成系AIモデルからのレスポンス受信 5. Receiving responses from generative AI models

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。端末は、このレスポンスをユーザに表示する準備を行う。 The server receives the response from the generative AI model and forwards it to the device. The device then prepares to display this response to the user.

6. レスポンスの表示 6. Displaying the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it might say, "It's sunny today. Have a nice day." The user can review this response and enter further prompts if necessary.

プロンプト文の例 Example prompt

「今日の天気はどうですか?」 "What's the weather like today?"

「次の会議の予定を教えてください。」 "Please let me know when the next meeting is scheduled."

「最近のニュースを教えてください。」 "Please tell me the latest news."

このようにして、ユーザはアクセサリー装置を通じて生成系AIモデルと自然な対話を行うことができる。 In this way, users can naturally interact with generative AI models through accessory devices.

実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.

ステップ1:ユーザ認証 Step 1: User Authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。端末は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。入力はユーザの指紋データであり、出力は認証結果である。端末は、指紋データを解析し、登録データと一致するかどうかを確認する。認証が成功すると、端末は「認証成功」と表示する。 The user places their finger on the fingerprint authentication sensor of the accessory device. The terminal receives the fingerprint data from the accessory device and compares it with registered fingerprint data. The input is the user's fingerprint data, and the output is the authentication result. The terminal analyzes the fingerprint data and checks whether it matches the registered data. If authentication is successful, the terminal displays "Authentication successful."

ステップ2:アクセサリー装置とスマートフォンの接続 Step 2: Connect your accessory device to your smartphone

端末は、Bluetooth通信を介してアクセサリー装置と接続を確立する。入力はBluetooth接続要求であり、出力は接続状態である。端末は、アクセサリー装置からの接続要求を受け取り、接続を確立する。サーバは、この接続を監視し、必要に応じてデータの中継を行う。接続が成功すると、端末は「接続成功」と表示する。 The terminal establishes a connection with an accessory device via Bluetooth communication. The input is a Bluetooth connection request and the output is the connection status. The terminal receives a connection request from the accessory device and establishes the connection. The server monitors this connection and relays data as necessary. If the connection is successful, the terminal displays "Connection successful."

ステップ3:プロンプト入力 Step 3: Enter the prompt

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。入力はユーザのプロンプト文であり、出力はプロンプトデータである。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。ユーザが入力を完了すると、端末は「プロンプト入力完了」と表示する。 The user opens a dedicated application on their smartphone and inputs a prompt. For example, they might input "What's the weather like today?" The input is the user's prompt, and the output is the prompt data. The device prepares to send this prompt to the generative AI model. When the user has completed their input, the device displays "Prompt input completed."

ステップ4:感情認識 Step 4: Emotion Recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。入力はユーザの声のトーンや顔の表情データであり、出力は感情データである。端末は、この感情データを生成系AIモデルに送信するために準備する。感情データが取得されると、端末は「感情データ取得成功」と表示する。 The accessory device uses an emotion engine that senses the user's vocal tone and facial expressions to analyze the user's emotional state. The input is the user's vocal tone and facial expression data, and the output is emotion data. The device prepares this emotion data to send to the generative AI model. Once the emotion data is acquired, the device displays "Emotion data acquisition successful."

ステップ5:生成系AIモデルへのプロンプト送信 Step 5: Send prompts to the generative AI model

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。入力はプロンプトデータと感情データであり、出力はサーバへの送信結果である。サーバは、これらのデータを生成系AIモデルに送信する。データ送信が成功すると、端末は「データ送信成功」と表示する。 The device sends the prompt and emotion data entered by the user to the server. The input is the prompt data and emotion data, and the output is the result of transmission to the server. The server then sends this data to the generative AI model. If the data transmission is successful, the device displays "Data transmission successful."

ステップ6:生成系AIモデルからのレスポンス受信 Step 6: Receive a response from the generative AI model

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。入力は生成系AIモデルからのレスポンスデータであり、出力は端末への転送結果である。端末は、このレスポンスをユーザに表示する準備を行う。レスポンスが受信されると、端末は「レスポンス受信成功」と表示する。 The server receives the response from the generative AI model and forwards it to the device. The input is the response data from the generative AI model, and the output is the result of forwarding to the device. The device prepares to display this response to the user. Once the response is received, the device displays "Response received successfully."

ステップ7:レスポンスの表示 Step 7: View the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。入力は生成系AIモデルからのレスポンスデータであり、出力はユーザへの表示結果である。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it displays "It's sunny today. Have a nice day." The input is the response data from the generative AI model, and the output is the display result to the user. The user can review this response and enter further prompts if necessary.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来のフードデリバリーサービスでは、ユーザーの感情や状況に応じたカスタマイズされた提案を行うことが難しかった。また、ユーザーが生成系AIを利用して注文プロセスを簡素化するための手段が不足していた。これにより、ユーザーエクスペリエンスが低下し、サービスの利用頻度が減少する可能性があった Traditional food delivery services struggled to provide customized recommendations based on users' emotions and circumstances. They also lacked a means for users to use generative AI to simplify the ordering process. This could result in a poor user experience and reduced frequency of service use.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIにフィードバックする手段と、を含む。これにより、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI. This makes it possible to propose customized food delivery according to the user's emotions.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続される外部デバイスであり、特定の機能を提供するものである。 An "accessory device connectable to a smartphone" is an external device that connects to a smartphone using wireless communication means and provides specific functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて応答や提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates responses and suggestions based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions or questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術であり、特定のユーザーのみがシステムを操作できるようにするものである。 "User authentication means" refers to technology used to verify a user's identity and ensure that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を基にユーザーを認証する技術である。 "Fingerprint authentication" is a technology that scans a user's fingerprint and authenticates the user based on that information.

「操作手段」とは、ユーザーがシステムを操作するための物理的またはソフトウェア的なインターフェースである。 "Operation means" refers to the physical or software interface that allows the user to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースである。 A "one-click operation means" is an interface that allows users to perform a specific function with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を分析し、その感情を認識する技術である。 "Emotion recognition means" is a technology that analyzes the user's tone of voice and facial expressions to recognize their emotions.

「感情情報を生成系AIにフィードバックする手段」とは、認識された感情情報を生成系AIに送信し、生成系AIがその情報を基に応答や提案を生成するための機能である。 "Means for feeding back emotional information to the generative AI" is a function that sends recognized emotional information to the generative AI, allowing the generative AI to generate responses and suggestions based on that information.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、ユーザーが生成系AIを通じてフードデリバリーサービスを利用する際に、注文プロセスを簡素化し、ユーザーの感情に応じたカスタマイズされた提案を行うシステムである。 This invention is a system that uses an accessory device connectable to a smartphone to simplify the ordering process when a user uses a food delivery service through generative AI and makes customized suggestions based on the user's emotions.

システムの構成 System Configuration

このシステムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートフォンに接続可能なアクセサリー装置 1. Accessory devices that can be connected to smartphones

無線通信手段: Bluetoothなどを用いてスマートフォンと接続される。 Wireless communication method: Connects to a smartphone using Bluetooth or other means.

ユーザー認証手段: 指紋認証センサーを用いてユーザーを認証する。 User authentication method: User authentication is performed using a fingerprint sensor.

操作手段: ワンクリック操作手段を用いて、ユーザーが生成系AIへのプロンプト入力を行う。 Operation method: The user uses a one-click operation method to input prompts to the generative AI.

感情認識手段: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 Emotion recognition: Analyzes the user's tone of voice and facial expressions to recognize emotions.

2. 生成系AI 2. Generative AI

プロンプト入力: ユーザーからの指示や質問を受け取り、応答や提案を生成する。 Prompt Input: Receives instructions or questions from the user and generates responses or suggestions.

感情情報のフィードバック: 認識された感情情報を基に、カスタマイズされた応答や提案を生成する。 Emotional feedback: Generate customized responses and suggestions based on recognized emotional information.

プログラムの処理 Program processing

サーバは、以下のような処理を行う: The server performs the following process:

1. Bluetooth接続: スマートフォンとアクセサリー装置をBluetoothを用いて接続する。 1. Bluetooth connection: Connect your smartphone and accessory device using Bluetooth.

2. ユーザー認証: 指紋認証センサーを用いてユーザーの指紋をスキャンし、認証を行う。 2. User authentication: The fingerprint sensor scans the user's fingerprint for authentication.

3. 感情認識: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 3. Emotion recognition: Analyze the user's tone of voice and facial expressions to recognize emotions.

4. プロンプト生成: 認識された感情に基づいて、生成系AIへのプロンプトを生成する。 4. Prompt generation: Generate prompts for the generative AI based on the recognized emotions.

5. AI応答生成: 生成系AIを用いて、プロンプトに対する応答や提案を生成する。 5. AI Response Generation: Use generative AI to generate responses and suggestions to prompts.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: Bluetoothモジュール、指紋認証センサー、カメラ(顔認識用)、マイク(音声認識用) Hardware: Bluetooth module, fingerprint sensor, camera (for facial recognition), microphone (for voice recognition)

ソフトウェア: Bluetooth接続ライブラリ、指紋認証ライブラリ、感情認識エンジン、生成系AIモデル Software: Bluetooth connection library, fingerprint authentication library, emotion recognition engine, generative AI model

具体例 Specific examples

ユーザーが疲れていると認識された場合、生成系AIは「疲れているときにおすすめのフードデリバリー」を提案する。例えば、以下のようなプロンプト文が生成される: If the generative AI recognizes that the user is tired, it will suggest "food delivery options recommended for when you're tired." For example, it might generate a prompt like this:

ユーザーは疲れている気分です。おすすめのフードデリバリーを提案してください。 The user is feeling tired. Please suggest some food delivery options.

このようにして、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this way, it becomes possible to offer customized food delivery suggestions based on the user's emotions.

応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.

ステップ1: Step 1:

サーバは、Bluetoothモジュールを用いてスマートフォンとアクセサリー装置を接続する。入力はスマートフォンとアクセサリー装置のペアリング情報であり、出力は接続の確立である。具体的には、Bluetooth接続ライブラリを使用して、スマートフォンとアクセサリー装置間の通信を確立する。 The server connects the smartphone and accessory device using a Bluetooth module. The input is pairing information between the smartphone and accessory device, and the output is the establishment of the connection. Specifically, it uses the Bluetooth connection library to establish communication between the smartphone and accessory device.

ステップ2: Step 2:

端末は、指紋認証センサーを用いてユーザーの指紋をスキャンし、ユーザー認証を行う。入力はユーザーの指紋データであり、出力は認証結果である。具体的には、指紋認証ライブラリを使用して、スキャンされた指紋データを登録済みのデータと照合し、認証の成否を判断する。 The device uses a fingerprint authentication sensor to scan the user's fingerprint and perform user authentication. The input is the user's fingerprint data, and the output is the authentication result. Specifically, the fingerprint authentication library is used to compare the scanned fingerprint data with registered data to determine whether authentication was successful.

ステップ3: Step 3:

端末は、マイクとカメラを用いてユーザーの声のトーンと顔の表情をキャプチャし、感情認識を行う。入力は音声データと画像データであり、出力は認識された感情情報である。具体的には、感情認識エンジンを使用して、音声データと画像データを解析し、ユーザーの感情を特定する。 The device uses a microphone and camera to capture the user's tone of voice and facial expressions to perform emotion recognition. The input is voice data and image data, and the output is recognized emotional information. Specifically, an emotion recognition engine is used to analyze the voice data and image data to identify the user's emotions.

ステップ4: Step 4:

サーバは、認識された感情情報を基に生成系AIへのプロンプトを生成する。入力は感情情報であり、出力はプロンプト文である。具体的には、感情情報をテキスト形式に変換し、生成系AIに適したプロンプト文を作成する。 The server generates a prompt for the generative AI based on the recognized emotional information. The input is emotional information, and the output is a prompt. Specifically, the emotional information is converted into text format and a prompt suitable for the generative AI is created.

ステップ5: Step 5:

サーバは、生成系AIモデルを用いてプロンプト文に対する応答や提案を生成する。入力はプロンプト文であり、出力は生成された応答や提案である。具体的には、生成系AIモデルにプロンプト文を入力し、AIが応答や提案を生成する。 The server uses a generative AI model to generate responses and suggestions in response to prompts. The input is the prompt, and the output is the generated response or suggestion. Specifically, the prompt is input into the generative AI model, and the AI generates the response or suggestion.

ステップ6: Step 6:

端末は、生成された応答や提案をユーザーに提示する。入力は生成された応答や提案であり、出力はユーザーへの表示である。具体的には、スマートフォンのディスプレイに応答や提案を表示し、ユーザーが確認できるようにする。 The device presents the generated response or suggestion to the user. The input is the generated response or suggestion, and the output is what is displayed to the user. Specifically, the response or suggestion is displayed on the smartphone display so that the user can check it.

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来の生成AIモデルを利用するシステムでは、ユーザーがスマートフォンを操作する必要があり、手軽に利用することが難しかった。また、ユーザーの感情に応じた適切なレスポンスを生成することができず、ユーザー体験が限定されていた。これにより、ユーザーが生成AIモデルを効果的に活用することが困難であった。 Conventional systems using generative AI models required users to operate their smartphones, making them difficult to use. They also were unable to generate appropriate responses based on the user's emotions, limiting the user experience. This made it difficult for users to effectively utilize generative AI models.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが生成AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの音声データをキャプチャし、感情を分析する感情認識手段と、該感情認識手段により分析された感情情報を生成AIモデルにフィードバックする手段と、を含む。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成AIモデルを利用でき、さらにユーザーの感情に応じた適切なレスポンスを得ることが可能となる。 In this invention, the server includes a user authentication means, an operation means for a user authenticated by the user authentication means to input prompts to the generative AI model, an emotion recognition means for capturing the user's voice data and analyzing their emotions, and a means for feeding back the emotion information analyzed by the emotion recognition means to the generative AI model. This allows the user to easily use the generative AI model without operating a smartphone, and further enables the user to obtain an appropriate response according to their emotions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、指紋認証や顔認証などの生体認証技術を含む。 "User authentication means" refers to a means for verifying a user's identity, and includes biometric authentication technologies such as fingerprint authentication and facial recognition.

「操作手段」とは、ユーザーが生成AIモデルへのプロンプト入力を行うための手段であり、ボタンやタッチスクリーンなどのインターフェースを含む。 "Operation means" refers to the means by which a user inputs prompts to the generated AI model, and includes interfaces such as buttons and touchscreens.

「感情認識手段」とは、ユーザーの音声データをキャプチャし、そのトーンや内容からユーザーの感情を分析するための手段である。 "Emotion recognition means" is a means for capturing a user's voice data and analyzing the user's emotions from its tone and content.

「生成AIモデル」とは、ユーザーからのプロンプトに基づいて適切なレスポンスを生成する人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates appropriate responses based on prompts from the user.

「プロンプト入力」とは、ユーザーが生成AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「フィードバック手段」とは、感情認識手段により分析された感情情報を生成AIモデルに送信するための手段である。 The "feedback means" is a means for transmitting the emotional information analyzed by the emotion recognition means to the generative AI model.

この発明は、ユーザー認証手段、操作手段、感情認識手段、フィードバック手段を含むシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that includes a user authentication means, an operation means, an emotion recognition means, and a feedback means. Specific embodiments of this system are described below.

まず、ユーザはアクセサリー装置の指紋認証センサーに指を当てる。指紋認証センサーは、ユーザーの指紋データをキャプチャし、端末に送信する。端末はこのデータをサーバに送信し、サーバは指紋データを既存のデータベースと照合してユーザーの認証を行う。認証が成功すると、端末のボタンが有効化される。 First, the user places their finger on the accessory device's fingerprint authentication sensor. The fingerprint authentication sensor captures the user's fingerprint data and sends it to the device. The device then sends this data to the server, which compares the fingerprint data with an existing database to authenticate the user. If authentication is successful, the device's buttons are enabled.

次に、ユーザが有効化されたボタンを押すと、端末はスマートフォン上の専用アプリケーションを起動する。このアプリケーションは、生成AIモデルに対してプロンプト文を入力する機能を持つ。例えば、「今日の天気について教えてください」というプロンプト文を生成AIモデルに入力する。 Next, when the user presses the enabled button, the device launches a dedicated application on the smartphone. This application has the function of inputting prompt sentences to the generative AI model. For example, the prompt sentence "Please tell me about today's weather" is input to the generative AI model.

さらに、ユーザがアクセサリー装置に話しかけると、端末内のマイクロフォンが音声データをキャプチャする。この音声データは感情認識手段に送信され、感情認識手段は音声データのトーンを解析してユーザの感情を分析する。分析結果はフィードバック手段を通じて生成AIモデルに送信される。生成AIモデルは、この感情情報に基づいて適切なレスポンスを生成する。例えば、「ユーザは少し疲れているようです。元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。 Furthermore, when the user speaks to the accessory device, the microphone in the terminal captures voice data. This voice data is sent to the emotion recognition means, which analyzes the tone of the voice data to analyze the user's emotions. The analysis results are sent to the generative AI model via the feedback means. The generative AI model generates an appropriate response based on this emotional information. For example, in response to the prompt "The user seems a little tired. Please generate an encouraging message," it generates the response "Let's take a break today and refresh ourselves."

このシステムにより、ユーザはスマートフォンを操作することなく、手軽に生成AIモデルを利用できる。また、ユーザの感情に応じた適切なレスポンスを得ることが可能となるため、ユーザ体験が向上する。 This system allows users to easily use generative AI models without having to operate a smartphone. It also improves the user experience by enabling appropriate responses based on the user's emotions.

具体例として、ユーザがアクセサリー装置の指紋認証センサーに指を当て、認証が成功した後にボタンを押すと、スマートフォン上のアプリケーションが起動し、以下のプロンプト文が生成AIモデルに入力される: For example, when a user places their finger on the fingerprint authentication sensor on an accessory device and presses a button after successful authentication, an application on the smartphone launches and the following prompt is input into the generative AI model:

「今日の天気について教えてください。」 "Can you tell me about today's weather?"

別の具体例として、ユーザがアクセサリー装置に「今日はどんな気分?」と話しかけると、感情認識手段がユーザの声のトーンから感情を認識し、生成AIモデルに以下のプロンプト文を入力する: As another example, when a user asks an accessory device, "How are you feeling today?", the emotion recognition means recognizes the emotion from the user's tone of voice and inputs the following prompt sentence into the generative AI model:

「ユーザは少し疲れているようです。元気づけるメッセージを生成してください。」 "The user seems a little tired. Please generate an encouraging message."

これにより、ユーザはスマートフォンを操作することなく、手軽に生成AIを活用することが可能となる。 This allows users to easily utilize generative AI without having to operate their smartphone.

実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋 Input: User's fingerprint

具体的な動作:ユーザがアクセサリー装置の指紋認証センサーに指を当てると、センサーが青く光る。 Specific operation: When the user places their finger on the fingerprint authentication sensor on the accessory device, the sensor will glow blue.

出力:キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、サーバに送信する。 The device captures fingerprint data and sends it to the server.

入力:キャプチャされた指紋データ Input: Captured fingerprint data

具体的な動作:端末は指紋認証センサーから指紋データをキャプチャし、そのデータをサーバに送信する際、端末の画面に「認証中...」と表示される。 Specific operation: The device captures fingerprint data from the fingerprint authentication sensor and, when sending that data to the server, displays "Authentication in progress..." on the device screen.

出力:サーバに送信された指紋データ Output: Fingerprint data sent to the server

ステップ3: Step 3:

サーバが指紋データを認証する。 The server authenticates the fingerprint data.

入力:サーバに送信された指紋データ Input: Fingerprint data sent to the server

具体的な動作:サーバは受信した指紋データを既存のデータベースと照合し、ユーザの認証を行う。 Specific operation: The server compares the received fingerprint data with an existing database and authenticates the user.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ4: Step 4:

認証が成功すると、端末のボタンを有効化する。 If authentication is successful, the device's buttons will be enabled.

入力:認証結果(成功) Input: Authentication result (success)

具体的な動作:サーバが認証に成功すると、端末に信号を送り、ボタンを有効化する。端末のボタンが緑色に点灯する。 Specific operation: If the server successfully authenticates, it sends a signal to the device to activate the button. The button on the device will light up green.

出力:有効化されたボタン Output: Enabled button

ステップ5: Step 5:

ユーザがボタンを押す。 The user presses the button.

入力:有効化されたボタン Input: Enabled button

具体的な動作:ユーザは有効化されたボタンを押す。これにより、次のステップがトリガーされる。 Specific Action: The user presses the enabled button, which triggers the next step.

出力:ボタン押下の信号 Output: Button press signal

ステップ6: Step 6:

端末がスマートフォン上のアプリケーションを起動する。 The device launches the application on the smartphone.

入力:ボタン押下の信号 Input: Button press signal

具体的な動作:端末はスマートフォン上の専用アプリケーションを起動する。スマートフォンの画面にアプリケーションのロゴが表示される。 Specific operation: The device launches a dedicated application on the smartphone. The application logo will appear on the smartphone screen.

出力:起動されたアプリケーション Output: Launched application

ステップ7: Step 7:

アプリケーションが生成AIモデルへのプロンプト入力を行う。 The application prompts input to the generative AI model.

入力:起動されたアプリケーション Input: Launched application

具体的な動作:アプリケーションは生成AIモデルに対してプロンプト文を入力する。画面に「プロンプトを送信中...」と表示される。例えば、「今日の天気について教えてください」というプロンプト文を入力する。 Specific operation: The application inputs a prompt to the generative AI model. The screen displays "Sending prompt...". For example, the prompt input is "Tell me about the weather today."

出力:生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ8: Step 8:

ユーザがアクセサリー装置に話しかける。 The user speaks to the accessory device.

入力:ユーザの音声 Input: User's voice

具体的な動作:ユーザはアクセサリー装置に向かって話しかける。例えば、「今日はどんな気分?」と話す。端末のマイクロフォンが赤く点灯し、音声データをキャプチャしていることを示す。 Specific operation: The user speaks to the accessory device. For example, "How are you feeling today?" The device's microphone lights up red, indicating that it is capturing audio data.

出力:キャプチャされた音声データ Output: Captured audio data

ステップ9: Step 9:

端末が音声データをキャプチャし、感情エンジンに送信する。 The device captures voice data and sends it to the emotion engine.

入力:キャプチャされた音声データ Input: Captured audio data

具体的な動作:端末は内蔵マイクロフォンを使用して音声データをキャプチャし、そのデータを感情エンジンに送信する。 Specific operation: The device uses the built-in microphone to capture audio data and sends that data to the emotion engine.

出力:感情エンジンに送信された音声データ Output: Audio data sent to the emotion engine

ステップ10: Step 10:

感情エンジンが音声データのトーンからユーザの感情を分析する。 The emotion engine analyzes the user's emotions from the tone of the voice data.

入力:感情エンジンに送信された音声データ Input: Audio data sent to the emotion engine

具体的な動作:感情エンジンは音声データのトーンを解析し、ユーザの感情を分析する。端末の画面に「感情を解析中...」と表示される。 Specific operation: The emotion engine analyzes the tone of the voice data and determines the user's emotions. The device screen will display "Analyzing emotions..."

出力:分析された感情情報 Output: Analyzed emotional information

ステップ11: Step 11:

感情エンジンが分析結果を生成AIモデルにフィードバックする。 The emotion engine feeds the analysis results back into the generative AI model.

入力:分析された感情情報 Input: Analyzed emotional information

具体的な動作:感情エンジンは分析結果を生成AIモデルにフィードバックする。例えば、「ユーザは少し疲れているようです」という情報を送信する。 Specific operation: The emotion engine feeds the analysis results back to the generative AI model. For example, it sends information such as "The user seems a little tired."

出力:生成AIモデルに送信された感情情報 Output: Emotional information sent to the generative AI model

ステップ12: Step 12:

生成AIモデルがユーザの感情に応じたレスポンスを生成する。 The generative AI model generates responses based on the user's emotions.

入力:生成AIモデルに送信された感情情報 Input: Emotional information sent to the generative AI model

具体的な動作:生成AIモデルはフィードバックされた感情情報に基づいて、適切なレスポンスを生成する。例えば、「元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。スマートフォンの画面にレスポンスが表示される。 Specific operation: The generative AI model generates an appropriate response based on the emotional information fed back. For example, in response to the prompt "Generate an encouraging message," it generates the response "Take a break today to refresh yourself." The response is displayed on the smartphone screen.

出力:生成されたレスポンス Output: Generated response

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."

従来のフードデリバリーサービスにおいて、ユーザーがスマートフォンを操作して注文を行う際、操作が煩雑であることや、ユーザーの感情に応じた適切な提案が行われないことが課題であった。特に、疲れているユーザーやストレスを感じているユーザーに対して、リラックスできる食事の提案が不足しているため、ユーザー体験が向上しないという問題があった With conventional food delivery services, when users order using their smartphones, the process is cumbersome and they don't offer appropriate suggestions based on the user's mood. In particular, there are issues with the lack of relaxing meal suggestions for tired or stressed users, which hinders the user experience.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

この発明では、サーバは、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの音声をキャプチャし、感情を認識するための音声キャプチャ手段と、該音声キャプチャ手段によりキャプチャされた音声データを分析し、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情に基づいて生成系AIが適切なレスポンスを生成するための手段と、を含む。これにより、ユーザーがスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 In this invention, the server includes means for enabling prompt input to the generative AI, user authentication means for operating the accessory device, operation means for a user authenticated by the user authentication means to input prompts to the generative AI, voice capture means for capturing the user's voice and recognizing their emotions, emotion recognition means for analyzing the voice data captured by the voice capture means and recognizing the user's emotions, and means for the generative AI to generate an appropriate response based on the emotions recognized by the emotion recognition means. This enables the user to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate a smartphone.

「生成系AI」とは、ユーザーからの入力に基づいて適切なレスポンスや提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates appropriate responses and suggestions based on user input.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為を指す。 "Prompt input" refers to the act of inputting instructions or questions to generative AI.

「アクセサリー装置」とは、スマートフォンに接続可能な外部デバイスであり、特定の機能を提供するための装置である。 An "accessory device" is an external device that can be connected to a smartphone to provide specific functions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、特定のユーザーのみがシステムを操作できるようにするためのものである。 "User authentication means" refers to a means for verifying a user's identity and ensuring that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋を読み取って認証を行う手段である。 "Fingerprint authentication means" refers to a means of authenticating a user by reading their fingerprint.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやボタンなどの手段である。 "Operation means" refers to the interface, buttons, and other means that users use to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できる手段である。 A "one-click operation method" is a method that allows the user to complete an operation with a single click.

「音声キャプチャ手段」とは、ユーザーの音声を録音またはキャプチャするための手段である。 "Audio capture means" means for recording or capturing a user's voice.

「感情認識手段」とは、キャプチャされた音声データを分析し、ユーザーの感情を認識するための手段である。 "Emotion recognition means" refers to a means for analyzing captured voice data and recognizing the user's emotions.

「レスポンス」とは、生成系AIがユーザーの入力に対して生成する応答や提案を指す。 "Response" refers to the response or suggestion that generative AI generates in response to user input.

この発明を実施するためのシステムは、以下のように構成される。まず、ユーザーはスマートフォンに接続されたアクセサリー装置を使用する。このアクセサリー装置には指紋認証手段が搭載されており、ユーザーが指を当てることで認証が行われる。認証が成功すると、アクセサリー装置の操作手段が有効化され、ユーザーはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行うことができる。 A system for implementing this invention is configured as follows: First, a user uses an accessory device connected to a smartphone. This accessory device is equipped with a fingerprint authentication means, and authentication is performed by the user placing their finger on it. If authentication is successful, the operation means of the accessory device is enabled, and the user can use the one-click operation means to input prompts to the generative AI.

次に、音声キャプチャ手段がユーザーの音声をキャプチャする。この音声データは感情認識手段に送信され、ユーザーの感情が分析される。感情認識手段は音声データのトーンや内容からユーザーの感情を認識し、その結果を生成系AIにフィードバックする。生成系AIは、認識された感情に基づいて適切なレスポンスを生成する。 Next, the voice capture means captures the user's voice. This voice data is sent to the emotion recognition means, which analyzes the user's emotions. The emotion recognition means recognizes the user's emotions from the tone and content of the voice data and feeds the results back to the generative AI. The generative AI generates an appropriate response based on the recognized emotions.

具体的には、以下のようなハードウェアおよびソフトウェアが使用される。指紋認証手段としては、指紋センサーが用いられる。音声キャプチャ手段としては、マイクロフォンと音声認識ソフトウェア(例:speech_recognitionライブラリ)が使用される。感情認識手段としては、感情エンジン(例:EmotionEngine)が使用される。生成系AIとしては、AI生成モデル(例:AIGenerator)が使用される。 Specifically, the following hardware and software are used: A fingerprint sensor is used as the fingerprint authentication method. A microphone and voice recognition software (e.g., speech_recognition library) are used as the voice capture method. An emotion engine (e.g., EmotionEngine) is used as the emotion recognition method. An AI generation model (e.g., AIGenerator) is used as the generative AI.

例えば、ユーザーが「今日は疲れた」と話しかけた場合、音声キャプチャ手段がその音声をキャプチャし、感情認識手段が「疲労」を感知する。生成系AIはこの感情に基づいて、「リラックスできる食事」を提案するレスポンスを生成する。このようにして、ユーザーの感情に応じた適切なフードデリバリーの提案が行われる。 For example, if a user says, "I'm tired today," the voice capture means captures the voice and the emotion recognition means detects "fatigue." Based on this emotion, the generative AI generates a response suggesting a "relaxing meal." In this way, appropriate food delivery suggestions are made according to the user's emotions.

生成AIモデルへ入力するプロンプト文の例としては、以下のようなものがある: Examples of prompts to input to a generative AI model include:

ユーザーの感情: 疲労 User Emotion: Fatigue

生成系AIへのプロンプト: "疲れているユーザーにおすすめのリラックスできる食事を提案してください。" Prompt for generative AI: "Please recommend a relaxing meal for a tired user."

このシステムにより、ユーザーはスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 This system allows users to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate their smartphone.

応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 18.

ステップ1: Step 1:

ユーザがスマートフォンに接続されたアクセサリー装置の指紋認証センサーに指を当てる。入力はユーザの指紋データであり、出力は認証結果である。アクセサリー装置は指紋データを読み取り、内部のデータベースと照合して認証を行う。認証が成功すると、次のステップに進む。 The user places their finger on the fingerprint authentication sensor of an accessory device connected to their smartphone. The input is the user's fingerprint data, and the output is the authentication result. The accessory device reads the fingerprint data and compares it with its internal database for authentication. If authentication is successful, the device proceeds to the next step.

ステップ2: Step 2:

認証が成功した場合、アクセサリー装置の操作手段が有効化される。ユーザはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行う。入力はユーザのクリック操作であり、出力はプロンプト入力のトリガーである。アクセサリー装置はクリック操作を検知し、生成系AIへのプロンプト入力を開始する。 If authentication is successful, the accessory device's operation means is enabled. The user uses the one-click operation means to input a prompt to the generative AI. The input is the user's click operation, and the output is the trigger for the prompt input. The accessory device detects the click operation and begins prompt input to the generative AI.

ステップ3: Step 3:

端末の音声キャプチャ手段がユーザの音声をキャプチャする。入力はユーザの音声データであり、出力はキャプチャされた音声データである。端末のマイクロフォンがユーザの音声を録音し、音声認識ソフトウェアがそのデータをデジタル形式に変換する。 The device's voice capture means captures the user's voice. The input is the user's voice data and the output is the captured voice data. The device's microphone records the user's voice and voice recognition software converts the data into digital form.

ステップ4: Step 4:

キャプチャされた音声データが感情認識手段に送信される。入力はキャプチャされた音声データであり、出力は認識された感情データである。感情エンジンが音声データを分析し、トーンや内容からユーザの感情を認識する。 The captured voice data is sent to the emotion recognition means. The input is the captured voice data and the output is the recognized emotion data. The emotion engine analyzes the voice data and recognizes the user's emotion from the tone and content.

ステップ5: Step 5:

認識された感情データが生成系AIにフィードバックされる。入力は認識された感情データであり、出力は生成系AIへのプロンプト文である。生成系AIは感情データに基づいて適切なレスポンスを生成するためのプロンプト文を作成する。 The recognized emotional data is fed back to the generative AI. The input is the recognized emotional data, and the output is a prompt sentence to the generative AI. The generative AI creates a prompt sentence to generate an appropriate response based on the emotional data.

ステップ6: Step 6:

生成系AIがプロンプト文に基づいて適切なレスポンスを生成する。入力はプロンプト文であり、出力は生成されたレスポンスである。生成系AIはプロンプト文を解析し、ユーザの感情に応じたフードデリバリーの提案を生成する。 The generative AI generates an appropriate response based on the prompt. The input is the prompt and the output is the generated response. The generative AI analyzes the prompt and generates food delivery suggestions based on the user's emotions.

ステップ7: Step 7:

生成されたレスポンスがユーザに提供される。入力は生成されたレスポンスであり、出力はユーザへの提案である。端末のディスプレイや音声出力装置を通じて、ユーザに適切なフードデリバリーの提案が表示または音声で伝えられる。 The generated response is provided to the user. The input is the generated response, and the output is a suggestion to the user. Appropriate food delivery suggestions are displayed or spoken to the user via the terminal's display or audio output device.

特定処理部290は、特定処理の結果をスマート眼鏡214に送信する。スマート眼鏡214では、制御部46Aが、スピーカ240に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the smart glasses 214. In the smart glasses 214, the control unit 46A causes the speaker 240 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.

データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating voice, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.

生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>).

上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマート眼鏡214によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the smart glasses 214.

[第3実施形態] [Third embodiment]

図5には、第3実施形態に係るデータ処理システム310の構成の一例が示されている。 Figure 5 shows an example of the configuration of a data processing system 310 according to the third embodiment.

図5に示すように、データ処理システム310は、データ処理装置12及びヘッドセット型端末314を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 5, the data processing system 310 includes a data processing device 12 and a headset terminal 314. An example of the data processing device 12 is a server.

データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).

ヘッドセット型端末314は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及びディスプレイ343を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及びディスプレイ343も、バス52に接続されている。 The headset terminal 314 includes a computer 36, a microphone 238, a speaker 240, a camera 42, a communication I/F 44, and a display 343. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, the speaker 240, the camera 42, and the display 343 are also connected to the bus 52.

マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.

カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).

通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.

図6には、データ処理装置12及びヘッドセット型端末314の要部機能の一例が示されている。図6に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 6 shows an example of the main functions of the data processing device 12 and headset terminal 314. As shown in Figure 6, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.

特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.

ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.

ヘッドセット型端末314では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the headset terminal 314, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.

次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段を含む。具体的には、アクセサリー装置はBluetooth等の無線通信手段を用いてスマートフォンと接続され、生成系AIへのプロンプト入力はスマートフォン上で動作するアプリケーションを通じて行われる。ユーザー認証手段としては、指紋認証センサーが装置に組み込まれ、登録されたユーザーの指紋情報と照合することで認証を行う。操作手段としては、装置に設けられたボタンをユーザーが押すことで、生成系AIへのプロンプト入力が行われる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to generative AI, a user authentication means for operating the accessory device, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. Specifically, the accessory device is connected to the smartphone using a wireless communication means such as Bluetooth, and prompt input to the generative AI is performed through an application running on the smartphone. The user authentication means includes a fingerprint authentication sensor built into the device, which performs authentication by comparing the fingerprint information with the registered user's fingerprint. The operation means involves the user pressing a button on the device, which inputs prompts to the generative AI.

「形態例2」 "Example 2"

具体的な使用例としては、ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行い、認証が成功すると、装置のボタンが有効化される。ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 As a specific example of use, a user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device, and if authentication is successful, the button on the device is enabled. When the user presses the button, an application on the smartphone is launched and a prompt input is sent to the generative AI. This allows the user to easily utilize generative AI without having to operate the smartphone.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置をBluetooth等の無線通信手段を用いてスマートフォンと接続する。 Step 1: The user connects an accessory device that can be connected to a smartphone to the smartphone using a wireless communication method such as Bluetooth.

ステップ2:ユーザーがアクセサリー装置の指紋認証センサーに指を当て、指紋認証センサーが登録されたユーザーの指紋情報と照合することでユーザー認証を行う。 Step 2: The user places their finger on the fingerprint authentication sensor on the accessory device, and the fingerprint authentication sensor authenticates the user by matching it with the registered user's fingerprint information.

ステップ3:認証が成功すると、装置のボタンが有効化される。 Step 3: If authentication is successful, the device's buttons will be enabled.

ステップ4:ユーザーが装置のボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 4: When the user presses a button on the device, an application on the smartphone is launched and prompts are input to the generative AI.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行う。 Step 1: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device.

ステップ2:認証が成功すると、装置のボタンが有効化される。 Step 2: If authentication is successful, the device's buttons will be enabled.

ステップ3:ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 3: When the user presses the button, an application on the smartphone is launched and prompt input is sent to the generative AI.

ステップ4:これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 Step 4: This allows users to easily utilize generative AI without having to operate their smartphone.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来の生成系AIモデルを利用するシステムでは、ユーザーがプロンプト文を入力する際に、複雑な操作や多段階の認証が必要であり、ユーザーエクスペリエンスが低下する問題があった。また、生成結果を迅速かつ正確に取得するための効率的な手段が不足していた。これにより、ユーザーが生成系AIモデルを活用する際の利便性が損なわれていた。 In systems that use conventional generative AI models, users are required to perform complex operations and undergo multi-step authentication when entering prompt text, resulting in a poor user experience. Furthermore, there is a lack of efficient means for quickly and accurately obtaining generated results. This reduces the convenience for users when using generative AI models.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、該生成系AIへのプロンプト入力を行うためのアプリケーションをスマートフォン上で動作させる手段と、該生成系AIモデルにプロンプト文を送信し、生成結果を受信する手段と、を含む。これにより、ユーザーは簡単な操作で生成系AIモデルにプロンプト文を入力し、迅速かつ正確に生成結果を取得することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for running an application on the smartphone for inputting prompts to the generative AI; and means for sending prompts to the generative AI model and receiving generation results. This allows the user to input prompts to the generative AI model with simple operations and quickly and accurately obtain generation results.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持ち、アプリケーションをインストールして多様な機能を利用できる携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer, and can be used to install applications and utilize a variety of functions.

「アクセサリー装置」とは、スマートフォンに接続して追加の機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AI」とは、入力されたプロンプト文に基づいてテキストや画像などの生成を行う人工知能モデルである。 "Generative AI" is an artificial intelligence model that generates text, images, etc. based on input prompts.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為である。 "Prompt input" is the act of inputting instructions or questions to a generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術や装置である。 "User authentication means" refers to technology or devices used to verify a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーの身元を確認する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and verify the user's identity based on that information.

「操作手段」とは、ユーザーがアクセサリー装置やスマートフォンを操作するためのインターフェースや装置である。 "Operation means" refers to the interface or device that allows the user to operate the accessory device or smartphone.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースや装置である。 A "one-click operation means" is an interface or device that allows a user to perform a specific function with a single click.

「アプリケーション」とは、スマートフォン上で動作し、特定の機能やサービスを提供するソフトウェアである。 An "application" is software that runs on a smartphone and provides specific functions or services.

「生成結果」とは、生成系AIがプロンプト文に基づいて生成したテキストや画像などの出力物である。 "Generation results" are output such as text and images generated by the generative AI based on the prompt text.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を簡便に行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to easily input prompts into a generative AI model. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置: Accessory equipment:

アクセサリー装置は、スマートフォンに接続される外部デバイスであり、以下の主要な機能を持つ。 Accessory devices are external devices that connect to your smartphone and have the following main functions:

ユーザー認証手段: 指紋認証センサーを搭載し、ユーザーの指紋情報を読み取る。 User authentication method: Equipped with a fingerprint authentication sensor that reads the user's fingerprint information.

操作手段: ワンクリック操作が可能なボタンを備え、ユーザーが簡単に操作できる。 Operation method: Equipped with a one-click button, making it easy for users to operate.

スマートフォン: Smartphone:

スマートフォンは、アクセサリー装置とBluetooth等の無線通信手段を用いて接続される。スマートフォン上には、生成系AIモデルへのプロンプト入力を行うためのアプリケーションがインストールされている。 The smartphone is connected to the accessory device using wireless communication means such as Bluetooth. An application for providing prompt input to the generative AI model is installed on the smartphone.

生成系AIモデル: Generative AI model:

生成系AIモデルは、サーバ上で動作し、スマートフォンから送信されたプロンプト文に基づいてテキストや画像を生成する。 The generative AI model runs on a server and generates text and images based on prompts sent from the smartphone.

システムの動作 System Operation

ユーザー認証: User authentication:

ユーザは、アクセサリー装置に設置された指紋認証センサーに指を置く。アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。認証が成功すると、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 The user places their finger on the fingerprint authentication sensor installed on the accessory device. The accessory device reads the fingerprint information and compares it with the fingerprint information stored in its internal database. If authentication is successful, the accessory device sends a signal indicating successful authentication to the smartphone.

プロンプト入力: Prompt Input:

認証が成功した後、ユーザはアクセサリー装置のボタンを押す。スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。ユーザは、生成系AIモデルに対するプロンプト文を入力する。 After successful authentication, the user presses a button on the accessory device. The smartphone application launches and a prompt input screen appears. The user enters a prompt statement for the generative AI model.

生成AIモデルへの送信: Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 The smartphone sends the input prompt to the generative AI model. The server operates the generative AI model based on the received prompt and creates the generated results.

生成結果の表示: Display generated results:

サーバは、生成された結果をスマートフォンに送信する。スマートフォンは、受け取った生成結果をユーザに表示する。ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 The server sends the generated results to the smartphone. The smartphone displays the received results to the user. The user can check the displayed results and save or share them as needed.

具体例 Specific examples

ユーザが新しい詩を生成系AIに作成させたい場合の具体的な手順は以下の通りである。 If a user wants to have a generative AI create a new poem, the specific steps are as follows:

1. ユーザー認証: 1. User authentication:

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。 The user places their finger on the fingerprint authentication sensor on the accessory device.

アクセサリー装置は、指紋を読み取り、認証を行う。 The accessory device reads the fingerprint and performs authentication.

認証が成功すると、スマートフォンに認証成功の信号が送信される。 If authentication is successful, a signal indicating successful authentication will be sent to your smartphone.

2. プロンプト入力: 2. Prompt input:

ユーザは、アクセサリー装置のボタンを押す。 The user presses a button on the accessory device.

スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。 The smartphone application will launch and a prompt input screen will appear.

ユーザは、「新しい詩を作成してください」というプロンプト文を入力する。 The user enters the prompt text "Create a new poem."

3. 生成AIモデルへの送信: 3. Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。 The smartphone sends the entered prompt to the generative AI model.

サーバは、プロンプト文を基に生成AIモデルを動作させ、詩を生成する。 The server runs a generative AI model based on the prompt text to generate the poem.

4. 生成結果の表示: 4. Displaying the generated results:

サーバは、生成された詩をスマートフォンに送信する。 The server sends the generated poem to your smartphone.

スマートフォンは、受け取った詩をユーザに表示する。 The smartphone will then display the received poem to the user.

ユーザは、表示された詩を確認し、必要に応じて保存や共有を行う。 Users can review the displayed poems and save or share them as needed.

このようにして、ユーザはアクセサリー装置とスマートフォンを用いて生成系AIモデルに対するプロンプト入力を行い、生成結果を得ることができる。 In this way, users can use the accessory device and smartphone to provide prompt input to the generative AI model and obtain generated results.

実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.

ステップ1:アクセサリー装置の接続 Step 1: Connecting Accessory Devices

入力: ユーザがスマートフォンのBluetooth設定を開き、アクセサリー装置を選択する。 Input: User opens their smartphone's Bluetooth settings and selects an accessory device.

動作: スマートフォンは、Bluetoothを用いてアクセサリー装置と接続を確立する。 How it works: Your smartphone establishes a connection with the accessory device using Bluetooth.

出力: スマートフォンは、接続が成功したことを通知する。 Output: The smartphone notifies you that the connection was successful.

ステップ2:ユーザー認証 Step 2: User Authentication

入力: ユーザがアクセサリー装置の指紋認証センサーに指を置く。 Input: The user places their finger on the fingerprint sensor on the accessory device.

動作: アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。 How it works: The accessory device reads your fingerprint and compares it with the fingerprint information stored in its internal database.

出力: 認証が成功した場合、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 Output: If authentication is successful, the accessory device sends a signal to the smartphone indicating successful authentication.

ステップ3:プロンプト入力準備 Step 3: Prepare for prompt input

入力: スマートフォンが認証成功の信号を受け取る。 Input: The smartphone receives a signal indicating successful authentication.

動作: スマートフォンは、生成系AIへのプロンプト入力画面を表示する。 How it works: The smartphone displays a prompt input screen for the generative AI.

出力: ユーザは、プロンプト入力画面を確認し、プロンプト文の入力を開始する。 Output: The user sees the prompt input screen and begins entering the prompt statement.

ステップ4:プロンプト入力 Step 4: Enter the prompt

入力: ユーザがスマートフォンのアプリケーションを通じて生成系AIに対するプロンプト文を入力する。 Input: The user enters a prompt for the generative AI through a smartphone application.

動作: スマートフォンは、入力されたプロンプト文を受け取り、内部でデータ形式を整える。 How it works: The smartphone receives the entered prompt text and formats the data internally.

出力: 整えたプロンプト文が生成系AIモデルに送信される準備が整う。 Output: The prepared prompt is ready to be sent to the generative AI model.

ステップ5:生成AIモデルへの送信 Step 5: Send to the generative AI model

入力: スマートフォンが整えたプロンプト文を生成系AIモデルに送信する。 Input: The smartphone sends the prepared prompt to the generative AI model.

動作: サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 Operation: The server runs the generative AI model based on the received prompt text and creates the generated results.

出力: 生成された結果がサーバからスマートフォンに送信される。 Output: The generated results are sent from the server to the smartphone.

ステップ6:生成結果の表示 Step 6: View the generated results

入力: スマートフォンがサーバから生成結果を受け取る。 Input: The smartphone receives the generated results from the server.

動作: スマートフォンは、受け取った生成結果をユーザに表示する。 How it works: The smartphone displays the generated results to the user.

出力: ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 Output: The user checks the displayed generated results and saves or shares them as needed.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

工場内のロボットを効率的かつ安全に管理・操作するためには、迅速かつ正確な指示をロボットに伝達する必要がある。しかし、従来の方法では、操作が複雑であり、ユーザー認証のセキュリティも十分ではないため、誤操作や不正アクセスのリスクが存在する。これにより、工場の生産性や安全性が低下する可能性がある To efficiently and safely manage and operate robots in factories, it is necessary to transmit instructions to the robots quickly and accurately. However, conventional methods involve complex operations and lack sufficient user authentication security, creating the risk of operational errors and unauthorized access. This can potentially reduce factory productivity and safety.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、工場内のロボットを管理・操作するための指示を生成する手段と、該指示を無線通信手段を用いてロボットに送信する手段と、を含む。これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for generating instructions for managing and operating robots in a factory; and means for transmitting the instructions to the robots using wireless communication means. This makes it possible to efficiently and safely manage and operate robots in a factory.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続され、追加の機能を提供する装置である。 An "accessory device connectable to a smartphone" is a device that connects to a smartphone using wireless communication means and provides additional functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて指示や情報を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates instructions and information based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions and questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認し、認証するための機能である。 "User authentication means" is a function for verifying and authenticating a user's identity.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を用いてユーザーを認証する機能である。 "Fingerprint authentication means" is a function that scans a user's fingerprint and uses that information to authenticate the user.

「操作手段」とは、ユーザーが生成系AIに対してプロンプト入力を行うためのインターフェースである。 "Operation means" is an interface that allows the user to input prompts to the generative AI.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で生成系AIにプロンプト入力を行うための機能である。 "One-click operation means" is a function that allows the user to input prompts to the generative AI with a single click.

「工場内のロボットを管理・操作するための指示を生成する手段」とは、工場内のロボットに対して具体的な作業指示を生成するための機能である。 "Means for generating instructions for managing and operating robots within a factory" refers to a function for generating specific work instructions for robots within a factory.

「無線通信手段」とは、BluetoothやWi-Fiなどの無線通信技術を用いてデバイス間でデータを送受信するための機能である。 "Wireless communication means" refers to a function for sending and receiving data between devices using wireless communication technologies such as Bluetooth and Wi-Fi.

「ロボットに送信する手段」とは、生成された指示を無線通信手段を用いてロボットに送信するための機能である。 "Means for transmitting to robot" is a function for transmitting the generated instructions to the robot using wireless communication means.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、工場内のロボットを効率的かつ安全に管理・操作するシステムである。以下に、このシステムの具体的な実施形態について説明する。 This invention is a system that efficiently and safely manages and operates robots in a factory using accessory devices that can be connected to a smartphone. A specific embodiment of this system is described below.

システム構成 System Configuration

システムは、スマートフォン、アクセサリー装置、生成系AIモデル、無線通信手段、指紋認証手段、操作手段、工場ロボットから構成される。 The system consists of a smartphone, accessory devices, a generative AI model, wireless communication means, fingerprint authentication means, operation means, and a factory robot.

ハードウェア Hardware

スマートフォン: ユーザーインターフェースとして機能し、アクセサリー装置と無線通信手段を介して接続される。 Smartphone: Functions as a user interface and connects to accessory devices via wireless communication means.

アクセサリー装置: スマートフォンに接続され、指紋認証手段と操作手段を含む。 Accessory device: Connects to a smartphone and includes fingerprint authentication means and operation means.

指紋認証手段: ユーザーの指紋をスキャンし、認証を行う。 Fingerprint authentication method: Scans the user's fingerprint for authentication.

無線通信手段: BluetoothやWi-Fiなどを用いて、スマートフォンと工場ロボット間でデータを送受信する。 Wireless communication method: Data is sent and received between smartphones and factory robots using Bluetooth, Wi-Fi, etc.

工場ロボット: 指示を受けて動作を行う。 Factory robot: Receives instructions and performs actions.

ソフトウェア Software

生成系AIモデル: ユーザーからのプロンプト入力に基づいて、工場ロボットに対する具体的な指示を生成する。 Generative AI model: Generates specific instructions for factory robots based on prompt input from the user.

スマートフォンアプリケーション: ユーザーインターフェースを提供し、生成系AIモデルとの通信を管理する。 Smartphone application: Provides the user interface and manages communication with the generative AI model.

動作手順 Operating Procedure

1. ユーザー認証: ユーザーがアクセサリー装置に指を置き、指紋認証手段で認証を行う。認証が成功すると、ユーザーはプロンプト入力を行うことができる。 1. User authentication: The user places their finger on the accessory device and authenticates using the fingerprint authentication method. If authentication is successful, the user can enter prompts.

2. プロンプト入力: 認証されたユーザーが操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 2. Prompt input: An authenticated user uses an operation method (one-click operation method) to input a prompt to the generative AI model.

3. 指示生成: 生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 3. Instruction generation: Based on the prompts, the generative AI model generates specific instructions for the factory robot.

4. 指示送信: 生成された指示は、無線通信手段を用いて工場ロボットに送信される。 4. Instruction transmission: The generated instructions are transmitted to the factory robot using wireless communication means.

5. ロボット動作: 工場ロボットは受信した指示に従って動作を行う。 5. Robot operation: The factory robot operates according to the instructions it receives.

具体例 Specific examples

例えば、工場内でロボットが特定の作業を行う際に、管理者がスマートフォンとアクセサリー装置を使ってロボットに指示を出す。以下はプロンプト文の具体例である。 For example, when a robot needs to perform a specific task in a factory, a manager can use a smartphone and accessory devices to give the robot instructions. Below are some example prompts:

「組立ライン3に移動して溶接を開始する」 "Move to assembly line 3 and begin welding."

「検査エリアに移動して品質チェックを行う」 "Move to the inspection area to perform quality checks."

「部品Aを取りに行って、組立ライン2に運ぶ」 "Go get part A and take it to assembly line 2."

これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。システムは、ユーザー認証と生成系AIを活用して、誤操作や不正アクセスのリスクを低減し、工場の生産性と安全性を向上させる。 This makes it possible to efficiently and safely manage and operate robots within factories. The system utilizes user authentication and generative AI to reduce the risk of incorrect operation and unauthorized access, improving factory productivity and safety.

応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.

ステップ1: Step 1:

ユーザがアクセサリー装置に指を置き、指紋認証手段で認証を行う。 The user places their finger on the accessory device and is authenticated using the fingerprint authentication means.

入力:ユーザの指紋 Input: User's fingerprint

データ加工:指紋認証手段が指紋をスキャンし、登録された指紋データと照合する。 Data processing: The fingerprint authentication device scans the fingerprint and compares it with registered fingerprint data.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

具体的な動作:指紋認証センサーがユーザの指紋をスキャンし、内部データベースと照合して認証を行う。 Specific operation: The fingerprint authentication sensor scans the user's fingerprint and compares it with an internal database for authentication.

ステップ2: Step 2:

認証が成功すると、ユーザは操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 If authentication is successful, the user uses the operation means (one-click operation means) to input a prompt to the generative AI model.

入力:認証結果(成功)、ユーザのプロンプト文 Input: Authentication result (success), user prompt

データ加工:認証結果が成功の場合、プロンプト文を生成系AIモデルに送信する。 Data processing: If the authentication result is successful, a prompt text is sent to the generative AI model.

出力:生成系AIモデルへのプロンプト入力 Output: Prompt input to the generative AI model

具体的な動作:ユーザがボタンを押すと、スマートフォンアプリケーションがプロンプト文を生成系AIモデルに送信する。 Specific operation: When the user presses the button, the smartphone application sends a prompt statement to the generative AI model.

ステップ3: Step 3:

生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 Based on the prompts, a generative AI model generates specific instructions for the factory robot.

入力:ユーザのプロンプト文 Input: User prompt

データ加工:生成系AIモデルがプロンプト文を解析し、適切な指示を生成する。 Data processing: The generative AI model analyzes the prompt and generates appropriate instructions.

出力:工場ロボットへの指示 Output: Instructions to factory robots

具体的な動作:生成系AIモデルがプロンプト文を解析し、例えば「組立ライン3に移動して溶接を開始する」といった具体的な指示を生成する。 Specific actions: The generative AI model analyzes the prompt and generates specific instructions, such as "Move to assembly line 3 and start welding."

ステップ4: Step 4:

生成された指示は、無線通信手段を用いて工場ロボットに送信される。 The generated instructions are sent to the factory robot using wireless communication means.

入力:生成系AIモデルからの指示 Input: Instructions from a generative AI model

データ加工:指示を無線通信手段を介して工場ロボットに送信する。 Data processing: Send instructions to factory robots via wireless communication means.

出力:工場ロボットへの指示送信 Output: Send instructions to factory robots

具体的な動作:BluetoothやWi-Fiを用いて、スマートフォンから工場ロボットに指示を送信する。 Specific operation: Instructions are sent from a smartphone to a factory robot using Bluetooth or Wi-Fi.

ステップ5: Step 5:

工場ロボットは受信した指示に従って動作を行う。 The factory robot will act according to the instructions it receives.

入力:工場ロボットへの指示 Input: Instructions for factory robots

データ加工:工場ロボットが指示を解析し、対応する動作を実行する。 Data processing: Factory robots analyze instructions and perform corresponding actions.

出力:ロボットの動作 Output: Robot movement

具体的な動作:工場ロボットが「組立ライン3に移動して溶接を開始する」といった指示に従って動作を行う。 Specific operation: The factory robot operates according to instructions such as "move to assembly line 3 and start welding."

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来の生成AIモデルを利用するためには、ユーザーがスマートデバイスを直接操作し、プロンプト文を入力する必要があった。この操作は手間がかかり、特に手がふさがっている場合や、迅速な応答が求められる状況では不便である。また、セキュリティの観点からも、ユーザー認証が不十分な場合があり、第三者による不正利用のリスクが存在する。これらの課題を解決し、より手軽で安全に生成AIモデルを利用できるシステムが求められている To use conventional generative AI models, users had to manually operate their smart devices and input prompts. This was time-consuming and inconvenient, especially when their hands were full or when a quick response was required. Furthermore, from a security perspective, user authentication was sometimes insufficient, creating a risk of unauthorized use by third parties. A system that solves these issues and allows users to use generative AI models more easily and safely is needed.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、認証されたユーザーが操作するための操作手段と、操作手段を用いてスマートデバイスに信号を送信し、特定のアプリケーションを起動する手段と、起動したアプリケーションが生成AIモデルにプロンプト文を送信する手段と、生成AIモデルがプロンプト文に基づいて応答を生成し、スマートデバイスに応答を送信する手段と、を含む。これにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能となり、さらにユーザー認証手段によりセキュリティも向上する。 In this invention, the server includes a user authentication means, an operation means for operation by an authenticated user, a means for using the operation means to send a signal to the smart device and launch a specific application, a means for the launched application to send a prompt sentence to the generative AI model, and a means for the generative AI model to generate a response based on the prompt sentence and send the response to the smart device. This allows the user to easily use the generative AI model without having to directly operate the smart device, and the user authentication means also improves security.

「ユーザー認証手段」とは、ユーザーの身元を確認し、システムへのアクセスを許可するための手段である。 "User authentication means" refers to the means used to verify a user's identity and grant access to a system.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやデバイスである。 "Operation means" refers to the interface or device that allows the user to operate the system.

「スマートデバイス」とは、インターネットに接続可能で、アプリケーションを実行する機能を持つ電子機器である。 A "smart device" is an electronic device that can connect to the Internet and has the ability to run applications.

「信号を送信する手段」とは、操作手段からスマートデバイスに対して特定の指示やデータを送信するための手段である。 "Means for transmitting signals" refers to means for transmitting specific instructions or data from the operating means to the smart device.

「特定のアプリケーション」とは、特定の機能やサービスを提供するために設計されたソフトウェアプログラムである。 A "specific application" is a software program designed to provide a specific function or service.

「生成AIモデル」とは、入力されたプロンプト文に基づいて応答を生成する人工知能のモデルである。 A "generative AI model" is an artificial intelligence model that generates a response based on an input prompt.

「プロンプト文」とは、生成AIモデルに対して指示や質問を行うためのテキスト入力である。 A "prompt" is text input used to give instructions or ask questions to a generative AI model.

「応答を生成する手段」とは、生成AIモデルがプロンプト文に基づいて適切な応答を作成するための手段である。 "Means for generating a response" refers to the means by which a generative AI model creates an appropriate response based on a prompt.

「応答を送信する手段」とは、生成された応答をスマートデバイスに送信するための手段である。 "Means for sending a response" refers to means for sending the generated response to a smart device.

発明を実施するための形態 Form for implementing the invention

この発明は、ユーザーがスマートデバイスを直接操作することなく、生成AIモデルを利用するためのシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that allows users to use generative AI models without directly operating a smart device. Specific embodiments of this system are described below.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: アクセサリー装置(指紋認証センサー付き)、スマートデバイス(スマートフォンなど) Hardware: Accessory devices (with fingerprint authentication sensors), smart devices (smartphones, etc.)

ソフトウェア: 指紋認証システム、スマートデバイス用アプリケーション、生成AIモデル Software: Fingerprint authentication system, smart device application, generative AI model

システムの構成 System Configuration

1. ユーザー認証手段: 1. User authentication method:

ユーザーがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

指紋認証システムが指紋データをキャプチャし、ユーザーの認証を行う。 The fingerprint authentication system captures fingerprint data and authenticates the user.

2. 操作手段: 2. Operating means:

認証が成功すると、アクセサリー装置のボタンが有効化される。 If authentication is successful, the buttons on the accessory device will be enabled.

ユーザーが有効化されたボタンを押す。 The user presses the enabled button.

3. 信号送信手段: 3. Signal transmission method:

ボタンが押されると、アクセサリー装置がスマートデバイスに信号を送信する。 When the button is pressed, the accessory device sends a signal to the smart device.

スマートデバイスが信号を受信し、特定のアプリケーションを起動する。 The smart device receives the signal and launches a specific application.

4. プロンプト文送信手段: 4. Prompt sending method:

起動したアプリケーションが生成AIモデルにプロンプト文を送信する。 The launched application sends a prompt to the generative AI model.

プロンプト文は事前に設定されたものであり、ユーザーが生成AIモデルに対して行いたい指示や質問を含む。 Prompts are pre-defined and contain the instructions or questions the user wants to ask the generated AI model.

5. 応答生成手段: 5. Response generation method:

サーバが生成AIモデルを用いて、受信したプロンプト文に基づいて応答を生成する。 The server uses a generative AI model to generate a response based on the received prompt.

6. 応答送信手段: 6. Response sending method:

サーバが生成した応答をスマートデバイスに送信する。 The server generates a response and sends it to the smart device.

スマートデバイスが応答を受信し、ユーザーに表示する。 The smart device receives the response and displays it to the user.

具体例 Specific examples

ユーザーがアクセサリー装置の指紋認証センサーに指を当てると、端末が指紋データをキャプチャし、認証を行う。認証が成功すると、端末のボタンが有効化される。ユーザーがボタンを押すと、端末がスマートデバイスに信号を送信し、アプリケーションを起動する。アプリケーションが起動し、「今日の天気を教えて」というプロンプト文を生成AIモデルに送信する。サーバが生成AIモデルを用いて「今日の天気は晴れです」という応答を生成し、スマートデバイスに送信する。スマートデバイスが応答を表示し、ユーザーは画面で「今日の天気は晴れです」という情報を確認することができる。 When a user places their finger on the fingerprint authentication sensor on the accessory device, the terminal captures the fingerprint data and performs authentication. If authentication is successful, the button on the terminal is enabled. When the user presses the button, the terminal sends a signal to the smart device, which launches an application. The application launches and sends a prompt sentence, "Tell me what the weather is today," to the generative AI model. The server uses the generative AI model to generate a response, "Today's weather is sunny," and sends it to the smart device. The smart device displays the response, and the user can see the information, "Today's weather is sunny," on the screen.

プロンプト文の例 Example prompt

「今日の天気を教えて」 "Tell me what the weather is like today."

「次の会議の予定を確認して」 "Check the schedule for the next meeting."

「最新のニュースを教えて」 "Tell me the latest news."

このシステムにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能であり、さらにユーザー認証手段によりセキュリティも向上する。 This system allows users to easily use generative AI models without having to directly operate a smart device, and also improves security through user authentication measures.

実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.

プログラムの処理の流れ Program processing flow

ステップ1: Step 1:

ユーザがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

入力: ユーザの指紋 Input: User fingerprint

データ加工: 指紋認証センサーが指紋データをキャプチャする。 Data processing: The fingerprint sensor captures fingerprint data.

出力: キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、認証を行う。 The device captures the fingerprint data and performs authentication.

入力: キャプチャされた指紋データ Input: Captured fingerprint data

データ演算: 指紋認証システムが指紋データを解析し、ユーザの認証を行う。 Data calculation: The fingerprint authentication system analyzes the fingerprint data and authenticates the user.

出力: 認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ3: Step 3:

認証が成功すると、端末のボタンが有効化される。 If authentication is successful, the device's buttons will be enabled.

入力: 認証結果(成功) Input: Authentication result (success)

データ加工: 認証が成功した場合、端末のボタンを有効化する。 Data processing: If authentication is successful, enable the device button.

出力: 有効化されたボタン Output: Enabled button

ステップ4: Step 4:

ユーザがボタンを押す。 The user presses the button.

入力: 有効化されたボタン Input: Enabled button

データ加工: ボタンが押されたことを端末が検知する。 Data processing: The device detects that a button has been pressed.

出力: ボタン押下の信号 Output: Button press signal

ステップ5: Step 5:

端末がスマートデバイスに信号を送信し、アプリケーションを起動する。 The terminal sends a signal to the smart device to launch the application.

入力: ボタン押下の信号 Input: Button press signal

データ加工: 端末がスマートデバイスに信号を送信し、特定のアプリケーションを起動する。 Data processing: The terminal sends a signal to the smart device to launch a specific application.

出力: 起動されたアプリケーション Output: Launched application

ステップ6: Step 6:

アプリケーションが生成AIモデルにプロンプト文を送信する。 The application sends a prompt to the generative AI model.

入力: 起動されたアプリケーション Input: Launched application

データ加工: アプリケーションが事前に設定されたプロンプト文を生成AIモデルに送信する。 Data processing: The application sends pre-defined prompts to the generative AI model.

出力: 生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ7: Step 7:

サーバが生成AIモデルを用いて応答を生成する。 The server generates a response using a generative AI model.

入力: 生成AIモデルに送信されたプロンプト文 Input: Prompt sent to the generative AI model

データ演算: 生成AIモデルがプロンプト文を解析し、適切な応答を生成する。 Data calculation: The generative AI model analyzes the prompt and generates an appropriate response.

出力: 生成された応答 Output: Generated response

ステップ8: Step 8:

サーバが応答をスマートデバイスに送信する。 The server sends the response to the smart device.

入力: 生成された応答 Input: Generated response

データ加工: サーバが生成された応答をスマートデバイスに送信する。 Data processing: The server sends the generated response to the smart device.

出力: スマートデバイスに送信された応答 Output: Response sent to smart device

ステップ9: Step 9:

スマートデバイスが応答を表示する。 Your smart device will display the response.

入力: スマートデバイスに送信された応答 Input: Response sent to smart device

データ加工: スマートデバイスが受信した応答をユーザに表示する。 Data processing: The smart device displays the response received to the user.

出力: ユーザに表示された応答 Output: Response displayed to the user

このようにして、ユーザはスマートデバイスを直接操作することなく、生成AIモデルを利用することができる。 In this way, users can use generative AI models without directly operating their smart devices.

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来のフードデリバリーシステムでは、ユーザーがスマートフォンを操作して注文を行う必要があり、操作が煩雑であるという問題があった。また、ユーザー認証が不十分であるため、セキュリティ上のリスクも存在していた。さらに、音声認識を利用した注文システムが普及していないため、ユーザーの利便性が低かった。これらの問題を解決し、ユーザーが簡単かつ安全にフードデリバリーを利用できるシステムを提供することが求められている Traditional food delivery systems require users to use their smartphones to place orders, making them cumbersome to operate. In addition, insufficient user authentication poses security risks. Furthermore, voice recognition-based ordering systems are not widespread, resulting in low user convenience. There is a need to solve these problems and provide a system that allows users to use food delivery services easily and safely.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

スマートデバイスに接続可能な付属装置は、指紋認証により該付属装置を操作するユーザを認証する利用者認証手段と、前記付属装置に設けられたボタンであって、該利用者認証手段により認証されたユーザが前記生成系AIへの指示入力を行うために押下されるボタンと、前記ボタンの押下に応じて、ユーザの音声を認識する音声認識手段と、を含む。サーバは、該音声認識手段により取得された音声データを含むプロンプト文と、前記生成系AIとを用いて、前記生成系AIの出力を取得する手段を含む。前記プロンプト文は、フードデリバリーサービスで注文することを指示し、前記取得する手段は、フードデリバリーAPIを使用した注文の結果を取得する。これにより、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能となる。 An accessory device connectable to a smart device includes a user authentication means that authenticates a user operating the accessory device through fingerprint authentication, a button provided on the accessory device that a user authenticated by the user authentication means presses to input instructions to the generative AI, and a voice recognition means that recognizes the user's voice in response to the button being pressed. The server includes a means for acquiring the output of the generative AI using a prompt statement including voice data acquired by the voice recognition means and the generative AI. The prompt statement instructs the user to place an order through a food delivery service, and the acquiring means acquires the results of the order using a food delivery API. This allows users to easily and safely use food delivery services using only their voice, without having to operate their smartphone.

「スマートデバイス」とは、スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器である。 A "smart device" is a portable electronic device, such as a smartphone or tablet, that has internet connectivity and can run applications.

「付属装置」とは、スマートデバイスに接続して使用する追加のハードウェアであり、特定の機能を提供するための装置である。 An "accessory device" is additional hardware that is connected to a smart device to provide specific functionality.

「生成系AI」とは、ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術である。 "Generative AI" is an artificial intelligence technology that generates text and other content based on user instructions and prompts.

「指示入力」とは、ユーザーが生成系AIに対して行う命令や要求の入力である。 "Instruction input" refers to commands or requests that a user inputs to a generative AI.

「利用者認証手段」とは、ユーザーの身元を確認し、認証するための技術や装置である。 "User authentication means" refers to technology or devices used to verify and authenticate a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーを認証する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and authenticate the user based on that information.

「操作手段」とは、ユーザーが付属装置やスマートデバイスを操作するためのインターフェースやボタンである。 "Operation means" refers to the interface or buttons that users use to operate accessory devices or smart devices.

「音声認識手段」とは、ユーザーの音声を解析し、テキストデータに変換する技術や装置である。 "Voice recognition means" refers to technology or devices that analyze the user's voice and convert it into text data.

「音声データ」とは、ユーザーが発した音声をデジタル形式で記録したデータである。 "Voice data" refers to data that has been digitally recorded from the user's voice.

「送信手段」とは、データを他の装置やシステムに送信するための技術や装置である。 "Transmission means" refers to the technology or equipment used to transmit data to other devices or systems.

この発明は、スマートデバイスに接続可能な付属装置を用いて、ユーザーが生成系AIを簡単かつ安全に利用できるシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that allows users to easily and safely use generative AI using an accessory device that can be connected to a smart device. Specific embodiments of this system are described below.

システムの構成 System Configuration

システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートデバイス:スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器。 1. Smart device: A portable electronic device such as a smartphone or tablet that has internet connectivity and can run applications.

2. 付属装置:スマートデバイスに接続して使用する追加のハードウェアであり、指紋認証手段、操作手段、音声認識手段を含む。 2. Accessory device: Additional hardware that is connected to a smart device and used, including fingerprint authentication means, operation means, and voice recognition means.

3. 生成系AI:ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術。 3. Generative AI: Artificial intelligence technology that generates text and other content based on user instructions and prompts.

プログラムの処理 Program processing

ハードウェア Hardware

指紋認証センサー:ユーザーの指紋を読み取り、その情報を基にユーザーを認証する。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates the user based on that information.

スマートデバイス:アプリケーションの実行環境として機能する。 Smart device: Functions as the application execution environment.

マイクロフォン:音声認識手段としてユーザーの音声を取得する。 Microphone: Captures the user's voice as a means of voice recognition.

ソフトウェア Software

指紋認証ライブラリ:指紋認証を行うためのソフトウェアモジュール。 Fingerprint authentication library: A software module for performing fingerprint authentication.

音声認識ライブラリ:音声をテキストデータに変換するためのソフトウェアモジュール(例:Google(登録商標) Speech-to-Text)。 Speech recognition library: A software module for converting speech into text data (e.g., Google® Speech-to-Text).

生成系AIモデル:ユーザーのプロンプトに基づいて応答を生成するAIモデル(例:GPT-3(登録商標))。 Generative AI model: An AI model that generates responses based on user prompts (e.g., GPT-3 (registered trademark)).

フードデリバリーAPI:フードデリバリーサービスのAPIを使用して注文を行う。 Food delivery API: Place orders using the food delivery service's API.

処理の流れ Processing flow

1. ユーザー認証:ユーザーが付属装置の指紋認証センサーに指を当てることで認証を行う。認証が成功すると、次のステップに進む。 1. User authentication: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device. If authentication is successful, the device proceeds to the next step.

2. 音声入力:ユーザーが付属装置の操作手段(ワンクリックボタン)を押しながら、音声で注文内容を伝える。マイクロフォンが音声を取得し、音声認識ライブラリがこれをテキストデータに変換する。 2. Voice input: The user presses the operation means (one-click button) of the attached device and verbally states the order details. The microphone picks up the voice, and the voice recognition library converts it into text data.

3. プロンプト生成:取得されたテキストデータを基に、生成系AIに対するプロンプト文を生成する。 3. Prompt generation: Generate a prompt sentence for the generative AI based on the acquired text data.

4. AI応答生成:生成系AIモデルがプロンプト文に基づいて最適な応答を生成する。 4. AI response generation: The generative AI model generates the optimal response based on the prompt.

5. 注文実行:生成された応答を基に、フードデリバリーAPIを使用して注文を完了する。 5. Order execution: Based on the generated response, the order is completed using the food delivery API.

具体例 Specific examples

ユーザーが指紋認証センサーに指を当てて認証し、「ピザを注文したい」と音声で伝えると、音声認識ライブラリがこれをテキストデータに変換する。生成系AIモデルに「ユーザーが注文したいのは: ピザ」というプロンプト文を入力すると、生成系AIモデルが最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 When a user places their finger on the fingerprint sensor for authentication and says "I want to order pizza," the speech recognition library converts this into text data. When the generative AI model receives the prompt "The user wants to order: pizza," the generative AI model suggests the most suitable pizza restaurant and menu item, and completes the order using a food delivery API.

プロンプト文の例 Example prompt

「ユーザーが注文したいのは: ピザ」 "User wants to order: Pizza"

このようにして、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能である。 In this way, users can easily and safely use food delivery services using only their voice, without having to operate their smartphone.

応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋データ。 Input: User's fingerprint data.

処理:指紋認証ライブラリが指紋データを解析し、登録された指紋データと照合する。 Processing: The fingerprint authentication library analyzes the fingerprint data and compares it with registered fingerprint data.

出力:認証結果(成功または失敗)。 Output: Authentication result (success or failure).

具体的な動作:指紋認証センサーがユーザの指紋を読み取り、指紋認証ライブラリがそのデータを解析して認証を行う。 Specific operation: The fingerprint authentication sensor reads the user's fingerprint, and the fingerprint authentication library analyzes the data to perform authentication.

ステップ2: Step 2:

ユーザが付属装置の操作手段(ワンクリックボタン)を押す。 The user presses the operating means (one-click button) of the accessory device.

入力:ユーザの操作(ボタン押下)。 Input: User operation (button press).

処理:操作手段が押下されたことを検知し、音声認識モードを起動する。 Processing: Detects that the operating means has been pressed and activates voice recognition mode.

出力:音声認識モードの起動。 Output: Activate voice recognition mode.

具体的な動作:ボタンが押されたことをセンサーが検知し、音声認識ライブラリが音声入力の準備を開始する。 Specific operation: The sensor detects that a button has been pressed, and the voice recognition library begins preparing for voice input.

ステップ3: Step 3:

ユーザが音声で注文内容を伝える。 The user verbally communicates the order details.

入力:ユーザの音声データ。 Input: User's voice data.

処理:マイクロフォンが音声データを取得し、音声認識ライブラリがこれをテキストデータに変換する。 Processing: The microphone captures the audio data, and the speech recognition library converts it into text data.

出力:テキストデータ(注文内容)。 Output: Text data (order details).

具体的な動作:マイクロフォンがユーザの音声をキャプチャし、音声認識ライブラリがその音声を解析してテキストに変換する。 Specific operation: The microphone captures the user's voice, and the speech recognition library analyzes the voice and converts it into text.

ステップ4: Step 4:

端末が取得されたテキストデータを基にプロンプト文を生成する。 The device generates a prompt based on the acquired text data.

入力:テキストデータ(注文内容)。 Input: Text data (order details).

処理:テキストデータを「ユーザーが注文したいのは: [注文内容]」という形式のプロンプト文に変換する。 Processing: Convert the text data into a prompt in the format "The user would like to order: [Order details]".

出力:プロンプト文。 Output: Prompt statement.

具体的な動作:テキストデータをフォーマットに従ってプロンプト文に変換する。 Specific operation: Converts text data into prompt text according to the format.

ステップ5: Step 5:

端末が生成系AIモデルにプロンプト文を送信する。 The device sends a prompt to the generative AI model.

入力:プロンプト文。 Input: Prompt text.

処理:生成系AIモデルがプロンプト文を解析し、最適な応答を生成する。 Processing: The generative AI model analyzes the prompt and generates the optimal response.

出力:AI応答(最適な注文内容)。 Output: AI response (optimal order content).

具体的な動作:プロンプト文を生成系AIモデルに送信し、AIが応答を生成する。 Specific operation: The prompt sentence is sent to the generative AI model, and the AI generates a response.

ステップ6: Step 6:

端末が生成された応答を基にフードデリバリーAPIを使用して注文を完了する。 The device uses the food delivery API based on the generated response to complete the order.

入力:AI応答(最適な注文内容)。 Input: AI response (optimal order content).

処理:フードデリバリーAPIを使用して注文を実行する。 Processing: Fulfill orders using the food delivery API.

出力:注文確認(注文が正常に完了したことを示すデータ)。 Output: Order confirmation (data indicating the order was completed successfully).

具体的な動作:AI応答をフードデリバリーAPIに送信し、注文を確定する。 Specific operation: Sends the AI response to the food delivery API and confirms the order.

なお、サーバは、後述する感情エンジンを用いてユーザの感情を認識する手段を更に含み、該音声認識手段により取得された音声データ、及び前記ユーザの感情を含むプロンプト文と、前記生成系AIとを用いて、生成系AIの出力を取得するようにしてもよい。例えば、ユーザの感情が、「悲しみ」であると認識された場合には、「ユーザーが注文したいのは: ピザ、ユーザの感情:悲しみ」というプロンプト文を生成し、生成系AIモデルが、ユーザの感情を考慮した最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 The server may further include means for recognizing the user's emotions using an emotion engine, which will be described later, and may obtain the output of the generative AI using the voice data acquired by the voice recognition means, a prompt statement including the user's emotion, and the generative AI. For example, if the user's emotion is recognized as "sadness," a prompt statement such as "User wants to order: pizza, user's emotion: sadness" may be generated, and the generative AI model may suggest the optimal pizza restaurant and menu item taking the user's emotion into consideration, and the order may be completed using a food delivery API.

なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段、ユーザー認証手段、およびユーザー認証手段により認証されたユーザーが生成系AIへのプロンプト入力を行うための操作手段を含む。さらに、この装置はユーザーの感情を認識する感情エンジンを含む。具体的には、ユーザーの声のトーンや顔の表情から感情を認識し、その情報を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to the generative AI, a user authentication means, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. The device also includes an emotion engine that recognizes the user's emotions. Specifically, it recognizes emotions from the user's tone of voice and facial expression, and feeds this information back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotions.

「形態例2」 "Example 2"

本発明の別の実施形態として、感情エンジンがユーザーの声のトーンから感情を認識するシステムが提供される。具体的には、ユーザーがアクセサリー装置に話しかけると、装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。感情エンジンは音声データのトーンからユーザーの感情を分析し、その結果を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 Another embodiment of the present invention provides a system in which an emotion engine recognizes emotions from the tone of a user's voice. Specifically, when a user speaks to an accessory device, a microphone within the device captures the user's voice and transmits the voice data to the emotion engine. The emotion engine analyzes the user's emotion from the tone of the voice data and feeds the results back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotion.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置を操作する。 Step 1: The user operates an accessory device that can be connected to a smartphone.

ステップ2:装置のユーザー認証手段がユーザーを認証する。認証方法としては、例えば指紋認証が考えられる。 Step 2: The device's user authentication means authenticates the user. One possible authentication method is fingerprint authentication.

ステップ3:認証されたユーザーが生成系AIへのプロンプト入力を行う。 Step 3: The authenticated user provides prompt input to the generative AI.

ステップ4:装置の感情エンジンがユーザーの声のトーンや顔の表情から感情を認識する。 Step 4: The device's emotion engine recognizes emotions from the user's tone of voice and facial expressions.

ステップ5:感情エンジンがその情報を生成系AIにフィードバックする。 Step 5: The emotion engine feeds that information back to the generative AI.

ステップ6:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 6: The generative AI generates an appropriate response based on the user's emotions.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置に話しかける。 Step 1: The user speaks to the accessory device.

ステップ2:装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。 Step 2: The device's microphone captures the user's voice and sends the audio data to the emotion engine.

ステップ3:感情エンジンが音声データのトーンからユーザーの感情を分析する。 Step 3: The emotion engine analyzes the user's emotions from the tone of the voice data.

ステップ4:感情エンジンがその結果を生成系AIにフィードバックする。 Step 4: The emotion engine feeds the results back to the generative AI.

ステップ5:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 5: The generative AI generates an appropriate response based on the user's emotions.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来のスマートフォンに接続可能なアクセサリー装置では、生成系AIモデルへのプロンプト入力が可能であるが、ユーザーの感情状態を考慮したレスポンスを生成することができないという課題があった。これにより、ユーザーの意図や感情に応じた適切なレスポンスを得ることが難しく、ユーザーエクスペリエンスが向上しないという問題が生じていた Existing smartphone accessory devices allow prompt input to generative AI models, but they have the problem of being unable to generate responses that take the user's emotional state into account. This makes it difficult to obtain appropriate responses based on the user's intentions and emotions, resulting in a lack of improvement in the user experience.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIモデルへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIモデルにフィードバックする手段と、を含む。これにより、ユーザーの感情状態を考慮した適切なレスポンスを生成系AIモデルから得ることが可能となる。 In this invention, the server is an accessory device connectable to a smartphone, and includes: means for enabling prompt input to the generative AI model; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI model; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI model. This makes it possible to obtain an appropriate response from the generative AI model that takes into account the user's emotional state.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持つ携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer.

「アクセサリー装置」とは、スマートフォンに接続して追加機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AIモデル」とは、入力されたプロンプトに基づいてテキストや音声などの出力を生成する人工知能システムである。 A "generative AI model" is an artificial intelligence system that generates output such as text or voice based on input prompts.

「プロンプト入力」とは、ユーザーが生成系AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術手段である。 "User authentication means" refers to technical means for verifying a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基に認証を行う技術手段である。 "Fingerprint authentication means" refers to a technical means that reads a user's fingerprint and performs authentication based on that information.

「操作手段」とは、ユーザーがアクセサリー装置を操作するためのインターフェースである。 "Operation means" refers to the interface that allows the user to operate the accessory device.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できるインターフェースである。 A "one-click operation method" is an interface that allows users to complete an operation with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を解析して感情を認識する技術手段である。 "Emotion recognition means" refers to a technical means for recognizing emotions by analyzing the user's tone of voice and facial expressions.

「感情情報」とは、感情認識手段によって取得されたユーザーの感情状態に関するデータである。 "Emotion information" is data regarding the user's emotional state obtained by emotion recognition means.

「フィードバック手段」とは、取得された感情情報を生成系AIモデルに送信する技術手段である。 "Feedback means" refers to the technical means for transmitting acquired emotional information to the generative AI model.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を行い、ユーザーの感情状態を考慮したレスポンスを得るシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to provide prompt input to a generative AI model and obtain a response that takes into account the user's emotional state. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置 Accessory equipment

アクセサリー装置は、スマートフォンにBluetoothなどの無線通信手段を用いて接続される。この装置には、以下の主要なコンポーネントが含まれる: The accessory device connects to your smartphone using wireless communication methods such as Bluetooth. The device includes the following main components:

指紋認証センサー:ユーザーの指紋を読み取り、認証を行う。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates them.

操作ボタン:ユーザーがプロンプト入力を開始するためのインターフェース。 Action button: An interface that allows the user to start prompt input.

感情認識エンジン:ユーザーの声のトーンや顔の表情を解析し、感情情報を取得する。 Emotion recognition engine: Analyzes the user's tone of voice and facial expressions to obtain emotional information.

スマートフォン Smartphone

スマートフォンは、アクセサリー装置と連携して動作する専用アプリケーションを実行する。このアプリケーションは、以下の機能を提供する: The smartphone runs a dedicated application that works in conjunction with the accessory device. This application provides the following functions:

プロンプト入力インターフェース:ユーザーが生成系AIモデルに対して指示や質問を入力するための画面。 Prompt input interface: A screen where users can enter instructions or questions for the generative AI model.

データ送信機能:プロンプトと感情情報をサーバに送信する。 Data transmission function: Sends prompts and emotion information to the server.

サーバ Server

サーバは、スマートフォンと生成系AIモデルの間でデータ通信を行うバックエンドサービスを提供する。サーバは、以下の機能を持つ: The server provides backend services that handle data communication between smartphones and generative AI models. The server has the following functions:

データ中継機能:スマートフォンから受信したプロンプトと感情情報を生成系AIモデルに送信する。 Data relay function: Sends prompts and emotional information received from a smartphone to the generative AI model.

レスポンス受信機能:生成系AIモデルからのレスポンスを受信し、スマートフォンに転送する。 Response reception function: Receives responses from the generative AI model and forwards them to the smartphone.

具体例 Specific examples

ユーザがスマートフォンに接続されたアクセサリー装置を使用して、生成系AIモデルに対して質問を行うシナリオを考える。 Consider a scenario in which a user uses an accessory device connected to a smartphone to ask a generative AI model questions.

1. ユーザ認証 1. User authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置き、認証を行う。端末(スマートフォン)は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。認証が成功すると、ユーザは次のステップに進むことができる。 The user places their finger on the accessory device's fingerprint authentication sensor to authenticate. The terminal (smartphone) receives the fingerprint data from the accessory device and compares it with registered fingerprint data. If authentication is successful, the user can proceed to the next step.

2. プロンプト入力 2. Prompt Input

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。 The user opens a dedicated application on their smartphone and enters a prompt. For example, they might enter, "What's the weather like today?" The device then prepares to send this prompt to the generative AI model.

3. 感情認識 3. Emotion recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。端末は、この感情データを生成系AIモデルに送信するために準備する。 The accessory device analyzes the user's emotional state using an emotion engine that senses the user's tone of voice and facial expressions. The device prepares this emotion data to send to the generative AI model.

4. 生成系AIモデルへのプロンプト送信 4. Sending prompts to generative AI models

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。サーバは、これらのデータを生成系AIモデルに送信する。生成系AIモデルは、プロンプトと感情データを基に適切なレスポンスを生成する。 The device sends the prompt and emotion data entered by the user to the server. The server then sends this data to the generative AI model. The generative AI model generates an appropriate response based on the prompt and emotion data.

5. 生成系AIモデルからのレスポンス受信 5. Receiving responses from generative AI models

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。端末は、このレスポンスをユーザに表示する準備を行う。 The server receives the response from the generative AI model and forwards it to the device. The device then prepares to display this response to the user.

6. レスポンスの表示 6. Displaying the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it might say, "It's sunny today. Have a nice day." The user can review this response and enter further prompts if necessary.

プロンプト文の例 Example prompt

「今日の天気はどうですか?」 "What's the weather like today?"

「次の会議の予定を教えてください。」 "Please let me know when the next meeting is scheduled."

「最近のニュースを教えてください。」 "Please tell me the latest news."

このようにして、ユーザはアクセサリー装置を通じて生成系AIモデルと自然な対話を行うことができる。 In this way, users can naturally interact with generative AI models through accessory devices.

実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.

ステップ1:ユーザ認証 Step 1: User Authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。端末は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。入力はユーザの指紋データであり、出力は認証結果である。端末は、指紋データを解析し、登録データと一致するかどうかを確認する。認証が成功すると、端末は「認証成功」と表示する。 The user places their finger on the fingerprint authentication sensor of the accessory device. The terminal receives the fingerprint data from the accessory device and compares it with registered fingerprint data. The input is the user's fingerprint data, and the output is the authentication result. The terminal analyzes the fingerprint data and checks whether it matches the registered data. If authentication is successful, the terminal displays "Authentication successful."

ステップ2:アクセサリー装置とスマートフォンの接続 Step 2: Connect your accessory device to your smartphone

端末は、Bluetooth通信を介してアクセサリー装置と接続を確立する。入力はBluetooth接続要求であり、出力は接続状態である。端末は、アクセサリー装置からの接続要求を受け取り、接続を確立する。サーバは、この接続を監視し、必要に応じてデータの中継を行う。接続が成功すると、端末は「接続成功」と表示する。 The terminal establishes a connection with an accessory device via Bluetooth communication. The input is a Bluetooth connection request and the output is the connection status. The terminal receives a connection request from the accessory device and establishes the connection. The server monitors this connection and relays data as necessary. If the connection is successful, the terminal displays "Connection successful."

ステップ3:プロンプト入力 Step 3: Enter the prompt

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。入力はユーザのプロンプト文であり、出力はプロンプトデータである。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。ユーザが入力を完了すると、端末は「プロンプト入力完了」と表示する。 The user opens a dedicated application on their smartphone and inputs a prompt. For example, they might input "What's the weather like today?" The input is the user's prompt, and the output is the prompt data. The device prepares to send this prompt to the generative AI model. When the user has completed their input, the device displays "Prompt input completed."

ステップ4:感情認識 Step 4: Emotion Recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。入力はユーザの声のトーンや顔の表情データであり、出力は感情データである。端末は、この感情データを生成系AIモデルに送信するために準備する。感情データが取得されると、端末は「感情データ取得成功」と表示する。 The accessory device uses an emotion engine that senses the user's vocal tone and facial expressions to analyze the user's emotional state. The input is the user's vocal tone and facial expression data, and the output is emotion data. The device prepares this emotion data to send to the generative AI model. Once the emotion data is acquired, the device displays "Emotion data acquisition successful."

ステップ5:生成系AIモデルへのプロンプト送信 Step 5: Send prompts to the generative AI model

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。入力はプロンプトデータと感情データであり、出力はサーバへの送信結果である。サーバは、これらのデータを生成系AIモデルに送信する。データ送信が成功すると、端末は「データ送信成功」と表示する。 The device sends the prompt and emotion data entered by the user to the server. The input is the prompt data and emotion data, and the output is the result of transmission to the server. The server then sends this data to the generative AI model. If the data transmission is successful, the device displays "Data transmission successful."

ステップ6:生成系AIモデルからのレスポンス受信 Step 6: Receive a response from the generative AI model

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。入力は生成系AIモデルからのレスポンスデータであり、出力は端末への転送結果である。端末は、このレスポンスをユーザに表示する準備を行う。レスポンスが受信されると、端末は「レスポンス受信成功」と表示する。 The server receives the response from the generative AI model and forwards it to the device. The input is the response data from the generative AI model, and the output is the result of forwarding to the device. The device prepares to display this response to the user. Once the response is received, the device displays "Response received successfully."

ステップ7:レスポンスの表示 Step 7: View the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。入力は生成系AIモデルからのレスポンスデータであり、出力はユーザへの表示結果である。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it displays "It's sunny today. Have a nice day." The input is the response data from the generative AI model, and the output is the display result to the user. The user can review this response and enter further prompts if necessary.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来のフードデリバリーサービスでは、ユーザーの感情や状況に応じたカスタマイズされた提案を行うことが難しかった。また、ユーザーが生成系AIを利用して注文プロセスを簡素化するための手段が不足していた。これにより、ユーザーエクスペリエンスが低下し、サービスの利用頻度が減少する可能性があった Traditional food delivery services struggled to provide customized recommendations based on users' emotions and circumstances. They also lacked a means for users to use generative AI to simplify the ordering process. This could result in a poor user experience and reduced frequency of service use.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIにフィードバックする手段と、を含む。これにより、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI. This makes it possible to propose customized food delivery according to the user's emotions.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続される外部デバイスであり、特定の機能を提供するものである。 An "accessory device connectable to a smartphone" is an external device that connects to a smartphone using wireless communication means and provides specific functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて応答や提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates responses and suggestions based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions or questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術であり、特定のユーザーのみがシステムを操作できるようにするものである。 "User authentication means" refers to technology used to verify a user's identity and ensure that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を基にユーザーを認証する技術である。 "Fingerprint authentication" is a technology that scans a user's fingerprint and authenticates the user based on that information.

「操作手段」とは、ユーザーがシステムを操作するための物理的またはソフトウェア的なインターフェースである。 "Operation means" refers to the physical or software interface that allows the user to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースである。 A "one-click operation means" is an interface that allows users to perform a specific function with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を分析し、その感情を認識する技術である。 "Emotion recognition means" is a technology that analyzes the user's tone of voice and facial expressions to recognize their emotions.

「感情情報を生成系AIにフィードバックする手段」とは、認識された感情情報を生成系AIに送信し、生成系AIがその情報を基に応答や提案を生成するための機能である。 "Means for feeding back emotional information to the generative AI" is a function that sends recognized emotional information to the generative AI, allowing the generative AI to generate responses and suggestions based on that information.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、ユーザーが生成系AIを通じてフードデリバリーサービスを利用する際に、注文プロセスを簡素化し、ユーザーの感情に応じたカスタマイズされた提案を行うシステムである。 This invention is a system that uses an accessory device connectable to a smartphone to simplify the ordering process when a user uses a food delivery service through generative AI and makes customized suggestions based on the user's emotions.

システムの構成 System Configuration

このシステムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートフォンに接続可能なアクセサリー装置 1. Accessory devices that can be connected to smartphones

無線通信手段: Bluetoothなどを用いてスマートフォンと接続される。 Wireless communication method: Connects to a smartphone using Bluetooth or other means.

ユーザー認証手段: 指紋認証センサーを用いてユーザーを認証する。 User authentication method: User authentication is performed using a fingerprint sensor.

操作手段: ワンクリック操作手段を用いて、ユーザーが生成系AIへのプロンプト入力を行う。 Operation method: The user uses a one-click operation method to input prompts to the generative AI.

感情認識手段: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 Emotion recognition: Analyzes the user's tone of voice and facial expressions to recognize emotions.

2. 生成系AI 2. Generative AI

プロンプト入力: ユーザーからの指示や質問を受け取り、応答や提案を生成する。 Prompt Input: Receives instructions or questions from the user and generates responses or suggestions.

感情情報のフィードバック: 認識された感情情報を基に、カスタマイズされた応答や提案を生成する。 Emotional feedback: Generate customized responses and suggestions based on recognized emotional information.

プログラムの処理 Program processing

サーバは、以下のような処理を行う: The server performs the following process:

1. Bluetooth接続: スマートフォンとアクセサリー装置をBluetoothを用いて接続する。 1. Bluetooth connection: Connect your smartphone and accessory device using Bluetooth.

2. ユーザー認証: 指紋認証センサーを用いてユーザーの指紋をスキャンし、認証を行う。 2. User authentication: The fingerprint sensor scans the user's fingerprint for authentication.

3. 感情認識: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 3. Emotion recognition: Analyze the user's tone of voice and facial expressions to recognize emotions.

4. プロンプト生成: 認識された感情に基づいて、生成系AIへのプロンプトを生成する。 4. Prompt generation: Generate prompts for the generative AI based on the recognized emotions.

5. AI応答生成: 生成系AIを用いて、プロンプトに対する応答や提案を生成する。 5. AI Response Generation: Use generative AI to generate responses and suggestions to prompts.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: Bluetoothモジュール、指紋認証センサー、カメラ(顔認識用)、マイク(音声認識用) Hardware: Bluetooth module, fingerprint sensor, camera (for facial recognition), microphone (for voice recognition)

ソフトウェア: Bluetooth接続ライブラリ、指紋認証ライブラリ、感情認識エンジン、生成系AIモデル Software: Bluetooth connection library, fingerprint authentication library, emotion recognition engine, generative AI model

具体例 Specific examples

ユーザーが疲れていると認識された場合、生成系AIは「疲れているときにおすすめのフードデリバリー」を提案する。例えば、以下のようなプロンプト文が生成される: If the generative AI recognizes that the user is tired, it will suggest "food delivery options recommended for when you're tired." For example, it might generate a prompt like this:

ユーザーは疲れている気分です。おすすめのフードデリバリーを提案してください。 The user is feeling tired. Please suggest some food delivery options.

このようにして、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this way, it becomes possible to offer customized food delivery suggestions based on the user's emotions.

応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.

ステップ1: Step 1:

サーバは、Bluetoothモジュールを用いてスマートフォンとアクセサリー装置を接続する。入力はスマートフォンとアクセサリー装置のペアリング情報であり、出力は接続の確立である。具体的には、Bluetooth接続ライブラリを使用して、スマートフォンとアクセサリー装置間の通信を確立する。 The server connects the smartphone and accessory device using a Bluetooth module. The input is pairing information between the smartphone and accessory device, and the output is the establishment of the connection. Specifically, it uses the Bluetooth connection library to establish communication between the smartphone and accessory device.

ステップ2: Step 2:

端末は、指紋認証センサーを用いてユーザーの指紋をスキャンし、ユーザー認証を行う。入力はユーザーの指紋データであり、出力は認証結果である。具体的には、指紋認証ライブラリを使用して、スキャンされた指紋データを登録済みのデータと照合し、認証の成否を判断する。 The device uses a fingerprint authentication sensor to scan the user's fingerprint and perform user authentication. The input is the user's fingerprint data, and the output is the authentication result. Specifically, the fingerprint authentication library is used to compare the scanned fingerprint data with registered data to determine whether authentication was successful.

ステップ3: Step 3:

端末は、マイクとカメラを用いてユーザーの声のトーンと顔の表情をキャプチャし、感情認識を行う。入力は音声データと画像データであり、出力は認識された感情情報である。具体的には、感情認識エンジンを使用して、音声データと画像データを解析し、ユーザーの感情を特定する。 The device uses a microphone and camera to capture the user's tone of voice and facial expressions to perform emotion recognition. The input is voice data and image data, and the output is recognized emotional information. Specifically, an emotion recognition engine is used to analyze the voice data and image data to identify the user's emotions.

ステップ4: Step 4:

サーバは、認識された感情情報を基に生成系AIへのプロンプトを生成する。入力は感情情報であり、出力はプロンプト文である。具体的には、感情情報をテキスト形式に変換し、生成系AIに適したプロンプト文を作成する。 The server generates a prompt for the generative AI based on the recognized emotional information. The input is emotional information, and the output is a prompt. Specifically, the emotional information is converted into text format and a prompt suitable for the generative AI is created.

ステップ5: Step 5:

サーバは、生成系AIモデルを用いてプロンプト文に対する応答や提案を生成する。入力はプロンプト文であり、出力は生成された応答や提案である。具体的には、生成系AIモデルにプロンプト文を入力し、AIが応答や提案を生成する。 The server uses a generative AI model to generate responses and suggestions in response to prompts. The input is the prompt, and the output is the generated response or suggestion. Specifically, the prompt is input into the generative AI model, and the AI generates the response or suggestion.

ステップ6: Step 6:

端末は、生成された応答や提案をユーザーに提示する。入力は生成された応答や提案であり、出力はユーザーへの表示である。具体的には、スマートフォンのディスプレイに応答や提案を表示し、ユーザーが確認できるようにする。 The device presents the generated response or suggestion to the user. The input is the generated response or suggestion, and the output is what is displayed to the user. Specifically, the response or suggestion is displayed on the smartphone display so that the user can check it.

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来の生成AIモデルを利用するシステムでは、ユーザーがスマートフォンを操作する必要があり、手軽に利用することが難しかった。また、ユーザーの感情に応じた適切なレスポンスを生成することができず、ユーザー体験が限定されていた。これにより、ユーザーが生成AIモデルを効果的に活用することが困難であった。 Conventional systems using generative AI models required users to operate their smartphones, making them difficult to use. They also were unable to generate appropriate responses based on the user's emotions, limiting the user experience. This made it difficult for users to effectively utilize generative AI models.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが生成AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの音声データをキャプチャし、感情を分析する感情認識手段と、該感情認識手段により分析された感情情報を生成AIモデルにフィードバックする手段と、を含む。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成AIモデルを利用でき、さらにユーザーの感情に応じた適切なレスポンスを得ることが可能となる。 In this invention, the server includes a user authentication means, an operation means for a user authenticated by the user authentication means to input prompts to the generative AI model, an emotion recognition means for capturing the user's voice data and analyzing their emotions, and a means for feeding back the emotion information analyzed by the emotion recognition means to the generative AI model. This allows the user to easily use the generative AI model without operating a smartphone, and further enables the user to obtain an appropriate response according to their emotions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、指紋認証や顔認証などの生体認証技術を含む。 "User authentication means" refers to a means for verifying a user's identity, and includes biometric authentication technologies such as fingerprint authentication and facial recognition.

「操作手段」とは、ユーザーが生成AIモデルへのプロンプト入力を行うための手段であり、ボタンやタッチスクリーンなどのインターフェースを含む。 "Operation means" refers to the means by which a user inputs prompts to the generated AI model, and includes interfaces such as buttons and touchscreens.

「感情認識手段」とは、ユーザーの音声データをキャプチャし、そのトーンや内容からユーザーの感情を分析するための手段である。 "Emotion recognition means" is a means for capturing a user's voice data and analyzing the user's emotions from its tone and content.

「生成AIモデル」とは、ユーザーからのプロンプトに基づいて適切なレスポンスを生成する人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates appropriate responses based on prompts from the user.

「プロンプト入力」とは、ユーザーが生成AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「フィードバック手段」とは、感情認識手段により分析された感情情報を生成AIモデルに送信するための手段である。 The "feedback means" is a means for transmitting the emotional information analyzed by the emotion recognition means to the generative AI model.

この発明は、ユーザー認証手段、操作手段、感情認識手段、フィードバック手段を含むシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that includes a user authentication means, an operation means, an emotion recognition means, and a feedback means. Specific embodiments of this system are described below.

まず、ユーザはアクセサリー装置の指紋認証センサーに指を当てる。指紋認証センサーは、ユーザーの指紋データをキャプチャし、端末に送信する。端末はこのデータをサーバに送信し、サーバは指紋データを既存のデータベースと照合してユーザーの認証を行う。認証が成功すると、端末のボタンが有効化される。 First, the user places their finger on the accessory device's fingerprint authentication sensor. The fingerprint authentication sensor captures the user's fingerprint data and sends it to the device. The device then sends this data to the server, which compares the fingerprint data with an existing database to authenticate the user. If authentication is successful, the device's buttons are enabled.

次に、ユーザが有効化されたボタンを押すと、端末はスマートフォン上の専用アプリケーションを起動する。このアプリケーションは、生成AIモデルに対してプロンプト文を入力する機能を持つ。例えば、「今日の天気について教えてください」というプロンプト文を生成AIモデルに入力する。 Next, when the user presses the enabled button, the device launches a dedicated application on the smartphone. This application has the function of inputting prompt sentences to the generative AI model. For example, the prompt sentence "Please tell me about today's weather" is input to the generative AI model.

さらに、ユーザがアクセサリー装置に話しかけると、端末内のマイクロフォンが音声データをキャプチャする。この音声データは感情認識手段に送信され、感情認識手段は音声データのトーンを解析してユーザの感情を分析する。分析結果はフィードバック手段を通じて生成AIモデルに送信される。生成AIモデルは、この感情情報に基づいて適切なレスポンスを生成する。例えば、「ユーザは少し疲れているようです。元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。 Furthermore, when the user speaks to the accessory device, the microphone in the terminal captures voice data. This voice data is sent to the emotion recognition means, which analyzes the tone of the voice data to analyze the user's emotions. The analysis results are sent to the generative AI model via the feedback means. The generative AI model generates an appropriate response based on this emotional information. For example, in response to the prompt "The user seems a little tired. Please generate an encouraging message," it generates the response "Let's take a break today and refresh ourselves."

このシステムにより、ユーザはスマートフォンを操作することなく、手軽に生成AIモデルを利用できる。また、ユーザの感情に応じた適切なレスポンスを得ることが可能となるため、ユーザ体験が向上する。 This system allows users to easily use generative AI models without having to operate a smartphone. It also improves the user experience by enabling appropriate responses based on the user's emotions.

具体例として、ユーザがアクセサリー装置の指紋認証センサーに指を当て、認証が成功した後にボタンを押すと、スマートフォン上のアプリケーションが起動し、以下のプロンプト文が生成AIモデルに入力される: For example, when a user places their finger on the fingerprint authentication sensor on an accessory device and presses a button after successful authentication, an application on the smartphone launches and the following prompt is input into the generative AI model:

「今日の天気について教えてください。」 "Can you tell me about today's weather?"

別の具体例として、ユーザがアクセサリー装置に「今日はどんな気分?」と話しかけると、感情認識手段がユーザの声のトーンから感情を認識し、生成AIモデルに以下のプロンプト文を入力する: As another example, when a user asks an accessory device, "How are you feeling today?", the emotion recognition means recognizes the emotion from the user's tone of voice and inputs the following prompt sentence into the generative AI model:

「ユーザは少し疲れているようです。元気づけるメッセージを生成してください。」 "The user seems a little tired. Please generate an encouraging message."

これにより、ユーザはスマートフォンを操作することなく、手軽に生成AIを活用することが可能となる。 This allows users to easily utilize generative AI without having to operate their smartphone.

実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋 Input: User's fingerprint

具体的な動作:ユーザがアクセサリー装置の指紋認証センサーに指を当てると、センサーが青く光る。 Specific operation: When the user places their finger on the fingerprint authentication sensor on the accessory device, the sensor will glow blue.

出力:キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、サーバに送信する。 The device captures fingerprint data and sends it to the server.

入力:キャプチャされた指紋データ Input: Captured fingerprint data

具体的な動作:端末は指紋認証センサーから指紋データをキャプチャし、そのデータをサーバに送信する際、端末の画面に「認証中...」と表示される。 Specific operation: The device captures fingerprint data from the fingerprint authentication sensor and, when sending that data to the server, displays "Authentication in progress..." on the device screen.

出力:サーバに送信された指紋データ Output: Fingerprint data sent to the server

ステップ3: Step 3:

サーバが指紋データを認証する。 The server authenticates the fingerprint data.

入力:サーバに送信された指紋データ Input: Fingerprint data sent to the server

具体的な動作:サーバは受信した指紋データを既存のデータベースと照合し、ユーザの認証を行う。 Specific operation: The server compares the received fingerprint data with an existing database and authenticates the user.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ4: Step 4:

認証が成功すると、端末のボタンを有効化する。 If authentication is successful, the device's buttons will be enabled.

入力:認証結果(成功) Input: Authentication result (success)

具体的な動作:サーバが認証に成功すると、端末に信号を送り、ボタンを有効化する。端末のボタンが緑色に点灯する。 Specific operation: If the server successfully authenticates, it sends a signal to the device to activate the button. The button on the device will light up green.

出力:有効化されたボタン Output: Enabled button

ステップ5: Step 5:

ユーザがボタンを押す。 The user presses the button.

入力:有効化されたボタン Input: Enabled button

具体的な動作:ユーザは有効化されたボタンを押す。これにより、次のステップがトリガーされる。 Specific Action: The user presses the enabled button, which triggers the next step.

出力:ボタン押下の信号 Output: Button press signal

ステップ6: Step 6:

端末がスマートフォン上のアプリケーションを起動する。 The device launches the application on the smartphone.

入力:ボタン押下の信号 Input: Button press signal

具体的な動作:端末はスマートフォン上の専用アプリケーションを起動する。スマートフォンの画面にアプリケーションのロゴが表示される。 Specific operation: The device launches a dedicated application on the smartphone. The application logo will appear on the smartphone screen.

出力:起動されたアプリケーション Output: Launched application

ステップ7: Step 7:

アプリケーションが生成AIモデルへのプロンプト入力を行う。 The application prompts input to the generative AI model.

入力:起動されたアプリケーション Input: Launched application

具体的な動作:アプリケーションは生成AIモデルに対してプロンプト文を入力する。画面に「プロンプトを送信中...」と表示される。例えば、「今日の天気について教えてください」というプロンプト文を入力する。 Specific operation: The application inputs a prompt to the generative AI model. The screen displays "Sending prompt...". For example, the prompt input is "Tell me about the weather today."

出力:生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ8: Step 8:

ユーザがアクセサリー装置に話しかける。 The user speaks to the accessory device.

入力:ユーザの音声 Input: User's voice

具体的な動作:ユーザはアクセサリー装置に向かって話しかける。例えば、「今日はどんな気分?」と話す。端末のマイクロフォンが赤く点灯し、音声データをキャプチャしていることを示す。 Specific operation: The user speaks to the accessory device. For example, "How are you feeling today?" The device's microphone lights up red, indicating that it is capturing audio data.

出力:キャプチャされた音声データ Output: Captured audio data

ステップ9: Step 9:

端末が音声データをキャプチャし、感情エンジンに送信する。 The device captures voice data and sends it to the emotion engine.

入力:キャプチャされた音声データ Input: Captured audio data

具体的な動作:端末は内蔵マイクロフォンを使用して音声データをキャプチャし、そのデータを感情エンジンに送信する。 Specific operation: The device uses the built-in microphone to capture audio data and sends that data to the emotion engine.

出力:感情エンジンに送信された音声データ Output: Audio data sent to the emotion engine

ステップ10: Step 10:

感情エンジンが音声データのトーンからユーザの感情を分析する。 The emotion engine analyzes the user's emotions from the tone of the voice data.

入力:感情エンジンに送信された音声データ Input: Audio data sent to the emotion engine

具体的な動作:感情エンジンは音声データのトーンを解析し、ユーザの感情を分析する。端末の画面に「感情を解析中...」と表示される。 Specific operation: The emotion engine analyzes the tone of the voice data and determines the user's emotions. The device screen will display "Analyzing emotions..."

出力:分析された感情情報 Output: Analyzed emotional information

ステップ11: Step 11:

感情エンジンが分析結果を生成AIモデルにフィードバックする。 The emotion engine feeds the analysis results back into the generative AI model.

入力:分析された感情情報 Input: Analyzed emotional information

具体的な動作:感情エンジンは分析結果を生成AIモデルにフィードバックする。例えば、「ユーザは少し疲れているようです」という情報を送信する。 Specific operation: The emotion engine feeds the analysis results back to the generative AI model. For example, it sends information such as "The user seems a little tired."

出力:生成AIモデルに送信された感情情報 Output: Emotional information sent to the generative AI model

ステップ12: Step 12:

生成AIモデルがユーザの感情に応じたレスポンスを生成する。 The generative AI model generates responses based on the user's emotions.

入力:生成AIモデルに送信された感情情報 Input: Emotional information sent to the generative AI model

具体的な動作:生成AIモデルはフィードバックされた感情情報に基づいて、適切なレスポンスを生成する。例えば、「元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。スマートフォンの画面にレスポンスが表示される。 Specific operation: The generative AI model generates an appropriate response based on the emotional information fed back. For example, in response to the prompt "Generate an encouraging message," it generates the response "Take a break today to refresh yourself." The response is displayed on the smartphone screen.

出力:生成されたレスポンス Output: Generated response

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."

従来のフードデリバリーサービスにおいて、ユーザーがスマートフォンを操作して注文を行う際、操作が煩雑であることや、ユーザーの感情に応じた適切な提案が行われないことが課題であった。特に、疲れているユーザーやストレスを感じているユーザーに対して、リラックスできる食事の提案が不足しているため、ユーザー体験が向上しないという問題があった With conventional food delivery services, when users order using their smartphones, the process is cumbersome and they don't offer appropriate suggestions based on the user's mood. In particular, there are issues with the lack of relaxing meal suggestions for tired or stressed users, which hinders the user experience.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

この発明では、サーバは、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの音声をキャプチャし、感情を認識するための音声キャプチャ手段と、該音声キャプチャ手段によりキャプチャされた音声データを分析し、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情に基づいて生成系AIが適切なレスポンスを生成するための手段と、を含む。これにより、ユーザーがスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 In this invention, the server includes means for enabling prompt input to the generative AI, user authentication means for operating the accessory device, operation means for a user authenticated by the user authentication means to input prompts to the generative AI, voice capture means for capturing the user's voice and recognizing their emotions, emotion recognition means for analyzing the voice data captured by the voice capture means and recognizing the user's emotions, and means for the generative AI to generate an appropriate response based on the emotions recognized by the emotion recognition means. This enables the user to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate a smartphone.

「生成系AI」とは、ユーザーからの入力に基づいて適切なレスポンスや提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates appropriate responses and suggestions based on user input.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為を指す。 "Prompt input" refers to the act of inputting instructions or questions to generative AI.

「アクセサリー装置」とは、スマートフォンに接続可能な外部デバイスであり、特定の機能を提供するための装置である。 An "accessory device" is an external device that can be connected to a smartphone to provide specific functions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、特定のユーザーのみがシステムを操作できるようにするためのものである。 "User authentication means" refers to a means for verifying a user's identity and ensuring that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋を読み取って認証を行う手段である。 "Fingerprint authentication means" refers to a means of authenticating a user by reading their fingerprint.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやボタンなどの手段である。 "Operation means" refers to the interface, buttons, and other means that users use to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できる手段である。 A "one-click operation method" is a method that allows the user to complete an operation with a single click.

「音声キャプチャ手段」とは、ユーザーの音声を録音またはキャプチャするための手段である。 "Audio capture means" means for recording or capturing a user's voice.

「感情認識手段」とは、キャプチャされた音声データを分析し、ユーザーの感情を認識するための手段である。 "Emotion recognition means" refers to a means for analyzing captured voice data and recognizing the user's emotions.

「レスポンス」とは、生成系AIがユーザーの入力に対して生成する応答や提案を指す。 "Response" refers to the response or suggestion that generative AI generates in response to user input.

この発明を実施するためのシステムは、以下のように構成される。まず、ユーザーはスマートフォンに接続されたアクセサリー装置を使用する。このアクセサリー装置には指紋認証手段が搭載されており、ユーザーが指を当てることで認証が行われる。認証が成功すると、アクセサリー装置の操作手段が有効化され、ユーザーはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行うことができる。 A system for implementing this invention is configured as follows: First, a user uses an accessory device connected to a smartphone. This accessory device is equipped with a fingerprint authentication means, and authentication is performed by the user placing their finger on it. If authentication is successful, the operation means of the accessory device is enabled, and the user can use the one-click operation means to input prompts to the generative AI.

次に、音声キャプチャ手段がユーザーの音声をキャプチャする。この音声データは感情認識手段に送信され、ユーザーの感情が分析される。感情認識手段は音声データのトーンや内容からユーザーの感情を認識し、その結果を生成系AIにフィードバックする。生成系AIは、認識された感情に基づいて適切なレスポンスを生成する。 Next, the voice capture means captures the user's voice. This voice data is sent to the emotion recognition means, which analyzes the user's emotions. The emotion recognition means recognizes the user's emotions from the tone and content of the voice data and feeds the results back to the generative AI. The generative AI generates an appropriate response based on the recognized emotions.

具体的には、以下のようなハードウェアおよびソフトウェアが使用される。指紋認証手段としては、指紋センサーが用いられる。音声キャプチャ手段としては、マイクロフォンと音声認識ソフトウェア(例:speech_recognitionライブラリ)が使用される。感情認識手段としては、感情エンジン(例:EmotionEngine)が使用される。生成系AIとしては、AI生成モデル(例:AIGenerator)が使用される。 Specifically, the following hardware and software are used: A fingerprint sensor is used as the fingerprint authentication method. A microphone and voice recognition software (e.g., speech_recognition library) are used as the voice capture method. An emotion engine (e.g., EmotionEngine) is used as the emotion recognition method. An AI generation model (e.g., AIGenerator) is used as the generative AI.

例えば、ユーザーが「今日は疲れた」と話しかけた場合、音声キャプチャ手段がその音声をキャプチャし、感情認識手段が「疲労」を感知する。生成系AIはこの感情に基づいて、「リラックスできる食事」を提案するレスポンスを生成する。このようにして、ユーザーの感情に応じた適切なフードデリバリーの提案が行われる。 For example, if a user says, "I'm tired today," the voice capture means captures the voice and the emotion recognition means detects "fatigue." Based on this emotion, the generative AI generates a response suggesting a "relaxing meal." In this way, appropriate food delivery suggestions are made according to the user's emotions.

生成AIモデルへ入力するプロンプト文の例としては、以下のようなものがある: Examples of prompts to input to a generative AI model include:

ユーザーの感情: 疲労 User Emotion: Fatigue

生成系AIへのプロンプト: "疲れているユーザーにおすすめのリラックスできる食事を提案してください。" Prompt for generative AI: "Please recommend a relaxing meal for a tired user."

このシステムにより、ユーザーはスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 This system allows users to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate their smartphone.

応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 is explained using Figure 18.

ステップ1: Step 1:

ユーザがスマートフォンに接続されたアクセサリー装置の指紋認証センサーに指を当てる。入力はユーザの指紋データであり、出力は認証結果である。アクセサリー装置は指紋データを読み取り、内部のデータベースと照合して認証を行う。認証が成功すると、次のステップに進む。 The user places their finger on the fingerprint authentication sensor of an accessory device connected to their smartphone. The input is the user's fingerprint data, and the output is the authentication result. The accessory device reads the fingerprint data and compares it with its internal database for authentication. If authentication is successful, the device proceeds to the next step.

ステップ2: Step 2:

認証が成功した場合、アクセサリー装置の操作手段が有効化される。ユーザはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行う。入力はユーザのクリック操作であり、出力はプロンプト入力のトリガーである。アクセサリー装置はクリック操作を検知し、生成系AIへのプロンプト入力を開始する。 If authentication is successful, the accessory device's operation means is enabled. The user uses the one-click operation means to input a prompt to the generative AI. The input is the user's click operation, and the output is the trigger for the prompt input. The accessory device detects the click operation and begins prompt input to the generative AI.

ステップ3: Step 3:

端末の音声キャプチャ手段がユーザの音声をキャプチャする。入力はユーザの音声データであり、出力はキャプチャされた音声データである。端末のマイクロフォンがユーザの音声を録音し、音声認識ソフトウェアがそのデータをデジタル形式に変換する。 The device's voice capture means captures the user's voice. The input is the user's voice data and the output is the captured voice data. The device's microphone records the user's voice and the voice recognition software converts the data into a digital format.

ステップ4: Step 4:

キャプチャされた音声データが感情認識手段に送信される。入力はキャプチャされた音声データであり、出力は認識された感情データである。感情エンジンが音声データを分析し、トーンや内容からユーザの感情を認識する。 The captured voice data is sent to the emotion recognition means. The input is the captured voice data and the output is the recognized emotion data. The emotion engine analyzes the voice data and recognizes the user's emotion from the tone and content.

ステップ5: Step 5:

認識された感情データが生成系AIにフィードバックされる。入力は認識された感情データであり、出力は生成系AIへのプロンプト文である。生成系AIは感情データに基づいて適切なレスポンスを生成するためのプロンプト文を作成する。 The recognized emotional data is fed back to the generative AI. The input is the recognized emotional data, and the output is a prompt sentence to the generative AI. The generative AI creates a prompt sentence to generate an appropriate response based on the emotional data.

ステップ6: Step 6:

生成系AIがプロンプト文に基づいて適切なレスポンスを生成する。入力はプロンプト文であり、出力は生成されたレスポンスである。生成系AIはプロンプト文を解析し、ユーザの感情に応じたフードデリバリーの提案を生成する。 The generative AI generates an appropriate response based on the prompt. The input is the prompt and the output is the generated response. The generative AI analyzes the prompt and generates food delivery suggestions based on the user's emotions.

ステップ7: Step 7:

生成されたレスポンスがユーザに提供される。入力は生成されたレスポンスであり、出力はユーザへの提案である。端末のディスプレイや音声出力装置を通じて、ユーザに適切なフードデリバリーの提案が表示または音声で伝えられる。 The generated response is provided to the user. The input is the generated response, and the output is a suggestion to the user. Appropriate food delivery suggestions are displayed or spoken to the user via the terminal's display or audio output device.

特定処理部290は、特定処理の結果をヘッドセット型端末314に送信する。ヘッドセット型端末314では、制御部46Aが、スピーカ240及びディスプレイ343に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the headset terminal 314. In the headset terminal 314, the control unit 46A causes the speaker 240 and display 343 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.

データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is

、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 These results are obtained by performing deep learning on a neural network. A prompt containing instructions is input to the data generation model 58, and inference data such as voice data indicating speech, text data indicating text, and image data indicating an image is also input. The data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.

生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>).

上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ヘッドセット型端末314によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the headset-type terminal 314.

[第4実施形態] [Fourth embodiment]

図7には、第4実施形態に係るデータ処理システム410の構成の一例が示されている。 Figure 7 shows an example of the configuration of a data processing system 410 according to the fourth embodiment.

図7に示すように、データ処理システム410は、データ処理装置12及びロボット414を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 7, the data processing system 410 includes a data processing device 12 and a robot 414. An example of the data processing device 12 is a server.

データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).

ロボット414は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及び制御対象443を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及び制御対象443も、バス52に接続されている。 The robot 414 includes a computer 36, a microphone 238, a speaker 240, a camera 42, a communication I/F 44, and a control target 443. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, speaker 240, camera 42, and control target 443 are also connected to the bus 52.

マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.

カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).

通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.

制御対象443は、表示装置、目部のLED、並びに、腕、手及び足等を駆動するモータ等を含む。ロボット414の姿勢や仕草は、腕、手及び足等のモータを制御することにより制御される。ロボット414の感情の一部は、これらのモータを制御することにより表現できる。また、ロボット414の目部のLEDの発光状態を制御することによっても、ロボット414の表情を表現できる。 The control object 443 includes a display device, LEDs in the eyes, and motors that drive the arms, hands, and feet. The posture and gestures of the robot 414 are controlled by controlling the motors of the arms, hands, and feet. Some of the emotions of the robot 414 can be expressed by controlling these motors. In addition, the facial expressions of the robot 414 can also be expressed by controlling the light emission state of the LEDs in the eyes of the robot 414.

図8には、データ処理装置12及びロボット414の要部機能の一例が示されている。図8に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 8 shows an example of the main functions of the data processing device 12 and the robot 414. As shown in Figure 8, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.

特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.

ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.

ロボット414では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the robot 414, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.

次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段を含む。具体的には、アクセサリー装置はBluetooth等の無線通信手段を用いてスマートフォンと接続され、生成系AIへのプロンプト入力はスマートフォン上で動作するアプリケーションを通じて行われる。ユーザー認証手段としては、指紋認証センサーが装置に組み込まれ、登録されたユーザーの指紋情報と照合することで認証を行う。操作手段としては、装置に設けられたボタンをユーザーが押すことで、生成系AIへのプロンプト入力が行われる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to generative AI, a user authentication means for operating the accessory device, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. Specifically, the accessory device is connected to the smartphone using a wireless communication means such as Bluetooth, and prompt input to the generative AI is performed through an application running on the smartphone. The user authentication means includes a fingerprint authentication sensor built into the device, which performs authentication by comparing the fingerprint information with the registered user's fingerprint. The operation means involves the user pressing a button on the device, which inputs prompts to the generative AI.

「形態例2」 "Example 2"

具体的な使用例としては、ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行い、認証が成功すると、装置のボタンが有効化される。ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 As a specific example of use, a user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device, and if authentication is successful, the button on the device is enabled. When the user presses the button, an application on the smartphone is launched and a prompt input is sent to the generative AI. This allows the user to easily utilize generative AI without having to operate the smartphone.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置をBluetooth等の無線通信手段を用いてスマートフォンと接続する。 Step 1: The user connects an accessory device that can be connected to a smartphone to the smartphone using a wireless communication method such as Bluetooth.

ステップ2:ユーザーがアクセサリー装置の指紋認証センサーに指を当て、指紋認証センサーが登録されたユーザーの指紋情報と照合することでユーザー認証を行う。 Step 2: The user places their finger on the fingerprint authentication sensor on the accessory device, and the fingerprint authentication sensor authenticates the user by matching it with the registered user's fingerprint information.

ステップ3:認証が成功すると、装置のボタンが有効化される。 Step 3: If authentication is successful, the device's buttons will be enabled.

ステップ4:ユーザーが装置のボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 4: When the user presses a button on the device, an application on the smartphone is launched and prompts are input to the generative AI.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置の指紋認証センサーに指を当てることで認証を行う。 Step 1: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device.

ステップ2:認証が成功すると、装置のボタンが有効化される。 Step 2: If authentication is successful, the device's buttons will be enabled.

ステップ3:ユーザーがボタンを押すと、スマートフォン上のアプリケーションが起動し、生成系AIへのプロンプト入力が行われる。 Step 3: When the user presses the button, an application on the smartphone is launched and prompt input is sent to the generative AI.

ステップ4:これにより、ユーザーはスマートフォンを操作することなく、手軽に生成系AIを活用することが可能となる。 Step 4: This allows users to easily utilize generative AI without having to operate their smartphone.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来の生成系AIモデルを利用するシステムでは、ユーザーがプロンプト文を入力する際に、複雑な操作や多段階の認証が必要であり、ユーザーエクスペリエンスが低下する問題があった。また、生成結果を迅速かつ正確に取得するための効率的な手段が不足していた。これにより、ユーザーが生成系AIモデルを活用する際の利便性が損なわれていた。 In systems that use conventional generative AI models, users are required to perform complex operations and undergo multi-step authentication when entering prompt text, resulting in a poor user experience. Furthermore, there is a lack of efficient means for quickly and accurately obtaining generated results. This reduces the convenience for users when using generative AI models.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、該生成系AIへのプロンプト入力を行うためのアプリケーションをスマートフォン上で動作させる手段と、該生成系AIモデルにプロンプト文を送信し、生成結果を受信する手段と、を含む。これにより、ユーザーは簡単な操作で生成系AIモデルにプロンプト文を入力し、迅速かつ正確に生成結果を取得することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for running an application on the smartphone for inputting prompts to the generative AI; and means for sending prompts to the generative AI model and receiving generation results. This allows the user to input prompts to the generative AI model with simple operations and quickly and accurately obtain generation results.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持ち、アプリケーションをインストールして多様な機能を利用できる携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer, and can be used to install applications and utilize a variety of functions.

「アクセサリー装置」とは、スマートフォンに接続して追加の機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AI」とは、入力されたプロンプト文に基づいてテキストや画像などの生成を行う人工知能モデルである。 "Generative AI" is an artificial intelligence model that generates text, images, etc. based on input prompts.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為である。 "Prompt input" is the act of inputting instructions or questions to a generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術や装置である。 "User authentication means" refers to technology or devices used to verify a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーの身元を確認する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and verify the user's identity based on that information.

「操作手段」とは、ユーザーがアクセサリー装置やスマートフォンを操作するためのインターフェースや装置である。 "Operation means" refers to the interface or device that allows the user to operate the accessory device or smartphone.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースや装置である。 A "one-click operation means" is an interface or device that allows a user to perform a specific function with a single click.

「アプリケーション」とは、スマートフォン上で動作し、特定の機能やサービスを提供するソフトウェアである。 An "application" is software that runs on a smartphone and provides specific functions or services.

「生成結果」とは、生成系AIがプロンプト文に基づいて生成したテキストや画像などの出力物である。 "Generation results" are output such as text and images generated by the generative AI based on the prompt text.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を簡便に行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to easily input prompts into a generative AI model. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置: Accessory equipment:

アクセサリー装置は、スマートフォンに接続される外部デバイスであり、以下の主要な機能を持つ。 Accessory devices are external devices that connect to your smartphone and have the following main functions:

ユーザー認証手段: 指紋認証センサーを搭載し、ユーザーの指紋情報を読み取る。 User authentication method: Equipped with a fingerprint authentication sensor that reads the user's fingerprint information.

操作手段: ワンクリック操作が可能なボタンを備え、ユーザーが簡単に操作できる。 Operation method: Equipped with a one-click button, making it easy for users to operate.

スマートフォン: Smartphone:

スマートフォンは、アクセサリー装置とBluetooth等の無線通信手段を用いて接続される。スマートフォン上には、生成系AIモデルへのプロンプト入力を行うためのアプリケーションがインストールされている。 The smartphone is connected to the accessory device using wireless communication means such as Bluetooth. An application for providing prompt input to the generative AI model is installed on the smartphone.

生成系AIモデル: Generative AI model:

生成系AIモデルは、サーバ上で動作し、スマートフォンから送信されたプロンプト文に基づいてテキストや画像を生成する。 The generative AI model runs on a server and generates text and images based on prompts sent from the smartphone.

システムの動作 System Operation

ユーザー認証: User authentication:

ユーザは、アクセサリー装置に設置された指紋認証センサーに指を置く。アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。認証が成功すると、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 The user places their finger on the fingerprint authentication sensor installed on the accessory device. The accessory device reads the fingerprint information and compares it with the fingerprint information stored in its internal database. If authentication is successful, the accessory device sends a signal indicating successful authentication to the smartphone.

プロンプト入力: Prompt Input:

認証が成功した後、ユーザはアクセサリー装置のボタンを押す。スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。ユーザは、生成系AIモデルに対するプロンプト文を入力する。 After successful authentication, the user presses a button on the accessory device. The smartphone application launches and a prompt input screen appears. The user enters a prompt statement for the generative AI model.

生成AIモデルへの送信: Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 The smartphone sends the input prompt to the generative AI model. The server operates the generative AI model based on the received prompt and creates the generated results.

生成結果の表示: Display generated results:

サーバは、生成された結果をスマートフォンに送信する。スマートフォンは、受け取った生成結果をユーザに表示する。ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 The server sends the generated results to the smartphone. The smartphone displays the received results to the user. The user can check the displayed results and save or share them as needed.

具体例 Specific examples

ユーザが新しい詩を生成系AIに作成させたい場合の具体的な手順は以下の通りである。 If a user wants to have a generative AI create a new poem, the specific steps are as follows:

1. ユーザー認証: 1. User authentication:

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。 The user places their finger on the fingerprint authentication sensor on the accessory device.

アクセサリー装置は、指紋を読み取り、認証を行う。 The accessory device reads the fingerprint and performs authentication.

認証が成功すると、スマートフォンに認証成功の信号が送信される。 If authentication is successful, a signal indicating successful authentication will be sent to your smartphone.

2. プロンプト入力: 2. Prompt input:

ユーザは、アクセサリー装置のボタンを押す。 The user presses a button on the accessory device.

スマートフォンのアプリケーションが起動し、プロンプト入力画面が表示される。 The smartphone application will launch and a prompt input screen will appear.

ユーザは、「新しい詩を作成してください」というプロンプト文を入力する。 The user enters the prompt text "Create a new poem."

3. 生成AIモデルへの送信: 3. Send to generative AI model:

スマートフォンは、入力されたプロンプト文を生成系AIモデルに送信する。 The smartphone sends the entered prompt to the generative AI model.

サーバは、プロンプト文を基に生成AIモデルを動作させ、詩を生成する。 The server runs a generative AI model based on the prompt text to generate the poem.

4. 生成結果の表示: 4. Displaying the generated results:

サーバは、生成された詩をスマートフォンに送信する。 The server sends the generated poem to your smartphone.

スマートフォンは、受け取った詩をユーザに表示する。 The smartphone will then display the received poem to the user.

ユーザは、表示された詩を確認し、必要に応じて保存や共有を行う。 Users can review the displayed poems and save or share them as needed.

このようにして、ユーザはアクセサリー装置とスマートフォンを用いて生成系AIモデルに対するプロンプト入力を行い、生成結果を得ることができる。 In this way, users can use the accessory device and smartphone to provide prompt input to the generative AI model and obtain generated results.

実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.

ステップ1:アクセサリー装置の接続 Step 1: Connecting Accessory Devices

入力: ユーザがスマートフォンのBluetooth設定を開き、アクセサリー装置を選択する。 Input: User opens their smartphone's Bluetooth settings and selects an accessory device.

動作: スマートフォンは、Bluetoothを用いてアクセサリー装置と接続を確立する。 How it works: Your smartphone establishes a connection with the accessory device using Bluetooth.

出力: スマートフォンは、接続が成功したことを通知する。 Output: The smartphone notifies you that the connection was successful.

ステップ2:ユーザー認証 Step 2: User Authentication

入力: ユーザがアクセサリー装置の指紋認証センサーに指を置く。 Input: The user places their finger on the fingerprint sensor on the accessory device.

動作: アクセサリー装置は、指紋情報を読み取り、内部のデータベースに保存されている指紋情報と照合する。 How it works: The accessory device reads your fingerprint and compares it with the fingerprint information stored in its internal database.

出力: 認証が成功した場合、アクセサリー装置はスマートフォンに認証成功の信号を送信する。 Output: If authentication is successful, the accessory device sends a signal to the smartphone indicating successful authentication.

ステップ3:プロンプト入力準備 Step 3: Prepare for prompt input

入力: スマートフォンが認証成功の信号を受け取る。 Input: The smartphone receives a signal indicating successful authentication.

動作: スマートフォンは、生成系AIへのプロンプト入力画面を表示する。 How it works: The smartphone displays a prompt input screen for the generative AI.

出力: ユーザは、プロンプト入力画面を確認し、プロンプト文の入力を開始する。 Output: The user sees the prompt input screen and begins entering the prompt statement.

ステップ4:プロンプト入力 Step 4: Enter the prompt

入力: ユーザがスマートフォンのアプリケーションを通じて生成系AIに対するプロンプト文を入力する。 Input: The user enters a prompt for the generative AI through a smartphone application.

動作: スマートフォンは、入力されたプロンプト文を受け取り、内部でデータ形式を整える。 How it works: The smartphone receives the entered prompt text and formats the data internally.

出力: 整えたプロンプト文が生成系AIモデルに送信される準備が整う。 Output: The prepared prompt is ready to be sent to the generative AI model.

ステップ5:生成AIモデルへの送信 Step 5: Send to the generative AI model

入力: スマートフォンが整えたプロンプト文を生成系AIモデルに送信する。 Input: The smartphone sends the prepared prompt to the generative AI model.

動作: サーバは、受け取ったプロンプト文を基に生成AIモデルを動作させ、生成結果を作成する。 Operation: The server runs the generative AI model based on the received prompt text and creates the generated results.

出力: 生成された結果がサーバからスマートフォンに送信される。 Output: The generated results are sent from the server to the smartphone.

ステップ6:生成結果の表示 Step 6: View the generated results

入力: スマートフォンがサーバから生成結果を受け取る。 Input: The smartphone receives the generated results from the server.

動作: スマートフォンは、受け取った生成結果をユーザに表示する。 How it works: The smartphone displays the generated results to the user.

出力: ユーザは、表示された生成結果を確認し、必要に応じて保存や共有を行う。 Output: The user checks the displayed generated results and saves or shares them as needed.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

工場内のロボットを効率的かつ安全に管理・操作するためには、迅速かつ正確な指示をロボットに伝達する必要がある。しかし、従来の方法では、操作が複雑であり、ユーザー認証のセキュリティも十分ではないため、誤操作や不正アクセスのリスクが存在する。これにより、工場の生産性や安全性が低下する可能性がある To efficiently and safely manage and operate robots in factories, it is necessary to transmit instructions to the robots quickly and accurately. However, conventional methods involve complex operations and lack sufficient user authentication security, creating the risk of operational errors and unauthorized access. This can potentially reduce factory productivity and safety.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、工場内のロボットを管理・操作するための指示を生成する手段と、該指示を無線通信手段を用いてロボットに送信する手段と、を含む。これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; means for generating instructions for managing and operating robots in a factory; and means for transmitting the instructions to the robots using wireless communication means. This makes it possible to efficiently and safely manage and operate robots in a factory.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続され、追加の機能を提供する装置である。 An "accessory device connectable to a smartphone" is a device that connects to a smartphone using wireless communication means and provides additional functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて指示や情報を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates instructions and information based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions or questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認し、認証するための機能である。 "User authentication means" is a function for verifying and authenticating a user's identity.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を用いてユーザーを認証する機能である。 "Fingerprint authentication means" is a function that scans a user's fingerprint and uses that information to authenticate the user.

「操作手段」とは、ユーザーが生成系AIに対してプロンプト入力を行うためのインターフェースである。 "Operation means" is an interface that allows the user to input prompts to the generative AI.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で生成系AIにプロンプト入力を行うための機能である。 "One-click operation means" is a function that allows the user to input prompts to the generative AI with a single click.

「工場内のロボットを管理・操作するための指示を生成する手段」とは、工場内のロボットに対して具体的な作業指示を生成するための機能である。 "Means for generating instructions for managing and operating robots within a factory" refers to a function for generating specific work instructions for robots within a factory.

「無線通信手段」とは、BluetoothやWi-Fiなどの無線通信技術を用いてデバイス間でデータを送受信するための機能である。 "Wireless communication means" refers to a function for sending and receiving data between devices using wireless communication technologies such as Bluetooth and Wi-Fi.

「ロボットに送信する手段」とは、生成された指示を無線通信手段を用いてロボットに送信するための機能である。 "Means for transmitting to robot" is a function for transmitting the generated instructions to the robot using wireless communication means.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、工場内のロボットを効率的かつ安全に管理・操作するシステムである。以下に、このシステムの具体的な実施形態について説明する。 This invention is a system that efficiently and safely manages and operates robots in a factory using accessory devices that can be connected to a smartphone. A specific embodiment of this system is described below.

システム構成 System Configuration

システムは、スマートフォン、アクセサリー装置、生成系AIモデル、無線通信手段、指紋認証手段、操作手段、工場ロボットから構成される。 The system consists of a smartphone, accessory devices, a generative AI model, wireless communication means, fingerprint authentication means, operation means, and a factory robot.

ハードウェア Hardware

スマートフォン: ユーザーインターフェースとして機能し、アクセサリー装置と無線通信手段を介して接続される。 Smartphone: Functions as a user interface and connects to accessory devices via wireless communication means.

アクセサリー装置: スマートフォンに接続され、指紋認証手段と操作手段を含む。 Accessory device: Connects to a smartphone and includes fingerprint authentication means and operation means.

指紋認証手段: ユーザーの指紋をスキャンし、認証を行う。 Fingerprint authentication method: Scans the user's fingerprint for authentication.

無線通信手段: BluetoothやWi-Fiなどを用いて、スマートフォンと工場ロボット間でデータを送受信する。 Wireless communication method: Data is sent and received between smartphones and factory robots using Bluetooth, Wi-Fi, etc.

工場ロボット: 指示を受けて動作を行う。 Factory robot: Receives instructions and performs actions.

ソフトウェア Software

生成系AIモデル: ユーザーからのプロンプト入力に基づいて、工場ロボットに対する具体的な指示を生成する。 Generative AI model: Generates specific instructions for factory robots based on prompt input from the user.

スマートフォンアプリケーション: ユーザーインターフェースを提供し、生成系AIモデルとの通信を管理する。 Smartphone application: Provides the user interface and manages communication with the generative AI model.

動作手順 Operating Procedure

1. ユーザー認証: ユーザーがアクセサリー装置に指を置き、指紋認証手段で認証を行う。認証が成功すると、ユーザーはプロンプト入力を行うことができる。 1. User authentication: The user places their finger on the accessory device and authenticates using the fingerprint authentication method. If authentication is successful, the user can enter prompts.

2. プロンプト入力: 認証されたユーザーが操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 2. Prompt input: An authenticated user uses an operation method (one-click operation method) to input a prompt to the generative AI model.

3. 指示生成: 生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 3. Instruction generation: Based on the prompts, the generative AI model generates specific instructions for the factory robot.

4. 指示送信: 生成された指示は、無線通信手段を用いて工場ロボットに送信される。 4. Instruction transmission: The generated instructions are transmitted to the factory robot using wireless communication means.

5. ロボット動作: 工場ロボットは受信した指示に従って動作を行う。 5. Robot operation: The factory robot operates according to the instructions it receives.

具体例 Specific examples

例えば、工場内でロボットが特定の作業を行う際に、管理者がスマートフォンとアクセサリー装置を使ってロボットに指示を出す。以下はプロンプト文の具体例である。 For example, when a robot needs to perform a specific task in a factory, a manager can use a smartphone and accessory devices to give the robot instructions. Below are some example prompts:

「組立ライン3に移動して溶接を開始する」 "Move to assembly line 3 and begin welding."

「検査エリアに移動して品質チェックを行う」 "Move to the inspection area to perform quality checks."

「部品Aを取りに行って、組立ライン2に運ぶ」 "Go get part A and take it to assembly line 2."

これにより、工場内のロボットを効率的かつ安全に管理・操作することが可能となる。システムは、ユーザー認証と生成系AIを活用して、誤操作や不正アクセスのリスクを低減し、工場の生産性と安全性を向上させる。 This makes it possible to efficiently and safely manage and operate robots within factories. The system utilizes user authentication and generative AI to reduce the risk of incorrect operation and unauthorized access, improving factory productivity and safety.

応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.

ステップ1: Step 1:

ユーザがアクセサリー装置に指を置き、指紋認証手段で認証を行う。 The user places their finger on the accessory device and is authenticated using the fingerprint authentication means.

入力:ユーザの指紋 Input: User's fingerprint

データ加工:指紋認証手段が指紋をスキャンし、登録された指紋データと照合する。 Data processing: The fingerprint authentication device scans the fingerprint and compares it with registered fingerprint data.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

具体的な動作:指紋認証センサーがユーザの指紋をスキャンし、内部データベースと照合して認証を行う。 Specific operation: The fingerprint authentication sensor scans the user's fingerprint and compares it with an internal database for authentication.

ステップ2: Step 2:

認証が成功すると、ユーザは操作手段(ワンクリック操作手段)を用いて、生成系AIモデルに対してプロンプトを入力する。 If authentication is successful, the user uses the operation means (one-click operation means) to input a prompt to the generative AI model.

入力:認証結果(成功)、ユーザのプロンプト文 Input: Authentication result (success), user prompt

データ加工:認証結果が成功の場合、プロンプト文を生成系AIモデルに送信する。 Data processing: If the authentication result is successful, a prompt text is sent to the generative AI model.

出力:生成系AIモデルへのプロンプト入力 Output: Prompt input to the generative AI model

具体的な動作:ユーザがボタンを押すと、スマートフォンアプリケーションがプロンプト文を生成系AIモデルに送信する。 Specific operation: When the user presses the button, the smartphone application sends a prompt statement to the generative AI model.

ステップ3: Step 3:

生成系AIモデルがプロンプトに基づいて、工場ロボットに対する具体的な指示を生成する。 Based on the prompts, a generative AI model generates specific instructions for the factory robot.

入力:ユーザのプロンプト文 Input: User prompt

データ加工:生成系AIモデルがプロンプト文を解析し、適切な指示を生成する。 Data processing: The generative AI model analyzes the prompt and generates appropriate instructions.

出力:工場ロボットへの指示 Output: Instructions to factory robots

具体的な動作:生成系AIモデルがプロンプト文を解析し、例えば「組立ライン3に移動して溶接を開始する」といった具体的な指示を生成する。 Specific actions: The generative AI model analyzes the prompt and generates specific instructions, such as "Move to assembly line 3 and start welding."

ステップ4: Step 4:

生成された指示は、無線通信手段を用いて工場ロボットに送信される。 The generated instructions are sent to the factory robot using wireless communication means.

入力:生成系AIモデルからの指示 Input: Instructions from a generative AI model

データ加工:指示を無線通信手段を介して工場ロボットに送信する。 Data processing: Send instructions to factory robots via wireless communication means.

出力:工場ロボットへの指示送信 Output: Send instructions to factory robots

具体的な動作:BluetoothやWi-Fiを用いて、スマートフォンから工場ロボットに指示を送信する。 Specific operation: Instructions are sent from a smartphone to a factory robot using Bluetooth or Wi-Fi.

ステップ5: Step 5:

工場ロボットは受信した指示に従って動作を行う。 The factory robot will act according to the instructions it receives.

入力:工場ロボットへの指示 Input: Instructions for factory robots

データ加工:工場ロボットが指示を解析し、対応する動作を実行する。 Data processing: Factory robots analyze instructions and perform corresponding actions.

出力:ロボットの動作 Output: Robot movement

具体的な動作:工場ロボットが「組立ライン3に移動して溶接を開始する」といった指示に従って動作を行う。 Specific operation: The factory robot operates according to instructions such as "move to assembly line 3 and start welding."

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来の生成AIモデルを利用するためには、ユーザーがスマートデバイスを直接操作し、プロンプト文を入力する必要があった。この操作は手間がかかり、特に手がふさがっている場合や、迅速な応答が求められる状況では不便である。また、セキュリティの観点からも、ユーザー認証が不十分な場合があり、第三者による不正利用のリスクが存在する。これらの課題を解決し、より手軽で安全に生成AIモデルを利用できるシステムが求められている To use conventional generative AI models, users had to manually operate their smart devices and input prompts. This was time-consuming and inconvenient, especially when their hands were full or when a quick response was required. Furthermore, from a security perspective, user authentication was sometimes insufficient, creating a risk of unauthorized use by third parties. A system that solves these issues and allows users to use generative AI models more easily and safely is needed.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、認証されたユーザーが操作するための操作手段と、操作手段を用いてスマートデバイスに信号を送信し、特定のアプリケーションを起動する手段と、起動したアプリケーションが生成AIモデルにプロンプト文を送信する手段と、生成AIモデルがプロンプト文に基づいて応答を生成し、スマートデバイスに応答を送信する手段と、を含む。これにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能となり、さらにユーザー認証手段によりセキュリティも向上する。 In this invention, the server includes a user authentication means, an operation means for operation by an authenticated user, a means for using the operation means to send a signal to the smart device and launch a specific application, a means for the launched application to send a prompt sentence to the generative AI model, and a means for the generative AI model to generate a response based on the prompt sentence and send the response to the smart device. This allows the user to easily use the generative AI model without having to directly operate the smart device, and the user authentication means also improves security.

「ユーザー認証手段」とは、ユーザーの身元を確認し、システムへのアクセスを許可するための手段である。 "User authentication means" refers to the means used to verify a user's identity and grant access to a system.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやデバイスである。 "Operation means" refers to the interface or device that allows the user to operate the system.

「スマートデバイス」とは、インターネットに接続可能で、アプリケーションを実行する機能を持つ電子機器である。 A "smart device" is an electronic device that can connect to the Internet and has the ability to run applications.

「信号を送信する手段」とは、操作手段からスマートデバイスに対して特定の指示やデータを送信するための手段である。 "Means for transmitting signals" refers to means for transmitting specific instructions or data from the operating means to the smart device.

「特定のアプリケーション」とは、特定の機能やサービスを提供するために設計されたソフトウェアプログラムである。 A "specific application" is a software program designed to provide a specific function or service.

「生成AIモデル」とは、入力されたプロンプト文に基づいて応答を生成する人工知能のモデルである。 A "generative AI model" is an artificial intelligence model that generates a response based on an input prompt.

「プロンプト文」とは、生成AIモデルに対して指示や質問を行うためのテキスト入力である。 A "prompt" is text input used to give instructions or ask questions to a generative AI model.

「応答を生成する手段」とは、生成AIモデルがプロンプト文に基づいて適切な応答を作成するための手段である。 "Means for generating a response" refers to the means by which a generative AI model creates an appropriate response based on a prompt.

「応答を送信する手段」とは、生成された応答をスマートデバイスに送信するための手段である。 "Means for sending a response" refers to means for sending the generated response to a smart device.

発明を実施するための形態 Form for implementing the invention

この発明は、ユーザーがスマートデバイスを直接操作することなく、生成AIモデルを利用するためのシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that allows users to use generative AI models without directly operating a smart device. Specific embodiments of this system are described below.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: アクセサリー装置(指紋認証センサー付き)、スマートデバイス(スマートフォンなど) Hardware: Accessory devices (with fingerprint authentication sensors), smart devices (smartphones, etc.)

ソフトウェア: 指紋認証システム、スマートデバイス用アプリケーション、生成AIモデル Software: Fingerprint authentication system, smart device application, generative AI model

システムの構成 System Configuration

1. ユーザー認証手段: 1. User authentication method:

ユーザーがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

指紋認証システムが指紋データをキャプチャし、ユーザーの認証を行う。 The fingerprint authentication system captures fingerprint data and authenticates the user.

2. 操作手段: 2. Operating means:

認証が成功すると、アクセサリー装置のボタンが有効化される。 If authentication is successful, the buttons on the accessory device will be enabled.

ユーザーが有効化されたボタンを押す。 The user presses the enabled button.

3. 信号送信手段: 3. Signal transmission method:

ボタンが押されると、アクセサリー装置がスマートデバイスに信号を送信する。 When the button is pressed, the accessory device sends a signal to the smart device.

スマートデバイスが信号を受信し、特定のアプリケーションを起動する。 The smart device receives the signal and launches a specific application.

4. プロンプト文送信手段: 4. Prompt sending method:

起動したアプリケーションが生成AIモデルにプロンプト文を送信する。 The launched application sends a prompt to the generative AI model.

プロンプト文は事前に設定されたものであり、ユーザーが生成AIモデルに対して行いたい指示や質問を含む。 Prompts are pre-defined and contain the instructions or questions the user wants to ask the generated AI model.

5. 応答生成手段: 5. Response generation method:

サーバが生成AIモデルを用いて、受信したプロンプト文に基づいて応答を生成する。 The server uses a generative AI model to generate a response based on the received prompt.

6. 応答送信手段: 6. Response sending method:

サーバが生成した応答をスマートデバイスに送信する。 The server generates a response and sends it to the smart device.

スマートデバイスが応答を受信し、ユーザーに表示する。 The smart device receives the response and displays it to the user.

具体例 Specific examples

ユーザーがアクセサリー装置の指紋認証センサーに指を当てると、端末が指紋データをキャプチャし、認証を行う。認証が成功すると、端末のボタンが有効化される。ユーザーがボタンを押すと、端末がスマートデバイスに信号を送信し、アプリケーションを起動する。アプリケーションが起動し、「今日の天気を教えて」というプロンプト文を生成AIモデルに送信する。サーバが生成AIモデルを用いて「今日の天気は晴れです」という応答を生成し、スマートデバイスに送信する。スマートデバイスが応答を表示し、ユーザーは画面で「今日の天気は晴れです」という情報を確認することができる。 When a user places their finger on the fingerprint authentication sensor on the accessory device, the terminal captures the fingerprint data and performs authentication. If authentication is successful, the button on the terminal is enabled. When the user presses the button, the terminal sends a signal to the smart device, which launches an application. The application launches and sends a prompt sentence, "Tell me what the weather is today," to the generative AI model. The server uses the generative AI model to generate a response, "Today's weather is sunny," and sends it to the smart device. The smart device displays the response, and the user can see the information, "Today's weather is sunny," on the screen.

プロンプト文の例 Example prompt

「今日の天気を教えて」 "Tell me what the weather is like today."

「次の会議の予定を確認して」 "Check the schedule for the next meeting."

「最新のニュースを教えて」 "Tell me the latest news."

このシステムにより、ユーザーはスマートデバイスを直接操作することなく、手軽に生成AIモデルを利用することが可能であり、さらにユーザー認証手段によりセキュリティも向上する。 This system allows users to easily use generative AI models without having to directly operate a smart device, and also improves security through user authentication measures.

実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.

プログラムの処理の流れ Program processing flow

ステップ1: Step 1:

ユーザがアクセサリー装置の指紋認証センサーに指を当てる。 The user places their finger on the fingerprint authentication sensor on the accessory device.

入力: ユーザの指紋 Input: User fingerprint

データ加工: 指紋認証センサーが指紋データをキャプチャする。 Data processing: The fingerprint sensor captures fingerprint data.

出力: キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、認証を行う。 The device captures the fingerprint data and performs authentication.

入力: キャプチャされた指紋データ Input: Captured fingerprint data

データ演算: 指紋認証システムが指紋データを解析し、ユーザの認証を行う。 Data calculation: The fingerprint authentication system analyzes the fingerprint data and authenticates the user.

出力: 認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ3: Step 3:

認証が成功すると、端末のボタンが有効化される。 If authentication is successful, the device's buttons will be enabled.

入力: 認証結果(成功) Input: Authentication result (success)

データ加工: 認証が成功した場合、端末のボタンを有効化する。 Data processing: If authentication is successful, enable the device button.

出力: 有効化されたボタン Output: Enabled button

ステップ4: Step 4:

ユーザがボタンを押す。 The user presses the button.

入力: 有効化されたボタン Input: Enabled button

データ加工: ボタンが押されたことを端末が検知する。 Data processing: The device detects that a button has been pressed.

出力: ボタン押下の信号 Output: Button press signal

ステップ5: Step 5:

端末がスマートデバイスに信号を送信し、アプリケーションを起動する。 The terminal sends a signal to the smart device to launch the application.

入力: ボタン押下の信号 Input: Button press signal

データ加工: 端末がスマートデバイスに信号を送信し、特定のアプリケーションを起動する。 Data processing: The terminal sends a signal to the smart device to launch a specific application.

出力: 起動されたアプリケーション Output: Launched application

ステップ6: Step 6:

アプリケーションが生成AIモデルにプロンプト文を送信する。 The application sends a prompt to the generative AI model.

入力: 起動されたアプリケーション Input: Launched application

データ加工: アプリケーションが事前に設定されたプロンプト文を生成AIモデルに送信する。 Data processing: The application sends pre-defined prompts to the generative AI model.

出力: 生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ7: Step 7:

サーバが生成AIモデルを用いて応答を生成する。 The server generates a response using a generative AI model.

入力: 生成AIモデルに送信されたプロンプト文 Input: Prompt sent to the generative AI model

データ演算: 生成AIモデルがプロンプト文を解析し、適切な応答を生成する。 Data calculation: The generative AI model analyzes the prompt and generates an appropriate response.

出力: 生成された応答 Output: Generated response

ステップ8: Step 8:

サーバが応答をスマートデバイスに送信する。 The server sends the response to the smart device.

入力: 生成された応答 Input: Generated response

データ加工: サーバが生成された応答をスマートデバイスに送信する。 Data processing: The server sends the generated response to the smart device.

出力: スマートデバイスに送信された応答 Output: Response sent to smart device

ステップ9: Step 9:

スマートデバイスが応答を表示する。 Your smart device will display the response.

入力: スマートデバイスに送信された応答 Input: Response sent to smart device

データ加工: スマートデバイスが受信した応答をユーザに表示する。 Data processing: The smart device displays the response received to the user.

出力: ユーザに表示された応答 Output: Response displayed to the user

このようにして、ユーザはスマートデバイスを直接操作することなく、生成AIモデルを利用することができる。 In this way, users can use generative AI models without directly operating their smart devices.

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来のフードデリバリーシステムでは、ユーザーがスマートフォンを操作して注文を行う必要があり、操作が煩雑であるという問題があった。また、ユーザー認証が不十分であるため、セキュリティ上のリスクも存在していた。さらに、音声認識を利用した注文システムが普及していないため、ユーザーの利便性が低かった。これらの問題を解決し、ユーザーが簡単かつ安全にフードデリバリーを利用できるシステムを提供することが求められている Traditional food delivery systems require users to use their smartphones to place orders, making them cumbersome to operate. In addition, insufficient user authentication poses security risks. Furthermore, voice recognition-based ordering systems are not widespread, resulting in low user convenience. There is a need to solve these problems and provide a system that allows users to use food delivery services easily and safely.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

スマートデバイスに接続可能な付属装置は、指紋認証により該付属装置を操作するユーザを認証する利用者認証手段と、前記付属装置に設けられたボタンであって、該利用者認証手段により認証されたユーザが前記生成系AIへの指示入力を行うために押下されるボタンと、前記ボタンの押下に応じて、ユーザの音声を認識する音声認識手段と、を含む。サーバは、該音声認識手段により取得された音声データを含むプロンプト文と、前記生成系AIとを用いて、前記生成系AIの出力を取得する手段を含む。前記プロンプト文は、フードデリバリーサービスで注文することを指示し、前記取得する手段は、フードデリバリーAPIを使用した注文の結果を取得する。これにより、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能となる。 An accessory device connectable to a smart device includes a user authentication means that authenticates a user operating the accessory device through fingerprint authentication, a button provided on the accessory device that a user authenticated by the user authentication means presses to input instructions to the generative AI, and a voice recognition means that recognizes the user's voice in response to the button being pressed. The server includes a means for acquiring the output of the generative AI using a prompt statement including voice data acquired by the voice recognition means and the generative AI. The prompt statement instructs the user to place an order through a food delivery service, and the acquiring means acquires the results of the order using a food delivery API. This allows users to easily and safely use food delivery services using only their voice, without having to operate their smartphone.

「スマートデバイス」とは、スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器である。 A "smart device" is a portable electronic device, such as a smartphone or tablet, that has internet connectivity and can run applications.

「付属装置」とは、スマートデバイスに接続して使用する追加のハードウェアであり、特定の機能を提供するための装置である。 An "accessory device" is additional hardware that is connected to a smart device to provide specific functionality.

「生成系AI」とは、ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術である。 "Generative AI" is an artificial intelligence technology that generates text and other content based on user instructions and prompts.

「指示入力」とは、ユーザーが生成系AIに対して行う命令や要求の入力である。 "Instruction input" refers to commands or requests that a user inputs to a generative AI.

「利用者認証手段」とは、ユーザーの身元を確認し、認証するための技術や装置である。 "User authentication means" refers to technology or devices used to verify and authenticate a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基にユーザーを認証する技術や装置である。 "Fingerprint authentication means" refers to technology or devices that read a user's fingerprint and authenticate the user based on that information.

「操作手段」とは、ユーザーが付属装置やスマートデバイスを操作するためのインターフェースやボタンである。 "Operation means" refers to the interface or buttons that users use to operate accessory devices or smart devices.

「音声認識手段」とは、ユーザーの音声を解析し、テキストデータに変換する技術や装置である。 "Voice recognition means" refers to technology or devices that analyze the user's voice and convert it into text data.

「音声データ」とは、ユーザーが発した音声をデジタル形式で記録したデータである。 "Voice data" refers to data that has been digitally recorded from the user's voice.

「送信手段」とは、データを他の装置やシステムに送信するための技術や装置である。 "Transmission means" refers to the technology or equipment used to transmit data to other devices or systems.

この発明は、スマートデバイスに接続可能な付属装置を用いて、ユーザーが生成系AIを簡単かつ安全に利用できるシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that allows users to easily and safely use generative AI using an accessory device that can be connected to a smart device. Specific embodiments of this system are described below.

システムの構成 System Configuration

システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートデバイス:スマートフォンやタブレットなど、インターネット接続機能を持ち、アプリケーションを実行できる携帯型の電子機器。 1. Smart device: A portable electronic device such as a smartphone or tablet that has internet connectivity and can run applications.

2. 付属装置:スマートデバイスに接続して使用する追加のハードウェアであり、指紋認証手段、操作手段、音声認識手段を含む。 2. Accessory device: Additional hardware that is connected to a smart device and used, including fingerprint authentication means, operation means, and voice recognition means.

3. 生成系AI:ユーザーからの指示やプロンプトに基づいてテキストやその他のコンテンツを生成する人工知能技術。 3. Generative AI: Artificial intelligence technology that generates text and other content based on user instructions and prompts.

プログラムの処理 Program processing

ハードウェア Hardware

指紋認証センサー:ユーザーの指紋を読み取り、その情報を基にユーザーを認証する。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates the user based on that information.

スマートデバイス:アプリケーションの実行環境として機能する。 Smart device: Functions as the application execution environment.

マイクロフォン:音声認識手段としてユーザーの音声を取得する。 Microphone: Captures the user's voice as a means of voice recognition.

ソフトウェア Software

指紋認証ライブラリ:指紋認証を行うためのソフトウェアモジュール。 Fingerprint authentication library: A software module for performing fingerprint authentication.

音声認識ライブラリ:音声をテキストデータに変換するためのソフトウェアモジュール(例:Google(登録商標) Speech-to-Text)。 Speech recognition library: A software module for converting speech into text data (e.g., Google® Speech-to-Text).

生成系AIモデル:ユーザーのプロンプトに基づいて応答を生成するAIモデル(例:GPT-3(登録商標))。 Generative AI model: An AI model that generates responses based on user prompts (e.g., GPT-3 (registered trademark)).

フードデリバリーAPI:フードデリバリーサービスのAPIを使用して注文を行う。 Food delivery API: Place orders using the food delivery service's API.

処理の流れ Processing flow

1. ユーザー認証:ユーザーが付属装置の指紋認証センサーに指を当てることで認証を行う。認証が成功すると、次のステップに進む。 1. User authentication: The user authenticates by placing their finger on the fingerprint authentication sensor on the accessory device. If authentication is successful, the device proceeds to the next step.

2. 音声入力:ユーザーが付属装置の操作手段(ワンクリックボタン)を押しながら、音声で注文内容を伝える。マイクロフォンが音声を取得し、音声認識ライブラリがこれをテキストデータに変換する。 2. Voice input: The user presses the operation means (one-click button) of the attached device and verbally states the order details. The microphone picks up the voice, and the voice recognition library converts it into text data.

3. プロンプト生成:取得されたテキストデータを基に、生成系AIに対するプロンプト文を生成する。 3. Prompt generation: Generate a prompt sentence for the generative AI based on the acquired text data.

4. AI応答生成:生成系AIモデルがプロンプト文に基づいて最適な応答を生成する。 4. AI response generation: The generative AI model generates the optimal response based on the prompt.

5. 注文実行:生成された応答を基に、フードデリバリーAPIを使用して注文を完了する。 5. Order execution: Based on the generated response, the order is completed using the food delivery API.

具体例 Specific examples

ユーザーが指紋認証センサーに指を当てて認証し、「ピザを注文したい」と音声で伝えると、音声認識ライブラリがこれをテキストデータに変換する。生成系AIモデルに「ユーザーが注文したいのは: ピザ」というプロンプト文を入力すると、生成系AIモデルが最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 When a user places their finger on the fingerprint sensor for authentication and says "I want to order pizza," the speech recognition library converts this into text data. When the generative AI model receives the prompt "The user wants to order: pizza," the generative AI model suggests the most suitable pizza restaurant and menu item, and completes the order using a food delivery API.

プロンプト文の例 Example prompt

「ユーザーが注文したいのは: ピザ」 "User wants to order: Pizza"

このようにして、ユーザーはスマートフォンを操作することなく、音声だけで簡単かつ安全にフードデリバリーを利用することが可能である。 In this way, users can easily and safely use food delivery services using only their voice, without having to operate their smartphone.

応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋データ。 Input: User's fingerprint data.

処理:指紋認証ライブラリが指紋データを解析し、登録された指紋データと照合する。 Processing: The fingerprint authentication library analyzes the fingerprint data and compares it with registered fingerprint data.

出力:認証結果(成功または失敗)。 Output: Authentication result (success or failure).

具体的な動作:指紋認証センサーがユーザの指紋を読み取り、指紋認証ライブラリがそのデータを解析して認証を行う。 Specific operation: The fingerprint authentication sensor reads the user's fingerprint, and the fingerprint authentication library analyzes the data to perform authentication.

ステップ2: Step 2:

ユーザが付属装置の操作手段(ワンクリックボタン)を押す。 The user presses the operating means (one-click button) of the accessory device.

入力:ユーザの操作(ボタン押下)。 Input: User operation (button press).

処理:操作手段が押下されたことを検知し、音声認識モードを起動する。 Processing: Detects that the operating means has been pressed and activates voice recognition mode.

出力:音声認識モードの起動。 Output: Activate voice recognition mode.

具体的な動作:ボタンが押されたことをセンサーが検知し、音声認識ライブラリが音声入力の準備を開始する。 Specific operation: The sensor detects that a button has been pressed, and the voice recognition library begins preparing for voice input.

ステップ3: Step 3:

ユーザが音声で注文内容を伝える。 The user verbally communicates the order details.

入力:ユーザの音声データ。 Input: User's voice data.

処理:マイクロフォンが音声データを取得し、音声認識ライブラリがこれをテキストデータに変換する。 Processing: The microphone captures the audio data, and the speech recognition library converts it into text data.

出力:テキストデータ(注文内容)。 Output: Text data (order details).

具体的な動作:マイクロフォンがユーザの音声をキャプチャし、音声認識ライブラリがその音声を解析してテキストに変換する。 Specific operation: The microphone captures the user's voice, and the speech recognition library analyzes the voice and converts it into text.

ステップ4: Step 4:

端末が取得されたテキストデータを基にプロンプト文を生成する。 The device generates a prompt based on the acquired text data.

入力:テキストデータ(注文内容)。 Input: Text data (order details).

処理:テキストデータを「ユーザーが注文したいのは: [注文内容]」という形式のプロンプト文に変換する。 Processing: Convert the text data into a prompt in the format "The user would like to order: [Order details]".

出力:プロンプト文。 Output: Prompt statement.

具体的な動作:テキストデータをフォーマットに従ってプロンプト文に変換する。 Specific operation: Converts text data into prompt text according to the format.

ステップ5: Step 5:

端末が生成系AIモデルにプロンプト文を送信する。 The device sends a prompt to the generative AI model.

入力:プロンプト文。 Input: Prompt text.

処理:生成系AIモデルがプロンプト文を解析し、最適な応答を生成する。 Processing: The generative AI model analyzes the prompt and generates the optimal response.

出力:AI応答(最適な注文内容)。 Output: AI response (optimal order content).

具体的な動作:プロンプト文を生成系AIモデルに送信し、AIが応答を生成する。 Specific operation: The prompt sentence is sent to the generative AI model, and the AI generates a response.

ステップ6: Step 6:

端末が生成された応答を基にフードデリバリーAPIを使用して注文を完了する。 The device uses the food delivery API based on the generated response to complete the order.

入力:AI応答(最適な注文内容)。 Input: AI response (optimal order content).

処理:フードデリバリーAPIを使用して注文を実行する。 Processing: Fulfill orders using the food delivery API.

出力:注文確認(注文が正常に完了したことを示すデータ)。 Output: Order confirmation (data indicating the order was completed successfully).

具体的な動作:AI応答をフードデリバリーAPIに送信し、注文を確定する。 Specific operation: Sends the AI response to the food delivery API and confirms the order.

なお、サーバは、後述する感情エンジンを用いてユーザの感情を認識する手段を更に含み、該音声認識手段により取得された音声データ、及び前記ユーザの感情を含むプロンプト文と、前記生成系AIとを用いて、生成系AIの出力を取得するようにしてもよい。例えば、ユーザの感情が、「悲しみ」であると認識された場合には、「ユーザーが注文したいのは: ピザ、ユーザの感情:悲しみ」というプロンプト文を生成し、生成系AIモデルが、ユーザの感情を考慮した最適なピザ店とメニューを提案し、フードデリバリーAPIを使用して注文を完了する。 The server may further include means for recognizing the user's emotions using an emotion engine, which will be described later, and may obtain the output of the generative AI using the voice data acquired by the voice recognition means, a prompt statement including the user's emotion, and the generative AI. For example, if the user's emotion is recognized as "sadness," a prompt statement such as "User wants to order: pizza, user's emotion: sadness" may be generated, and the generative AI model may suggest the optimal pizza restaurant and menu item taking the user's emotion into consideration, and the order may be completed using a food delivery API.

なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.

「形態例1」 "Example 1"

本発明の一実施形態として、スマートフォンに接続可能なアクセサリー装置が提供される。この装置は、生成系AIへのプロンプト入力を可能にする手段、ユーザー認証手段、およびユーザー認証手段により認証されたユーザーが生成系AIへのプロンプト入力を行うための操作手段を含む。さらに、この装置はユーザーの感情を認識する感情エンジンを含む。具体的には、ユーザーの声のトーンや顔の表情から感情を認識し、その情報を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 One embodiment of the present invention provides an accessory device connectable to a smartphone. This device includes a means for enabling prompt input to the generative AI, a user authentication means, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI. The device also includes an emotion engine that recognizes the user's emotions. Specifically, it recognizes emotions from the user's tone of voice and facial expression, and feeds this information back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotions.

「形態例2」 "Example 2"

本発明の別の実施形態として、感情エンジンがユーザーの声のトーンから感情を認識するシステムが提供される。具体的には、ユーザーがアクセサリー装置に話しかけると、装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。感情エンジンは音声データのトーンからユーザーの感情を分析し、その結果を生成系AIにフィードバックする。これにより、生成系AIはユーザーの感情に応じた適切なレスポンスを生成することが可能となる。 Another embodiment of the present invention provides a system in which an emotion engine recognizes emotions from the tone of a user's voice. Specifically, when a user speaks to an accessory device, a microphone within the device captures the user's voice and transmits the voice data to the emotion engine. The emotion engine analyzes the user's emotion from the tone of the voice data and feeds the results back to the generative AI. This enables the generative AI to generate an appropriate response according to the user's emotion.

以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.

「形態例1」 "Example 1"

ステップ1:ユーザーがスマートフォンに接続可能なアクセサリー装置を操作する。 Step 1: The user operates an accessory device that can be connected to a smartphone.

ステップ2:装置のユーザー認証手段がユーザーを認証する。認証方法としては、例えば指紋認証が考えられる。 Step 2: The device's user authentication means authenticates the user. One possible authentication method is fingerprint authentication.

ステップ3:認証されたユーザーが生成系AIへのプロンプト入力を行う。 Step 3: The authenticated user provides prompt input to the generative AI.

ステップ4:装置の感情エンジンがユーザーの声のトーンや顔の表情から感情を認識する。 Step 4: The device's emotion engine recognizes emotions from the user's tone of voice and facial expressions.

ステップ5:感情エンジンがその情報を生成系AIにフィードバックする。 Step 5: The emotion engine feeds that information back to the generative AI.

ステップ6:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 6: The generative AI generates an appropriate response based on the user's emotions.

「形態例2」 "Example 2"

ステップ1:ユーザーがアクセサリー装置に話しかける。 Step 1: The user speaks to the accessory device.

ステップ2:装置内のマイクロフォンがユーザーの声をキャプチャし、その音声データを感情エンジンに送信する。 Step 2: The device's microphone captures the user's voice and sends the audio data to the emotion engine.

ステップ3:感情エンジンが音声データのトーンからユーザーの感情を分析する。 Step 3: The emotion engine analyzes the user's emotions from the tone of the voice data.

ステップ4:感情エンジンがその結果を生成系AIにフィードバックする。 Step 4: The emotion engine feeds the results back to the generative AI.

ステップ5:生成系AIがユーザーの感情に応じた適切なレスポンスを生成する。 Step 5: The generative AI generates an appropriate response based on the user's emotions.

(実施例1) (Example 1)

次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来のスマートフォンに接続可能なアクセサリー装置では、生成系AIモデルへのプロンプト入力が可能であるが、ユーザーの感情状態を考慮したレスポンスを生成することができないという課題があった。これにより、ユーザーの意図や感情に応じた適切なレスポンスを得ることが難しく、ユーザーエクスペリエンスが向上しないという問題が生じていた Existing smartphone accessory devices allow prompt input to generative AI models, but they have the problem of being unable to generate responses that take the user's emotional state into account. This makes it difficult to obtain appropriate responses based on the user's intentions and emotions, resulting in a lack of improvement in the user experience.

実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIモデルへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIモデルにフィードバックする手段と、を含む。これにより、ユーザーの感情状態を考慮した適切なレスポンスを生成系AIモデルから得ることが可能となる。 In this invention, the server is an accessory device connectable to a smartphone, and includes: means for enabling prompt input to the generative AI model; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI model; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI model. This makes it possible to obtain an appropriate response from the generative AI model that takes into account the user's emotional state.

「スマートフォン」とは、携帯電話機能とコンピュータ機能を併せ持つ携帯情報端末である。 A "smartphone" is a mobile information terminal that combines the functions of a mobile phone and a computer.

「アクセサリー装置」とは、スマートフォンに接続して追加機能を提供する外部デバイスである。 An "accessory device" is an external device that connects to a smartphone to provide additional functionality.

「生成系AIモデル」とは、入力されたプロンプトに基づいてテキストや音声などの出力を生成する人工知能システムである。 A "generative AI model" is an artificial intelligence system that generates output such as text or voice based on input prompts.

「プロンプト入力」とは、ユーザーが生成系AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術手段である。 "User authentication means" refers to technical means for verifying a user's identity.

「指紋認証手段」とは、ユーザーの指紋を読み取り、その情報を基に認証を行う技術手段である。 "Fingerprint authentication means" refers to a technical means that reads a user's fingerprint and performs authentication based on that information.

「操作手段」とは、ユーザーがアクセサリー装置を操作するためのインターフェースである。 "Operation means" refers to the interface that allows the user to operate the accessory device.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できるインターフェースである。 A "one-click operation method" is an interface that allows users to complete an operation with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を解析して感情を認識する技術手段である。 "Emotion recognition means" refers to a technical means for recognizing emotions by analyzing the user's tone of voice and facial expressions.

「感情情報」とは、感情認識手段によって取得されたユーザーの感情状態に関するデータである。 "Emotion information" is data regarding the user's emotional state obtained by emotion recognition means.

「フィードバック手段」とは、取得された感情情報を生成系AIモデルに送信する技術手段である。 "Feedback means" refers to the technical means for transmitting acquired emotional information to the generative AI model.

発明を実施するための形態 Form for implementing the invention

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、生成系AIモデルへのプロンプト入力を行い、ユーザーの感情状態を考慮したレスポンスを得るシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that uses an accessory device connectable to a smartphone to provide prompt input to a generative AI model and obtain a response that takes into account the user's emotional state. A specific embodiment of this system is described below.

ハードウェアおよびソフトウェアの構成 Hardware and software configuration

アクセサリー装置 Accessory equipment

アクセサリー装置は、スマートフォンにBluetoothなどの無線通信手段を用いて接続される。この装置には、以下の主要なコンポーネントが含まれる: The accessory device connects to your smartphone using wireless communication methods such as Bluetooth. The device includes the following main components:

指紋認証センサー:ユーザーの指紋を読み取り、認証を行う。 Fingerprint authentication sensor: Reads the user's fingerprint and authenticates them.

操作ボタン:ユーザーがプロンプト入力を開始するためのインターフェース。 Action button: An interface that allows the user to start prompt input.

感情認識エンジン:ユーザーの声のトーンや顔の表情を解析し、感情情報を取得する。 Emotion recognition engine: Analyzes the user's tone of voice and facial expressions to obtain emotional information.

スマートフォン Smartphone

スマートフォンは、アクセサリー装置と連携して動作する専用アプリケーションを実行する。このアプリケーションは、以下の機能を提供する: The smartphone runs a dedicated application that works in conjunction with the accessory device. This application provides the following functions:

プロンプト入力インターフェース:ユーザーが生成系AIモデルに対して指示や質問を入力するための画面。 Prompt input interface: A screen where users can enter instructions or questions for the generative AI model.

データ送信機能:プロンプトと感情情報をサーバに送信する。 Data transmission function: Sends prompts and emotion information to the server.

サーバ Server

サーバは、スマートフォンと生成系AIモデルの間でデータ通信を行うバックエンドサービスを提供する。サーバは、以下の機能を持つ: The server provides backend services that handle data communication between smartphones and generative AI models. The server has the following functions:

データ中継機能:スマートフォンから受信したプロンプトと感情情報を生成系AIモデルに送信する。 Data relay function: Sends prompts and emotional information received from a smartphone to the generative AI model.

レスポンス受信機能:生成系AIモデルからのレスポンスを受信し、スマートフォンに転送する。 Response reception function: Receives responses from the generative AI model and forwards them to the smartphone.

具体例 Specific examples

ユーザがスマートフォンに接続されたアクセサリー装置を使用して、生成系AIモデルに対して質問を行うシナリオを考える。 Consider a scenario in which a user uses an accessory device connected to a smartphone to ask a generative AI model questions.

1. ユーザ認証 1. User authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置き、認証を行う。端末(スマートフォン)は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。認証が成功すると、ユーザは次のステップに進むことができる。 The user places their finger on the accessory device's fingerprint authentication sensor to authenticate. The terminal (smartphone) receives the fingerprint data from the accessory device and compares it with registered fingerprint data. If authentication is successful, the user can proceed to the next step.

2. プロンプト入力 2. Prompt Input

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。 The user opens a dedicated application on their smartphone and enters a prompt. For example, they might enter, "What's the weather like today?" The device then prepares to send this prompt to the generative AI model.

3. 感情認識 3. Emotion recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。端末は、この感情データを生成系AIモデルに送信するために準備する。 The accessory device analyzes the user's emotional state using an emotion engine that senses the user's tone of voice and facial expressions. The device prepares this emotion data to send to the generative AI model.

4. 生成系AIモデルへのプロンプト送信 4. Sending prompts to generative AI models

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。サーバは、これらのデータを生成系AIモデルに送信する。生成系AIモデルは、プロンプトと感情データを基に適切なレスポンスを生成する。 The device sends the prompt and emotion data entered by the user to the server. The server then sends this data to the generative AI model. The generative AI model generates an appropriate response based on the prompt and emotion data.

5. 生成系AIモデルからのレスポンス受信 5. Receiving responses from generative AI models

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。端末は、このレスポンスをユーザに表示する準備を行う。 The server receives the response from the generative AI model and forwards it to the device. The device then prepares to display this response to the user.

6. レスポンスの表示 6. Displaying the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it might say, "It's sunny today. Have a nice day." The user can review this response and enter further prompts if necessary.

プロンプト文の例 Example prompt

「今日の天気はどうですか?」 "What's the weather like today?"

「次の会議の予定を教えてください。」 "Please let me know when the next meeting is scheduled."

「最近のニュースを教えてください。」 "Please tell me the latest news."

このようにして、ユーザはアクセサリー装置を通じて生成系AIモデルと自然な対話を行うことができる。 In this way, users can naturally interact with generative AI models through accessory devices.

実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.

ステップ1:ユーザ認証 Step 1: User Authentication

ユーザは、アクセサリー装置の指紋認証センサーに指を置く。端末は、指紋データをアクセサリー装置から受け取り、登録された指紋データと照合する。入力はユーザの指紋データであり、出力は認証結果である。端末は、指紋データを解析し、登録データと一致するかどうかを確認する。認証が成功すると、端末は「認証成功」と表示する。 The user places their finger on the fingerprint authentication sensor of the accessory device. The terminal receives the fingerprint data from the accessory device and compares it with registered fingerprint data. The input is the user's fingerprint data, and the output is the authentication result. The terminal analyzes the fingerprint data and checks whether it matches the registered data. If authentication is successful, the terminal displays "Authentication successful."

ステップ2:アクセサリー装置とスマートフォンの接続 Step 2: Connect your accessory device to your smartphone

端末は、Bluetooth通信を介してアクセサリー装置と接続を確立する。入力はBluetooth接続要求であり、出力は接続状態である。端末は、アクセサリー装置からの接続要求を受け取り、接続を確立する。サーバは、この接続を監視し、必要に応じてデータの中継を行う。接続が成功すると、端末は「接続成功」と表示する。 The terminal establishes a connection with an accessory device via Bluetooth communication. The input is a Bluetooth connection request and the output is the connection status. The terminal receives a connection request from the accessory device and establishes the connection. The server monitors this connection and relays data as necessary. If the connection is successful, the terminal displays "Connection successful."

ステップ3:プロンプト入力 Step 3: Enter the prompt

ユーザは、スマートフォン上の専用アプリケーションを開き、プロンプトを入力する。例えば、「今日の天気はどうですか?」と入力する。入力はユーザのプロンプト文であり、出力はプロンプトデータである。端末は、このプロンプトを生成系AIモデルに送信する準備を行う。ユーザが入力を完了すると、端末は「プロンプト入力完了」と表示する。 The user opens a dedicated application on their smartphone and inputs a prompt. For example, they might input "What's the weather like today?" The input is the user's prompt, and the output is the prompt data. The device prepares to send this prompt to the generative AI model. When the user has completed their input, the device displays "Prompt input completed."

ステップ4:感情認識 Step 4: Emotion Recognition

アクセサリー装置は、ユーザの声のトーンや顔の表情を感知する感情エンジンを使用して、ユーザの感情状態を解析する。入力はユーザの声のトーンや顔の表情データであり、出力は感情データである。端末は、この感情データを生成系AIモデルに送信するために準備する。感情データが取得されると、端末は「感情データ取得成功」と表示する。 The accessory device uses an emotion engine that senses the user's vocal tone and facial expressions to analyze the user's emotional state. The input is the user's vocal tone and facial expression data, and the output is emotion data. The device prepares this emotion data to send to the generative AI model. Once the emotion data is acquired, the device displays "Emotion data acquisition successful."

ステップ5:生成系AIモデルへのプロンプト送信 Step 5: Send prompts to the generative AI model

端末は、ユーザが入力したプロンプトと感情データをサーバに送信する。入力はプロンプトデータと感情データであり、出力はサーバへの送信結果である。サーバは、これらのデータを生成系AIモデルに送信する。データ送信が成功すると、端末は「データ送信成功」と表示する。 The device sends the prompt and emotion data entered by the user to the server. The input is the prompt data and emotion data, and the output is the result of transmission to the server. The server then sends this data to the generative AI model. If the data transmission is successful, the device displays "Data transmission successful."

ステップ6:生成系AIモデルからのレスポンス受信 Step 6: Receive a response from the generative AI model

サーバは、生成系AIモデルからのレスポンスを受信し、端末に転送する。入力は生成系AIモデルからのレスポンスデータであり、出力は端末への転送結果である。端末は、このレスポンスをユーザに表示する準備を行う。レスポンスが受信されると、端末は「レスポンス受信成功」と表示する。 The server receives the response from the generative AI model and forwards it to the device. The input is the response data from the generative AI model, and the output is the result of forwarding to the device. The device prepares to display this response to the user. Once the response is received, the device displays "Response received successfully."

ステップ7:レスポンスの表示 Step 7: View the response

端末は、生成系AIモデルから受信したレスポンスをユーザに表示する。例えば、「今日は晴れです。素敵な一日をお過ごしください。」と表示される。入力は生成系AIモデルからのレスポンスデータであり、出力はユーザへの表示結果である。ユーザは、このレスポンスを確認し、必要に応じてさらにプロンプトを入力することができる。 The device displays the response received from the generative AI model to the user. For example, it displays "It's sunny today. Have a nice day." The input is the response data from the generative AI model, and the output is the display result to the user. The user can review this response and enter further prompts if necessary.

(応用例1) (Application Example 1)

次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来のフードデリバリーサービスでは、ユーザーの感情や状況に応じたカスタマイズされた提案を行うことが難しかった。また、ユーザーが生成系AIを利用して注文プロセスを簡素化するための手段が不足していた。これにより、ユーザーエクスペリエンスが低下し、サービスの利用頻度が減少する可能性があった Traditional food delivery services struggled to provide customized recommendations based on users' emotions and circumstances. They also lacked a means for users to use generative AI to simplify the ordering process. This could result in a poor user experience and reduced frequency of service use.

応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.

この発明では、サーバは、スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情情報を生成系AIにフィードバックする手段と、を含む。これにより、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this invention, the server is an accessory device connectable to a smartphone and includes: means for enabling prompt input to the generative AI; user authentication means for operating the accessory device; operation means for a user authenticated by the user authentication means to input prompts to the generative AI; emotion recognition means for recognizing the user's emotions; and means for feeding back emotion information recognized by the emotion recognition means to the generative AI. This makes it possible to propose customized food delivery according to the user's emotions.

「スマートフォンに接続可能なアクセサリー装置」とは、スマートフォンと無線通信手段を用いて接続される外部デバイスであり、特定の機能を提供するものである。 An "accessory device connectable to a smartphone" is an external device that connects to a smartphone using wireless communication means and provides specific functions.

「生成系AI」とは、ユーザーからのプロンプト入力に基づいて応答や提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates responses and suggestions based on prompt input from the user.

「プロンプト入力を可能にする手段」とは、ユーザーが生成系AIに対して指示や質問を入力するためのインターフェースを提供する機能である。 "Means to enable prompt input" is a function that provides an interface for users to input instructions or questions to the generative AI.

「ユーザー認証手段」とは、ユーザーの身元を確認するための技術であり、特定のユーザーのみがシステムを操作できるようにするものである。 "User authentication means" refers to technology used to verify a user's identity and ensure that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋をスキャンし、その情報を基にユーザーを認証する技術である。 "Fingerprint authentication" is a technology that scans a user's fingerprint and authenticates the user based on that information.

「操作手段」とは、ユーザーがシステムを操作するための物理的またはソフトウェア的なインターフェースである。 "Operation means" refers to the physical or software interface that allows the user to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリック操作で特定の機能を実行できるインターフェースである。 A "one-click operation means" is an interface that allows users to perform a specific function with a single click.

「感情認識手段」とは、ユーザーの声のトーンや顔の表情を分析し、その感情を認識する技術である。 "Emotion recognition means" is a technology that analyzes the user's tone of voice and facial expressions to recognize their emotions.

「感情情報を生成系AIにフィードバックする手段」とは、認識された感情情報を生成系AIに送信し、生成系AIがその情報を基に応答や提案を生成するための機能である。 "Means for feeding back emotional information to the generative AI" is a function that sends recognized emotional information to the generative AI, allowing the generative AI to generate responses and suggestions based on that information.

この発明は、スマートフォンに接続可能なアクセサリー装置を用いて、ユーザーが生成系AIを通じてフードデリバリーサービスを利用する際に、注文プロセスを簡素化し、ユーザーの感情に応じたカスタマイズされた提案を行うシステムである。 This invention is a system that uses an accessory device connectable to a smartphone to simplify the ordering process when a user uses a food delivery service through generative AI and makes customized suggestions based on the user's emotions.

システムの構成 System Configuration

このシステムは以下の主要なコンポーネントから構成される: The system consists of the following main components:

1. スマートフォンに接続可能なアクセサリー装置 1. Accessory devices that can be connected to smartphones

無線通信手段: Bluetoothなどを用いてスマートフォンと接続される。 Wireless communication method: Connects to a smartphone using Bluetooth or other means.

ユーザー認証手段: 指紋認証センサーを用いてユーザーを認証する。 User authentication method: User authentication is performed using a fingerprint sensor.

操作手段: ワンクリック操作手段を用いて、ユーザーが生成系AIへのプロンプト入力を行う。 Operation method: The user uses a one-click operation method to input prompts to the generative AI.

感情認識手段: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 Emotion recognition: Analyzes the user's tone of voice and facial expressions to recognize emotions.

2. 生成系AI 2. Generative AI

プロンプト入力: ユーザーからの指示や質問を受け取り、応答や提案を生成する。 Prompt Input: Receives instructions or questions from the user and generates responses or suggestions.

感情情報のフィードバック: 認識された感情情報を基に、カスタマイズされた応答や提案を生成する。 Emotional feedback: Generate customized responses and suggestions based on recognized emotional information.

プログラムの処理 Program processing

サーバは、以下のような処理を行う: The server performs the following process:

1. Bluetooth接続: スマートフォンとアクセサリー装置をBluetoothを用いて接続する。 1. Bluetooth connection: Connect your smartphone and accessory device using Bluetooth.

2. ユーザー認証: 指紋認証センサーを用いてユーザーの指紋をスキャンし、認証を行う。 2. User authentication: The fingerprint sensor scans the user's fingerprint for authentication.

3. 感情認識: ユーザーの声のトーンや顔の表情を分析し、感情を認識する。 3. Emotion recognition: Analyze the user's tone of voice and facial expressions to recognize emotions.

4. プロンプト生成: 認識された感情に基づいて、生成系AIへのプロンプトを生成する。 4. Prompt generation: Generate prompts for the generative AI based on the recognized emotions.

5. AI応答生成: 生成系AIを用いて、プロンプトに対する応答や提案を生成する。 5. AI Response Generation: Use generative AI to generate responses and suggestions to prompts.

使用するハードウェアおよびソフトウェア Hardware and software used

ハードウェア: Bluetoothモジュール、指紋認証センサー、カメラ(顔認識用)、マイク(音声認識用) Hardware: Bluetooth module, fingerprint sensor, camera (for facial recognition), microphone (for voice recognition)

ソフトウェア: Bluetooth接続ライブラリ、指紋認証ライブラリ、感情認識エンジン、生成系AIモデル Software: Bluetooth connection library, fingerprint authentication library, emotion recognition engine, generative AI model

具体例 Specific examples

ユーザーが疲れていると認識された場合、生成系AIは「疲れているときにおすすめのフードデリバリー」を提案する。例えば、以下のようなプロンプト文が生成される: If the generative AI recognizes that the user is tired, it will suggest "food delivery options recommended for when you're tired." For example, it might generate a prompt like this:

ユーザーは疲れている気分です。おすすめのフードデリバリーを提案してください。 The user is feeling tired. Please suggest some food delivery options.

このようにして、ユーザーの感情に応じたカスタマイズされたフードデリバリーの提案が可能となる。 In this way, it becomes possible to offer customized food delivery suggestions based on the user's emotions.

応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.

ステップ1: Step 1:

サーバは、Bluetoothモジュールを用いてスマートフォンとアクセサリー装置を接続する。入力はスマートフォンとアクセサリー装置のペアリング情報であり、出力は接続の確立である。具体的には、Bluetooth接続ライブラリを使用して、スマートフォンとアクセサリー装置間の通信を確立する。 The server connects the smartphone and accessory device using a Bluetooth module. The input is pairing information between the smartphone and accessory device, and the output is the establishment of the connection. Specifically, it uses the Bluetooth connection library to establish communication between the smartphone and accessory device.

ステップ2: Step 2:

端末は、指紋認証センサーを用いてユーザーの指紋をスキャンし、ユーザー認証を行う。入力はユーザーの指紋データであり、出力は認証結果である。具体的には、指紋認証ライブラリを使用して、スキャンされた指紋データを登録済みのデータと照合し、認証の成否を判断する。 The device uses a fingerprint authentication sensor to scan the user's fingerprint and perform user authentication. The input is the user's fingerprint data, and the output is the authentication result. Specifically, the fingerprint authentication library is used to compare the scanned fingerprint data with registered data to determine whether authentication was successful.

ステップ3: Step 3:

端末は、マイクとカメラを用いてユーザーの声のトーンと顔の表情をキャプチャし、感情認識を行う。入力は音声データと画像データであり、出力は認識された感情情報である。具体的には、感情認識エンジンを使用して、音声データと画像データを解析し、ユーザーの感情を特定する。 The device uses a microphone and camera to capture the user's tone of voice and facial expressions to perform emotion recognition. The input is voice data and image data, and the output is recognized emotional information. Specifically, an emotion recognition engine is used to analyze the voice data and image data to identify the user's emotions.

ステップ4: Step 4:

サーバは、認識された感情情報を基に生成系AIへのプロンプトを生成する。入力は感情情報であり、出力はプロンプト文である。具体的には、感情情報をテキスト形式に変換し、生成系AIに適したプロンプト文を作成する。 The server generates a prompt for the generative AI based on the recognized emotional information. The input is emotional information, and the output is a prompt. Specifically, the emotional information is converted into text format and a prompt suitable for the generative AI is created.

ステップ5: Step 5:

サーバは、生成系AIモデルを用いてプロンプト文に対する応答や提案を生成する。入力はプロンプト文であり、出力は生成された応答や提案である。具体的には、生成系AIモデルにプロンプト文を入力し、AIが応答や提案を生成する。 The server uses a generative AI model to generate responses and suggestions in response to prompts. The input is the prompt, and the output is the generated response or suggestion. Specifically, the prompt is input into the generative AI model, and the AI generates the response or suggestion.

ステップ6: Step 6:

端末は、生成された応答や提案をユーザーに提示する。入力は生成された応答や提案であり、出力はユーザーへの表示である。具体的には、スマートフォンのディスプレイに応答や提案を表示し、ユーザーが確認できるようにする。 The device presents the generated response or suggestion to the user. The input is the generated response or suggestion, and the output is what is displayed to the user. Specifically, the response or suggestion is displayed on the smartphone display so that the user can check it.

(実施例2) (Example 2)

次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来の生成AIモデルを利用するシステムでは、ユーザーがスマートフォンを操作する必要があり、手軽に利用することが難しかった。また、ユーザーの感情に応じた適切なレスポンスを生成することができず、ユーザー体験が限定されていた。これにより、ユーザーが生成AIモデルを効果的に活用することが困難であった。 Conventional systems using generative AI models required users to operate their smartphones, making them difficult to use. They also were unable to generate appropriate responses based on the user's emotions, limiting the user experience. This made it difficult for users to effectively utilize generative AI models.

実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.

この発明では、サーバは、ユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが生成AIモデルへのプロンプト入力を行うための操作手段と、ユーザーの音声データをキャプチャし、感情を分析する感情認識手段と、該感情認識手段により分析された感情情報を生成AIモデルにフィードバックする手段と、を含む。これにより、ユーザーはスマートフォンを操作することなく、手軽に生成AIモデルを利用でき、さらにユーザーの感情に応じた適切なレスポンスを得ることが可能となる。 In this invention, the server includes a user authentication means, an operation means for a user authenticated by the user authentication means to input prompts to the generative AI model, an emotion recognition means for capturing the user's voice data and analyzing their emotions, and a means for feeding back the emotion information analyzed by the emotion recognition means to the generative AI model. This allows the user to easily use the generative AI model without operating a smartphone, and further enables the user to obtain an appropriate response according to their emotions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、指紋認証や顔認証などの生体認証技術を含む。 "User authentication means" refers to a means for verifying a user's identity, and includes biometric authentication technologies such as fingerprint authentication and facial recognition.

「操作手段」とは、ユーザーが生成AIモデルへのプロンプト入力を行うための手段であり、ボタンやタッチスクリーンなどのインターフェースを含む。 "Operation means" refers to the means by which a user inputs prompts to the generated AI model, and includes interfaces such as buttons and touchscreens.

「感情認識手段」とは、ユーザーの音声データをキャプチャし、そのトーンや内容からユーザーの感情を分析するための手段である。 "Emotion recognition means" is a means for capturing a user's voice data and analyzing the user's emotions from its tone and content.

「生成AIモデル」とは、ユーザーからのプロンプトに基づいて適切なレスポンスを生成する人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates appropriate responses based on prompts from the user.

「プロンプト入力」とは、ユーザーが生成AIモデルに対して指示や質問を入力する行為である。 "Prompt input" is the act of a user inputting instructions or questions into a generative AI model.

「フィードバック手段」とは、感情認識手段により分析された感情情報を生成AIモデルに送信するための手段である。 The "feedback means" is a means for transmitting the emotional information analyzed by the emotion recognition means to the generative AI model.

この発明は、ユーザー認証手段、操作手段、感情認識手段、フィードバック手段を含むシステムを提供するものである。以下に、このシステムの具体的な実施形態を説明する。 This invention provides a system that includes a user authentication means, an operation means, an emotion recognition means, and a feedback means. Specific embodiments of this system are described below.

まず、ユーザはアクセサリー装置の指紋認証センサーに指を当てる。指紋認証センサーは、ユーザーの指紋データをキャプチャし、端末に送信する。端末はこのデータをサーバに送信し、サーバは指紋データを既存のデータベースと照合してユーザーの認証を行う。認証が成功すると、端末のボタンが有効化される。 First, the user places their finger on the accessory device's fingerprint authentication sensor. The fingerprint authentication sensor captures the user's fingerprint data and sends it to the device. The device then sends this data to the server, which compares the fingerprint data with an existing database to authenticate the user. If authentication is successful, the device's buttons are enabled.

次に、ユーザが有効化されたボタンを押すと、端末はスマートフォン上の専用アプリケーションを起動する。このアプリケーションは、生成AIモデルに対してプロンプト文を入力する機能を持つ。例えば、「今日の天気について教えてください」というプロンプト文を生成AIモデルに入力する。 Next, when the user presses the enabled button, the device launches a dedicated application on the smartphone. This application has the function of inputting prompt sentences to the generative AI model. For example, the prompt sentence "Please tell me about today's weather" is input to the generative AI model.

さらに、ユーザがアクセサリー装置に話しかけると、端末内のマイクロフォンが音声データをキャプチャする。この音声データは感情認識手段に送信され、感情認識手段は音声データのトーンを解析してユーザの感情を分析する。分析結果はフィードバック手段を通じて生成AIモデルに送信される。生成AIモデルは、この感情情報に基づいて適切なレスポンスを生成する。例えば、「ユーザは少し疲れているようです。元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。 Furthermore, when the user speaks to the accessory device, the microphone in the terminal captures voice data. This voice data is sent to the emotion recognition means, which analyzes the tone of the voice data to analyze the user's emotions. The analysis results are sent to the generative AI model via the feedback means. The generative AI model generates an appropriate response based on this emotional information. For example, in response to the prompt "The user seems a little tired. Please generate an encouraging message," it generates the response "Let's take a break today and refresh ourselves."

このシステムにより、ユーザはスマートフォンを操作することなく、手軽に生成AIモデルを利用できる。また、ユーザの感情に応じた適切なレスポンスを得ることが可能となるため、ユーザ体験が向上する。 This system allows users to easily use generative AI models without having to operate a smartphone. It also improves the user experience by enabling appropriate responses based on the user's emotions.

具体例として、ユーザがアクセサリー装置の指紋認証センサーに指を当て、認証が成功した後にボタンを押すと、スマートフォン上のアプリケーションが起動し、以下のプロンプト文が生成AIモデルに入力される: For example, when a user places their finger on the fingerprint authentication sensor on an accessory device and presses a button after successful authentication, an application on the smartphone launches and the following prompt is input into the generative AI model:

「今日の天気について教えてください。」 "Can you tell me about today's weather?"

別の具体例として、ユーザがアクセサリー装置に「今日はどんな気分?」と話しかけると、感情認識手段がユーザの声のトーンから感情を認識し、生成AIモデルに以下のプロンプト文を入力する: As another example, when a user asks an accessory device, "How are you feeling today?", the emotion recognition means recognizes the emotion from the user's tone of voice and inputs the following prompt sentence into the generative AI model:

「ユーザは少し疲れているようです。元気づけるメッセージを生成してください。」 "The user seems a little tired. Please generate an encouraging message."

これにより、ユーザはスマートフォンを操作することなく、手軽に生成AIを活用することが可能となる。 This allows users to easily utilize generative AI without having to operate their smartphone.

実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.

ステップ1: Step 1:

ユーザが指紋認証センサーに指を当てる。 The user places their finger on the fingerprint sensor.

入力:ユーザの指紋 Input: User's fingerprint

具体的な動作:ユーザがアクセサリー装置の指紋認証センサーに指を当てると、センサーが青く光る。 Specific operation: When the user places their finger on the fingerprint authentication sensor on the accessory device, the sensor will glow blue.

出力:キャプチャされた指紋データ Output: Captured fingerprint data

ステップ2: Step 2:

端末が指紋データをキャプチャし、サーバに送信する。 The device captures fingerprint data and sends it to the server.

入力:キャプチャされた指紋データ Input: Captured fingerprint data

具体的な動作:端末は指紋認証センサーから指紋データをキャプチャし、そのデータをサーバに送信する際、端末の画面に「認証中...」と表示される。 Specific operation: The device captures fingerprint data from the fingerprint authentication sensor and, when sending that data to the server, the device screen displays "Authentication in progress..."

出力:サーバに送信された指紋データ Output: Fingerprint data sent to the server

ステップ3: Step 3:

サーバが指紋データを認証する。 The server authenticates the fingerprint data.

入力:サーバに送信された指紋データ Input: Fingerprint data sent to the server

具体的な動作:サーバは受信した指紋データを既存のデータベースと照合し、ユーザの認証を行う。 Specific operation: The server compares the received fingerprint data with an existing database and authenticates the user.

出力:認証結果(成功または失敗) Output: Authentication result (success or failure)

ステップ4: Step 4:

認証が成功すると、端末のボタンを有効化する。 If authentication is successful, the device's buttons will be enabled.

入力:認証結果(成功) Input: Authentication result (success)

具体的な動作:サーバが認証に成功すると、端末に信号を送り、ボタンを有効化する。端末のボタンが緑色に点灯する。 Specific operation: If the server successfully authenticates, it sends a signal to the device to activate the button. The button on the device will light up green.

出力:有効化されたボタン Output: Enabled button

ステップ5: Step 5:

ユーザがボタンを押す。 The user presses the button.

入力:有効化されたボタン Input: Enabled button

具体的な動作:ユーザは有効化されたボタンを押す。これにより、次のステップがトリガーされる。 Specific Action: The user presses the enabled button, which triggers the next step.

出力:ボタン押下の信号 Output: Button press signal

ステップ6: Step 6:

端末がスマートフォン上のアプリケーションを起動する。 The device launches the application on the smartphone.

入力:ボタン押下の信号 Input: Button press signal

具体的な動作:端末はスマートフォン上の専用アプリケーションを起動する。スマートフォンの画面にアプリケーションのロゴが表示される。 Specific operation: The device launches a dedicated application on the smartphone. The application logo will appear on the smartphone screen.

出力:起動されたアプリケーション Output: Launched application

ステップ7: Step 7:

アプリケーションが生成AIモデルへのプロンプト入力を行う。 The application prompts input to the generative AI model.

入力:起動されたアプリケーション Input: Launched application

具体的な動作:アプリケーションは生成AIモデルに対してプロンプト文を入力する。画面に「プロンプトを送信中...」と表示される。例えば、「今日の天気について教えてください」というプロンプト文を入力する。 Specific operation: The application inputs a prompt to the generative AI model. The screen displays "Sending prompt...". For example, the prompt input is "Tell me about the weather today."

出力:生成AIモデルに送信されたプロンプト文 Output: Prompt sent to the generative AI model

ステップ8: Step 8:

ユーザがアクセサリー装置に話しかける。 The user speaks to the accessory device.

入力:ユーザの音声 Input: User's voice

具体的な動作:ユーザはアクセサリー装置に向かって話しかける。例えば、「今日はどんな気分?」と話す。端末のマイクロフォンが赤く点灯し、音声データをキャプチャしていることを示す。 Specific operation: The user speaks to the accessory device. For example, "How are you feeling today?" The device's microphone lights up red, indicating that it is capturing audio data.

出力:キャプチャされた音声データ Output: Captured audio data

ステップ9: Step 9:

端末が音声データをキャプチャし、感情エンジンに送信する。 The device captures voice data and sends it to the emotion engine.

入力:キャプチャされた音声データ Input: Captured audio data

具体的な動作:端末は内蔵マイクロフォンを使用して音声データをキャプチャし、そのデータを感情エンジンに送信する。 Specific operation: The device uses the built-in microphone to capture audio data and sends that data to the emotion engine.

出力:感情エンジンに送信された音声データ Output: Audio data sent to the emotion engine

ステップ10: Step 10:

感情エンジンが音声データのトーンからユーザの感情を分析する。 The emotion engine analyzes the user's emotions from the tone of the voice data.

入力:感情エンジンに送信された音声データ Input: Audio data sent to the emotion engine

具体的な動作:感情エンジンは音声データのトーンを解析し、ユーザの感情を分析する。端末の画面に「感情を解析中...」と表示される。 Specific operation: The emotion engine analyzes the tone of the voice data and determines the user's emotions. The device screen will display "Analyzing emotions..."

出力:分析された感情情報 Output: Analyzed emotional information

ステップ11: Step 11:

感情エンジンが分析結果を生成AIモデルにフィードバックする。 The emotion engine feeds the analysis results back into the generative AI model.

入力:分析された感情情報 Input: Analyzed emotional information

具体的な動作:感情エンジンは分析結果を生成AIモデルにフィードバックする。例えば、「ユーザは少し疲れているようです」という情報を送信する。 Specific operation: The emotion engine feeds the analysis results back to the generative AI model. For example, it sends information such as "The user seems a little tired."

出力:生成AIモデルに送信された感情情報 Output: Emotional information sent to the generative AI model

ステップ12: Step 12:

生成AIモデルがユーザの感情に応じたレスポンスを生成する。 The generative AI model generates responses based on the user's emotions.

入力:生成AIモデルに送信された感情情報 Input: Emotional information sent to the generative AI model

具体的な動作:生成AIモデルはフィードバックされた感情情報に基づいて、適切なレスポンスを生成する。例えば、「元気づけるメッセージを生成してください」というプロンプトに対して、「今日は少し休んでリフレッシュしましょう」というレスポンスを生成する。スマートフォンの画面にレスポンスが表示される。 Specific operation: The generative AI model generates an appropriate response based on the emotional information fed back. For example, in response to the prompt "Generate an encouraging message," it generates the response "Take a break today to refresh yourself." The response is displayed on the smartphone screen.

出力:生成されたレスポンス Output: Generated response

(応用例2) (Application Example 2)

次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."

従来のフードデリバリーサービスにおいて、ユーザーがスマートフォンを操作して注文を行う際、操作が煩雑であることや、ユーザーの感情に応じた適切な提案が行われないことが課題であった。特に、疲れているユーザーやストレスを感じているユーザーに対して、リラックスできる食事の提案が不足しているため、ユーザー体験が向上しないという問題があった With conventional food delivery services, when users order using their smartphones, the process is cumbersome and they don't offer appropriate suggestions based on the user's mood. In particular, there are issues with the lack of relaxing meal suggestions for tired or stressed users, which hinders the user experience.

応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.

この発明では、サーバは、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、ユーザーの音声をキャプチャし、感情を認識するための音声キャプチャ手段と、該音声キャプチャ手段によりキャプチャされた音声データを分析し、ユーザーの感情を認識する感情認識手段と、該感情認識手段により認識された感情に基づいて生成系AIが適切なレスポンスを生成するための手段と、を含む。これにより、ユーザーがスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 In this invention, the server includes means for enabling prompt input to the generative AI, user authentication means for operating the accessory device, operation means for a user authenticated by the user authentication means to input prompts to the generative AI, voice capture means for capturing the user's voice and recognizing their emotions, emotion recognition means for analyzing the voice data captured by the voice capture means and recognizing the user's emotions, and means for the generative AI to generate an appropriate response based on the emotions recognized by the emotion recognition means. This enables the user to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate a smartphone.

「生成系AI」とは、ユーザーからの入力に基づいて適切なレスポンスや提案を生成する人工知能システムである。 "Generative AI" is an artificial intelligence system that generates appropriate responses and suggestions based on user input.

「プロンプト入力」とは、生成系AIに対して指示や質問を入力する行為を指す。 "Prompt input" refers to the act of inputting instructions or questions to generative AI.

「アクセサリー装置」とは、スマートフォンに接続可能な外部デバイスであり、特定の機能を提供するための装置である。 An "accessory device" is an external device that can be connected to a smartphone to provide specific functions.

「ユーザー認証手段」とは、ユーザーの身元を確認するための手段であり、特定のユーザーのみがシステムを操作できるようにするためのものである。 "User authentication means" refers to a means for verifying a user's identity and ensuring that only specific users can operate the system.

「指紋認証手段」とは、ユーザーの指紋を読み取って認証を行う手段である。 "Fingerprint authentication means" refers to a means of authenticating a user by reading their fingerprint.

「操作手段」とは、ユーザーがシステムを操作するためのインターフェースやボタンなどの手段である。 "Operation means" refers to the interface, buttons, and other means that users use to operate the system.

「ワンクリック操作手段」とは、ユーザーが一度のクリックで操作を完了できる手段である。 A "one-click operation method" is a method that allows the user to complete an operation with a single click.

「音声キャプチャ手段」とは、ユーザーの音声を録音またはキャプチャするための手段である。 "Audio capture means" means for recording or capturing a user's voice.

「感情認識手段」とは、キャプチャされた音声データを分析し、ユーザーの感情を認識するための手段である。 "Emotion recognition means" refers to a means for analyzing captured voice data and recognizing the user's emotions.

「レスポンス」とは、生成系AIがユーザーの入力に対して生成する応答や提案を指す。 "Response" refers to the response or suggestion that generative AI generates in response to user input.

この発明を実施するためのシステムは、以下のように構成される。まず、ユーザーはスマートフォンに接続されたアクセサリー装置を使用する。このアクセサリー装置には指紋認証手段が搭載されており、ユーザーが指を当てることで認証が行われる。認証が成功すると、アクセサリー装置の操作手段が有効化され、ユーザーはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行うことができる。 A system for implementing this invention is configured as follows: First, a user uses an accessory device connected to a smartphone. This accessory device is equipped with a fingerprint authentication means, and authentication is performed by the user placing their finger on it. If authentication is successful, the operation means of the accessory device is enabled, and the user can use the one-click operation means to input prompts to the generative AI.

次に、音声キャプチャ手段がユーザーの音声をキャプチャする。この音声データは感情認識手段に送信され、ユーザーの感情が分析される。感情認識手段は音声データのトーンや内容からユーザーの感情を認識し、その結果を生成系AIにフィードバックする。生成系AIは、認識された感情に基づいて適切なレスポンスを生成する。 Next, the voice capture means captures the user's voice. This voice data is sent to the emotion recognition means, which analyzes the user's emotions. The emotion recognition means recognizes the user's emotions from the tone and content of the voice data and feeds the results back to the generative AI. The generative AI generates an appropriate response based on the recognized emotions.

具体的には、以下のようなハードウェアおよびソフトウェアが使用される。指紋認証手段としては、指紋センサーが用いられる。音声キャプチャ手段としては、マイクロフォンと音声認識ソフトウェア(例:speech_recognitionライブラリ)が使用される。感情認識手段としては、感情エンジン(例:EmotionEngine)が使用される。生成系AIとしては、AI生成モデル(例:AIGenerator)が使用される。 Specifically, the following hardware and software are used: A fingerprint sensor is used as the fingerprint authentication method. A microphone and voice recognition software (e.g., speech_recognition library) are used as the voice capture method. An emotion engine (e.g., EmotionEngine) is used as the emotion recognition method. An AI generation model (e.g., AIGenerator) is used as the generative AI.

例えば、ユーザーが「今日は疲れた」と話しかけた場合、音声キャプチャ手段がその音声をキャプチャし、感情認識手段が「疲労」を感知する。生成系AIはこの感情に基づいて、「リラックスできる食事」を提案するレスポンスを生成する。このようにして、ユーザーの感情に応じた適切なフードデリバリーの提案が行われる。 For example, if a user says, "I'm tired today," the voice capture means captures the voice and the emotion recognition means detects "fatigue." Based on this emotion, the generative AI generates a response suggesting a "relaxing meal." In this way, appropriate food delivery suggestions are made according to the user's emotions.

生成AIモデルへ入力するプロンプト文の例としては、以下のようなものがある: Examples of prompts to input to a generative AI model include:

ユーザーの感情: 疲労 User Emotion: Fatigue

生成系AIへのプロンプト: "疲れているユーザーにおすすめのリラックスできる食事を提案してください。" Prompt for generative AI: "Please recommend a relaxing meal for a tired user."

このシステムにより、ユーザーはスマートフォンを操作することなく、音声と感情認識を通じて、適切なフードデリバリーの提案を受けることが可能となる。 This system allows users to receive appropriate food delivery suggestions through voice and emotion recognition without having to operate their smartphone.

応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 is explained using Figure 18.

ステップ1: Step 1:

ユーザがスマートフォンに接続されたアクセサリー装置の指紋認証センサーに指を当てる。入力はユーザの指紋データであり、出力は認証結果である。アクセサリー装置は指紋データを読み取り、内部のデータベースと照合して認証を行う。認証が成功すると、次のステップに進む。 The user places their finger on the fingerprint authentication sensor of an accessory device connected to their smartphone. The input is the user's fingerprint data, and the output is the authentication result. The accessory device reads the fingerprint data and compares it with its internal database for authentication. If authentication is successful, the device proceeds to the next step.

ステップ2: Step 2:

認証が成功した場合、アクセサリー装置の操作手段が有効化される。ユーザはワンクリック操作手段を用いて生成系AIへのプロンプト入力を行う。入力はユーザのクリック操作であり、出力はプロンプト入力のトリガーである。アクセサリー装置はクリック操作を検知し、生成系AIへのプロンプト入力を開始する。 If authentication is successful, the accessory device's operation means is enabled. The user uses the one-click operation means to input a prompt to the generative AI. The input is the user's click operation, and the output is the trigger for the prompt input. The accessory device detects the click operation and begins prompt input to the generative AI.

ステップ3: Step 3:

端末の音声キャプチャ手段がユーザの音声をキャプチャする。入力はユーザの音声データであり、出力はキャプチャされた音声データである。端末のマイクロフォンがユーザの音声を録音し、音声認識ソフトウェアがそのデータをデジタル形式に変換する。 The device's voice capture means captures the user's voice. The input is the user's voice data and the output is the captured voice data. The device's microphone records the user's voice and the voice recognition software converts the data into a digital format.

ステップ4: Step 4:

キャプチャされた音声データが感情認識手段に送信される。入力はキャプチャされた音声データであり、出力は認識された感情データである。感情エンジンが音声データを分析し、トーンや内容からユーザの感情を認識する。 The captured voice data is sent to the emotion recognition means. The input is the captured voice data and the output is the recognized emotion data. The emotion engine analyzes the voice data and recognizes the user's emotion from the tone and content.

ステップ5: Step 5:

認識された感情データが生成系AIにフィードバックされる。入力は認識された感情データであり、出力は生成系AIへのプロンプト文である。生成系AIは感情データに基づいて適切なレスポンスを生成するためのプロンプト文を作成する。 The recognized emotional data is fed back to the generative AI. The input is the recognized emotional data, and the output is a prompt sentence to the generative AI. The generative AI creates a prompt sentence to generate an appropriate response based on the emotional data.

ステップ6: Step 6:

生成系AIがプロンプト文に基づいて適切なレスポンスを生成する。入力はプロンプト文であり、出力は生成されたレスポンスである。生成系AIはプロンプト文を解析し、ユーザの感情に応じたフードデリバリーの提案を生成する。 The generative AI generates an appropriate response based on the prompt. The input is the prompt and the output is the generated response. The generative AI analyzes the prompt and generates food delivery suggestions based on the user's emotions.

ステップ7: Step 7:

生成されたレスポンスがユーザに提供される。入力は生成されたレスポンスであり、出力はユーザへの提案である。端末のディスプレイや音声出力装置を通じて、ユーザに適切なフードデリバリーの提案が表示または音声で伝えられる。 The generated response is provided to the user. The input is the generated response, and the output is a suggestion to the user. Appropriate food delivery suggestions are displayed or spoken to the user via the terminal's display or audio output device.

特定処理部290は、特定処理の結果をロボット414に送信する。ロボット414では、制御部46Aが、スピーカ240及び制御対象443に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the robot 414. In the robot 414, the control unit 46A causes the speaker 240 and the control target 443 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.

データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating voice, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.

生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>).

上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ロボット414によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the robot 414.

なお、感情エンジンとしての感情特定モデル59は、特定のマッピングに従い、ユーザの感情を決定してよい。具体的には、感情特定モデル59は、特定のマッピングである感情マップ(図9参照)に従い、ユーザの感情を決定してよい。また、感情特定モデル59は、同様に、ロボットの感情を決定し、特定処理部290は、ロボットの感情を用いた特定処理を行うようにしてもよい。 The emotion identification model 59, which serves as an emotion engine, may determine the user's emotion according to a specific mapping. Specifically, the emotion identification model 59 may determine the user's emotion according to an emotion map (see Figure 9), which is a specific mapping. Similarly, the emotion identification model 59 may determine the robot's emotion, and the identification processing unit 290 may perform identification processing using the robot's emotion.

図9は、複数の感情がマッピングされる感情マップ400を示す図である。感情マップ400において、感情は、中心から放射状に同心円に配置されている。同心円の中心に近いほど、原始的状態の感情が配置されている。同心円のより外側には、心境から生まれる状態や行動を表す感情が配置されている。感情とは、情動や心的状態も含む概念である。同心円の左側には、概して脳内で起きる反応から生成される感情が配置されている。同心円の右側には概して、状況判断で誘導される感情が配置されている。同心円の上方向及び下方向には、概して脳内で起きる反応から生成され、かつ、状況判断で誘導される感情が配置されている。また、同心円の上側には、「快」の感情が配置され、下側には、「不快」の感情が配置されている。このように、感情マップ400では、感情が生まれる構造に基づいて複数の感情がマッピングされており、同時に生じやすい感情が、近くにマッピングされている。 Figure 9 shows an emotion map 400 on which multiple emotions are mapped. In emotion map 400, emotions are arranged in concentric circles radiating from the center. Emotions closer to the center of the concentric circles are more primitive. Emotions representing states and actions arising from a state of mind are arranged on the outer edges of the concentric circles. The concept of emotion includes both emotions and mental states. Emotions that are generally generated from reactions that occur in the brain are arranged on the left side of the concentric circles. Emotions that are generally induced by situational judgment are arranged on the right side of the concentric circles. Emotions that are generally generated from reactions that occur in the brain and are induced by situational judgment are arranged above and below the concentric circles. Furthermore, the emotion of "pleasure" is arranged on the top side of the concentric circles, and the emotion of "discomfort" is arranged on the bottom side. In this way, emotion map 400 maps multiple emotions based on the structure by which emotions are generated, with emotions that tend to occur simultaneously being mapped close together.

これらの感情は、感情マップ400の3時の方向に分布しており、普段は安心と不安のあたりを行き来する。感情マップ400の右半分では、内部的な感覚よりも状況認識の方が優位に立つため、落ち着いた印象になる。 These emotions are distributed in the 3 o'clock direction on emotion map 400, and usually fluctuate between relief and anxiety. In the right half of emotion map 400, situational awareness takes precedence over internal sensations, resulting in a sense of calm.

感情マップ400の内側は心の中、感情マップ400の外側は行動を表すため、感情マップ400の外側に行くほど、感情が目に見える(行動に表れる)ようになる。 The inside of emotion map 400 represents what is going on in the mind, and the outside of emotion map 400 represents behavior, so the further out you go on emotion map 400, the more visible (expressed in behavior) the emotion becomes.

ここで、人の感情は、姿勢や血糖値のような様々なバランスを基礎としており、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示す。ロボットや自動車やバイク等においても、姿勢やバッテリー残量のような様々なバランスを基礎として、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示すように感情を作ることができる。感情マップは、例えば、光吉博士の感情地図(音声感情認識及び情動の脳生理信号分析システムに関する研究、徳島大学、博士論文:https://ci.n Here, human emotions are based on various balances, such as posture and blood sugar levels. When these balances deviate from the ideal, it indicates discomfort, and when they approach the ideal, it indicates pleasure. Robots, cars, motorcycles, etc. can also create emotions based on various balances, such as posture and battery level, so that when these balances deviate from the ideal, it indicates discomfort, and when they approach the ideal, it indicates pleasure. Emotion maps are, for example, based on Dr. Mitsuyoshi's Emotion Map (Research on Voice Emotion Recognition and Emotional Brain Physiological Signal Analysis Systems, Tokushima University, Doctoral Dissertation: https://ci.n

ii.ac.jp/naid/500000375379)に基づいて生成されてよい。感情地図の左半分には、感覚が優位にたつ「反応」と呼ばれる領域に属する感情が並ぶ。また、感情地図の右半分には、状況認識が優位にたつ「状況」と呼ばれる領域に属する感情が並ぶ。 ii.ac.jp/naid/500000375379). The left half of the emotion map lists emotions that belong to an area called "reaction," where sensation is dominant. The right half of the emotion map lists emotions that belong to an area called "situation," where situation awareness is dominant.

感情マップでは学習を促す感情が2つ定義される。1つは、状況側にあるネガティブな「懺悔」や「反省」の真ん中周辺の感情である。つまり、「もう2度とこんな想いはしたくない」「もう叱られたくない」というネガティブな感情がロボットに生じたときである。もう1つは、反応側にあるポジティブな「欲」のあたりの感情である。つまり、「もっと欲しい」「もっと知りたい」というポジティブな気持ちのときである。 The emotion map defines two emotions that encourage learning. One is the negative emotion around the middle of "repentance" or "reflection" on the situation side. In other words, this is when the robot experiences negative emotions such as "I never want to feel this way again" or "I don't want to be scolded again." The other is the positive emotion around "desire" on the response side. In other words, this is when the robot experiences positive feelings such as "I want more" or "I want to know more."

感情特定モデル59は、ユーザ入力を、予め学習されたニューラルネットワークに入力し、感情マップ400に示す各感情を示す感情値を取得し、ユーザの感情を決定する。このニューラルネットワークは、ユーザ入力と、感情マップ400に示す各感情を示す感情値との組み合わせである複数の学習データに基づいて予め学習されたものである。また、このニューラルネットワークは、図10に示す感情マップ900のように、近くに配置されている感情同士は、近い値を持つように学習される。図10では、「安心」、「安穏」、「心強い」という複数の感情が、近い感情値となる例を示している。 The emotion identification model 59 inputs user input into a pre-trained neural network, obtains emotion values indicating each emotion shown in the emotion map 400, and determines the user's emotion. This neural network is pre-trained based on multiple pieces of training data that are combinations of user input and emotion values indicating each emotion shown in the emotion map 400. Furthermore, this neural network is trained so that emotions that are close to each other have similar values, as in the emotion map 900 shown in Figure 10. Figure 10 shows an example in which multiple emotions, such as "relieved," "calm," and "reassuring," have similar emotion values.

上記実施形態では、1台のコンピュータ22によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、コンピュータ22を含めた複数のコンピュータによる特定処理に対する分散処理が行われるようにしてもよい。 In the above embodiment, an example was given in which a specific process is performed by a single computer 22, but the technology disclosed herein is not limited to this, and distributed processing of the specific process may also be performed by multiple computers, including computer 22.

上記実施形態では、ストレージ32に特定処理プログラム56が格納されている形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、特定処理プログラム56がUSB(Universal Serial Bus)メモリなどの可搬型のコンピュータ読み取り可能な非一時的格納媒体に格納されていてもよい。非一時的格納媒体に格納されている特定処理プログラム56は、データ処理装置12のコンピュータ22にインストールされる。プロセッサ28は、特定処理プログラム56に従って特定処理を実行する。 In the above embodiment, an example was described in which the specific processing program 56 is stored in the storage 32, but the technology of the present disclosure is not limited to this. For example, the specific processing program 56 may be stored in a portable, computer-readable, non-transitory storage medium such as a USB (Universal Serial Bus) memory. The specific processing program 56 stored in the non-transitory storage medium is installed in the computer 22 of the data processing device 12. The processor 28 executes the specific processing in accordance with the specific processing program 56.

また、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56を格納させておき、データ処理装置12の要求に応じて特定処理プログラム56がダウンロードされ、コンピュータ22にインストールされるようにしてもよい。 Alternatively, the specific processing program 56 may be stored in a storage device such as a server connected to the data processing device 12 via the network 54, and the specific processing program 56 may be downloaded and installed on the computer 22 in response to a request from the data processing device 12.

なお、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56の全てを格納させておいたり、ストレージ32に特定処理プログラム56の全てを記憶させたりしておく必要はなく、特定処理プログラム56の一部を格納させておいてもよい。 It is not necessary to store the entire specific processing program 56 in a storage device such as a server connected to the data processing device 12 via the network 54, or to store the entire specific processing program 56 in the storage 32; only a portion of the specific processing program 56 may be stored.

特定処理を実行するハードウェア資源としては、次に示す各種のプロセッサを用いることができる。プロセッサとしては、例えば、ソフトウェア、すなわち、プログラムを実行することで、特定処理を実行するハードウェア資源として機能する汎用的なプロセッサであるCPUが挙げられる。また、プロセッサとしては、例えば、FPGA(Field-Programmable Gate Array)、PLD(Programmable Logic Device)、又はASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計さ The hardware resources that execute specific processes can include the following types of processors. Examples of processors include a CPU, a general-purpose processor that functions as a hardware resource that executes specific processes by executing software, i.e., a program. Processors also include FPGAs (Field-Programmable Gate Arrays), PLDs (Programmable Logic Devices), and ASICs (Application Specific Integrated Circuits), which are specially designed to execute specific processes.

れた回路構成を有するプロセッサである専用電気回路が挙げられる。何れのプロセッサにもメモリが内蔵又は接続されており、何れのプロセッサもメモリを使用することで特定処理を実行する。 Specialized electrical circuits are processors with specialized circuit configurations. Each processor has built-in or connected memory, and each processor uses memory to perform specific processes.

特定処理を実行するハードウェア資源は、これらの各種のプロセッサのうちの1つで構 The hardware resource that executes a specific process consists of one of these various processors.

成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせ、又はCPUとFPGAとの組み合わせ)で構成されてもよい。また、特定処理を実行するハードウェア資源は1つのプロセッサであってもよい。 It may also be configured as a combination of two or more processors of the same or different types (for example, a combination of multiple FPGAs, or a combination of a CPU and an FPGA). Furthermore, the hardware resource that executes a specific process may be a single processor.

1つのプロセッサで構成する例としては、第1に、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが、特定処理を実行するハードウェア資源として機能する形態がある。第2に、SoC(System-on-a-chip)などに代表されるように、特定処理を実行する複数のハードウェア資源を含むシステム全体の機能を1つのICチップで実現するプロセッサを使用する形態がある。このように、特定処理は、ハードウェア資源として、上記各種のプロセッサの1つ以上を用いて実現される。 As an example of a configuration using a single processor, first, there is a configuration in which one processor is configured using a combination of one or more CPUs and software, and this processor functions as a hardware resource that executes specific processing. Second, there is a configuration in which a processor is used to realize the functions of an entire system, including multiple hardware resources that execute specific processing, on a single IC chip, as typified by SoC (System-on-a-chip). In this way, specific processing is realized using one or more of the various processors listed above as hardware resources.

更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路を用いることができる。また、上記の特定処理はあくまでも一例である。従って、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。 More specifically, the hardware structure of these various processors can be an electrical circuit that combines circuit elements such as semiconductor devices. Furthermore, the specific processing described above is merely an example. Therefore, it goes without saying that unnecessary steps can be deleted, new steps can be added, or the processing order can be rearranged, all within the scope of the spirit of the invention.

以上に示した記載内容及び図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、及び効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、及び効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容及び図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことは言うまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容及び図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。 The above-described written content and illustrations are a detailed explanation of the parts related to the technology of the present disclosure and are merely an example of the technology of the present disclosure. For example, the above explanation of the configuration, functions, actions, and effects is an explanation of an example of the configuration, functions, actions, and effects of the parts related to the technology of the present disclosure. Therefore, it goes without saying that unnecessary parts may be deleted, new elements may be added, or substitutions may be made to the above-described written content and illustrations, as long as they do not deviate from the spirit of the technology of the present disclosure. Furthermore, to avoid confusion and facilitate understanding of the parts related to the technology of the present disclosure, the above-described written content and illustrations omit explanations of common technical knowledge that do not require particular explanation to enable the implementation of the technology of the present disclosure.

本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。 All publications, patent applications, and technical standards mentioned in this specification are incorporated by reference herein to the same extent as if each individual publication, patent application, and technical standard was specifically and individually indicated to be incorporated by reference.

以上の実施形態に関し、更に以下を開示する。 The following is further disclosed regarding the above embodiments.

(請求項1) (Claim 1)

スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、該アクセサリー装置を操作するためのユーザー認証手段と、該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、を含むシステム。 A system comprising an accessory device connectable to a smartphone, a means for enabling prompt input to generative AI, a user authentication means for operating the accessory device, and an operation means for a user authenticated by the user authentication means to input prompts to the generative AI.

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

(請求項4) (Claim 4)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステムにおいて、ユーザーの感情を認識する感情エンジンを更に含むシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means, and further includes an emotion engine that recognizes the user's emotions.

(請求項5) (Claim 5)

前記感情エンジンが、ユーザーの声のトーンから感情を認識する、請求項4記載のシステム。 The system of claim 4, wherein the emotion engine recognizes emotions from the user's tone of voice.

(請求項6) (Claim 6)

前記感情エンジンが、ユーザーの顔の表情から感情を認識する、請求項4記載のシステム The system of claim 4, wherein the emotion engine recognizes emotions from the user's facial expressions.

.

「実施例1」 "Example 1"

(請求項1) (Claim 1)

スマートフォンに接続可能なアクセサリー装置であって、
生成系AIへのプロンプト入力を可能にする手段と、
該アクセサリー装置を操作するためのユーザー認証手段と、
該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、
該生成系AIへのプロンプト入力を行うためのアプリケーションをスマートフォン上で動作させる手段と、
該生成系AIモデルにプロンプト文を送信し、生成結果を受信する手段と、
を含むシステム。
An accessory device connectable to a smartphone,
A means to enable prompt input to the generative AI; and
a user authentication means for operating the accessory device;
an operation means for a user authenticated by the user authentication means to input a prompt to the generative AI;
A means for running an application on a smartphone for inputting prompts to the generative AI;
means for sending a prompt sentence to the generative AI model and receiving a generated result;
A system including:

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「応用例1」 "Application Example 1"

(請求項1) (Claim 1)

スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、
該アクセサリー装置を操作するためのユーザー認証手段と、
該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、
工場内のロボットを管理・操作するための指示を生成する手段と、
該指示を無線通信手段を用いてロボットに送信する手段と、
を含むシステム。
An accessory device connectable to a smartphone, the accessory device enabling prompt input to the generative AI;
a user authentication means for operating the accessory device;
an operation means for a user authenticated by the user authentication means to input a prompt to the generation system AI;
means for generating instructions for managing and operating robots in a factory;
means for transmitting the instruction to the robot using wireless communication means;
A system including:

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「実施例2」 "Example 2"

(請求項1) (Claim 1)

ユーザー認証手段と、
認証されたユーザーが操作するための操作手段と、
操作手段を用いてスマートデバイスに信号を送信し、特定のアプリケーションを起動する手段と、
起動したアプリケーションが生成AIモデルにプロンプト文を送信する手段と、
生成AIモデルがプロンプト文に基づいて応答を生成し、スマートデバイスに応答を送信する手段と、
を含むシステム。
A user authentication means;
an operation means for an authenticated user to operate;
A means for transmitting a signal to the smart device using the operation means to launch a specific application;
A means for the launched application to send a prompt to the generative AI model;
a means for the generative AI model to generate a response based on the prompt sentence and transmit the response to the smart device;
A system including:

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「応用例2」 "Application Example 2"

(請求項1) (Claim 1)

スマートデバイスに接続可能な付属装置であって、生成系AIへの指示入力を可能にする手段と、
該付属装置を操作するための利用者認証手段と、
該利用者認証手段により認証された利用者が該生成系AIへの指示入力を行うための操作手段と、
音声認識手段と、
該音声認識手段により取得された音声データを生成系AIに送信する手段と、
を含むシステム。
An accessory device connectable to the smart device, which allows instructions to be input to the generative AI;
a user authentication means for operating the accessory device;
an operation means for a user authenticated by the user authentication means to input instructions to the generation system AI;
a speech recognition means;
A means for transmitting the voice data acquired by the voice recognition means to a generation system AI;
A system including:

(請求項2) (Claim 2)

前記利用者認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「感情エンジンを組み合わせた場合の実施例1」 "Example 1: Combining Emotion Engines"

(請求項1) (Claim 1)

スマートフォンに接続可能なアクセサリー装置であって、生成系AIモデルへのプロンプト入力を可能にする手段と、
該アクセサリー装置を操作するためのユーザー認証手段と、
該ユーザー認証手段により認証されたユーザーが該生成系AIモデルへのプロンプト入力を行うための操作手段と、
ユーザーの感情を認識する感情認識手段と、
該感情認識手段により認識された感情情報を生成系AIモデルにフィードバックする手段と、
を含むシステム。
an accessory device connectable to a smartphone, the accessory device enabling prompt input to the generative AI model;
a user authentication means for operating the accessory device;
an operation means for a user authenticated by the user authentication means to input a prompt to the generative AI model;
an emotion recognition means for recognizing an emotion of a user;
a means for feeding back the emotion information recognized by the emotion recognition means to a generative AI model;
A system including:

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「感情エンジンを組み合わせた場合の応用例1」 "Application example 1: Combining emotion engines"

(請求項1) (Claim 1)

スマートフォンに接続可能なアクセサリー装置であって、生成系AIへのプロンプト入力を可能にする手段と、
該アクセサリー装置を操作するためのユーザー認証手段と、
該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、
ユーザーの感情を認識する感情認識手段と、
該感情認識手段により認識された感情情報を生成系AIにフィードバックする手段と、
An accessory device connectable to a smartphone, the accessory device enabling prompt input to the generative AI;
a user authentication means for operating the accessory device;
an operation means for a user authenticated by the user authentication means to input a prompt to the generation system AI;
an emotion recognition means for recognizing an emotion of a user;
a means for feeding back emotion information recognized by the emotion recognition means to a generative AI;

を含むシステム。 A system including

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「感情エンジンを組み合わせた場合の実施例2」 "Example 2: Combining Emotion Engines"

(請求項1) (Claim 1)

ユーザー認証手段と、
該ユーザー認証手段により認証されたユーザーが生成AIモデルへのプロンプト入力を行うための操作手段と、
ユーザーの音声データをキャプチャし、感情を分析する感情認識手段と、
該感情認識手段により分析された感情情報を生成AIモデルにフィードバックする手段と、
を含むシステム。
A user authentication means;
An operation means for a user authenticated by the user authentication means to input a prompt to the generated AI model;
an emotion recognition means for capturing voice data of a user and analyzing the user's emotions;
a means for feeding back the emotion information analyzed by the emotion recognition means to a generative AI model;
A system including:

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

「感情エンジンを組み合わせた場合の応用例2」 "Application Example 2: Combining Emotion Engines"

(請求項1) (Claim 1)

生成系AIへのプロンプト入力を可能にする手段と、
該アクセサリー装置を操作するためのユーザー認証手段と、
該ユーザー認証手段により認証されたユーザーが該生成系AIへのプロンプト入力を行うための操作手段と、
ユーザーの音声をキャプチャし、感情を認識するための音声キャプチャ手段と、
該音声キャプチャ手段によりキャプチャされた音声データを分析し、ユーザーの感情を認識する感情認識手段と、
該感情認識手段により認識された感情に基づいて生成系AIが適切なレスポンスを生成するための手段と、
を含むシステム。
means for enabling prompt input to the generative AI;
a user authentication means for operating the accessory device;
an operation means for a user authenticated by the user authentication means to input a prompt to the generation system AI;
a voice capture means for capturing a user's voice and recognizing emotions;
emotion recognition means for analyzing the voice data captured by the voice capture means and recognizing the emotion of the user;
means for generating an appropriate response by a generative AI based on the emotion recognized by the emotion recognition means;
A system including:

(請求項2) (Claim 2)

前記ユーザー認証手段が、指紋認証手段である、請求項1記載のシステム。 The system of claim 1, wherein the user authentication means is a fingerprint authentication means.

(請求項3) (Claim 3)

前記操作手段が、ワンクリック操作手段である、請求項1記載のシステム。 The system of claim 1, wherein the operation means is a one-click operation means.

10、210、310、410 データ処理システム
12 データ処理装置
14 スマートデバイス
214 スマート眼鏡
314 ヘッドセット型端末
414 ロボット

10, 210, 310, 410 Data processing system 12 Data processing device 14 Smart device 214 Smart glasses 314 Headset type terminal 414 Robot

Claims (1)

スマートデバイスに接続可能な付属装置を含むシステムであって、
指紋認証により該付属装置を操作するユーザを認証する利用者認証手段と、
前記利用者認証手段による認証が成功した場合に、前記付属装置の操作手段が有効化される操作手段と、
前記付属装置に設けられたボタンであって、前記操作手段が有効化された後に、生成系AIへの指示入力を行うために押下されるボタンと、
前記ボタンの押下に応じて、ユーザの音声を認識する音声認識手段と、
該音声認識手段により取得された音声データを含むプロンプト文と、前記生成系AIとを用いて、前記生成系AIの出力を取得する手段と、
前記音声認識手段により取得された音声データを分析し、音声データのトーン及び内容からユーザの感情を認識する感情エンジンを用いてユーザの感情を認識する手段とを含み、
前記取得する手段は、
前記音声認識手段により取得された音声データ、及び前記感情エンジンにより認識されたユーザの感情を含むプロンプト文を生成し、
前記プロンプト文は、フードデリバリーサービスで注文することを指示し、
前記取得する手段は、前記生成系AIとフードデリバリーAPIとを用いて注文結果を取得する、
システム。
1. A system including an accessory device connectable to a smart device,
a user authentication means for authenticating a user who operates the accessory device by fingerprint authentication;
an operation means for enabling an operation means of the accessory device when authentication by the user authentication means is successful;
a button provided on the accessory device, the button being pressed to input an instruction to the generative AI after the operation means is enabled ;
a voice recognition means for recognizing a user's voice in response to pressing of the button;
a means for acquiring an output of the generative AI using a prompt sentence including the voice data acquired by the voice recognition means and the generative AI;
means for analyzing the voice data acquired by the voice recognition means and recognizing the user's emotion using an emotion engine that recognizes the user's emotion from the tone and content of the voice data ;
The acquiring means includes:
generating a prompt sentence including the voice data acquired by the voice recognition means and the user's emotion recognized by the emotion engine ;
the prompt instructs the user to order from a food delivery service;
The acquiring means acquires the order result using the generative AI and the food delivery API.
system.
JP2024161775A 2023-09-19 2024-09-19 system Active JP7825005B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2023150995 2023-09-19
JP2023150995 2023-09-19

Publications (2)

Publication Number Publication Date
JP2025044192A JP2025044192A (en) 2025-04-01
JP7825005B2 true JP7825005B2 (en) 2026-03-05

Family

ID=95205279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024161775A Active JP7825005B2 (en) 2023-09-19 2024-09-19 system

Country Status (1)

Country Link
JP (1) JP7825005B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019101659A (en) 2017-11-30 2019-06-24 株式会社サイバーエージェント Chat system, server, chat method, terminal device and computer program
JP2019101504A (en) 2017-11-28 2019-06-24 キヤノン株式会社 System and method of system
JP2019191937A (en) 2018-04-25 2019-10-31 Kddi株式会社 Feeling estimation method, feeling estimation device and program
JP2020177498A (en) 2019-04-19 2020-10-29 ヤフー株式会社 Decision device, decision method and decision program
WO2021140816A1 (en) 2020-01-07 2021-07-15 ソニーグループ株式会社 Information processing device, information processing system, information processing method, and program
JP2021168020A (en) 2020-04-09 2021-10-21 励至 鈴木 Voice input device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019101504A (en) 2017-11-28 2019-06-24 キヤノン株式会社 System and method of system
JP2019101659A (en) 2017-11-30 2019-06-24 株式会社サイバーエージェント Chat system, server, chat method, terminal device and computer program
JP2019191937A (en) 2018-04-25 2019-10-31 Kddi株式会社 Feeling estimation method, feeling estimation device and program
JP2020177498A (en) 2019-04-19 2020-10-29 ヤフー株式会社 Decision device, decision method and decision program
WO2021140816A1 (en) 2020-01-07 2021-07-15 ソニーグループ株式会社 Information processing device, information processing system, information processing method, and program
JP2021168020A (en) 2020-04-09 2021-10-21 励至 鈴木 Voice input device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
金子 拓正,LLMに基づく音声対話システムのための非言語情報を活用したユーザ心情の考慮とリアルタイム性の向上,第99回 言語・音声理解と対話処理研究会資料(SIG-SLUD-099),日本,一般社団法人人工知能学会,2023年12月04日,第131~133頁

Also Published As

Publication number Publication date
JP2025044192A (en) 2025-04-01

Similar Documents

Publication Publication Date Title
JP7825005B2 (en) system
JP2026038069A (en) system
JP2026062243A (en) system
JP2026040160A (en) system
JP2026034048A (en) system
JP2026021073A (en) system
JP2026034159A (en) system
JP2026036286A (en) system
JP2026040079A (en) system
JP2026014268A (en) system
JP2026025500A (en) system
JP2026034143A (en) system
JP2026030428A (en) system
JP2026016184A (en) system
JP2026028089A (en) system
JP2026037947A (en) system
JP2026063895A (en) system
JP2026023371A (en) system
JP2026035155A (en) system
JP2026028751A (en) system
JP2026035348A (en) system
JP2026025494A (en) system
JP2026037323A (en) system
JP2026022513A (en) system
JP2025044295A (en) system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20241118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20251209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20260203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260220

R150 Certificate of patent or registration of utility model

Ref document number: 7825005

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150