JP7742466B2 - system - Google Patents
systemInfo
- Publication number
- JP7742466B2 JP7742466B2 JP2024164528A JP2024164528A JP7742466B2 JP 7742466 B2 JP7742466 B2 JP 7742466B2 JP 2024164528 A JP2024164528 A JP 2024164528A JP 2024164528 A JP2024164528 A JP 2024164528A JP 7742466 B2 JP7742466 B2 JP 7742466B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- ideal
- server
- person
- custom
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
本開示の技術は、システムに関する。 The technology disclosed herein relates to a system.
特許文献1には、少なくとも一つのプロセッサにより遂行される、ペルソナチャットボット制御方法であって、ユーザ発話を受信するステップと、前記ユーザ発話を、チャットボットのキャラクターに関する説明と関連した指示文を含むプロンプトに追加するステップと前記プロンプトをエンコードするステップと、前記エンコードしたプロンプトを言語モデルに入力して、前記ユーザ発話に応答するチャットボット発話を生成するステップ、を含む、方法が開示されている。 Patent document 1 discloses a persona chatbot control method executed by at least one processor, the method including the steps of receiving a user utterance, adding the user utterance to a prompt including an instruction sentence related to a description of the chatbot's character, encoding the prompt, and inputting the encoded prompt into a language model to generate a chatbot utterance in response to the user utterance.
人間関係のトラウマや教養等が足りず、素の自分を発信することに自信がない人々が、具体的な理想像があるにも関わらず、その理想の姿になることが困難である。という課題が存在する。 People who lack the confidence to express their true selves due to trauma from interpersonal relationships or a lack of education find it difficult to become that ideal person, even if they have a specific ideal image in mind. This is the problem that exists.
ユーザーが設定した理想の人間像を投影し、その理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする。そして、そのカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進するシステムを提供する。 The system projects the ideal image of the person set by the user and custom-changes the user's behavior and speech based on that ideal image. It then presents these custom-changed behaviors and speech to the user, and through repeated training, it provides a system that encourages the user to get closer to their ideal image.
以下、添付図面に従って本開示の技術に係るシステムの実施形態の一例について説明する。 Below, an example of an embodiment of a system relating to the technology disclosed herein will be described with reference to the accompanying drawings.
先ず、以下の説明で使用される文言について説明する。 First, let me explain the terminology used in the following explanation.
以下の実施形態において、符号付きのプロセッサ(以下、単に「プロセッサ」と称する)は、1つの演算装置であってもよいし、複数の演算装置の組み合わせであってもよい。また、プロセッサは、1種類の演算装置であってもよいし、複数種類の演算装置の組み合わせであってもよい。演算装置の一例としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、GPGPU(General-Purpose computing on Graphics Processing Units)、APU(Accelerated Processing Unit)、又はTPU(TENSOR PROCESSING UNIT(登録商標))等が挙げられる。 In the following embodiments, a coded processor (hereinafter simply referred to as a "processor") may be a single arithmetic unit or a combination of multiple arithmetic units. Furthermore, a processor may be a single type of arithmetic unit or a combination of multiple types of arithmetic units. Examples of arithmetic units include a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), a GPGPU (General-Purpose Computing on Graphics Processing Units), an APU (Accelerated Processing Unit), or a TPU (TENSOR PROCESSING UNIT (registered trademark)).
以下の実施形態において、符号付きのRAM(Random Access Memory)は、一時的に情報が格納されるメモリであり、プロセッサによってワークメモリとして用いられる。 In the following embodiments, coded random access memory (RAM) is memory in which information is temporarily stored and is used as work memory by the processor.
以下の実施形態において、符号付きのストレージは、各種プログラム及び各種パラメータ等を記憶する1つ又は複数の不揮発性の記憶装置である。不揮発性の記憶装置の一例としては、フラッシュメモリ(SSD(Solid State Drive))、磁気ディスク(例えば、ハードディスク)、又は磁気テープ等が挙げられる。 In the following embodiments, the coded storage refers to one or more non-volatile storage devices that store various programs, parameters, etc. Examples of non-volatile storage devices include flash memory (SSD (Solid State Drive)), magnetic disks (e.g., hard disks), and magnetic tapes.
以下の実施形態において、符号付きの通信I/F(Interface)は、通信プロセッサ及びアンテナ等を含むインタフェースである。通信I/Fは、複数のコンピュータ間での通信を司る。通信I/Fに対して適用される通信規格の一例としては、5G(5th Generation Mobile Communication System)、Wi-Fi(登録商標)、又はBluetooth(登録商標)等を含む無線通信規格が挙げられる。 In the following embodiments, a communication I/F (Interface) with a symbol is an interface that includes a communication processor, an antenna, etc. The communication I/F controls communication between multiple computers. Examples of communication standards that can be applied to the communication I/F include wireless communication standards such as 5G (5th Generation Mobile Communication System), Wi-Fi (registered trademark), or Bluetooth (registered trademark).
以下の実施形態において、「A及び/又はB」は、「A及びBのうちの少なくとも1つ」と同義である。つまり、「A及び/又はB」は、Aだけであってもよいし、Bだけであってもよいし、A及びBの組み合わせであってもよい、という意味である。また、本明細書において、3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「A及び/又はB」と同様の考え方が適用される。 In the following embodiments, "A and/or B" is synonymous with "at least one of A and B." In other words, "A and/or B" means that it may be just A, just B, or a combination of A and B. Furthermore, in this specification, the same concept as "A and/or B" also applies when three or more things are expressed connected by "and/or."
[第1実施形態] [First embodiment]
図1には、第1実施形態に係るデータ処理システム10の構成の一例が示されている。 Figure 1 shows an example of the configuration of a data processing system 10 according to the first embodiment.
図1に示すように、データ処理システム10は、データ処理装置12及びスマートデバイス14を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 1, the data processing system 10 includes a data processing device 12 and a smart device 14. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
スマートデバイス14は、コンピュータ36、受付装置38、出力装置40、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、受付装置38、出力装置40、及びカメラ42も、バス52に接続されている。 The smart device 14 includes a computer 36, a reception device 38, an output device 40, a camera 42, and a communication I/F 44. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The reception device 38, output device 40, and camera 42 are also connected to the bus 52.
受付装置38は、タッチパネル38A及びマイクロフォン38B等を備えており、ユーザ入力を受け付ける。タッチパネル38Aは、指示体(例えば、ペン又は指等)の接触を検出することにより、指示体の接触によるユーザ入力を受け付ける。マイクロフォン38Bは、ユーザの音声を検出することにより、音声によるユーザ入力を受け付ける。制御部46Aは、タッチパネル38A及びマイクロフォン38Bによって受け付けたユーザ入力を示すデータをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が、ユーザ入力を示すデータを取得する。 The reception device 38 is equipped with a touch panel 38A, a microphone 38B, etc., and receives user input. The touch panel 38A detects contact with an indicator (e.g., a pen or finger) to receive user input via the indicator. The microphone 38B detects the user's voice to receive user input via voice. The control unit 46A transmits data indicating the user input received by the touch panel 38A and the microphone 38B to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the data indicating the user input.
出力装置40は、ディスプレイ40A及びスピーカ40B等を備えており、データをユーザ20が知覚可能な表現形(例えば、音声及び/又はテキスト)で出力することでデータをユーザ20に対して提示する。ディスプレイ40Aは、プロセッサ46からの指示に従ってテキスト及び画像等の可視情報を表示する。スピーカ40Bは、プロセッサ46からの指示に従って音声を出力する。カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラである。 The output device 40 is equipped with a display 40A and a speaker 40B, and presents data to the user 20 by outputting the data in a form perceptible by the user 20 (e.g., audio and/or text). The display 40A displays visible information such as text and images in accordance with instructions from the processor 46. The speaker 40B outputs audio in accordance with instructions from the processor 46. The camera 42 is a compact digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor.
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54.
図2には、データ処理装置12及びスマートデバイス14の要部機能の一例が示されている。 Figure 2 shows an example of the main functions of the data processing device 12 and smart device 14.
図2に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って特定処理部290として動作することによって実現される。 As shown in FIG. 2, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32. The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as a specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
スマートデバイス14では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。受付出力プログラム60は、データ処理システム10によって特定処理プログラム56と併用される。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the smart device 14, the processor 46 performs the reception output processing. The storage 50 stores a reception output program 60. The reception output program 60 is used in conjunction with the specific processing program 56 by the data processing system 10. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output processing is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.
「形態例1」 "Example 1"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
「形態例2」 "Example 2"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがアプリケーション上で理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 Step 1: The user sets their ideal person in the application. For example, they can set "a compassionate person" as their ideal person.
ステップ2:システムがユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。具体的には、「思いやりのある人」に基づいてユーザーの行動や発言を分析し、それに適した行動や発言を生成する。 Step 2: The system custom-changes the user's behavior and comments based on the ideal image of a person. Specifically, it analyzes the user's behavior and comments based on the image of a "compassionate person" and generates appropriate behavior and comments.
ステップ3:システムがカスタムチェンジした行動や発言をユーザーに提示する。例えば、ユーザーが他人に対して思いやりのある行動をとるようにアドバイスを提供する。 Step 3: The system presents the user with the customized actions and statements. For example, it may provide advice to encourage the user to behave more considerately toward others.
ステップ4:ユーザーが提示された行動や発言を反復トレーニングする。これにより、ユーザーは自身の理想像に近づくことが可能となる。 Step 4: The user repeatedly practices the suggested actions and statements, allowing them to get closer to their ideal self.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来の自己改善システムでは、ユーザーが設定した理想の人間像に基づいて具体的な行動や発言をカスタムチェンジすることが難しく、またその反復トレーニングの進捗を効果的に記録しフィードバックを提供する手段が不足している。このため、ユーザーが自身の理想像に近づくための効果的なサポートが提供されていないという課題がある。 Existing self-improvement systems have difficulty customizing specific actions and speech based on the ideal person the user sets, and lack a means to effectively record the progress of this repetitive training and provide feedback. This poses a challenge in that they do not provide effective support to help users get closer to their ideal self.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、生成AIモデルを用いて該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、該反復トレーニングの進捗を記録し、フィードバックを提供する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための具体的な行動や発言を学び、実践し、その進捗を効果的に管理することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image using a generative AI model, means for presenting the custom-changed actions and speech to the user and repeatedly training them, and means for recording the progress of the repeated training and providing feedback. This enables the user to learn and practice specific actions and speech that will bring them closer to their ideal image, and effectively manage their progress.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「生成AIモデル」とは、人工知能を用いてデータを生成し、ユーザーの行動や発言をカスタムチェンジするためのアルゴリズムやプログラムを指す。 A "generative AI model" refers to an algorithm or program that uses artificial intelligence to generate data and custom-change user behavior and speech.
「カスタムチェンジ」とは、ユーザーの行動や発言を理想の人間像に基づいて変更することを指す。 "Custom Change" refers to changing a user's behavior and words based on an ideal image of a person.
「反復トレーニング」とは、ユーザーが提示されたカスタムチェンジされた行動や発言を繰り返し実践することを指す。 "Repeated training" refers to the user repeatedly practicing the custom-changed actions and utterances that are presented to them.
「フィードバック」とは、ユーザーの反復トレーニングの進捗に基づいて提供される評価やアドバイスを指す。 "Feedback" refers to evaluations and advice provided based on the user's progress through repeated training.
「進捗を記録する」とは、ユーザーが行った反復トレーニングの内容や成果をデータとして保存することを指す。 "Recording progress" refers to saving the content and results of the user's repeated training as data.
「提示する」とは、サーバが生成したカスタムチェンジされた行動や発言をユーザーに見せることを指す。 "Presenting" refers to showing the custom-changed actions and statements generated by the server to the user.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それを反復トレーニングすることでユーザーが自身の理想像に近づくことを促進するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes actions and speech based on the ideal person image set by the user, and encourages the user to approach their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: スマートフォン、パソコン、タブレットなどのユーザーが操作するデバイス。 Device: A device operated by the user, such as a smartphone, computer, or tablet.
サーバ: データ処理および生成AIモデルの実行を行うためのサーバ。 Server: A server for processing data and running generative AI models.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供するソフトウェア。 Application: Software that provides an interface for users to define their ideal person and review their custom-changed behavior and statements.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのアルゴリズム。具体的には、OpenAI(登録商標)のGPT-4(登録商標)などの生成AIモデルを使用する。 Generative AI model: An algorithm that custom-changes a user's behavior and speech based on an ideal human image. Specifically, we use generative AI models such as OpenAI's (registered trademark) GPT-4 (registered trademark).
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 The user launches the application and sets their ideal image of a person. For example, they can set "a considerate person" as their ideal image of a person.
端末が設定データをサーバに送信する The device sends configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。このデータには、ユーザーの選択した理想の人間像に関する情報が含まれる。 The device sends data about the ideal person set by the user to the server. This data includes information about the ideal person selected by the user.
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信したデータを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データを収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received data to analyze the user's behavior and comments. Specifically, the server collects data on the user's past behavior and comments, and custom-changes it based on the ideal image of the person.
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。このデータには、ユーザーが実践すべき具体的な行動や発言の例が含まれる。 The server then sends the generated custom-changed behavior and speech data to the device. This data includes specific examples of behaviors and speech that the user should practice.
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。 Users practice the proposed custom-changed actions and utterances, practicing repeatedly. The application records the user's progress and provides feedback as needed.
具体例 Specific examples
例えば、ユーザーが「思いやりのある人」を理想の人間像として設定した場合、以下のようなプロンプト文を生成AIモデルに入力する。 For example, if a user sets "a compassionate person" as their ideal person, the following prompt sentence would be input into the generative AI model:
プロンプト文の例 Example prompt
「ユーザーが友人と会話しているときに、思いやりのある発言をするためのアドバイスを提供してください。」 "Please provide advice to help users be more considerate when speaking with friends."
生成AIモデルは、このプロンプト文に基づいて、ユーザーが友人と会話する際に使える具体的な発言例を生成する。例えば、「友人が困っているときに『何か手伝えることがあれば教えてね』と言う」といったアドバイスを提供する。 Based on this prompt, the generative AI model generates specific example utterances that the user can use when conversing with friends. For example, it provides advice such as, "When a friend is in trouble, say, 'Let me know if there's anything I can help you with.'"
このようにして、ユーザーは理想の人間像に基づいた行動や発言を学び、実践することができる。 In this way, users can learn and practice behaviors and speech based on their ideal image of a person.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのインターフェース上で「理想の人間像を設定する」ボタンをクリックし、ドロップダウンメニューから「思いやりのある人」を選択し、「設定」ボタンを押す。 The user launches the application and sets their ideal person. Specifically, they click the "Set Ideal Person" button on the application interface, select "Compassionate Person" from the drop-down menu, and press the "Set" button.
入力: ユーザーの選択した理想の人間像(例:「思いやりのある人」) Input: User's chosen ideal person (e.g., "a caring person")
出力: 理想の人間像の設定データ Output: Ideal human image configuration data
ステップ2: Step 2:
端末が設定データをサーバに送信する The device sends the configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。この送信は、HTTPSプロトコルを使用して安全に行われる。 The device sends data about the user's ideal person profile to a server. This transmission is secure using the HTTPS protocol.
入力: 理想の人間像の設定データ Input: Ideal human image data
出力: サーバに送信された設定データ Output: Configuration data sent to the server
ステップ3: Step 3:
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信した設定データを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データ(例:チャットログやSNSの投稿)を収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received configuration data to analyze the user's behavior and comments. Specifically, the server collects the user's past behavior and comment data (e.g., chat logs and social media posts) and customizes it based on the ideal image of the person.
入力: 設定データ、ユーザーの過去の行動や発言データ Input: Configuration data, user past behavior and comment data
出力: カスタムチェンジされた行動や発言データ Output: Custom-changed behavior and speech data
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
入力: カスタムチェンジされた行動や発言データ Input: Custom-changed behavior and speech data
出力: 生成された具体的な行動や発言の例 Output: Examples of specific actions and statements generated
ステップ5: Step 5:
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。この送信も、HTTPSプロトコルを使用して行われる。 The server then sends the generated custom-changed behavior and speech data to the device. This transmission is also done using the HTTPS protocol.
入力: 生成された具体的な行動や発言の例 Input: Examples of specific actions or statements to be generated
出力: 端末に送信されたデータ Output: Data sent to the device
ステップ6: Step 6:
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
入力: 端末に送信されたデータ Input: Data sent to the device
出力: ユーザーに提示された具体的な行動や発言の例 Output: Examples of specific actions and statements presented to the user
ステップ7: Step 7:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。例えば、ユーザーが「今日、友人に思いやりのある発言をした」とアプリケーションに入力する。 The user then practices the custom-changed actions and statements presented to them, repeatedly practicing. The application records the user's progress and provides feedback as needed. For example, a user might enter into the application, "Today, I made a kind statement to a friend."
入力: ユーザーの実践結果 Input: User practice results
出力: 記録された進捗データおよび提供されたフィードバック Output: Recorded progress data and provided feedback
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的な行動や発言のカスタムチェンジが難しく、効果的なトレーニングが行えないという問題があった。また、スタッフが理想の接客態度に近づくための反復トレーニングが不足しており、実際の接客において理想の態度を維持することが困難であった。 Traditional customer service training systems had the problem of being unable to provide effective training because it was difficult to customize specific actions and comments to help staff develop the ideal customer service attitude. Furthermore, there was a lack of repetitive training to help staff approach the ideal customer service attitude, making it difficult for them to maintain the ideal attitude when actually serving customers.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する手段と、該生成された行動や発言をプロンプト文としてユーザーに提示する手段と、を含む。これにより、スタッフが理想の接客態度を具体的に理解し、反復トレーニングを通じて実際の接客において理想の態度を維持することが可能となる。 The identification processing by the identification processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means. In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for generating actions and utterances based on the ideal human image using a generative AI model, and means for presenting the generated actions and utterances to the user as prompt sentences. This enables staff to concretely understand the ideal customer service attitude and maintain the ideal attitude in actual customer service through repeated training.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言を学習しようとする個人である。 A "user" is an individual who uses the system to learn to behave and speak in a way that is consistent with the ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や態度のことであり、システムがそれに基づいて行動や発言をカスタムチェンジする基準となるものである。 The "ideal person" is the specific character and attitude that the user should strive for, and serves as the standard by which the system will custom-change their behavior and speech.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキストとして表示する機能である。 "Projection means" is a function that displays the user's ideal image of a person visually or as text on the system.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能である。 "Means for custom change" is a function that allows users to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための機能である。 "Means of presentation" is a function for displaying custom-changed actions and comments to users.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice custom-changed actions and statements.
「生成AIモデル」とは、ユーザーが設定した理想の人間像に基づいて行動や発言を生成するための人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates actions and statements based on the ideal human image set by the user.
「プロンプト文」とは、生成AIモデルが理想の人間像に基づいて生成した行動や発言をユーザーに提示するためのテキスト形式の指示文である。 A "prompt" is a text-based instruction that presents the user with actions and statements generated by the generative AI model based on an ideal human image.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うものである。以下に、このシステムの具体的な実施形態について説明する。 The system for implementing this invention custom-changes behavior and speech based on the ideal person image set by the user, and presents this to the user for repetitive training. Specific embodiments of this system are described below.
システムの構成 System Configuration
システムは、以下の主要なコンポーネントから構成される。 The system consists of the following main components:
1. ユーザー端末: スマートフォンやタブレットなどのデバイスで、ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するために使用する。 1. User device: A device such as a smartphone or tablet that allows the user to define their ideal person and check their custom-changed behavior and statements.
2. サーバ: ユーザーの入力データを処理し、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する。 2. Server: Processes user input data and uses a generative AI model to generate behaviors and statements based on the ideal human image.
3. 生成AIモデル: OpenAIのGPT-3(登録商標)などの生成AIモデルを使用し、ユーザーが設定した理想の人間像に基づいて行動や発言を生成する。 3. Generative AI models: Using generative AI models such as OpenAI's GPT-3 (registered trademark), actions and statements are generated based on the ideal human image set by the user.
プログラムの処理 Program processing
サーバは、ユーザー端末から送信された理想の人間像と現在の行動や発言のデータを受け取り、生成AIモデルにプロンプト文として入力する。生成AIモデルは、理想の人間像に基づいた行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server receives the ideal human image and current behavior and speech data sent from the user's device and inputs this as prompt text into the generative AI model. The generative AI model generates behavior and speech based on the ideal human image and returns the results to the server. The server then sends the generated behavior and speech to the user's device and presents them to the user.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア: スマートフォン、タブレット、サーバ Hardware: Smartphones, tablets, servers
ソフトウェア: Python、OpenAI API、ユーザーインターフェースアプリケーション Software: Python, OpenAI API, user interface application
データ加工およびデータ演算 Data processing and calculation
サーバは、ユーザーが設定した理想の人間像と現在の行動や発言をプロンプト文として生成AIモデルに送信する。生成AIモデルは、プロンプト文に基づいて理想の行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server sends the user's ideal image of a person and their current actions and statements as prompts to the generative AI model. The generative AI model generates the ideal actions and statements based on the prompts and returns the results to the server. The server then sends the generated actions and statements to the user's device and presents them to the user.
具体例 Specific examples
例えば、ユーザーが「思いやりのある接客」を理想の人間像として設定し、現在の行動が「お客様に対して無愛想な対応をする」である場合、プロンプト文は以下のようになる。 For example, if the user defines their ideal person as "attentive customer service" and their current behavior is "treating customers in an unfriendly manner," the prompt would be as follows:
プロンプト文の例: Example prompt:
理想の人間像: 思いやりのある接客 Ideal person: Attentive customer service
ユーザーの行動: お客様に対して無愛想な対応をする User behavior: Treating customers rudely
理想の人間像に基づいた行動: Acting based on the ideal human image:
生成AIモデルは、このプロンプト文に基づいて「思いやりのある接客」に適した行動や発言を生成し、その結果をユーザーに提示する。ユーザーは提示された行動や発言を反復トレーニングすることで、理想の接客態度に近づくことができる。 Based on this prompt, the generative AI model generates actions and statements appropriate for "considerate customer service" and presents the results to the user. By repeatedly practicing the actions and statements presented, users can get closer to their ideal customer service attitude.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
ユーザーが端末を使用して理想の人間像を設定する。ユーザーはアプリケーションを起動し、理想の人間像(例:「思いやりのある接客」)を入力する。入力データは端末からサーバに送信される。 The user sets their ideal person image using their device. The user launches the application and inputs their ideal person image (e.g., "thorough customer service"). The input data is sent from the device to the server.
入力:理想の人間像 Input: Ideal human image
出力:サーバに送信された理想の人間像データ Output: Ideal human image data sent to the server
ステップ2: Step 2:
サーバは、ユーザーから送信された理想の人間像データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the ideal human image data sent by the user. The server stores this data and uses it for subsequent processing.
入力:理想の人間像データ Input: Ideal human image data
出力:保存された理想の人間像データ Output: Saved ideal human image data
ステップ3: Step 3:
ユーザーが端末を使用して現在の行動や発言を入力する。ユーザーは現在の行動(例:「お客様に対して無愛想な対応をする」)を入力し、端末からサーバに送信する。 The user uses the device to input their current actions and statements. The user inputs their current actions (e.g., "being rude to customers") and sends it from the device to the server.
入力:現在の行動や発言 Input: Current action or statement
出力:サーバに送信された現在の行動や発言データ Output: Current behavior and speech data sent to the server
ステップ4: Step 4:
サーバは、ユーザーから送信された現在の行動や発言データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the current activity and comment data sent by the user. The server stores this data and uses it for further processing.
入力:現在の行動や発言データ Input: Current activity and speech data
出力:保存された現在の行動や発言データ Output: Saved current behavior and speech data
ステップ5: Step 5:
サーバは、保存された理想の人間像データと現在の行動や発言データを組み合わせてプロンプト文を生成する。生成されたプロンプト文は、生成AIモデルに入力される。 The server generates prompts by combining the stored ideal human image data with current behavior and speech data. The generated prompts are then input into the generative AI model.
入力:理想の人間像データ、現在の行動や発言データ Input: Ideal person data, current behavior and speech data
出力:生成されたプロンプト文 Output: Generated prompt text
ステップ6: Step 6:
サーバは、生成されたプロンプト文を生成AIモデルに送信する。生成AIモデルはプロンプト文に基づいて理想の行動や発言を生成する。 The server sends the generated prompt text to the generative AI model, which then generates the ideal behavior or speech based on the prompt text.
入力:生成されたプロンプト文 Input: Generated prompt text
出力:生成AIモデルによって生成された理想の行動や発言 Output: Ideal actions and statements generated by the generative AI model
ステップ7: Step 7:
サーバは、生成AIモデルから返された理想の行動や発言を受信する。サーバはこのデータをユーザー端末に送信する。 The server receives the ideal actions and statements returned by the generative AI model. The server then sends this data to the user's device.
入力:生成AIモデルによって生成された理想の行動や発言 Input: Ideal actions and statements generated by a generative AI model
出力:ユーザー端末に送信された理想の行動や発言データ Output: Ideal behavior and speech data sent to the user's device
ステップ8: Step 8:
ユーザー端末は、サーバから送信された理想の行動や発言データを受信し、ユーザーに提示する。ユーザーは提示された行動や発言を確認し、反復トレーニングを行う。 The user's device receives the ideal behavior and speech data sent from the server and presents it to the user. The user confirms the presented behavior and speech and performs repeated training.
入力:理想の行動や発言データ Input: Ideal behavior and speech data
出力:ユーザーに提示された理想の行動や発言 Output: Ideal actions and statements presented to the user
以上の処理ステップにより、ユーザーは理想の人間像に基づいた行動や発言を学習し、反復トレーニングを通じて理想の態度に近づくことができる。 Through these processing steps, users learn how to behave and speak in a way that is based on the ideal image of a person, and through repeated training, they can move closer to their ideal attitude.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
現代社会において、多くの人々が自己改善や理想の人間像に近づくことを目指しているが、その過程は困難であり、持続的な努力が必要である。また、自己改善のための具体的な行動や発言の指針が不足しているため、効果的なトレーニングが難しいという問題がある。さらに、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするための適切な手段が存在しないため、ユーザーが自身の理想像に近づくことが困難である。 In modern society, many people aim to improve themselves and become closer to their ideal image, but the process is difficult and requires sustained effort. Furthermore, there is a lack of specific guidelines for actions and statements for self-improvement, making effective training difficult. Furthermore, there are no appropriate means for users to customize their actions and statements based on their ideal image, making it difficult for users to become closer to their ideal image.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示する手段と、該提示された行動や発言をユーザーが反復トレーニングする手段と、ユーザーの行動や発言を収集する手段と、収集した行動や発言を解析し、生成AIモデルを使用してカスタムチェンジする手段と、を含む。これにより、ユーザーは具体的な行動や発言の指針を得ることができ、持続的なトレーニングを通じて自身の理想像に近づくことが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and comments based on the ideal human image, means for presenting the custom-changed actions and comments to the user, means for the user to repeatedly train on the presented actions and comments, means for collecting the user's actions and comments, and means for analyzing the collected actions and comments and customizing them using a generative AI model. This allows the user to obtain specific guidelines for actions and comments, and enables them to get closer to their ideal image through continuous training.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的またはテキスト形式で表示するための機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person in visual or text form.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能を指す。 "Means for custom change" refers to the function that allows a user to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに通知または表示するための機能を指す。 "Means of presentation" refers to the function for notifying or displaying custom-changed actions or statements to the user.
「反復トレーニングする手段」とは、ユーザーが提示された行動や発言を繰り返し実行することで、理想の人間像に近づくためのトレーニングを行う機能を指す。 "Means for repeated training" refers to a function that allows users to train themselves to become closer to their ideal image of a person by repeatedly performing suggested actions and statements.
「収集する手段」とは、ユーザーの行動や発言を記録し、データとして保存するための機能を指す。 "Means of collection" refers to the function for recording user actions and comments and saving them as data.
「解析する手段」とは、収集されたユーザーの行動や発言データを分析し、理想の人間像に基づいてカスタムチェンジするための情報を抽出する機能を指す。 "Means of analysis" refers to the function of analyzing collected user behavior and comment data and extracting information for custom changes based on the ideal image of a person.
「生成AIモデル」とは、ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデルを指す。 A "generative AI model" refers to an artificial intelligence model that converts a user's actions and statements based on an ideal image of a human being.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes actions and speech based on the ideal person image set by the user, and presents this to the user for repetitive training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末:ユーザーが使用するスマートフォン、タブレット、またはパソコンなどのデバイス。 Device: The device used by the user, such as a smartphone, tablet, or computer.
サーバ:データの処理と保存を行うためのリモートサーバ。 Server: A remote server for processing and storing data.
ソフトウェア Software
アプリケーション:ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのソフトウェア。 Application: Software that allows users to define their ideal person and check their custom-changed behavior and statements.
生成AIモデル:ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデル(例:GPT-4)。 Generative AI model: An artificial intelligence model (e.g., GPT-4) that transforms user behavior and speech based on an ideal human image.
システムの動作 System Operation
理想の人間像の設定 Establishing the ideal human image
ユーザーは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーの日常的な行動や発言を記録する。例えば、ユーザーが友人と会話している内容や、SNSに投稿した内容を収集する。収集したデータは、リアルタイムでサーバに送信される。 The device records the user's everyday actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media. The collected data is sent to a server in real time.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、受信したユーザーの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。例えば、ユーザーが「今日は忙しいから手伝えない」と言った場合、生成AIモデルはこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変換する。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), it custom-changes the user's behavior and speech based on the ideal person. For example, if a user says, "I'm busy today, so I can't help you," the generative AI model converts this to, "I'm busy today, but please let me know if there's anything I can do to help."
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザーに通知する。ユーザーは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
反復トレーニング Repetitive training
ユーザーは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。これにより、ユーザーは理想の人間像に近づくためのトレーニングを行う。 Users repeatedly execute the custom-changed actions and statements that are presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts. In this way, users train to become closer to their ideal image of the person they want to be.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーはアプリケーションの設定画面で「思いやりのある人」と入力し、保存ボタンをクリックする。 The user enters "compassionate person" in the application's settings screen and clicks the save button.
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーが友人と会話している音声を録音し、テキストに変換する。また、ユーザーがSNSに投稿したテキストデータも収集する。 The device records the user's voice when they are talking to friends and converts it into text. It also collects text data that the user posts on social media.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、収集したテキストデータを生成AIモデルに入力する。生成AIモデルは、プロンプト文を使用して、ユーザーの発言を理想の人間像に基づいて変換する。 The server inputs the collected text data into a generative AI model, which uses prompts to convert the user's speech based on an ideal human image.
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、生成AIモデルが出力したカスタムチェンジされた発言を端末に送信する。端末は、ユーザーに通知を表示し、「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」といった提案を行う。 The server sends the custom-modified utterances output by the generative AI model to the device. The device then displays a notification to the user, suggesting something like, "I'm busy today, but please let me know if there's anything I can do to help you."
反復トレーニング Repetitive training
ユーザーは、毎日の会話やSNS投稿で、サーバから提案された発言を使用する。例えば、友人との会話で「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」と言う。これを繰り返すことで、ユーザーは「思いやりのある人」としての行動や発言が自然にできるようになる。 Users use the suggestions from the server in their everyday conversations and social media posts. For example, in a conversation with a friend, they might say, "I'm busy today, but please let me know if there's anything I can do to help." By repeating this, users will naturally begin to act and speak in a way that befits a "considerate person."
プロンプト文の例 Example prompt
生成AIモデルに入力するプロンプト文の例は以下の通りである: An example of a prompt to input to the generative AI model is as follows:
ユーザーの現在の発言:「今日は忙しいから手伝えない」 Current user statement: "I'm busy today, so I can't help."
理想の人間像:「思いやりのある人」 Ideal person: "A compassionate person"
生成AIモデルに対するプロンプト文:「ユーザーの発言を、思いやりのある人の発言に変換してください」 Prompt for generative AI model: "Transform the user's utterances into those of a considerate person."
このプロンプト文を生成AIモデルに入力することで、ユーザーの発言が理想の人間像に基づいてカスタムチェンジされる。 By inputting this prompt into a generative AI model, the user's speech is custom-changed based on the ideal human image.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
ユーザは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
入力:ユーザが設定画面で入力した理想の人間像。 Input: The ideal person image entered by the user on the settings screen.
出力:理想の人間像がアプリケーションに保存される。 Output: The ideal image of a person is saved in the application.
ステップ2: Step 2:
端末は、ユーザの日常的な行動や発言を記録する。例えば、ユーザが友人と会話している内容や、SNSに投稿した内容を収集する。 The device records the user's daily actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media.
入力:ユーザの行動や発言。 Input: User actions and statements.
出力:収集された行動や発言データが端末に保存され、リアルタイムでサーバに送信される。 Output: Collected behavioral and speech data is stored on the device and sent to the server in real time.
ステップ3: Step 3:
サーバは、受信したユーザの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザの行動や発言を理想の人間像に基づいてカスタムチェンジする。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), the user's behavior and speech are custom-changed based on the ideal image of a person.
入力:収集された行動や発言データ、理想の人間像。 Input: Collected behavioral and speech data, ideal human image.
出力:カスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements.
具体的な動作:サーバは、収集されたテキストデータを生成AIモデルに入力し、プロンプト文を使用してユーザの発言を変換する。 Specific operation: The server inputs the collected text data into the generative AI model and converts the user's utterances using prompts.
ステップ4: Step 4:
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザに通知する。ユーザは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
入力:カスタムチェンジされた行動や発言。 Input: Custom-changed actions and statements.
出力:ユーザに提示されたカスタムチェンジされた行動や発言。 Output: The custom-changed actions and statements presented to the user.
具体的な動作:端末は、サーバから受信したカスタムチェンジされた発言を通知として表示する。 Specific operation: The device displays the custom-changed message received from the server as a notification.
ステップ5: Step 5:
ユーザは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。 The user repeatedly executes the custom-changed actions and statements presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts.
入力:提示されたカスタムチェンジされた行動や発言。 Input: The proposed custom-changed actions and statements.
出力:ユーザが実行したカスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements performed by the user.
具体的な動作:ユーザは、友人との会話やSNS投稿で、サーバから提案された発言を使用する。これを繰り返すことで、ユーザは理想の人間像に近づくためのトレーニングを行う。 Specific operation: The user uses statements suggested by the server in conversations with friends and in social media posts. By repeating this process, the user trains to become closer to their ideal image of the person they want to be.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を身につけるためのトレーニング方法は限られており、効果的なトレーニングが難しいという課題があった。また、スタッフが理想の接客態度を実践するための具体的なガイドラインやフィードバックが不足しているため、接客品質の向上が困難であった。さらに、スタッフが自身の理想像に近づくための反復トレーニングを効率的に行う手段が求められていた。 In traditional customer service work, there were limited training methods for staff to acquire ideal customer service attitudes, making effective training difficult. Furthermore, there was a lack of specific guidelines or feedback for staff to put ideal customer service attitudes into practice, making it difficult to improve customer service quality. Furthermore, there was a need for an efficient way to provide repeated training to help staff become closer to their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングする手段と、生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する手段と、を含む。これにより、スタッフが理想の接客態度を効率的にトレーニングし、実践することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for training the ideal customer service attitude using smart glasses worn by staff performing customer service duties, and means for generating custom-changed utterances based on the ideal human image using a generative AI model. This enables staff to efficiently train in and practice the ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置またはソフトウェアである。 "Projection means" refers to a device or software that visually or audibly displays the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための装置またはソフトウェアである。 "Means for custom change" refers to a device or software that changes a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための装置またはソフトウェアである。 "Presentation means" refers to a device or software that displays custom-changed actions and statements to the user.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための装置またはソフトウェアである。 "Means for repeated training" refers to a device or software that allows the user to repeatedly practice custom-changed actions or utterances.
「接客業務」とは、顧客に対して商品やサービスを提供する業務である。 "Customer service" refers to the work of providing products and services to customers.
「スマート眼鏡」とは、情報を表示する機能を持つ眼鏡型のデバイスである。 "Smart glasses" are glasses-type devices that have the function of displaying information.
「生成AIモデル」とは、人工知能を用いてテキストや行動を生成するためのアルゴリズムである。 A "generative AI model" is an algorithm that uses artificial intelligence to generate text and behavior.
「カスタムチェンジされた発言」とは、理想の人間像に基づいて変更されたユーザーの発言である。 "Custom-changed statements" are statements made by users that have been altered based on their ideal image of a person.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするためのものである。具体的には、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングすることができる。 The system for implementing this invention projects the ideal image of a person set by the user, custom-changes the user's actions and speech, and repeatedly trains them. Specifically, it can train ideal customer service attitudes using smart glasses worn by staff performing customer service duties.
システムの構成 System Configuration
システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:
1. ユーザー端末:ユーザーが理想の人間像を設定するためのデバイス。スマートフォンやタブレットが該当する。 1. User device: The device on which the user sets their ideal image of the person. This includes smartphones and tablets.
2. スマート眼鏡:接客業務を行うスタッフが装着するデバイス。情報を視覚的に表示する機能を持つ。 2. Smart glasses: A device worn by staff performing customer service duties. It has the function of visually displaying information.
3. サーバ:生成AIモデルを実行し、ユーザーの行動や発言をカスタムチェンジするためのデータ処理を行う。 3. Server: Runs the generative AI model and processes data to custom change user behavior and speech.
4. 生成AIモデル:ユーザーの理想の人間像に基づいてカスタムチェンジされた発言を生成するアルゴリズム。 4. Generative AI model: An algorithm that generates custom-modified statements based on the user's ideal image of the person.
プログラムの処理 Program processing
サーバは、ユーザーが設定した理想の人間像を受け取り、それに基づいてユーザーの行動や発言をカスタムチェンジする。具体的には、以下の手順で処理が行われる: The server receives the user's ideal image of the person and custom-changes the user's behavior and speech based on that image. Specifically, the process is carried out as follows:
1. 理想の人間像の設定:ユーザー端末を用いて、ユーザーが理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想像として設定する。 1. Setting the ideal person: Using the user device, the user sets the ideal person. For example, they can set "kind and polite customer service" as their ideal image.
2. ユーザーの発言の入力:ユーザーが実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」という発言。 2. Enter user utterances: Enter actual utterances made by the user. For example, "Welcome, are you looking for something?"
3. 生成AIモデルの実行:サーバは生成AIモデルを用いて、理想の人間像に基づいたカスタムチェンジされた発言を生成する。 3. Execution of the generative AI model: The server uses the generative AI model to generate custom-modified utterances based on the ideal human image.
4. カスタムチェンジされた発言の提示:スマート眼鏡を通じて、カスタムチェンジされた発言をユーザーに提示する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言。 4. Present customized speech: Present customized speech to the user through smart glasses. For example, "Welcome, we'll help you find the product you're looking for."
5. 反復トレーニング:ユーザーは提示されたカスタムチェンジされた発言を反復して練習する。 5. Repetitive training: Users repeatedly practice the custom-modified utterances presented to them.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア:スマート眼鏡(例:Google(登録商標) Glass(登録商標))、ユーザー端末(スマートフォン、タブレット) Hardware: Smart glasses (e.g., Google® Glass®), user devices (smartphones, tablets)
ソフトウェア:生成AIモデル(例:OpenAI API)、データ処理サーバ Software: Generative AI models (e.g., OpenAI API), data processing servers
具体例 Specific examples
例えば、接客スタッフが「親切で丁寧な接客」を理想像として設定し、以下のようなプロンプト文を使用する: For example, let's say the ideal customer service staff member is "friendly and courteous service," and use the following prompt:
プロンプト文の例: Example prompt:
理想の人間像: 親切で丁寧な接客 Ideal personality: Kind and courteous customer service
ユーザーの発言: いらっしゃいませ、何かお探しですか? User says: Welcome, are you looking for something?
理想の人間像に基づいたカスタムチェンジされた発言: Custom-changed statements based on the ideal person:
このプロンプト文を生成AIモデルに入力することで、理想の接客態度に基づいたカスタムチェンジされた発言を生成する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」のような発言が生成される。 By inputting this prompt into the generative AI model, a custom-modified utterance based on the ideal customer service attitude is generated. For example, a utterance such as, "Welcome, we'll help you find the product you're looking for" is generated.
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する。 The user sets their ideal image of the person.
入力:ユーザーが端末(スマートフォンやタブレット)を使用して、理想の人間像を入力する。例えば、「親切で丁寧な接客」。 Input: The user uses a device (smartphone or tablet) to input their ideal image of a person. For example, "kind and polite customer service."
データ加工:端末は入力された理想の人間像をサーバに送信する。 Data processing: The device sends the input image of the ideal person to the server.
出力:サーバに理想の人間像が保存される。 Output: The ideal image of a person is saved on the server.
ステップ2: Step 2:
ユーザーが実際の発言を入力する。 The user enters the actual statement.
入力:ユーザーが端末を使用して、実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」。 Input: The user uses the device to type what they actually say. For example, "Welcome, is there anything I can help you with?"
データ加工:端末は入力された発言をサーバに送信する。 Data processing: The device sends the entered comments to the server.
出力:サーバにユーザーの発言が保存される。 Output: User comments are saved on the server.
ステップ3: Step 3:
サーバが生成AIモデルを実行する。 The server runs the generative AI model.
入力:サーバは保存された理想の人間像とユーザーの発言を取得する。 Input: The server retrieves the stored ideal person image and user statements.
データ演算:サーバは生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する。プロンプト文を生成AIモデルに入力し、カスタムチェンジされた発言を得る。 Data calculation: The server uses the generative AI model to generate custom-changed utterances based on the ideal human image. The prompt text is input into the generative AI model to obtain the custom-changed utterances.
出力:生成されたカスタムチェンジされた発言がサーバに保存される。 Output: The generated custom-changed comments are saved on the server.
ステップ4: Step 4:
カスタムチェンジされた発言をユーザーに提示する。 Present the custom-changed statement to the user.
入力:サーバは生成されたカスタムチェンジされた発言を取得する。 Input: The server receives the generated custom-changed statement.
データ加工:サーバはカスタムチェンジされた発言をスマート眼鏡に送信する。 Data processing: The server sends the custom-modified speech to the smart glasses.
出力:スマート眼鏡にカスタムチェンジされた発言が表示される。 Output: The custom-changed speech is displayed on the smart glasses.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う。 Users perform repetitive training.
入力:ユーザーはスマート眼鏡に表示されたカスタムチェンジされた発言を確認する。 Input: The user sees the custom-changed speech displayed on the smart glasses.
具体的な動作:ユーザーは表示された発言を繰り返し練習する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言を練習する。 Specific behavior: The user repeatedly practices the displayed utterance. For example, they practice saying, "Welcome, we'd love to help you find the product you're looking for."
出力:ユーザーの接客態度が理想の人間像に近づく。 Output: The user's customer service attitude becomes closer to the ideal person.
更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 Furthermore, an emotion engine that estimates the user's emotion may be combined. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
「形態例1」 "Example 1"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
「形態例2」 "Example 2"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがシステムを起動し、自身の理想像を設定する。この理想像は、ユーザーがどのような行動を取り、どのような発言をするかを具体的に示すものである。 Step 1: The user starts the system and sets their ideal self. This ideal self specifically describes how the user will behave and what they will say.
ステップ2:感情エンジンがユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。 Step 2: The emotion engine analyzes the user's emotional state in real time. Specifically, it infers the user's emotional state from their facial expressions, tone of voice, choice of words, etc.
ステップ3:感情エンジンがユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。 Step 3: The emotion engine tracks changes in the user's emotional state. This allows the content of the repetitive training to help the user approach their ideal self to be tailored to the user's emotional state.
ステップ4:ユーザーが自身の理想像に近づくための反復トレーニングを行う。このトレーニングは、ユーザーの感情状態に応じて調整される。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。 Step 4: The user undergoes repeated training to move closer to their ideal self. This training is adjusted according to the user's emotional state. For example, when the user is feeling stressed, training is provided to promote relaxation. On the other hand, when the user is feeling joy, training is provided to encourage behavior that shares that joy.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来のシステムでは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジすることが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、ユーザーが自身の理想像に近づくための効果的なサポートが不足しているという課題があった。 Previous systems had the problem that it was difficult to customise behaviour and speech based on the ideal image of the person set by the user, and the training content was not adjusted according to the user's emotional state, resulting in a lack of effective support to help users get closer to their ideal image.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンから得られたデータを基にトレーニング内容を調整する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための効果的なサポートが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, and means for adjusting the training content based on data obtained from the emotion engine. This enables effective support for the user to get closer to their ideal image.
「ユーザー」とは、システムを利用して自身の理想の人間像に近づくことを目指す個人を指す。 "User" refers to an individual who uses the system to aim to become closer to their ideal image of a person.
「理想の人間像」とは、ユーザーが目標とする人格や行動特性を具体的に設定したものである。 An "ideal person" is a specific set of personality and behavioral characteristics that a user aspires to.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキスト形式で表示する機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person on the system in visual or text format.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更・調整する機能を指す。 "Means for customizing" refers to the ability to change and adjust a user's behavior and comments based on their ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知または表示する機能を指す。 "Means of presentation" refers to the function of notifying or displaying custom-changed actions or comments to the user.
「反復トレーニングする手段」とは、ユーザーが提示されたカスタムチェンジを基に繰り返し練習する機能を指す。 "Means for repeated training" refers to a function that allows users to repeatedly practice based on the custom changes presented to them.
「感情エンジン」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態をリアルタイムで分析する機能を指す。 The "emotion engine" refers to a function that analyzes a user's emotional state in real time based on their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を変更・調整する機能を指す。 "Means for adjusting training content" refers to the function that changes and adjusts training content according to the user's emotional state based on data obtained from the emotion engine.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: ユーザーが使用するスマートフォン、タブレット、またはPC。 Device: The smartphone, tablet, or PC used by the user.
サーバ: データ処理およびストレージを行うためのクラウドサーバ。 Server: Cloud server for data processing and storage.
カメラおよびマイク: ユーザーの顔表情や声のトーンをリアルタイムでキャプチャするためのデバイス。 Camera and microphone: Devices that capture your facial expressions and tone of voice in real time.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供する。 Application: Provides an interface that allows users to define their ideal person and review their custom-changed behavior and statements.
感情エンジン: ユーザーの感情状態をリアルタイムで分析するためのソフトウェアモジュール。 Emotion engine: A software module for analyzing a user's emotional state in real time.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのAIモデル。 Generative AI model: An AI model that custom-changes a user's behavior and speech based on an ideal human image.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を選択する。 The user launches the application and sets their ideal image of the person. For example, they can select "a compassionate person."
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。これには、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容が含まれる。 The server collects input data, voice data, and text messages from users' smartphones and PCs in real time, including what users chat with friends and what they say to their voice assistants.
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。 The server analyzes the collected data using natural language processing (NLP) technology. For example, if a user says "thank you" infrequently, the server will suggest that they say "thank you" more frequently.
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。例えば、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。 The server then uses the application's notification function to present the custom-changed actions and comments to the user. For example, it could send a notification such as, "Try saying 'Thank you' the next time you talk to a friend."
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。これを繰り返すことで、ユーザーは「思いやりのある人」に近づく。 Based on suggestions from the server, users are made conscious of saying "thank you" more often in their daily lives. By repeating this, users become closer to becoming "considerate people."
感情エンジンがユーザーの感情状態を分析する The emotion engine analyzes the user's emotional state.
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。例えば、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。 The emotion engine uses the user's smartphone camera and microphone to analyze facial expressions and tone of voice in real time. For example, if a user is smiling while speaking, the emotion engine will determine that the user is feeling happy.
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。 The server uses data obtained from the emotion engine to adjust the training content according to the user's emotional state. For example, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax."
具体例 Specific examples
理想の人間像設定 Defining the ideal person
ユーザーがアプリケーションを開き、「思いやりのある人」を理想の人間像として設定する。 The user opens the application and sets "a compassionate person" as their ideal person.
カスタムチェンジの例 Custom Change Example
サーバは、ユーザーが友人と会話する際に「ありがとう」と言う頻度を増やすように提案する。 The server suggests that users say "thank you" more frequently when conversing with friends.
感情エンジンの分析 Emotion Engine Analysis
ユーザーが会話中に笑顔を見せている場合、感情エンジンはユーザーが喜びを感じていると判断する。 If a user smiles during a conversation, the emotion engine will determine that the user is feeling happy.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じている場合、サーバは深呼吸や瞑想を促すトレーニングを提供する。 If the user is feeling stressed, the server will provide deep breathing and meditation training.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのような行動や発言をカスタムチェンジするか提案してください。」 "If the user sets their ideal person as 'a considerate person,' please suggest what actions and statements they would like to customize."
このシステムは、ユーザーが自身の理想像に近づくための具体的な行動や発言を提供し、感情状態に応じたトレーニングを行うことで、ユーザーの成長をサポートする。 The system supports users' growth by providing them with specific actions and statements to help them become closer to their ideal self, and by providing training tailored to their emotional state.
実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションの設定画面で「思いやりのある人」などの選択肢から理想の人間像を選び、設定を保存する。入力はユーザーの選択した理想の人間像であり、出力は設定された理想の人間像のデータである。 The user launches the application and sets their ideal person. Specifically, they select their ideal person from options such as "a considerate person" on the application's settings screen and save the settings. The input is the ideal person selected by the user, and the output is data for the set ideal person.
ステップ2: Step 2:
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。具体的には、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーの行動データであり、出力は収集された行動データのデータベースである。 The server collects input data, voice data, and text messages from the user's smartphone or PC in real time. Specifically, it collects what the user chats with friends and what they say to their voice assistant. The input is user behavioral data, and the output is a database of the collected behavioral data.
ステップ3: Step 3:
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。具体的には、生成AIモデルを使用して、ユーザーの行動や発言を理想の人間像に基づいて変更する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。入力は収集された行動データであり、出力はカスタムチェンジされた行動や発言の提案である。 The server analyzes the collected data using natural language processing (NLP) technology. Specifically, it uses a generative AI model to change the user's behavior and speech based on the ideal person. For example, if the user says "thank you" infrequently, the server will suggest that they say "thank you" more often. The input is the collected behavioral data, and the output is suggested custom-changed behaviors and speech.
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。具体的には、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。入力はカスタムチェンジされた行動や発言の提案であり、出力はユーザーへの通知である。 The server presents the custom-changed actions and utterances to the user using the application's notification function. Specifically, it sends a notification such as, "Try saying 'thank you' the next time you talk to a friend." The input is a suggestion for a custom-changed action or utterance, and the output is a notification to the user.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。具体的には、友人や家族との会話で「ありがとう」と言う機会を増やす。入力はサーバからの提案であり、出力はユーザーの実際の行動である。 Based on suggestions from the server, users are made conscious to say "thank you" more frequently in their daily lives. Specifically, they increase the number of opportunities to say "thank you" in conversations with friends and family. The input is the suggestions from the server, and the output is the user's actual behavior.
ステップ6: Step 6:
感情エンジンがユーザーの感情状態を分析する Emotion engine analyzes the user's emotional state
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。具体的には、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。入力はユーザーの顔表情や声のトーンであり、出力は分析された感情状態のデータである。 The emotion engine uses the camera and microphone on the user's smartphone to analyze facial expressions and tone of voice in real time. Specifically, if the user is smiling and talking, the emotion engine determines that the user is feeling happy. The input is the user's facial expressions and tone of voice, and the output is data on the analyzed emotional state.
ステップ7: Step 7:
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。具体的には、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。入力は分析された感情状態のデータであり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state based on the data obtained from the emotion engine. Specifically, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax." The input is the analyzed emotional state data, and the output is the adjusted training content.
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的なフィードバックが不足しており、また、スタッフの感情状態に応じたトレーニング内容の調整が行われていないため、効果的なトレーニングが難しいという課題があった。 Conventional customer service training systems lacked specific feedback to help staff develop ideal customer service attitudes, and training content was not adjusted to reflect the emotional state of staff, making it difficult to provide effective training.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、ユーザーの感情状態に応じてトレーニング内容を調整する手段と、スマートデバイスを用いてユーザーにフィードバックを提供する手段と、を含む。これにより、スタッフが理想の接客態度を効果的に身につけることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, means for adjusting the training content according to the user's emotional state, and means for providing feedback to the user using a smart device. This enables staff to effectively acquire the ideal customer service attitude.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言のトレーニングを行う個人である。 A "user" is an individual who uses the system to train themselves to behave and speak in a way that reflects their ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な行動や態度のモデルである。 The "ideal person" is a model of specific behaviors and attitudes that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に提示するための方法や装置である。 "Projection means" refers to a method or device for visually or audibly presenting the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための方法や装置である。 "Means for custom change" refers to methods or devices for changing a user's behavior and speech based on an ideal image of a person.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジされた行動や発言を繰り返し練習するための方法や装置である。 "Means for repeated training" refers to methods or devices that allow users to repeatedly practice custom-changed actions and speech in order to become closer to their ideal image of the person.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情を推定するための方法や装置である。 "Means for analyzing emotional states in real time" refers to methods or devices for inferring emotions from a user's facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容を変更するための方法や装置である。 "Means for adjusting training content" refers to a method or device for changing the training content according to the user's emotional state.
「スマートデバイス」とは、カメラ、マイク、スピーカーなどを内蔵し、ユーザーにフィードバックを提供するためのデバイスである。 A "smart device" is a device that has a built-in camera, microphone, speaker, etc. and is used to provide feedback to the user.
「フィードバックを提供する手段」とは、ユーザーに対して理想の行動や発言に関するアドバイスや指示を提供するための方法や装置である。 "Means for providing feedback" refers to methods or devices for providing users with advice or instructions regarding ideal behavior or speech.
この発明を実施するための形態として、実店舗で働くスタッフが理想の接客態度を身につけるためのトレーニングシステムを提供する。システムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための手段を含む。また、ユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する手段も含まれる。 As an embodiment of this invention, we provide a training system that helps staff working in brick-and-mortar stores acquire ideal customer service attitudes. The system includes means for projecting an ideal image of a person set by the user, customizing the user's behavior and speech, and repeatedly training them. It also includes means for analyzing the user's emotional state in real time and adjusting the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア Hardware
スマート眼鏡: カメラ、マイク、スピーカーを内蔵し、ユーザーの行動や発言をキャプチャし、フィードバックを提供する。 Smart glasses: Equipped with a camera, microphone, and speaker, they capture the user's actions and speech and provide feedback.
サーバ: データ処理と分析を行うための中央処理装置。 Server: A central processing unit for data processing and analysis.
ソフトウェア Software
OpenCV: カメラ映像のキャプチャと処理を行うライブラリ。 OpenCV: A library for capturing and processing camera images.
EmotionRecognizer: 顔表情から感情を推定するライブラリ。 EmotionRecognizer: A library that estimates emotions from facial expressions.
SpeechRecognition: 音声認識ライブラリ。 SpeechRecognition: Speech recognition library.
TextToSpeech: テキストを音声に変換するライブラリ。 TextToSpeech: A library that converts text to speech.
IdealBehaviorModel: 理想の行動や発言を生成するモデル。 IdealBehaviorModel: A model that generates ideal behaviors and statements.
データ加工と演算 Data processing and calculations
カメラ映像のキャプチャ Camera footage capture
スマート眼鏡のカメラを使用して、ユーザーの顔表情や行動をリアルタイムでキャプチャする。OpenCVを用いて映像データを取得し、EmotionRecognizerで感情状態を分析する。 The camera in the smart glasses is used to capture the user's facial expressions and behavior in real time. OpenCV is used to acquire video data, and EmotionRecognizer is used to analyze the emotional state.
音声認識 Voice recognition
スマート眼鏡のマイクを使用して、ユーザーの発言をキャプチャする。SpeechRecognitionライブラリを用いて音声データをテキストに変換する。 Use the microphone in the smart glasses to capture what the user is saying. Use the SpeechRecognition library to convert the speech data into text.
フィードバック生成 Feedback generation
IdealBehaviorModelを使用して、ユーザーの感情状態と発言に基づいた理想の行動や発言を生成する。生成されたフィードバックはTextToSpeechライブラリを用いて音声に変換され、スマート眼鏡のスピーカーを通じてユーザーに提供される。 Using IdealBehaviorModel, ideal behaviors and utterances are generated based on the user's emotional state and utterances. The generated feedback is converted into speech using the TextToSpeech library and provided to the user through the smart glasses' speakers.
具体例 Specific examples
シナリオ Scenario
実店舗で働くスタッフが「思いやりのある接客」を目指してトレーニングを行う。 Staff working in physical stores will receive training aimed at providing "considerate customer service."
状況 situation
顧客が商品について質問した際、スタッフが適切な対応を行う。 When customers ask questions about products, staff will respond appropriately.
フィードバック Feedback
スタッフがストレスを感じている場合、システムはリラクゼーションを促すアドバイスを提供する。 If staff are feeling stressed, the system will provide advice to encourage relaxation.
プロンプト文の例 Example prompt
ユーザーが「思いやりのある接客」を目指している場合、顧客からの質問に対してどのように対応すれば良いかを教えてください。ユーザーがストレスを感じている場合は、リラクゼーションを促すアドバイスも提供してください。 If the user aims to provide "caring customer service," tell them how to respond to customer questions. If the user is feeling stressed, provide them with advice on how to promote relaxation.
このようにして、実店舗での接客トレーニングを効果的に行うことができる。 In this way, customer service training can be carried out effectively in physical stores.
応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.
ステップ1: Step 1:
ユーザがスマート眼鏡を装着し、システムを起動する。スマート眼鏡のカメラがユーザの顔表情や行動をリアルタイムでキャプチャし、マイクがユーザの発言をキャプチャする。入力はカメラ映像と音声データであり、出力はキャプチャされた映像と音声データである。 The user puts on the smart glasses and starts the system. The smart glasses' camera captures the user's facial expressions and actions in real time, and the microphone captures the user's speech. The input is camera video and audio data, and the output is the captured video and audio data.
ステップ2: Step 2:
サーバがOpenCVを使用して、スマート眼鏡から送信された映像データを処理する。具体的には、映像データからユーザの顔表情を抽出し、EmotionRecognizerを用いて感情状態を分析する。入力はキャプチャされた映像データであり、出力はユーザの感情状態である。 The server uses OpenCV to process the video data sent from the smart glasses. Specifically, it extracts the user's facial expressions from the video data and analyzes their emotional state using EmotionRecognizer. The input is the captured video data, and the output is the user's emotional state.
ステップ3: Step 3:
サーバがSpeechRecognitionライブラリを使用して、スマート眼鏡から送信された音声データをテキストに変換する。入力はキャプチャされた音声データであり、出力はテキストデータである。 The server uses the SpeechRecognition library to convert the voice data sent from the smart glasses into text. The input is the captured voice data, and the output is text data.
ステップ4: Step 4:
サーバがIdealBehaviorModelを使用して、ユーザの感情状態とテキストデータに基づいて理想の行動や発言を生成する。入力はユーザの感情状態とテキストデータであり、出力は理想の行動や発言のテキストである。 The server uses IdealBehaviorModel to generate ideal behaviors and statements based on the user's emotional state and text data. The input is the user's emotional state and text data, and the output is the text of the ideal behavior or statement.
ステップ5: Step 5:
サーバがTextToSpeechライブラリを使用して、生成された理想の行動や発言のテキストを音声に変換する。入力は理想の行動や発言のテキストであり、出力は音声データである。 The server uses the TextToSpeech library to convert the generated text of ideal actions and statements into speech. The input is the text of the ideal actions and statements, and the output is audio data.
ステップ6: Step 6:
スマート眼鏡のスピーカーを通じて、サーバから送信された音声データをユーザに提供する。入力は音声データであり、出力はユーザが聞く音声フィードバックである。 Audio data sent from the server is provided to the user through the smart glasses' speakers. The input is audio data, and the output is audio feedback heard by the user.
ステップ7: Step 7:
ユーザが提供されたフィードバックに基づいて行動や発言を修正し、再度スマート眼鏡のカメラとマイクを通じて新しいデータをキャプチャする。これにより、ステップ1からステップ6までの処理が繰り返される。入力は修正された行動や発言の映像と音声データであり、出力は新たなフィードバックである。 The user modifies their actions or statements based on the provided feedback, and new data is captured again through the smart glasses' camera and microphone. This repeats the process from step 1 to step 6. The input is video and audio data of the modified actions or statements, and the output is new feedback.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来のシステムでは、ユーザーが自身の理想の人間像に近づくための具体的な行動や発言のカスタマイズが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、効果的なトレーニングが実現できないという課題があった。さらに、ユーザーの感情状態をリアルタイムで分析し、それに基づいてトレーニング内容を調整する機能が欠如していたため、ユーザーの心理的負担を軽減しながら理想像に近づくことが困難であった。 Previous systems had issues with being unable to provide effective training because it was difficult for users to customize the specific actions and comments that would bring them closer to their ideal image of the person they wanted, and the training content was not adjusted according to the user's emotional state. Furthermore, the lack of a function to analyze the user's emotional state in real time and adjust the training content based on that analysis made it difficult to bring users closer to their ideal image while reducing the psychological burden.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、該感情状態に応じてトレーニング内容を調整する手段と、を含む。これにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, and means for adjusting the training content in accordance with the emotional state. This allows the user to receive effective training to approach their ideal image.
「理想の人間像」とは、ユーザーが目指すべき人物像や性格特性を指す。 "Ideal person" refers to the type of person or personality traits that the user should aim to become.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置やソフトウェアを指す。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムを指す。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知するための装置やソフトウェアを指す。 "Means of presentation" refers to devices or software used to notify users of custom-changed actions or statements.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するためのプログラムやシステムを指す。 "Means for repeated training" refers to a program or system that allows users to repeatedly practice custom-changed actions and utterances.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などを解析して感情状態を推定するための装置やソフトウェアを指す。 "Means for analyzing emotional state in real time" refers to devices or software that estimate a user's emotional state by analyzing their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容や方法を変更するためのアルゴリズムやプログラムを指す。 "Means for adjusting training content" refers to algorithms or programs that change the content or method of training according to the user's emotional state.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
システムの構成 System Configuration
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを使用して、自身が目指す理想の人間像を設定する。例えば、「思いやりのある人」を選択する。この設定は、ユーザーの人間関係のトラウマや教養等を考慮して行われる。 Using an application on their device, users can set the ideal person they aspire to be. For example, they can select "a compassionate person." This setting takes into account the user's interpersonal trauma, education, etc.
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。これには、ユーザーが入力したテキストや音声データが含まれる。例えば、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。 The server collects user actions and statements in real time, including text and voice data entered by the user. For example, it collects what users say to friends in chat apps and what they say to voice assistants.
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、自然言語処理(NLP)技術を用いて、ユーザーの発言内容を理解する。ここでは、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用する。 The server analyzes the collected data. Specifically, it uses natural language processing (NLP) technology to understand what the user is saying. It uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4.
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server customizes your actions and speech based on your ideal image of a person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 Based on the analysis results, the server custom-changes the user's actions and comments to match their ideal image of a person. For example, "I'm busy today, so I can't help you" could be changed to "I'm busy today, but please let me know if there's anything I can do to help."
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。 The server presents the custom-changed actions and comments to the user, who can review them and make any necessary corrections.
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。Microsoft(登録商標) Azure(登録商標)のEmotion APIやAffectivaのSDKを使用する。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it analyzes the user's facial expressions, tone of voice, and choice of words. It uses Microsoft (registered trademark) Azure (registered trademark) Emotion API and Affectiva's SDK.
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it will provide training to promote relaxation, and if the user is feeling joy, it will provide training to encourage behavior that encourages sharing that joy.
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。 The user performs the training content presented by the server. This allows the user to undergo repeated training to get closer to their ideal self.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーがアプリケーションを開き、「理想の人間像を設定」を選択し、「思いやりのある人」を選ぶ。 The user opens the application, selects "Set your ideal person," and chooses "A compassionate person."
行動や発言の収集 Collecting actions and statements
ユーザーが友人とチャットしている内容をアプリケーションがバックグラウンドで収集する。 The application collects chat content between users and friends in the background.
データの解析 Data Analysis
サーバが収集したチャット内容をGoogle Cloud Natural Language APIで解析し、感情分析を行う。また、OpenAIのGPT-4を使用して、ユーザーの発言内容を理解し、適切な応答を生成する。 The chat content collected by the server is analyzed using the Google Cloud Natural Language API to perform sentiment analysis. It also uses OpenAI's GPT-4 to understand what the user is saying and generate appropriate responses.
カスタムチェンジの例 Custom Change Example
ユーザーが「今日は忙しいから手伝えない」と言った場合、サーバがこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 If the user says, "I'm busy today and can't help," the server changes this to "I'm busy today, but please let me know if there's anything I can do to help."
感情エンジンの分析 Emotion Engine Analysis
ユーザーがカメラに向かって話しているとき、サーバがMicrosoft AzureのEmotion APIを使用して、ユーザーの顔表情や声のトーンからストレスを感じていると判断する。 When a user speaks into the camera, the server uses Microsoft Azure's Emotion API to determine whether the user is feeling stressed based on their facial expressions and tone of voice.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じているとき、サーバが「深呼吸をしてリラックスしましょう」といったリラクゼーショントレーニングを提供する。 When a user is feeling stressed, the server provides relaxation training such as "Take a deep breath and relax."
トレーニングの実行 Running the training
ユーザーがサーバから提示されたリラクゼーショントレーニングを実行する。 The user performs relaxation training presented by the server.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのように行動や発言をカスタムチェンジするか教えてください。」 "If a user sets their ideal person as 'a considerate person,' how would they customize their behavior and speech?"
このシステムにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることができる。 This system allows users to receive effective training to bring them closer to their ideal self.
実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのメニューから「理想の人間像を設定」を選択し、「思いやりのある人」などの選択肢から理想の人間像を選ぶ。入力はユーザーの選択した理想の人間像であり、出力はその設定情報である。 The user launches the application on their device and sets their ideal person. Specifically, they select "Set ideal person" from the application menu and choose their ideal person from options such as "a considerate person." The input is the ideal person selected by the user, and the output is that setting information.
ステップ2: Step 2:
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。具体的には、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーのテキストデータや音声データであり、出力は収集された行動や発言のデータである。 The server collects user behavior and speech in real time. Specifically, it collects the content of user conversations with friends on chat apps and what users say to voice assistants. The input is the user's text data and voice data, and the output is the collected behavior and speech data.
ステップ3: Step 3:
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用して、ユーザーの発言内容を理解し、感情分析やキーフレーズ抽出を行う。入力は収集された行動や発言のデータであり、出力は解析結果である。 The server analyzes the collected data. Specifically, it uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4 to understand what users say and perform sentiment analysis and key phrase extraction. The input is the collected behavioral and utterance data, and the output is the analysis results.
ステップ4: Step 4:
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server custom-changes your behavior and speech based on your ideal person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。入力は解析結果であり、出力はカスタムチェンジされた行動や発言である。 Based on the analysis results, the server custom-changes the user's actions and comments to match the ideal person. For example, "I'm busy today, so I can't help you" is changed to "I'm busy today, but please let me know if there's anything I can do to help." The input is the analysis results, and the output is the custom-changed actions and comments.
ステップ5: Step 5:
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。入力はカスタムチェンジされた行動や発言であり、出力はユーザーに提示された内容である。 The server presents the custom-changed actions and statements to the user, who can review them and make corrections as necessary. The input is the custom-changed actions and statements, and the output is the content presented to the user.
ステップ6: Step 6:
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、Microsoft AzureのEmotion APIやAffectivaのSDKを使用して、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。入力はユーザーの顔表情や声のトーン、言葉の選び方であり、出力は感情状態の分析結果である。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it uses Microsoft Azure's Emotion API and Affectiva's SDK to analyze the user's facial expressions, tone of voice, choice of words, etc. The input is the user's facial expressions, tone of voice, and choice of words, and the output is the analysis of the user's emotional state.
ステップ7: Step 7:
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。入力は感情状態の分析結果であり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it provides training to promote relaxation, and if the user is feeling happy, it provides training to encourage behavior that shares that joy. The input is the analysis result of the emotional state, and the output is the adjusted training content.
ステップ8: Step 8:
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。入力は調整されたトレーニング内容であり、出力はユーザーの実行結果である。 The user performs the training content presented by the server. This allows the user to undergo repeated training to approach their ideal self. The input is the adjusted training content, and the output is the user's execution results.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart device 14 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を維持することは難しく、特に感情状態が不安定な場合には顧客満足度が低下する問題があった。また、スタッフが自身の理想像に近づくためのトレーニングを効果的に行う手段が不足していた。 In traditional customer service work, it was difficult for staff to maintain an ideal customer service attitude, and customer satisfaction declined, particularly when their emotional state was unstable. Furthermore, there was a lack of effective training methods to help staff approach their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンに基づいてトレーニング内容を調整する手段と、スマート眼鏡に表示する手段と、を含む。これにより、スタッフが理想の接客態度を維持しつつ、感情状態に応じた適切なトレーニングを受けることが可能となる。 In this invention, the server includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, a means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, a means for adjusting the training content based on the emotion engine, and a means for displaying on the smart glasses. This enables staff to receive appropriate training according to their emotional state while maintaining an ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示する装置やソフトウェアである。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムである。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに知らせるための表示装置や通知システムである。 "Means of presentation" refers to a display device or notification system that notifies users of custom-changed actions and statements.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジした行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice their custom-changed actions and statements in order to become closer to their ideal image of the person they want to be.
「感情エンジン」とは、ユーザーの感情状態をリアルタイムで分析するためのソフトウェアまたはハードウェアである。 An "emotion engine" is software or hardware that analyzes a user's emotional state in real time.
「トレーニング内容を調整する手段」とは、感情エンジンの分析結果に基づいて、ユーザーに提供するトレーニングの内容を変更するための機能である。 "Means for adjusting training content" is a function for changing the content of training provided to users based on the analysis results of the emotion engine.
「スマート眼鏡」とは、ユーザーが装着することで情報を視覚的に表示することができるウェアラブルデバイスである。 "Smart glasses" are wearable devices that can visually display information when worn by the user.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための一連の手段を含む。さらに、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する機能を備えている。 The system for implementing this invention includes a series of means for projecting the ideal human image set by the user, customizing the user's behavior and speech, and repeatedly training them. It also has the ability to use an emotion engine to analyze the user's emotional state in real time and adjust the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア: スマート眼鏡、カメラ Hardware: Smart glasses, camera
ソフトウェア: OpenCV(顔検出)、EmotionRecognizer(感情認識)、BehaviorSuggestion(行動提案) Software: OpenCV (face detection), EmotionRecognizer (emotion recognition), BehaviorSuggestion (behavior suggestions)
システムの構成 System Configuration
1. ユーザーが設定した理想の人間像を投影する手段: 1. A way to project the user's ideal image of a person:
ユーザーはアプリケーションを通じて理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想とする場合、システムはこの情報を基に行動や発言をカスタムチェンジする。 Users can set their ideal image of a person through the application. For example, if their ideal is "kind and polite customer service," the system will use this information to customize their behavior and speech.
2. ユーザーの行動や発言をカスタムチェンジする手段: 2. How to customise user behaviour and comments:
システムは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するためのアルゴリズムを実行する。例えば、ユーザーがストレスを感じている場合、リラクゼーションを促す提案を行う。 The system runs algorithms to change the user's current behavior and speech based on the ideal person. For example, if the user is feeling stressed, it will make suggestions to encourage relaxation.
3. カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段: 3. A method for presenting custom-changed actions and statements to users and repeatedly training them:
カスタムチェンジされた行動や発言は、スマート眼鏡のディスプレイに表示される。ユーザーはこれを見て、理想の行動や発言を繰り返し練習する。 Custom-changed actions and speech are displayed on the smart glasses' display. Users can view these and repeatedly practice their ideal actions and speech.
4. 感情エンジン: 4. Emotion Engine:
カメラを用いてユーザーの顔表情をキャプチャし、EmotionRecognizerを用いて感情状態をリアルタイムで分析する。これにより、ユーザーの感情状態に応じたトレーニング内容を提供する。 The camera captures the user's facial expressions and EmotionRecognizer analyzes their emotional state in real time. This allows the system to provide training content tailored to the user's emotional state.
5. トレーニング内容を調整する手段: 5. Ways to adjust training content:
感情エンジンの分析結果に基づいて、BehaviorSuggestionエンジンが適切な行動や発言を提案する。例えば、ユーザーが喜びを感じている場合、その喜びを共有するような行動を促すトレーニングを提供する。 Based on the analysis results of the emotion engine, the BehaviorSuggestion engine suggests appropriate actions and statements. For example, if the user is feeling happy, it provides training to encourage behavior that shares that joy.
6. スマート眼鏡に表示する手段: 6. Display method on smart glasses:
提案された行動や発言は、スマート眼鏡のディスプレイにリアルタイムで表示される。これにより、ユーザーは接客中に理想の態度を維持することができる。 Suggested actions and comments are displayed in real time on the smart glasses' display, allowing users to maintain ideal behavior while serving customers.
具体例 Specific examples
シナリオ: 実店舗のスタッフがスマート眼鏡を装着し、接客中に「親切で丁寧な接客」を維持するための支援を受ける。 Scenario: Store staff wear smart glasses to help them maintain a "friendly and courteous" attitude while serving customers.
感情状態: スタッフがストレスを感じている場合、リラクゼーションを促す提案(例:「深呼吸をしてリラックスしましょう」)。 Emotional state: If staff are feeling stressed, offer relaxation suggestions (e.g., "Take a deep breath and relax").
行動提案: 顧客に対して「お困りのことがあれば何でもおっしゃってください」といった親切な発言を提案。 Action suggestion: Suggest a kind statement to customers such as, "Please let me know if you need any help."
プロンプト文の例 Example prompt
ユーザーが設定した理想の接客態度に基づいて、リアルタイムで行動や発言をカスタムチェンジし、スマート眼鏡のディスプレイに表示するアプリケーションを開発してください。感情エンジンを用いてユーザーの感情状態を分析し、適切なトレーニングを提供する機能も含めてください。 Develop an application that custom changes actions and comments in real time based on the ideal customer service attitude set by the user, and displays them on the smart glasses display. Include a function that uses an emotion engine to analyze the user's emotional state and provide appropriate training.
応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 is explained using Figure 18.
ステップ1: Step 1:
ユーザがアプリケーションを起動し、理想の人間像を設定する。ユーザは「親切で丁寧な接客」などの理想像を入力する。この入力データはサーバに送信され、保存される。 The user launches the application and sets their ideal image of the person. The user inputs an ideal image such as "kind and polite customer service." This input data is sent to the server and saved.
ステップ2: Step 2:
サーバは、ユーザの理想の人間像に基づいて行動や発言をカスタムチェンジするアルゴリズムを実行する。入力として理想の人間像とユーザの現在の行動データを受け取り、出力としてカスタムチェンジされた行動や発言を生成する。 The server runs an algorithm that custom-changes behavior and speech based on the user's ideal image of the person. It receives the ideal image of the person and the user's current behavioral data as input, and generates custom-changed behavior and speech as output.
ステップ3: Step 3:
サーバは、カスタムチェンジされた行動や発言をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、理想の行動や発言を実践する。 The server sends the custom-changed actions and statements to the smart glasses, which receive them and display them on the screen. The user then views these and practices their ideal actions and statements.
ステップ4: Step 4:
カメラがユーザの顔表情をキャプチャし、リアルタイムでサーバに送信する。サーバはEmotionRecognizerを用いて、入力された顔表情データからユーザの感情状態を分析する。出力として感情状態データを生成する。 The camera captures the user's facial expressions and transmits them to the server in real time. The server uses EmotionRecognizer to analyze the user's emotional state from the input facial expression data, and generates emotional state data as output.
ステップ5: Step 5:
サーバは、感情状態データに基づいてトレーニング内容を調整する。BehaviorSuggestionエンジンが感情状態データと理想の人間像を入力として受け取り、適切な行動や発言を提案する。出力として調整されたトレーニング内容を生成する。 The server adjusts the training content based on the emotional state data. The BehaviorSuggestion engine receives the emotional state data and the ideal human image as input and suggests appropriate actions and statements. The adjusted training content is generated as output.
ステップ6: Step 6:
サーバは、調整されたトレーニング内容をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、感情状態に応じたトレーニングを実践する。 The server sends the adjusted training content to the smart glasses, which receive it and display it on the screen. The user then views it and practices training that suits their emotional state.
ステップ7: Step 7:
ユーザがトレーニングを実践する過程で、サーバは感情状態の変化をトラッキングし、必要に応じてトレーニング内容を再調整する。これにより、ユーザは理想の人間像に近づくための最適なトレーニングを受けることができる。 As the user practices the training, the server tracks changes in their emotional state and readjusts the training content as needed. This allows the user to receive optimal training to bring them closer to their ideal image of the person they want to be.
特定処理部290は、特定処理の結果をスマートデバイス14に送信する。スマートデバイス14では、制御部46Aが、出力装置40に対して特定処理の結果を出力させる。マイクロフォン38Bは、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン38Bによって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the smart device 14. In the smart device 14, the control unit 46A causes the output device 40 to output the results of the specific processing. The microphone 38B acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 38B to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(登録商標)(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (registered trademark) (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating voice, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
生成AIの他の例としては、Gemini(登録商標)(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (registered trademark) (Internet search <URL: https://gemini.google.com/?hl=ja>).
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマートデバイス14によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the smart device 14.
[第2実施形態] [Second embodiment]
図3には、第2実施形態に係るデータ処理システム210の構成の一例が示されている。 Figure 3 shows an example of the configuration of a data processing system 210 according to the second embodiment.
図3に示すように、データ処理システム210は、データ処理装置12及びスマート眼鏡214を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 3, the data processing system 210 includes a data processing device 12 and smart glasses 214. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
スマート眼鏡214は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、及びカメラ42も、バス52に接続されている。 The smart glasses 214 include a computer 36, a microphone 238, a speaker 240, a camera 42, and a communication I/F 44. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, speaker 240, and camera 42 are also connected to the bus 52.
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.
図4には、データ処理装置12及びスマート眼鏡214の要部機能の一例が示されている。図4に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 4 shows an example of the main functions of the data processing device 12 and smart glasses 214. As shown in Figure 4, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
スマート眼鏡214では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the smart glasses 214, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.
「形態例1」 "Example 1"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
「形態例2」 "Example 2"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがアプリケーション上で理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 Step 1: The user sets their ideal person in the application. For example, they can set "a compassionate person" as their ideal person.
ステップ2:システムがユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。具体的には、「思いやりのある人」に基づいてユーザーの行動や発言を分析し、それに適した行動や発言を生成する。 Step 2: The system custom-changes the user's behavior and comments based on the ideal image of a person. Specifically, it analyzes the user's behavior and comments based on the image of a "compassionate person" and generates appropriate behavior and comments.
ステップ3:システムがカスタムチェンジした行動や発言をユーザーに提示する。例えば、ユーザーが他人に対して思いやりのある行動をとるようにアドバイスを提供する。 Step 3: The system presents the user with the customized actions and statements. For example, it may provide advice to encourage the user to behave more considerately toward others.
ステップ4:ユーザーが提示された行動や発言を反復トレーニングする。これにより、ユーザーは自身の理想像に近づくことが可能となる。 Step 4: The user repeatedly practices the suggested actions and statements, allowing them to get closer to their ideal self.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来の自己改善システムでは、ユーザーが設定した理想の人間像に基づいて具体的な行動や発言をカスタムチェンジすることが難しく、またその反復トレーニングの進捗を効果的に記録しフィードバックを提供する手段が不足している。このため、ユーザーが自身の理想像に近づくための効果的なサポートが提供されていないという課題がある。 Existing self-improvement systems have difficulty customizing specific actions and speech based on the ideal person the user sets, and lack a means to effectively record the progress of this repetitive training and provide feedback. This poses a challenge in that they do not provide effective support to help users get closer to their ideal self.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、生成AIモデルを用いて該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、該反復トレーニングの進捗を記録し、フィードバックを提供する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための具体的な行動や発言を学び、実践し、その進捗を効果的に管理することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image using a generative AI model, means for presenting the custom-changed actions and speech to the user and repeatedly training them, and means for recording the progress of the repeated training and providing feedback. This enables the user to learn and practice specific actions and speech that will bring them closer to their ideal image, and effectively manage their progress.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「生成AIモデル」とは、人工知能を用いてデータを生成し、ユーザーの行動や発言をカスタムチェンジするためのアルゴリズムやプログラムを指す。 A "generative AI model" refers to an algorithm or program that uses artificial intelligence to generate data and custom-change user behavior and speech.
「カスタムチェンジ」とは、ユーザーの行動や発言を理想の人間像に基づいて変更することを指す。 "Custom Change" refers to changing a user's behavior and words based on an ideal image of a person.
「反復トレーニング」とは、ユーザーが提示されたカスタムチェンジされた行動や発言を繰り返し実践することを指す。 "Repeated training" refers to the user repeatedly practicing the custom-changed actions and utterances that are presented to them.
「フィードバック」とは、ユーザーの反復トレーニングの進捗に基づいて提供される評価やアドバイスを指す。 "Feedback" refers to evaluations and advice provided based on the user's progress through repeated training.
「進捗を記録する」とは、ユーザーが行った反復トレーニングの内容や成果をデータとして保存することを指す。 "Recording progress" refers to saving the content and results of the user's repeated training as data.
「提示する」とは、サーバが生成したカスタムチェンジされた行動や発言をユーザーに見せることを指す。 "Presenting" refers to showing the custom-changed actions and statements generated by the server to the user.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それを反復トレーニングすることでユーザーが自身の理想像に近づくことを促進するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes actions and speech based on the ideal person image set by the user, and encourages the user to approach their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: スマートフォン、パソコン、タブレットなどのユーザーが操作するデバイス。 Device: A device operated by the user, such as a smartphone, computer, or tablet.
サーバ: データ処理および生成AIモデルの実行を行うためのサーバ。 Server: A server for processing data and running generative AI models.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供するソフトウェア。 Application: Software that provides an interface for users to define their ideal person and review their custom-changed behavior and statements.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのアルゴリズム。具体的には、OpenAIのGPT-4などの生成AIモデルを使用する。 Generative AI model: An algorithm that custom-changes a user's behavior and speech based on an ideal human image. Specifically, it uses a generative AI model such as OpenAI's GPT-4.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 The user launches the application and sets their ideal image of a person. For example, they can set "a considerate person" as their ideal image of a person.
端末が設定データをサーバに送信する The device sends configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。このデータには、ユーザーの選択した理想の人間像に関する情報が含まれる。 The device sends data about the ideal person set by the user to the server. This data includes information about the ideal person selected by the user.
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信したデータを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データを収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received data to analyze the user's behavior and comments. Specifically, the server collects data on the user's past behavior and comments and customizes it based on the ideal image of the person.
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。このデータには、ユーザーが実践すべき具体的な行動や発言の例が含まれる。 The server then sends the generated custom-changed behavior and speech data to the device. This data includes specific examples of behaviors and speech that the user should practice.
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。 Users practice the proposed custom-changed actions and utterances, practicing repeatedly. The application records the user's progress and provides feedback as needed.
具体例 Specific examples
例えば、ユーザーが「思いやりのある人」を理想の人間像として設定した場合、以下のようなプロンプト文を生成AIモデルに入力する。 For example, if a user sets "a compassionate person" as their ideal person, the following prompt sentence would be input into the generative AI model:
プロンプト文の例 Example prompt
「ユーザーが友人と会話しているときに、思いやりのある発言をするためのアドバイスを提供してください。」 "Please provide advice to help users be more considerate when speaking with friends."
生成AIモデルは、このプロンプト文に基づいて、ユーザーが友人と会話する際に使える具体的な発言例を生成する。例えば、「友人が困っているときに『何か手伝えることがあれば教えてね』と言う」といったアドバイスを提供する。 Based on this prompt, the generative AI model generates specific example utterances that the user can use when conversing with friends. For example, it provides advice such as, "When a friend is in trouble, say, 'Let me know if there's anything I can help you with.'"
このようにして、ユーザーは理想の人間像に基づいた行動や発言を学び、実践することができる。 In this way, users can learn and practice behaviors and speech based on their ideal image of a person.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのインターフェース上で「理想の人間像を設定する」ボタンをクリックし、ドロップダウンメニューから「思いやりのある人」を選択し、「設定」ボタンを押す。 The user launches the application and sets their ideal person. Specifically, they click the "Set Ideal Person" button on the application interface, select "Compassionate Person" from the drop-down menu, and press the "Set" button.
入力: ユーザーの選択した理想の人間像(例:「思いやりのある人」) Input: User's chosen ideal person (e.g., "a caring person")
出力: 理想の人間像の設定データ Output: Ideal human image configuration data
ステップ2: Step 2:
端末が設定データをサーバに送信する The device sends the configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。この送信は、HTTPSプロトコルを使用して安全に行われる。 The device sends data about the user's ideal person profile to a server. This transmission is secure using the HTTPS protocol.
入力: 理想の人間像の設定データ Input: Ideal human image data
出力: サーバに送信された設定データ Output: Configuration data sent to the server
ステップ3: Step 3:
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信した設定データを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データ(例:チャットログやSNSの投稿)を収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received configuration data to analyze the user's behavior and comments. Specifically, the server collects the user's past behavior and comment data (e.g., chat logs and social media posts) and customizes it based on the ideal image of the person.
入力: 設定データ、ユーザーの過去の行動や発言データ Input: Configuration data, user past behavior and comment data
出力: カスタムチェンジされた行動や発言データ Output: Custom-changed behavior and speech data
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
入力: カスタムチェンジされた行動や発言データ Input: Custom-changed behavior and speech data
出力: 生成された具体的な行動や発言の例 Output: Examples of specific actions and statements generated
ステップ5: Step 5:
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。この送信も、HTTPSプロトコルを使用して行われる。 The server then sends the generated custom-changed behavior and speech data to the device. This transmission is also done using the HTTPS protocol.
入力: 生成された具体的な行動や発言の例 Input: Examples of specific actions or statements to be generated
出力: 端末に送信されたデータ Output: Data sent to the device
ステップ6: Step 6:
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
入力: 端末に送信されたデータ Input: Data sent to the device
出力: ユーザーに提示された具体的な行動や発言の例 Output: Examples of specific actions and statements presented to the user
ステップ7: Step 7:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。例えば、ユーザーが「今日、友人に思いやりのある発言をした」とアプリケーションに入力する。 The user then practices the custom-changed actions and statements presented to them, repeatedly practicing. The application records the user's progress and provides feedback as needed. For example, a user might enter into the application, "Today, I made a kind statement to a friend."
入力: ユーザーの実践結果 Input: User practice results
出力: 記録された進捗データおよび提供されたフィードバック Output: Recorded progress data and provided feedback
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的な行動や発言のカスタムチェンジが難しく、効果的なトレーニングが行えないという問題があった。また、スタッフが理想の接客態度に近づくための反復トレーニングが不足しており、実際の接客において理想の態度を維持することが困難であった。 Traditional customer service training systems had the problem of being unable to provide effective training because it was difficult to customize specific actions and comments to help staff develop the ideal customer service attitude. Furthermore, there was a lack of repetitive training to help staff approach the ideal customer service attitude, making it difficult for them to maintain the ideal attitude when actually serving customers.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する手段と、該生成された行動や発言をプロンプト文としてユーザーに提示する手段と、を含む。これにより、スタッフが理想の接客態度を具体的に理解し、反復トレーニングを通じて実際の接客において理想の態度を維持することが可能となる。 The identification processing by the identification processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means. In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for generating actions and utterances based on the ideal human image using a generative AI model, and means for presenting the generated actions and utterances to the user as prompt sentences. This enables staff to concretely understand the ideal customer service attitude and maintain the ideal attitude in actual customer service through repeated training.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言を学習しようとする個人である。 A "user" is an individual who uses the system to learn to behave and speak in a way that is consistent with the ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や態度のことであり、システムがそれに基づいて行動や発言をカスタムチェンジする基準となるものである。 The "ideal person" is the specific character and attitude that the user should strive for, and serves as the standard by which the system will custom-change their behavior and speech.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキストとして表示する機能である。 "Projection means" is a function that displays the user's ideal image of a person visually or as text on the system.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能である。 "Means for custom change" is a function that allows users to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための機能である。 "Means of presentation" is a function for displaying custom-changed actions and comments to users.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice custom-changed actions and statements.
「生成AIモデル」とは、ユーザーが設定した理想の人間像に基づいて行動や発言を生成するための人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates actions and statements based on the ideal human image set by the user.
「プロンプト文」とは、生成AIモデルが理想の人間像に基づいて生成した行動や発言をユーザーに提示するためのテキスト形式の指示文である。 A "prompt" is a text-based instruction that presents the user with actions and statements generated by the generative AI model based on an ideal human image.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うものである。以下に、このシステムの具体的な実施形態について説明する。 The system for implementing this invention custom-changes behavior and speech based on the ideal person image set by the user, and presents this to the user for repetitive training. Specific embodiments of this system are described below.
システムの構成 System Configuration
システムは、以下の主要なコンポーネントから構成される。 The system consists of the following main components:
1. ユーザー端末: スマートフォンやタブレットなどのデバイスで、ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するために使用する。 1. User device: A device such as a smartphone or tablet that allows the user to define their ideal person and check their custom-changed behavior and statements.
2. サーバ: ユーザーの入力データを処理し、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する。 2. Server: Processes user input data and uses a generative AI model to generate behaviors and statements based on the ideal human image.
3. 生成AIモデル: OpenAIのGPT-3などの生成AIモデルを使用し、ユーザーが設定した理想の人間像に基づいて行動や発言を生成する。 3. Generative AI models: Using generative AI models such as OpenAI's GPT-3, actions and statements are generated based on the ideal human image set by the user.
プログラムの処理 Program processing
サーバは、ユーザー端末から送信された理想の人間像と現在の行動や発言のデータを受け取り、生成AIモデルにプロンプト文として入力する。生成AIモデルは、理想の人間像に基づいた行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server receives the ideal human image and current behavior and speech data sent from the user's device and inputs this as prompt text into the generative AI model. The generative AI model generates behavior and speech based on the ideal human image and returns the results to the server. The server then sends the generated behavior and speech to the user's device and presents them to the user.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア: スマートフォン、タブレット、サーバ Hardware: Smartphones, tablets, servers
ソフトウェア: Python、OpenAI API、ユーザーインターフェースアプリケーション Software: Python, OpenAI API, user interface application
データ加工およびデータ演算 Data processing and calculation
サーバは、ユーザーが設定した理想の人間像と現在の行動や発言をプロンプト文として生成AIモデルに送信する。生成AIモデルは、プロンプト文に基づいて理想の行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server sends the user's ideal image of a person and their current actions and statements as prompts to the generative AI model. The generative AI model generates the ideal actions and statements based on the prompts and returns the results to the server. The server then sends the generated actions and statements to the user's device and presents them to the user.
具体例 Specific examples
例えば、ユーザーが「思いやりのある接客」を理想の人間像として設定し、現在の行動が「お客様に対して無愛想な対応をする」である場合、プロンプト文は以下のようになる。 For example, if the user defines their ideal person as "attentive customer service" and their current behavior is "treating customers in an unfriendly manner," the prompt would be as follows:
プロンプト文の例: Example prompt:
理想の人間像: 思いやりのある接客 Ideal person: Attentive customer service
ユーザーの行動: お客様に対して無愛想な対応をする User behavior: Treating customers rudely
理想の人間像に基づいた行動: Acting based on the ideal human image:
生成AIモデルは、このプロンプト文に基づいて「思いやりのある接客」に適した行動や発言を生成し、その結果をユーザーに提示する。ユーザーは提示された行動や発言を反復トレーニングすることで、理想の接客態度に近づくことができる。 Based on this prompt, the generative AI model generates actions and statements appropriate for "considerate customer service" and presents the results to the user. By repeatedly practicing the actions and statements presented, users can get closer to their ideal customer service attitude.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
ユーザーが端末を使用して理想の人間像を設定する。ユーザーはアプリケーションを起動し、理想の人間像(例:「思いやりのある接客」)を入力する。入力データは端末からサーバに送信される。 The user sets their ideal person image using their device. The user launches the application and inputs their ideal person image (e.g., "thorough customer service"). The input data is sent from the device to the server.
入力:理想の人間像 Input: Ideal human image
出力:サーバに送信された理想の人間像データ Output: Ideal human image data sent to the server
ステップ2: Step 2:
サーバは、ユーザーから送信された理想の人間像データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the ideal human image data sent by the user. The server stores this data and uses it for subsequent processing.
入力:理想の人間像データ Input: Ideal human image data
出力:保存された理想の人間像データ Output: Saved ideal human image data
ステップ3: Step 3:
ユーザーが端末を使用して現在の行動や発言を入力する。ユーザーは現在の行動(例:「お客様に対して無愛想な対応をする」)を入力し、端末からサーバに送信する。 The user uses the device to input their current actions and statements. The user inputs their current actions (e.g., "being rude to customers") and sends it from the device to the server.
入力:現在の行動や発言 Input: Current action or statement
出力:サーバに送信された現在の行動や発言データ Output: Current behavior and speech data sent to the server
ステップ4: Step 4:
サーバは、ユーザーから送信された現在の行動や発言データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the current activity and comment data sent by the user. The server stores this data and uses it for further processing.
入力:現在の行動や発言データ Input: Current activity and speech data
出力:保存された現在の行動や発言データ Output: Saved current behavior and speech data
ステップ5: Step 5:
サーバは、保存された理想の人間像データと現在の行動や発言データを組み合わせてプロンプト文を生成する。生成されたプロンプト文は、生成AIモデルに入力される。 The server generates prompts by combining the stored ideal human image data with current behavior and speech data. The generated prompts are then input into the generative AI model.
入力:理想の人間像データ、現在の行動や発言データ Input: Ideal person data, current behavior and speech data
出力:生成されたプロンプト文 Output: Generated prompt text
ステップ6: Step 6:
サーバは、生成されたプロンプト文を生成AIモデルに送信する。生成AIモデルはプロンプト文に基づいて理想の行動や発言を生成する。 The server sends the generated prompt text to the generative AI model, which then generates the ideal behavior or speech based on the prompt text.
入力:生成されたプロンプト文 Input: Generated prompt text
出力:生成AIモデルによって生成された理想の行動や発言 Output: Ideal actions and statements generated by the generative AI model
ステップ7: Step 7:
サーバは、生成AIモデルから返された理想の行動や発言を受信する。サーバはこのデータをユーザー端末に送信する。 The server receives the ideal actions and statements returned by the generative AI model. The server then sends this data to the user's device.
入力:生成AIモデルによって生成された理想の行動や発言 Input: Ideal actions and statements generated by a generative AI model
出力:ユーザー端末に送信された理想の行動や発言データ Output: Ideal behavior and speech data sent to the user's device
ステップ8: Step 8:
ユーザー端末は、サーバから送信された理想の行動や発言データを受信し、ユーザーに提示する。ユーザーは提示された行動や発言を確認し、反復トレーニングを行う。 The user's device receives the ideal behavior and speech data sent from the server and presents it to the user. The user confirms the presented behavior and speech and performs repeated training.
入力:理想の行動や発言データ Input: Ideal behavior and speech data
出力:ユーザーに提示された理想の行動や発言 Output: Ideal actions and statements presented to the user
以上の処理ステップにより、ユーザーは理想の人間像に基づいた行動や発言を学習し、反復トレーニングを通じて理想の態度に近づくことができる。 Through these processing steps, users learn how to behave and speak in a way that is based on the ideal image of a person, and through repeated training, they can move closer to their ideal attitude.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
現代社会において、多くの人々が自己改善や理想の人間像に近づくことを目指しているが、その過程は困難であり、持続的な努力が必要である。また、自己改善のための具体的な行動や発言の指針が不足しているため、効果的なトレーニングが難しいという問題がある。さらに、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするための適切な手段が存在しないため、ユーザーが自身の理想像に近づくことが困難である。 In modern society, many people aim to improve themselves and become closer to their ideal image, but the process is difficult and requires sustained effort. Furthermore, there is a lack of specific guidelines for actions and statements for self-improvement, making effective training difficult. Furthermore, there are no appropriate means for users to customize their actions and statements based on their ideal image, making it difficult for users to become closer to their ideal image.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示する手段と、該提示された行動や発言をユーザーが反復トレーニングする手段と、ユーザーの行動や発言を収集する手段と、収集した行動や発言を解析し、生成AIモデルを使用してカスタムチェンジする手段と、を含む。これにより、ユーザーは具体的な行動や発言の指針を得ることができ、持続的なトレーニングを通じて自身の理想像に近づくことが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and comments based on the ideal human image, means for presenting the custom-changed actions and comments to the user, means for the user to repeatedly train on the presented actions and comments, means for collecting the user's actions and comments, and means for analyzing the collected actions and comments and customizing them using a generative AI model. This allows the user to obtain specific guidelines for actions and comments, and enables them to get closer to their ideal image through continuous training.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的またはテキスト形式で表示するための機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person in visual or text form.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能を指す。 "Means for custom change" refers to the function that allows a user to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに通知または表示するための機能を指す。 "Means of presentation" refers to the function for notifying or displaying custom-changed actions or statements to the user.
「反復トレーニングする手段」とは、ユーザーが提示された行動や発言を繰り返し実行することで、理想の人間像に近づくためのトレーニングを行う機能を指す。 "Means for repeated training" refers to a function that allows users to train themselves to become closer to their ideal image of a person by repeatedly performing suggested actions and statements.
「収集する手段」とは、ユーザーの行動や発言を記録し、データとして保存するための機能を指す。 "Means of collection" refers to the function for recording user actions and comments and saving them as data.
「解析する手段」とは、収集されたユーザーの行動や発言データを分析し、理想の人間像に基づいてカスタムチェンジするための情報を抽出する機能を指す。 "Means of analysis" refers to the function of analyzing collected user behavior and comment data and extracting information for custom changes based on the ideal image of a person.
「生成AIモデル」とは、ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデルを指す。 A "generative AI model" refers to an artificial intelligence model that converts a user's actions and statements based on an ideal image of a human being.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, presenting this to the user for repetitive training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末:ユーザーが使用するスマートフォン、タブレット、またはパソコンなどのデバイス。 Device: The device used by the user, such as a smartphone, tablet, or computer.
サーバ:データの処理と保存を行うためのリモートサーバ。 Server: A remote server for processing and storing data.
ソフトウェア Software
アプリケーション:ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのソフトウェア。 Application: Software that allows users to define their ideal person and check their custom-changed behavior and statements.
生成AIモデル:ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデル(例:GPT-4)。 Generative AI model: An artificial intelligence model (e.g., GPT-4) that transforms user behavior and speech based on an ideal human image.
システムの動作 System Operation
理想の人間像の設定 Establishing the ideal human image
ユーザーは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーの日常的な行動や発言を記録する。例えば、ユーザーが友人と会話している内容や、SNSに投稿した内容を収集する。収集したデータは、リアルタイムでサーバに送信される。 The device records the user's everyday actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media. The collected data is sent to a server in real time.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、受信したユーザーの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。例えば、ユーザーが「今日は忙しいから手伝えない」と言った場合、生成AIモデルはこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変換する。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), it custom-changes the user's behavior and speech based on the ideal person. For example, if a user says, "I'm busy today, so I can't help you," the generative AI model converts this to, "I'm busy today, but please let me know if there's anything I can do to help."
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザーに通知する。ユーザーは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
反復トレーニング Repetitive training
ユーザーは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。これにより、ユーザーは理想の人間像に近づくためのトレーニングを行う。 Users repeatedly execute the custom-changed actions and statements that are presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts. In this way, users train to become closer to their ideal image of the person they want to be.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーはアプリケーションの設定画面で「思いやりのある人」と入力し、保存ボタンをクリックする。 The user enters "compassionate person" in the application's settings screen and clicks the save button.
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーが友人と会話している音声を録音し、テキストに変換する。また、ユーザーがSNSに投稿したテキストデータも収集する。 The device records the user's voice when they are talking to friends and converts it into text. It also collects text data that the user posts on social media.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、収集したテキストデータを生成AIモデルに入力する。生成AIモデルは、プロンプト文を使用して、ユーザーの発言を理想の人間像に基づいて変換する。 The server inputs the collected text data into a generative AI model, which uses prompts to convert the user's speech based on an ideal human image.
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、生成AIモデルが出力したカスタムチェンジされた発言を端末に送信する。端末は、ユーザーに通知を表示し、「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」といった提案を行う。 The server sends the custom-modified utterances output by the generative AI model to the device. The device then displays a notification to the user, suggesting something like, "I'm busy today, but please let me know if there's anything I can do to help you."
反復トレーニング Repetitive training
ユーザーは、毎日の会話やSNS投稿で、サーバから提案された発言を使用する。例えば、友人との会話で「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」と言う。これを繰り返すことで、ユーザーは「思いやりのある人」としての行動や発言が自然にできるようになる。 Users use the suggestions from the server in their everyday conversations and social media posts. For example, in a conversation with a friend, they might say, "I'm busy today, but please let me know if there's anything I can do to help." By repeating this, users will naturally begin to act and speak in a way that befits a "considerate person."
プロンプト文の例 Example prompt
生成AIモデルに入力するプロンプト文の例は以下の通りである: An example of a prompt to input to the generative AI model is as follows:
ユーザーの現在の発言:「今日は忙しいから手伝えない」 Current user statement: "I'm busy today, so I can't help."
理想の人間像:「思いやりのある人」 Ideal person: "A compassionate person"
生成AIモデルに対するプロンプト文:「ユーザーの発言を、思いやりのある人の発言に変換してください」 Prompt for generative AI model: "Transform the user's utterances into those of a considerate person."
このプロンプト文を生成AIモデルに入力することで、ユーザーの発言が理想の人間像に基づいてカスタムチェンジされる。 By inputting this prompt into a generative AI model, the user's speech is custom-changed based on the ideal human image.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
ユーザは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
入力:ユーザが設定画面で入力した理想の人間像。 Input: The ideal person image entered by the user on the settings screen.
出力:理想の人間像がアプリケーションに保存される。 Output: The ideal image of a person is saved in the application.
ステップ2: Step 2:
端末は、ユーザの日常的な行動や発言を記録する。例えば、ユーザが友人と会話している内容や、SNSに投稿した内容を収集する。 The device records the user's daily actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media.
入力:ユーザの行動や発言。 Input: User actions and statements.
出力:収集された行動や発言データが端末に保存され、リアルタイムでサーバに送信される。 Output: Collected behavioral and speech data is stored on the device and sent to the server in real time.
ステップ3: Step 3:
サーバは、受信したユーザの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザの行動や発言を理想の人間像に基づいてカスタムチェンジする。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), the user's behavior and speech are custom-changed based on the ideal image of a person.
入力:収集された行動や発言データ、理想の人間像。 Input: Collected behavioral and speech data, ideal human image.
出力:カスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements.
具体的な動作:サーバは、収集されたテキストデータを生成AIモデルに入力し、プロンプト文を使用してユーザの発言を変換する。 Specific operation: The server inputs the collected text data into the generative AI model and converts the user's utterances using prompts.
ステップ4: Step 4:
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザに通知する。ユーザは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
入力:カスタムチェンジされた行動や発言。 Input: Custom-changed actions and statements.
出力:ユーザに提示されたカスタムチェンジされた行動や発言。 Output: The custom-changed actions and statements presented to the user.
具体的な動作:端末は、サーバから受信したカスタムチェンジされた発言を通知として表示する。 Specific operation: The device displays the custom-changed message received from the server as a notification.
ステップ5: Step 5:
ユーザは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。 The user repeatedly executes the custom-changed actions and statements presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts.
入力:提示されたカスタムチェンジされた行動や発言。 Input: The proposed custom-changed actions and statements.
出力:ユーザが実行したカスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements performed by the user.
具体的な動作:ユーザは、友人との会話やSNS投稿で、サーバから提案された発言を使用する。これを繰り返すことで、ユーザは理想の人間像に近づくためのトレーニングを行う。 Specific operation: The user uses statements suggested by the server in conversations with friends and in social media posts. By repeating this process, the user trains to become closer to their ideal image of the person they want to be.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を身につけるためのトレーニング方法は限られており、効果的なトレーニングが難しいという課題があった。また、スタッフが理想の接客態度を実践するための具体的なガイドラインやフィードバックが不足しているため、接客品質の向上が困難であった。さらに、スタッフが自身の理想像に近づくための反復トレーニングを効率的に行う手段が求められていた。 In traditional customer service work, there were limited training methods for staff to acquire ideal customer service attitudes, making effective training difficult. Furthermore, there was a lack of specific guidelines or feedback for staff to put ideal customer service attitudes into practice, making it difficult to improve customer service quality. Furthermore, there was a need for an efficient way to provide repeated training to help staff become closer to their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングする手段と、生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する手段と、を含む。これにより、スタッフが理想の接客態度を効率的にトレーニングし、実践することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for training the ideal customer service attitude using smart glasses worn by staff performing customer service duties, and means for generating custom-changed utterances based on the ideal human image using a generative AI model. This enables staff to efficiently train in and practice the ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置またはソフトウェアである。 "Projection means" refers to a device or software that visually or audibly displays the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための装置またはソフトウェアである。 "Means for custom change" refers to a device or software that changes a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための装置またはソフトウェアである。 "Presentation means" refers to a device or software that displays custom-changed actions and statements to the user.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための装置またはソフトウェアである。 "Means for repeated training" refers to a device or software that allows the user to repeatedly practice custom-changed actions or utterances.
「接客業務」とは、顧客に対して商品やサービスを提供する業務である。 "Customer service" refers to the work of providing products and services to customers.
「スマート眼鏡」とは、情報を表示する機能を持つ眼鏡型のデバイスである。 "Smart glasses" are glasses-type devices that have the function of displaying information.
「生成AIモデル」とは、人工知能を用いてテキストや行動を生成するためのアルゴリズムである。 A "generative AI model" is an algorithm that uses artificial intelligence to generate text and behavior.
「カスタムチェンジされた発言」とは、理想の人間像に基づいて変更されたユーザーの発言である。 "Custom-changed statements" are statements made by users that have been altered based on their ideal image of a person.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするためのものである。具体的には、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングすることができる。 The system for implementing this invention projects the ideal image of a person set by the user, custom-changes the user's actions and speech, and repeatedly trains them. Specifically, it can train ideal customer service attitudes using smart glasses worn by staff performing customer service duties.
システムの構成 System Configuration
システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:
1. ユーザー端末:ユーザーが理想の人間像を設定するためのデバイス。スマートフォンやタブレットが該当する。 1. User device: The device on which the user sets their ideal image of the person. This includes smartphones and tablets.
2. スマート眼鏡:接客業務を行うスタッフが装着するデバイス。情報を視覚的に表示する機能を持つ。 2. Smart glasses: A device worn by staff performing customer service duties. It has the function of visually displaying information.
3. サーバ:生成AIモデルを実行し、ユーザーの行動や発言をカスタムチェンジするためのデータ処理を行う。 3. Server: Runs the generative AI model and processes data to custom change user behavior and speech.
4. 生成AIモデル:ユーザーの理想の人間像に基づいてカスタムチェンジされた発言を生成するアルゴリズム。 4. Generative AI model: An algorithm that generates custom-modified statements based on the user's ideal image of the person.
プログラムの処理 Program processing
サーバは、ユーザーが設定した理想の人間像を受け取り、それに基づいてユーザーの行動や発言をカスタムチェンジする。具体的には、以下の手順で処理が行われる: The server receives the user's ideal image of the person and custom-changes the user's behavior and speech based on that image. Specifically, the process is carried out as follows:
1. 理想の人間像の設定:ユーザー端末を用いて、ユーザーが理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想像として設定する。 1. Setting the ideal person: Using the user device, the user sets the ideal person. For example, they can set "kind and polite customer service" as their ideal image.
2. ユーザーの発言の入力:ユーザーが実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」という発言。 2. Enter user utterances: Enter actual utterances made by the user. For example, "Welcome, are you looking for something?"
3. 生成AIモデルの実行:サーバは生成AIモデルを用いて、理想の人間像に基づいたカスタムチェンジされた発言を生成する。 3. Execution of the generative AI model: The server uses the generative AI model to generate custom-modified utterances based on the ideal human image.
4. カスタムチェンジされた発言の提示:スマート眼鏡を通じて、カスタムチェンジされた発言をユーザーに提示する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言。 4. Present customized utterances: Present customized utterances to the user through the smart glasses. For example, "Welcome, we'll help you find the product you're looking for."
5. 反復トレーニング:ユーザーは提示されたカスタムチェンジされた発言を反復して練習する。 5. Repetitive training: Users repeatedly practice the custom-modified utterances presented to them.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア:スマート眼鏡(例:Google Glass)、ユーザー端末(スマートフォン、タブレット) Hardware: Smart glasses (e.g., Google Glass), user devices (smartphones, tablets)
ソフトウェア:生成AIモデル(例:OpenAI API)、データ処理サーバ Software: Generative AI models (e.g., OpenAI API), data processing servers
具体例 Specific examples
例えば、接客スタッフが「親切で丁寧な接客」を理想像として設定し、以下のようなプロンプト文を使用する: For example, let's say the ideal customer service staff member is "friendly and courteous service," and use the following prompt:
プロンプト文の例: Example prompt:
理想の人間像: 親切で丁寧な接客 Ideal personality: Kind and courteous customer service
ユーザーの発言: いらっしゃいませ、何かお探しですか? User says: Welcome, are you looking for something?
理想の人間像に基づいたカスタムチェンジされた発言: Custom-changed statements based on the ideal person:
このプロンプト文を生成AIモデルに入力することで、理想の接客態度に基づいたカスタムチェンジされた発言を生成する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」のような発言が生成される。 By inputting this prompt into the generative AI model, a custom-modified utterance based on the ideal customer service attitude is generated. For example, a utterance such as, "Welcome, we'll help you find the product you're looking for" is generated.
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する。 The user sets their ideal image of the person.
入力:ユーザーが端末(スマートフォンやタブレット)を使用して、理想の人間像を入力する。例えば、「親切で丁寧な接客」。 Input: The user uses a device (smartphone or tablet) to input their ideal image of a person. For example, "kind and polite customer service."
データ加工:端末は入力された理想の人間像をサーバに送信する。 Data processing: The device sends the input image of the ideal person to the server.
出力:サーバに理想の人間像が保存される。 Output: The ideal image of a person is saved on the server.
ステップ2: Step 2:
ユーザーが実際の発言を入力する。 The user enters the actual statement.
入力:ユーザーが端末を使用して、実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」。 Input: The user uses the device to type what they actually say. For example, "Welcome, is there anything I can help you with?"
データ加工:端末は入力された発言をサーバに送信する。 Data processing: The device sends the entered comments to the server.
出力:サーバにユーザーの発言が保存される。 Output: User comments are saved on the server.
ステップ3: Step 3:
サーバが生成AIモデルを実行する。 The server runs the generative AI model.
入力:サーバは保存された理想の人間像とユーザーの発言を取得する。 Input: The server retrieves the stored ideal person image and user statements.
データ演算:サーバは生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する。プロンプト文を生成AIモデルに入力し、カスタムチェンジされた発言を得る。 Data calculation: The server uses the generative AI model to generate custom-changed utterances based on the ideal human image. The prompt text is input into the generative AI model to obtain the custom-changed utterances.
出力:生成されたカスタムチェンジされた発言がサーバに保存される。 Output: The generated custom-changed comments are saved on the server.
ステップ4: Step 4:
カスタムチェンジされた発言をユーザーに提示する。 Present the custom-changed statement to the user.
入力:サーバは生成されたカスタムチェンジされた発言を取得する。 Input: The server receives the generated custom-changed statement.
データ加工:サーバはカスタムチェンジされた発言をスマート眼鏡に送信する。 Data processing: The server sends the custom-modified speech to the smart glasses.
出力:スマート眼鏡にカスタムチェンジされた発言が表示される。 Output: The custom-changed speech is displayed on the smart glasses.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う。 Users perform repetitive training.
入力:ユーザーはスマート眼鏡に表示されたカスタムチェンジされた発言を確認する。 Input: The user sees the custom-changed speech displayed on the smart glasses.
具体的な動作:ユーザーは表示された発言を繰り返し練習する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言を練習する。 Specific behavior: The user repeatedly practices the displayed utterance. For example, they practice saying, "Welcome, we'd love to help you find the product you're looking for."
出力:ユーザーの接客態度が理想の人間像に近づく。 Output: The user's customer service attitude becomes closer to the ideal person.
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
「形態例1」 "Example 1"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
「形態例2」 "Example 2"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがシステムを起動し、自身の理想像を設定する。この理想像は、ユーザーがどのような行動を取り、どのような発言をするかを具体的に示すものである。 Step 1: The user starts the system and sets their ideal self. This ideal self specifically describes how the user will behave and what they will say.
ステップ2:感情エンジンがユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。 Step 2: The emotion engine analyzes the user's emotional state in real time. Specifically, it infers the user's emotional state from their facial expressions, tone of voice, choice of words, etc.
ステップ3:感情エンジンがユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。 Step 3: The emotion engine tracks changes in the user's emotional state. This allows the content of the repetitive training to help the user approach their ideal self to be tailored to the user's emotional state.
ステップ4:ユーザーが自身の理想像に近づくための反復トレーニングを行う。このトレーニングは、ユーザーの感情状態に応じて調整される。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。 Step 4: The user undergoes repeated training to move closer to their ideal self. This training is adjusted according to the user's emotional state. For example, when the user is feeling stressed, training is provided to promote relaxation. On the other hand, when the user is feeling joy, training is provided to encourage behavior that shares that joy.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来のシステムでは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジすることが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、ユーザーが自身の理想像に近づくための効果的なサポートが不足しているという課題があった。 Previous systems had the problem that it was difficult to customise behaviour and speech based on the ideal image of the person set by the user, and the training content was not adjusted according to the user's emotional state, resulting in a lack of effective support to help users get closer to their ideal image.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンから得られたデータを基にトレーニング内容を調整する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための効果的なサポートが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, and means for adjusting the training content based on data obtained from the emotion engine. This enables effective support for the user to get closer to their ideal image.
「ユーザー」とは、システムを利用して自身の理想の人間像に近づくことを目指す個人を指す。 "User" refers to an individual who uses the system to aim to become closer to their ideal image of a person.
「理想の人間像」とは、ユーザーが目標とする人格や行動特性を具体的に設定したものである。 An "ideal person" is a specific set of personality and behavioral characteristics that a user aspires to.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキスト形式で表示する機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person on the system in visual or text format.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更・調整する機能を指す。 "Means for customizing" refers to the ability to change and adjust a user's behavior and comments based on their ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知または表示する機能を指す。 "Means of presentation" refers to the function of notifying or displaying custom-changed actions or comments to the user.
「反復トレーニングする手段」とは、ユーザーが提示されたカスタムチェンジを基に繰り返し練習する機能を指す。 "Means for repeated training" refers to a function that allows users to repeatedly practice based on the custom changes presented to them.
「感情エンジン」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態をリアルタイムで分析する機能を指す。 The "emotion engine" refers to a function that analyzes a user's emotional state in real time based on their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を変更・調整する機能を指す。 "Means for adjusting training content" refers to the function that changes and adjusts training content according to the user's emotional state based on data obtained from the emotion engine.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: ユーザーが使用するスマートフォン、タブレット、またはPC。 Device: The smartphone, tablet, or PC used by the user.
サーバ: データ処理およびストレージを行うためのクラウドサーバ。 Server: Cloud server for data processing and storage.
カメラおよびマイク: ユーザーの顔表情や声のトーンをリアルタイムでキャプチャするためのデバイス。 Camera and microphone: Devices that capture your facial expressions and tone of voice in real time.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供する。 Application: Provides an interface that allows users to define their ideal person and review their custom-changed behavior and statements.
感情エンジン: ユーザーの感情状態をリアルタイムで分析するためのソフトウェアモジュール。 Emotion engine: A software module for analyzing a user's emotional state in real time.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのAIモデル。 Generative AI model: An AI model that custom-changes a user's behavior and speech based on an ideal human image.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を選択する。 The user launches the application and sets their ideal image of the person. For example, they can select "a compassionate person."
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。これには、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容が含まれる。 The server collects input data, voice data, and text messages from users' smartphones and PCs in real time, including what users chat with friends and what they say to their voice assistants.
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。 The server analyzes the collected data using natural language processing (NLP) technology. For example, if a user says "thank you" infrequently, the server will suggest that they say "thank you" more frequently.
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。例えば、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。 The server then uses the application's notification function to present the custom-changed actions and comments to the user. For example, it could send a notification such as, "Try saying 'Thank you' the next time you talk to a friend."
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。これを繰り返すことで、ユーザーは「思いやりのある人」に近づく。 Based on suggestions from the server, users are made conscious of saying "thank you" more often in their daily lives. By repeating this, users become closer to becoming "considerate people."
感情エンジンがユーザーの感情状態を分析する The emotion engine analyzes the user's emotional state.
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。例えば、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。 The emotion engine uses the user's smartphone camera and microphone to analyze facial expressions and tone of voice in real time. For example, if a user is smiling while speaking, the emotion engine will determine that the user is feeling happy.
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。 The server uses data obtained from the emotion engine to adjust the training content according to the user's emotional state. For example, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax."
具体例 Specific examples
理想の人間像設定 Defining the ideal person
ユーザーがアプリケーションを開き、「思いやりのある人」を理想の人間像として設定する。 The user opens the application and sets "a compassionate person" as their ideal person.
カスタムチェンジの例 Custom Change Example
サーバは、ユーザーが友人と会話する際に「ありがとう」と言う頻度を増やすように提案する。 The server suggests that users say "thank you" more frequently when conversing with friends.
感情エンジンの分析 Emotion Engine Analysis
ユーザーが会話中に笑顔を見せている場合、感情エンジンはユーザーが喜びを感じていると判断する。 If a user smiles during a conversation, the emotion engine will determine that the user is feeling happy.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じている場合、サーバは深呼吸や瞑想を促すトレーニングを提供する。 If the user is feeling stressed, the server will provide deep breathing and meditation training.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのような行動や発言をカスタムチェンジするか提案してください。」 "If the user sets their ideal person as 'a considerate person,' please suggest what actions and statements they would like to customize."
このシステムは、ユーザーが自身の理想像に近づくための具体的な行動や発言を提供し、感情状態に応じたトレーニングを行うことで、ユーザーの成長をサポートする。 The system supports users' growth by providing them with specific actions and statements to help them become closer to their ideal self, and by providing training tailored to their emotional state.
実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションの設定画面で「思いやりのある人」などの選択肢から理想の人間像を選び、設定を保存する。入力はユーザーの選択した理想の人間像であり、出力は設定された理想の人間像のデータである。 The user launches the application and sets their ideal person. Specifically, they select their ideal person from options such as "a considerate person" on the application's settings screen and save the settings. The input is the ideal person selected by the user, and the output is data for the set ideal person.
ステップ2: Step 2:
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。具体的には、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーの行動データであり、出力は収集された行動データのデータベースである。 The server collects input data, voice data, and text messages from the user's smartphone or PC in real time. Specifically, it collects what the user chats with friends and what they say to their voice assistant. The input is user behavioral data, and the output is a database of the collected behavioral data.
ステップ3: Step 3:
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。具体的には、生成AIモデルを使用して、ユーザーの行動や発言を理想の人間像に基づいて変更する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。入力は収集された行動データであり、出力はカスタムチェンジされた行動や発言の提案である。 The server analyzes the collected data using natural language processing (NLP) technology. Specifically, it uses a generative AI model to change the user's behavior and speech based on the ideal person. For example, if the user says "thank you" infrequently, the server will suggest that they say "thank you" more often. The input is the collected behavioral data, and the output is suggested custom-changed behaviors and speech.
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。具体的には、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。入力はカスタムチェンジされた行動や発言の提案であり、出力はユーザーへの通知である。 The server presents the custom-changed actions and utterances to the user using the application's notification function. Specifically, it sends a notification such as, "Try saying 'thank you' the next time you talk to a friend." The input is a suggestion for a custom-changed action or utterance, and the output is a notification to the user.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。具体的には、友人や家族との会話で「ありがとう」と言う機会を増やす。入力はサーバからの提案であり、出力はユーザーの実際の行動である。 Based on suggestions from the server, users are made conscious to say "thank you" more frequently in their daily lives. Specifically, they increase the number of opportunities to say "thank you" in conversations with friends and family. The input is the suggestions from the server, and the output is the user's actual behavior.
ステップ6: Step 6:
感情エンジンがユーザーの感情状態を分析する Emotion engine analyzes the user's emotional state
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。具体的には、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。入力はユーザーの顔表情や声のトーンであり、出力は分析された感情状態のデータである。 The emotion engine uses the camera and microphone on the user's smartphone to analyze facial expressions and tone of voice in real time. Specifically, if the user is smiling and talking, the emotion engine determines that the user is feeling happy. The input is the user's facial expressions and tone of voice, and the output is data on the analyzed emotional state.
ステップ7: Step 7:
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。具体的には、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。入力は分析された感情状態のデータであり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state based on the data obtained from the emotion engine. Specifically, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax." The input is the analyzed emotional state data, and the output is the adjusted training content.
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的なフィードバックが不足しており、また、スタッフの感情状態に応じたトレーニング内容の調整が行われていないため、効果的なトレーニングが難しいという課題があった。 Conventional customer service training systems lacked specific feedback to help staff develop ideal customer service attitudes, and training content was not adjusted to reflect the emotional state of staff, making it difficult to provide effective training.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、ユーザーの感情状態に応じてトレーニング内容を調整する手段と、スマートデバイスを用いてユーザーにフィードバックを提供する手段と、を含む。これにより、スタッフが理想の接客態度を効果的に身につけることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, means for adjusting the training content according to the user's emotional state, and means for providing feedback to the user using a smart device. This enables staff to effectively acquire the ideal customer service attitude.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言のトレーニングを行う個人である。 A "user" is an individual who uses the system to train themselves to behave and speak in a way that reflects their ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な行動や態度のモデルである。 The "ideal person" is a model of specific behaviors and attitudes that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に提示するための方法や装置である。 "Projection means" refers to a method or device for visually or audibly presenting the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための方法や装置である。 "Means for custom change" refers to methods or devices for changing a user's behavior and speech based on an ideal image of a person.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジされた行動や発言を繰り返し練習するための方法や装置である。 "Means for repeated training" refers to methods or devices that allow users to repeatedly practice custom-changed actions and speech in order to become closer to their ideal image of the person.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情を推定するための方法や装置である。 "Means for analyzing emotional states in real time" refers to methods or devices for inferring emotions from a user's facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容を変更するための方法や装置である。 "Means for adjusting training content" refers to a method or device for changing the training content according to the user's emotional state.
「スマートデバイス」とは、カメラ、マイク、スピーカーなどを内蔵し、ユーザーにフィードバックを提供するためのデバイスである。 A "smart device" is a device that has a built-in camera, microphone, speaker, etc. and is used to provide feedback to the user.
「フィードバックを提供する手段」とは、ユーザーに対して理想の行動や発言に関するアドバイスや指示を提供するための方法や装置である。 "Means for providing feedback" refers to methods or devices for providing users with advice or instructions regarding ideal behavior or speech.
この発明を実施するための形態として、実店舗で働くスタッフが理想の接客態度を身につけるためのトレーニングシステムを提供する。システムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための手段を含む。また、ユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する手段も含まれる。 As an embodiment of this invention, we provide a training system that helps staff working in brick-and-mortar stores acquire ideal customer service attitudes. The system includes means for projecting an ideal image of a person set by the user, customizing the user's behavior and speech, and repeatedly training them. It also includes means for analyzing the user's emotional state in real time and adjusting the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア Hardware
スマート眼鏡: カメラ、マイク、スピーカーを内蔵し、ユーザーの行動や発言をキャプチャし、フィードバックを提供する。 Smart glasses: Equipped with a camera, microphone, and speaker, they capture the user's actions and speech and provide feedback.
サーバ: データ処理と分析を行うための中央処理装置。 Server: A central processing unit for data processing and analysis.
ソフトウェア Software
OpenCV: カメラ映像のキャプチャと処理を行うライブラリ。 OpenCV: A library for capturing and processing camera images.
EmotionRecognizer: 顔表情から感情を推定するライブラリ。 EmotionRecognizer: A library that estimates emotions from facial expressions.
SpeechRecognition: 音声認識ライブラリ。 SpeechRecognition: Speech recognition library.
TextToSpeech: テキストを音声に変換するライブラリ。 TextToSpeech: A library for converting text to speech.
IdealBehaviorModel: 理想の行動や発言を生成するモデル。 IdealBehaviorModel: A model that generates ideal behaviors and statements.
データ加工と演算 Data processing and calculations
カメラ映像のキャプチャ Camera footage capture
スマート眼鏡のカメラを使用して、ユーザーの顔表情や行動をリアルタイムでキャプチャする。OpenCVを用いて映像データを取得し、EmotionRecognizerで感情状態を分析する。 The camera in the smart glasses is used to capture the user's facial expressions and behavior in real time. OpenCV is used to acquire video data, and EmotionRecognizer is used to analyze the emotional state.
音声認識 Voice recognition
スマート眼鏡のマイクを使用して、ユーザーの発言をキャプチャする。SpeechRecognitionライブラリを用いて音声データをテキストに変換する。 Use the microphone in the smart glasses to capture what the user is saying. Use the SpeechRecognition library to convert the speech data into text.
フィードバック生成 Feedback generation
IdealBehaviorModelを使用して、ユーザーの感情状態と発言に基づいた理想の行動や発言を生成する。生成されたフィードバックはTextToSpeechライブラリを用いて音声に変換され、スマート眼鏡のスピーカーを通じてユーザーに提供される。 Using IdealBehaviorModel, ideal behaviors and utterances are generated based on the user's emotional state and utterances. The generated feedback is converted into speech using the TextToSpeech library and provided to the user through the smart glasses' speakers.
具体例 Specific examples
シナリオ Scenario
実店舗で働くスタッフが「思いやりのある接客」を目指してトレーニングを行う。 Staff working in physical stores will receive training aimed at providing "considerate customer service."
状況 situation
顧客が商品について質問した際、スタッフが適切な対応を行う。 When customers ask questions about products, staff will respond appropriately.
フィードバック Feedback
スタッフがストレスを感じている場合、システムはリラクゼーションを促すアドバイスを提供する。 If staff are feeling stressed, the system will provide advice to encourage relaxation.
プロンプト文の例 Example prompt
ユーザーが「思いやりのある接客」を目指している場合、顧客からの質問に対してどのように対応すれば良いかを教えてください。ユーザーがストレスを感じている場合は、リラクゼーションを促すアドバイスも提供してください。 If the user aims to provide "caring customer service," tell them how to respond to customer questions. If the user is feeling stressed, provide them with advice on how to promote relaxation.
このようにして、実店舗での接客トレーニングを効果的に行うことができる。 In this way, customer service training can be carried out effectively in physical stores.
応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.
ステップ1: Step 1:
ユーザがスマート眼鏡を装着し、システムを起動する。スマート眼鏡のカメラがユーザの顔表情や行動をリアルタイムでキャプチャし、マイクがユーザの発言をキャプチャする。入力はカメラ映像と音声データであり、出力はキャプチャされた映像と音声データである。 The user puts on the smart glasses and starts the system. The smart glasses' camera captures the user's facial expressions and actions in real time, and the microphone captures the user's speech. The input is camera video and audio data, and the output is the captured video and audio data.
ステップ2: Step 2:
サーバがOpenCVを使用して、スマート眼鏡から送信された映像データを処理する。具体的には、映像データからユーザの顔表情を抽出し、EmotionRecognizerを用いて感情状態を分析する。入力はキャプチャされた映像データであり、出力はユーザの感情状態である。 The server uses OpenCV to process the video data sent from the smart glasses. Specifically, it extracts the user's facial expressions from the video data and analyzes their emotional state using EmotionRecognizer. The input is the captured video data, and the output is the user's emotional state.
ステップ3: Step 3:
サーバがSpeechRecognitionライブラリを使用して、スマート眼鏡から送信された音声データをテキストに変換する。入力はキャプチャされた音声データであり、出力はテキストデータである。 The server uses the SpeechRecognition library to convert the voice data sent from the smart glasses into text. The input is the captured voice data, and the output is text data.
ステップ4: Step 4:
サーバがIdealBehaviorModelを使用して、ユーザの感情状態とテキストデータに基づいて理想の行動や発言を生成する。入力はユーザの感情状態とテキストデータであり、出力は理想の行動や発言のテキストである。 The server uses IdealBehaviorModel to generate ideal behaviors and statements based on the user's emotional state and text data. The input is the user's emotional state and text data, and the output is the text of the ideal behavior or statement.
ステップ5: Step 5:
サーバがTextToSpeechライブラリを使用して、生成された理想の行動や発言のテキストを音声に変換する。入力は理想の行動や発言のテキストであり、出力は音声データである。 The server uses the TextToSpeech library to convert the generated text of ideal actions and statements into speech. The input is the text of the ideal actions and statements, and the output is audio data.
ステップ6: Step 6:
スマート眼鏡のスピーカーを通じて、サーバから送信された音声データをユーザに提供する。入力は音声データであり、出力はユーザが聞く音声フィードバックである。 Audio data sent from the server is provided to the user through the smart glasses' speakers. The input is audio data, and the output is audio feedback heard by the user.
ステップ7: Step 7:
ユーザが提供されたフィードバックに基づいて行動や発言を修正し、再度スマート眼鏡のカメラとマイクを通じて新しいデータをキャプチャする。これにより、ステップ1からステップ6までの処理が繰り返される。入力は修正された行動や発言の映像と音声データであり、出力は新たなフィードバックである。 The user modifies their actions or statements based on the provided feedback, and new data is captured again through the smart glasses' camera and microphone. This repeats the process from step 1 to step 6. The input is video and audio data of the modified actions or statements, and the output is new feedback.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来のシステムでは、ユーザーが自身の理想の人間像に近づくための具体的な行動や発言のカスタマイズが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、効果的なトレーニングが実現できないという課題があった。さらに、ユーザーの感情状態をリアルタイムで分析し、それに基づいてトレーニング内容を調整する機能が欠如していたため、ユーザーの心理的負担を軽減しながら理想像に近づくことが困難であった。 Previous systems had issues with being unable to provide effective training because it was difficult for users to customize the specific actions and comments that would bring them closer to their ideal image of the person they wanted, and the training content was not adjusted according to the user's emotional state. Furthermore, the lack of a function to analyze the user's emotional state in real time and adjust the training content based on that analysis made it difficult to bring users closer to their ideal image while reducing the psychological burden.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、該感情状態に応じてトレーニング内容を調整する手段と、を含む。これにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, and means for adjusting the training content in accordance with the emotional state. This allows the user to receive effective training to approach their ideal image.
「理想の人間像」とは、ユーザーが目指すべき人物像や性格特性を指す。 "Ideal person" refers to the type of person or personality traits that the user should aim to become.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置やソフトウェアを指す。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムを指す。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知するための装置やソフトウェアを指す。 "Means of presentation" refers to devices or software used to notify users of custom-changed actions or statements.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するためのプログラムやシステムを指す。 "Means for repeated training" refers to a program or system that allows users to repeatedly practice custom-changed actions and utterances.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などを解析して感情状態を推定するための装置やソフトウェアを指す。 "Means for analyzing emotional state in real time" refers to devices or software that estimate a user's emotional state by analyzing their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容や方法を変更するためのアルゴリズムやプログラムを指す。 "Means for adjusting training content" refers to algorithms or programs that change the content or method of training according to the user's emotional state.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
システムの構成 System Configuration
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを使用して、自身が目指す理想の人間像を設定する。例えば、「思いやりのある人」を選択する。この設定は、ユーザーの人間関係のトラウマや教養等を考慮して行われる。 Using an application on their device, users can set the ideal person they aspire to be. For example, they can select "a compassionate person." This setting takes into account the user's interpersonal trauma, education, etc.
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。これには、ユーザーが入力したテキストや音声データが含まれる。例えば、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。 The server collects user actions and statements in real time, including text and voice data entered by the user. For example, it collects what users say to friends in chat apps and what they say to voice assistants.
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、自然言語処理(NLP)技術を用いて、ユーザーの発言内容を理解する。ここでは、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用する。 The server analyzes the collected data. Specifically, it uses natural language processing (NLP) technology to understand what the user is saying. It uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4.
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server customizes your actions and speech based on your ideal image of a person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 Based on the analysis results, the server custom-changes the user's actions and comments to match their ideal image of a person. For example, "I'm busy today, so I can't help you" could be changed to "I'm busy today, but please let me know if there's anything I can do to help."
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。 The server presents the custom-changed actions and comments to the user, who can review them and make any necessary corrections.
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。Microsoft AzureのEmotion APIやAffectivaのSDKを使用する。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it analyzes the user's facial expressions, tone of voice, choice of words, etc. It uses Microsoft Azure's Emotion API and Affectiva's SDK.
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it will provide training to promote relaxation, and if the user is feeling joy, it will provide training to encourage behavior that encourages sharing that joy.
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。 The user performs the training content presented by the server. This allows the user to undergo repeated training to get closer to their ideal self.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーがアプリケーションを開き、「理想の人間像を設定」を選択し、「思いやりのある人」を選ぶ。 The user opens the application, selects "Set your ideal person," and chooses "A compassionate person."
行動や発言の収集 Collecting actions and statements
ユーザーが友人とチャットしている内容をアプリケーションがバックグラウンドで収集する。 The application collects chat content between users and friends in the background.
データの解析 Data Analysis
サーバが収集したチャット内容をGoogle Cloud Natural Language APIで解析し、感情分析を行う。また、OpenAIのGPT-4を使用して、ユーザーの発言内容を理解し、適切な応答を生成する。 The chat content collected by the server is analyzed using the Google Cloud Natural Language API to perform sentiment analysis. It also uses OpenAI's GPT-4 to understand what the user is saying and generate appropriate responses.
カスタムチェンジの例 Custom Change Example
ユーザーが「今日は忙しいから手伝えない」と言った場合、サーバがこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 If the user says, "I'm busy today and can't help," the server will change this to "I'm busy today, but please let me know if there's anything I can do to help."
感情エンジンの分析 Emotion Engine Analysis
ユーザーがカメラに向かって話しているとき、サーバがMicrosoft AzureのEmotion APIを使用して、ユーザーの顔表情や声のトーンからストレスを感じていると判断する。 When a user speaks into the camera, the server uses Microsoft Azure's Emotion API to determine whether the user is feeling stressed based on their facial expressions and tone of voice.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じているとき、サーバが「深呼吸をしてリラックスしましょう」といったリラクゼーショントレーニングを提供する。 When a user is feeling stressed, the server provides relaxation training such as "Take a deep breath and relax."
トレーニングの実行 Running the training
ユーザーがサーバから提示されたリラクゼーショントレーニングを実行する。 The user performs relaxation training presented by the server.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのように行動や発言をカスタムチェンジするか教えてください。」 "If a user sets their ideal person as 'a considerate person,' how would they customize their behavior and speech?"
このシステムにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることができる。 This system allows users to receive effective training to bring them closer to their ideal self.
実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのメニューから「理想の人間像を設定」を選択し、「思いやりのある人」などの選択肢から理想の人間像を選ぶ。入力はユーザーの選択した理想の人間像であり、出力はその設定情報である。 The user launches the application on their device and sets their ideal person. Specifically, they select "Set ideal person" from the application menu and choose their ideal person from options such as "a considerate person." The input is the ideal person selected by the user, and the output is that setting information.
ステップ2: Step 2:
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。具体的には、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーのテキストデータや音声データであり、出力は収集された行動や発言のデータである。 The server collects user behavior and speech in real time. Specifically, it collects the content of user conversations with friends on chat apps and what users say to voice assistants. The input is the user's text data and voice data, and the output is the collected behavior and speech data.
ステップ3: Step 3:
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用して、ユーザーの発言内容を理解し、感情分析やキーフレーズ抽出を行う。入力は収集された行動や発言のデータであり、出力は解析結果である。 The server analyzes the collected data. Specifically, it uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4 to understand what users say and perform sentiment analysis and key phrase extraction. The input is the collected behavioral and utterance data, and the output is the analysis results.
ステップ4: Step 4:
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server custom-changes your behavior and speech based on your ideal person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。入力は解析結果であり、出力はカスタムチェンジされた行動や発言である。 Based on the analysis results, the server custom-changes the user's actions and comments to match the ideal person. For example, "I'm busy today, so I can't help you" is changed to "I'm busy today, but please let me know if there's anything I can do to help." The input is the analysis results, and the output is the custom-changed actions and comments.
ステップ5: Step 5:
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。入力はカスタムチェンジされた行動や発言であり、出力はユーザーに提示された内容である。 The server presents the custom-changed actions and statements to the user, who can review them and make corrections as necessary. The input is the custom-changed actions and statements, and the output is the content presented to the user.
ステップ6: Step 6:
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、Microsoft AzureのEmotion APIやAffectivaのSDKを使用して、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。入力はユーザーの顔表情や声のトーン、言葉の選び方であり、出力は感情状態の分析結果である。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it uses Microsoft Azure's Emotion API and Affectiva's SDK to analyze the user's facial expressions, tone of voice, choice of words, etc. The input is the user's facial expressions, tone of voice, and choice of words, and the output is the analysis of the user's emotional state.
ステップ7: Step 7:
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。入力は感情状態の分析結果であり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it provides training to promote relaxation, and if the user is feeling happy, it provides training to encourage behavior that shares that joy. The input is the analysis result of the emotional state, and the output is the adjusted training content.
ステップ8: Step 8:
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。入力は調整されたトレーニング内容であり、出力はユーザーの実行結果である。 The user performs the training content presented by the server. This allows the user to undergo repeated training to approach their ideal self. The input is the adjusted training content, and the output is the user's execution results.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the smart glasses 214 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を維持することは難しく、特に感情状態が不安定な場合には顧客満足度が低下する問題があった。また、スタッフが自身の理想像に近づくためのトレーニングを効果的に行う手段が不足していた。 In traditional customer service work, it was difficult for staff to maintain an ideal customer service attitude, and customer satisfaction declined, especially when their emotional state was unstable. Furthermore, there was a lack of effective training methods to help staff approach their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンに基づいてトレーニング内容を調整する手段と、スマート眼鏡に表示する手段と、を含む。これにより、スタッフが理想の接客態度を維持しつつ、感情状態に応じた適切なトレーニングを受けることが可能となる。 In this invention, the server includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, a means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, a means for adjusting the training content based on the emotion engine, and a means for displaying on the smart glasses. This enables staff to receive appropriate training according to their emotional state while maintaining an ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示する装置やソフトウェアである。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムである。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに知らせるための表示装置や通知システムである。 "Means of presentation" refers to a display device or notification system that notifies users of custom-changed actions and statements.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジした行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice their custom-changed actions and statements in order to become closer to their ideal image of the person they want to be.
「感情エンジン」とは、ユーザーの感情状態をリアルタイムで分析するためのソフトウェアまたはハードウェアである。 An "emotion engine" is software or hardware that analyzes a user's emotional state in real time.
「トレーニング内容を調整する手段」とは、感情エンジンの分析結果に基づいて、ユーザーに提供するトレーニングの内容を変更するための機能である。 "Means for adjusting training content" is a function for changing the content of training provided to users based on the analysis results of the emotion engine.
「スマート眼鏡」とは、ユーザーが装着することで情報を視覚的に表示することができるウェアラブルデバイスである。 "Smart glasses" are wearable devices that can visually display information when worn by the user.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための一連の手段を含む。さらに、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する機能を備えている。 The system for implementing this invention includes a series of means for projecting the ideal human image set by the user, customizing the user's behavior and speech, and repeatedly training them. It also has the ability to use an emotion engine to analyze the user's emotional state in real time and adjust the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア: スマート眼鏡、カメラ Hardware: Smart glasses, camera
ソフトウェア: OpenCV(顔検出)、EmotionRecognizer(感情認識)、BehaviorSuggestion(行動提案) Software: OpenCV (face detection), EmotionRecognizer (emotion recognition), BehaviorSuggestion (behavior suggestions)
システムの構成 System Configuration
1. ユーザーが設定した理想の人間像を投影する手段: 1. A way to project the user's ideal image of a person:
ユーザーはアプリケーションを通じて理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想とする場合、システムはこの情報を基に行動や発言をカスタムチェンジする。 Users can set their ideal image of a person through the application. For example, if their ideal is "kind and polite customer service," the system will use this information to customize their behavior and speech.
2. ユーザーの行動や発言をカスタムチェンジする手段: 2. How to customise user behaviour and comments:
システムは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するためのアルゴリズムを実行する。例えば、ユーザーがストレスを感じている場合、リラクゼーションを促す提案を行う。 The system runs algorithms to change the user's current behavior and speech based on the ideal person. For example, if the user is feeling stressed, it will make suggestions to encourage relaxation.
3. カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段: 3. A method for presenting custom-changed actions and statements to users and repeatedly training them:
カスタムチェンジされた行動や発言は、スマート眼鏡のディスプレイに表示される。ユーザーはこれを見て、理想の行動や発言を繰り返し練習する。 Custom-changed actions and speech are displayed on the smart glasses' display. Users can view these and repeatedly practice their ideal actions and speech.
4. 感情エンジン: 4. Emotion Engine:
カメラを用いてユーザーの顔表情をキャプチャし、EmotionRecognizerを用いて感情状態をリアルタイムで分析する。これにより、ユーザーの感情状態に応じたトレーニング内容を提供する。 The camera captures the user's facial expressions, and EmotionRecognizer analyzes their emotional state in real time. This allows the system to provide training content tailored to the user's emotional state.
5. トレーニング内容を調整する手段: 5. Ways to adjust training content:
感情エンジンの分析結果に基づいて、BehaviorSuggestionエンジンが適切な行動や発言を提案する。例えば、ユーザーが喜びを感じている場合、その喜びを共有するような行動を促すトレーニングを提供する。 Based on the analysis results of the emotion engine, the BehaviorSuggestion engine suggests appropriate actions and statements. For example, if the user is feeling happy, it provides training to encourage behavior that shares that joy.
6. スマート眼鏡に表示する手段: 6. Display method on smart glasses:
提案された行動や発言は、スマート眼鏡のディスプレイにリアルタイムで表示される。これにより、ユーザーは接客中に理想の態度を維持することができる。 Suggested actions and comments are displayed in real time on the smart glasses' display, allowing users to maintain ideal behavior while serving customers.
具体例 Specific examples
シナリオ: 実店舗のスタッフがスマート眼鏡を装着し、接客中に「親切で丁寧な接客」を維持するための支援を受ける。 Scenario: Store staff wear smart glasses to help them maintain a "friendly and courteous" attitude while serving customers.
感情状態: スタッフがストレスを感じている場合、リラクゼーションを促す提案(例:「深呼吸をしてリラックスしましょう」)。 Emotional state: If staff are feeling stressed, offer relaxation suggestions (e.g., "Take a deep breath and relax").
行動提案: 顧客に対して「お困りのことがあれば何でもおっしゃってください」といった親切な発言を提案。 Action suggestion: Suggest a kind statement to customers such as, "Please let me know if you need any help."
プロンプト文の例 Example prompt
ユーザーが設定した理想の接客態度に基づいて、リアルタイムで行動や発言をカスタムチェンジし、スマート眼鏡のディスプレイに表示するアプリケーションを開発してください。感情エンジンを用いてユーザーの感情状態を分析し、適切なトレーニングを提供する機能も含めてください。 Develop an application that custom changes actions and comments in real time based on the ideal customer service attitude set by the user, and displays them on the smart glasses display. Include a function that uses an emotion engine to analyze the user's emotional state and provide appropriate training.
応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 18.
ステップ1: Step 1:
ユーザがアプリケーションを起動し、理想の人間像を設定する。ユーザは「親切で丁寧な接客」などの理想像を入力する。この入力データはサーバに送信され、保存される。 The user launches the application and sets their ideal image of the person. The user inputs an ideal image such as "kind and polite customer service." This input data is sent to the server and saved.
ステップ2: Step 2:
サーバは、ユーザの理想の人間像に基づいて行動や発言をカスタムチェンジするアルゴリズムを実行する。入力として理想の人間像とユーザの現在の行動データを受け取り、出力としてカスタムチェンジされた行動や発言を生成する。 The server runs an algorithm that custom-changes behavior and speech based on the user's ideal image of the person. It receives the ideal image of the person and the user's current behavioral data as input, and generates custom-changed behavior and speech as output.
ステップ3: Step 3:
サーバは、カスタムチェンジされた行動や発言をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、理想の行動や発言を実践する。 The server sends the custom-changed actions and statements to the smart glasses, which receive them and display them on the screen. The user then views these and practices their ideal actions and statements.
ステップ4: Step 4:
カメラがユーザの顔表情をキャプチャし、リアルタイムでサーバに送信する。サーバはEmotionRecognizerを用いて、入力された顔表情データからユーザの感情状態を分析する。出力として感情状態データを生成する。 The camera captures the user's facial expressions and transmits them to the server in real time. The server uses EmotionRecognizer to analyze the user's emotional state from the input facial expression data, and generates emotional state data as output.
ステップ5: Step 5:
サーバは、感情状態データに基づいてトレーニング内容を調整する。BehaviorSuggestionエンジンが感情状態データと理想の人間像を入力として受け取り、適切な行動や発言を提案する。出力として調整されたトレーニング内容を生成する。 The server adjusts the training content based on the emotional state data. The BehaviorSuggestion engine receives the emotional state data and the ideal human image as input and suggests appropriate actions and statements. The adjusted training content is generated as output.
ステップ6: Step 6:
サーバは、調整されたトレーニング内容をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、感情状態に応じたトレーニングを実践する。 The server sends the adjusted training content to the smart glasses, which receive it and display it on the screen. The user then views it and practices training that corresponds to their emotional state.
ステップ7: Step 7:
ユーザがトレーニングを実践する過程で、サーバは感情状態の変化をトラッキングし、必要に応じてトレーニング内容を再調整する。これにより、ユーザは理想の人間像に近づくための最適なトレーニングを受けることができる。 As the user practices the training, the server tracks changes in their emotional state and readjusts the training content as needed. This allows the user to receive optimal training to bring them closer to their ideal image of the person they want to be.
特定処理部290は、特定処理の結果をスマート眼鏡214に送信する。スマート眼鏡214では、制御部46Aが、スピーカ240に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the smart glasses 214. In the smart glasses 214, the control unit 46A causes the speaker 240 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating voice, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>).
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマート眼鏡214によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the smart glasses 214.
[第3実施形態] [Third embodiment]
図5には、第3実施形態に係るデータ処理システム310の構成の一例が示されている。 Figure 5 shows an example of the configuration of a data processing system 310 according to the third embodiment.
図5に示すように、データ処理システム310は、データ処理装置12及びヘッドセット型端末314を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 5, the data processing system 310 includes a data processing device 12 and a headset terminal 314. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
ヘッドセット型端末314は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及びディスプレイ343を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及びディスプレイ343も、バス52に接続されている。 The headset terminal 314 includes a computer 36, a microphone 238, a speaker 240, a camera 42, a communication I/F 44, and a display 343. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, the speaker 240, the camera 42, and the display 343 are also connected to the bus 52.
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.
図6には、データ処理装置12及びヘッドセット型端末314の要部機能の一例が示されている。図6に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 6 shows an example of the main functions of the data processing device 12 and headset terminal 314. As shown in Figure 6, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
ヘッドセット型端末314では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the headset terminal 314, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.
「形態例1」 "Example 1"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
「形態例2」 "Example 2"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがアプリケーション上で理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 Step 1: The user sets their ideal person in the application. For example, they can set "a compassionate person" as their ideal person.
ステップ2:システムがユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。具体的には、「思いやりのある人」に基づいてユーザーの行動や発言を分析し、それに適した行動や発言を生成する。 Step 2: The system custom-changes the user's behavior and comments based on the ideal image of a person. Specifically, it analyzes the user's behavior and comments based on the image of a "compassionate person" and generates appropriate behavior and comments.
ステップ3:システムがカスタムチェンジした行動や発言をユーザーに提示する。例えば、ユーザーが他人に対して思いやりのある行動をとるようにアドバイスを提供する。 Step 3: The system presents the user with the customized actions and statements. For example, it may provide advice to encourage the user to behave more considerately toward others.
ステップ4:ユーザーが提示された行動や発言を反復トレーニングする。これにより、ユーザーは自身の理想像に近づくことが可能となる。 Step 4: The user repeatedly practices the suggested actions and statements, allowing them to get closer to their ideal self.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来の自己改善システムでは、ユーザーが設定した理想の人間像に基づいて具体的な行動や発言をカスタムチェンジすることが難しく、またその反復トレーニングの進捗を効果的に記録しフィードバックを提供する手段が不足している。このため、ユーザーが自身の理想像に近づくための効果的なサポートが提供されていないという課題がある。 Existing self-improvement systems have difficulty customizing specific actions and speech based on the ideal person the user sets, and lack a means to effectively record the progress of this repetitive training and provide feedback. This poses a challenge in that they do not provide effective support to help users get closer to their ideal self.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、生成AIモデルを用いて該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、該反復トレーニングの進捗を記録し、フィードバックを提供する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための具体的な行動や発言を学び、実践し、その進捗を効果的に管理することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image using a generative AI model, means for presenting the custom-changed actions and speech to the user and repeatedly training them, and means for recording the progress of the repeated training and providing feedback. This enables the user to learn and practice specific actions and speech that will bring them closer to their ideal image, and effectively manage their progress.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「生成AIモデル」とは、人工知能を用いてデータを生成し、ユーザーの行動や発言をカスタムチェンジするためのアルゴリズムやプログラムを指す。 A "generative AI model" refers to an algorithm or program that uses artificial intelligence to generate data and custom-change user behavior and speech.
「カスタムチェンジ」とは、ユーザーの行動や発言を理想の人間像に基づいて変更することを指す。 "Custom Change" refers to changing a user's behavior and words based on an ideal image of a person.
「反復トレーニング」とは、ユーザーが提示されたカスタムチェンジされた行動や発言を繰り返し実践することを指す。 "Repeated training" refers to the user repeatedly practicing the custom-changed actions and utterances that are presented to them.
「フィードバック」とは、ユーザーの反復トレーニングの進捗に基づいて提供される評価やアドバイスを指す。 "Feedback" refers to evaluations and advice provided based on the user's progress through repeated training.
「進捗を記録する」とは、ユーザーが行った反復トレーニングの内容や成果をデータとして保存することを指す。 "Recording progress" refers to saving the content and results of the user's repeated training as data.
「提示する」とは、サーバが生成したカスタムチェンジされた行動や発言をユーザーに見せることを指す。 "Presenting" refers to showing the custom-changed actions and statements generated by the server to the user.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それを反復トレーニングすることでユーザーが自身の理想像に近づくことを促進するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes actions and speech based on the ideal person image set by the user, and encourages the user to approach their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: スマートフォン、パソコン、タブレットなどのユーザーが操作するデバイス。 Device: A device operated by the user, such as a smartphone, computer, or tablet.
サーバ: データ処理および生成AIモデルの実行を行うためのサーバ。 Server: A server for processing data and running generative AI models.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供するソフトウェア。 Application: Software that provides an interface for users to define their ideal person and review their custom-changed behavior and statements.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのアルゴリズム。具体的には、OpenAIのGPT-4などの生成AIモデルを使用する。 Generative AI model: An algorithm that custom-changes a user's behavior and speech based on an ideal human image. Specifically, it uses a generative AI model such as OpenAI's GPT-4.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 The user launches the application and sets their ideal image of a person. For example, they can set "a compassionate person" as their ideal image of a person.
端末が設定データをサーバに送信する The device sends configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。このデータには、ユーザーの選択した理想の人間像に関する情報が含まれる。 The device sends data about the ideal person set by the user to the server. This data includes information about the ideal person selected by the user.
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信したデータを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データを収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received data to analyze the user's behavior and comments. Specifically, the server collects data on the user's past behavior and comments and customizes it based on the ideal image of the person.
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。このデータには、ユーザーが実践すべき具体的な行動や発言の例が含まれる。 The server then sends the generated custom-changed behavior and speech data to the device. This data includes specific examples of behaviors and speech that the user should practice.
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。 Users practice the proposed custom-changed actions and utterances, practicing repeatedly. The application records the user's progress and provides feedback as needed.
具体例 Specific examples
例えば、ユーザーが「思いやりのある人」を理想の人間像として設定した場合、以下のようなプロンプト文を生成AIモデルに入力する。 For example, if a user sets "a compassionate person" as their ideal person, the following prompt sentence would be input into the generative AI model:
プロンプト文の例 Example prompt
「ユーザーが友人と会話しているときに、思いやりのある発言をするためのアドバイスを提供してください。」 "Please provide advice to help users be more considerate when speaking with friends."
生成AIモデルは、このプロンプト文に基づいて、ユーザーが友人と会話する際に使える具体的な発言例を生成する。例えば、「友人が困っているときに『何か手伝えることがあれば教えてね』と言う」といったアドバイスを提供する。 Based on this prompt, the generative AI model generates specific example utterances that the user can use when conversing with friends. For example, it provides advice such as, "When a friend is in trouble, say, 'Let me know if there's anything I can help you with.'"
このようにして、ユーザーは理想の人間像に基づいた行動や発言を学び、実践することができる。 In this way, users can learn and practice behaviors and speech based on their ideal image of a person.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのインターフェース上で「理想の人間像を設定する」ボタンをクリックし、ドロップダウンメニューから「思いやりのある人」を選択し、「設定」ボタンを押す。 The user launches the application and sets their ideal person. Specifically, they click the "Set Ideal Person" button on the application interface, select "Compassionate Person" from the drop-down menu, and press the "Set" button.
入力: ユーザーの選択した理想の人間像(例:「思いやりのある人」) Input: User's chosen ideal person (e.g., "a caring person")
出力: 理想の人間像の設定データ Output: Ideal human image configuration data
ステップ2: Step 2:
端末が設定データをサーバに送信する The device sends the configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。この送信は、HTTPSプロトコルを使用して安全に行われる。 The device sends data about the user's ideal person profile to a server. This transmission is secure using the HTTPS protocol.
入力: 理想の人間像の設定データ Input: Ideal human image data
出力: サーバに送信された設定データ Output: Configuration data sent to the server
ステップ3: Step 3:
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信した設定データを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データ(例:チャットログやSNSの投稿)を収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received configuration data to analyze the user's behavior and comments. Specifically, the server collects the user's past behavior and comment data (e.g., chat logs and social media posts) and customizes it based on the ideal image of the person.
入力: 設定データ、ユーザーの過去の行動や発言データ Input: Configuration data, user past behavior and comment data
出力: カスタムチェンジされた行動や発言データ Output: Custom-changed behavior and speech data
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
入力: カスタムチェンジされた行動や発言データ Input: Custom-changed behavior and speech data
出力: 生成された具体的な行動や発言の例 Output: Examples of specific actions and statements generated
ステップ5: Step 5:
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。この送信も、HTTPSプロトコルを使用して行われる。 The server then sends the generated custom-changed behavior and speech data to the device. This transmission is also done using the HTTPS protocol.
入力: 生成された具体的な行動や発言の例 Input: Examples of specific actions or statements to be generated
出力: 端末に送信されたデータ Output: Data sent to the device
ステップ6: Step 6:
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
入力: 端末に送信されたデータ Input: Data sent to the device
出力: ユーザーに提示された具体的な行動や発言の例 Output: Examples of specific actions and statements presented to the user
ステップ7: Step 7:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。例えば、ユーザーが「今日、友人に思いやりのある発言をした」とアプリケーションに入力する。 The user then practices the custom-changed actions and statements presented to them, repeatedly practicing. The application records the user's progress and provides feedback as needed. For example, a user might enter into the application, "Today, I made a kind statement to a friend."
入力: ユーザーの実践結果 Input: User practice results
出力: 記録された進捗データおよび提供されたフィードバック Output: Recorded progress data and provided feedback
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的な行動や発言のカスタムチェンジが難しく、効果的なトレーニングが行えないという問題があった。また、スタッフが理想の接客態度に近づくための反復トレーニングが不足しており、実際の接客において理想の態度を維持することが困難であった。 Traditional customer service training systems had the problem of being unable to provide effective training because it was difficult to customize specific actions and comments to help staff develop the ideal customer service attitude. Furthermore, there was a lack of repetitive training to help staff approach the ideal customer service attitude, making it difficult for them to maintain the ideal attitude when actually serving customers.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する手段と、該生成された行動や発言をプロンプト文としてユーザーに提示する手段と、を含む。これにより、スタッフが理想の接客態度を具体的に理解し、反復トレーニングを通じて実際の接客において理想の態度を維持することが可能となる。 The identification processing by the identification processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means. In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for generating actions and utterances based on the ideal human image using a generative AI model, and means for presenting the generated actions and utterances to the user as prompt sentences. This enables staff to concretely understand the ideal customer service attitude and maintain the ideal attitude in actual customer service through repeated training.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言を学習しようとする個人である。 A "user" is an individual who uses the system to learn to behave and speak in a way that is consistent with the ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や態度のことであり、システムがそれに基づいて行動や発言をカスタムチェンジする基準となるものである。 The "ideal person" is the specific character and attitude that the user should strive for, and serves as the standard by which the system will custom-change their behavior and speech.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキストとして表示する機能である。 "Projection means" is a function that displays the user's ideal image of a person visually or as text on the system.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能である。 "Means for custom change" is a function that allows users to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための機能である。 "Means of presentation" is a function for displaying custom-changed actions and comments to users.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice custom-changed actions and statements.
「生成AIモデル」とは、ユーザーが設定した理想の人間像に基づいて行動や発言を生成するための人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates actions and statements based on the ideal human image set by the user.
「プロンプト文」とは、生成AIモデルが理想の人間像に基づいて生成した行動や発言をユーザーに提示するためのテキスト形式の指示文である。 A "prompt" is a text-based instruction that presents the user with actions and statements generated by the generative AI model based on an ideal human image.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うものである。以下に、このシステムの具体的な実施形態について説明する。 The system for implementing this invention custom-changes behavior and speech based on the ideal person image set by the user, and presents this to the user for repetitive training. Specific embodiments of this system are described below.
システムの構成 System Configuration
システムは、以下の主要なコンポーネントから構成される。 The system consists of the following main components:
1. ユーザー端末: スマートフォンやタブレットなどのデバイスで、ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するために使用する。 1. User device: A device such as a smartphone or tablet that allows the user to define their ideal person and check their custom-changed behavior and statements.
2. サーバ: ユーザーの入力データを処理し、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する。 2. Server: Processes user input data and uses a generative AI model to generate behaviors and statements based on the ideal human image.
3. 生成AIモデル: OpenAIのGPT-3などの生成AIモデルを使用し、ユーザーが設定した理想の人間像に基づいて行動や発言を生成する。 3. Generative AI models: Using generative AI models such as OpenAI's GPT-3, actions and statements are generated based on the ideal human image set by the user.
プログラムの処理 Program processing
サーバは、ユーザー端末から送信された理想の人間像と現在の行動や発言のデータを受け取り、生成AIモデルにプロンプト文として入力する。生成AIモデルは、理想の人間像に基づいた行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server receives the ideal human image and current behavior and speech data sent from the user's device and inputs this as prompt text into the generative AI model. The generative AI model generates behavior and speech based on the ideal human image and returns the results to the server. The server then sends the generated behavior and speech to the user's device and presents them to the user.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア: スマートフォン、タブレット、サーバ Hardware: Smartphones, tablets, servers
ソフトウェア: Python、OpenAI API、ユーザーインターフェースアプリケーション Software: Python, OpenAI API, user interface application
データ加工およびデータ演算 Data processing and calculation
サーバは、ユーザーが設定した理想の人間像と現在の行動や発言をプロンプト文として生成AIモデルに送信する。生成AIモデルは、プロンプト文に基づいて理想の行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server sends the user's ideal image of a person and their current actions and statements as prompts to the generative AI model. The generative AI model generates the ideal actions and statements based on the prompts and returns the results to the server. The server then sends the generated actions and statements to the user's device and presents them to the user.
具体例 Specific examples
例えば、ユーザーが「思いやりのある接客」を理想の人間像として設定し、現在の行動が「お客様に対して無愛想な対応をする」である場合、プロンプト文は以下のようになる。 For example, if the user defines their ideal person as "attentive customer service" and their current behavior is "treating customers in a rude manner," the prompt would be as follows:
プロンプト文の例: Example prompt:
理想の人間像: 思いやりのある接客 Ideal person: Attentive customer service
ユーザーの行動: お客様に対して無愛想な対応をする User behavior: Treating customers rudely
理想の人間像に基づいた行動: Acting based on the ideal human image:
生成AIモデルは、このプロンプト文に基づいて「思いやりのある接客」に適した行動や発言を生成し、その結果をユーザーに提示する。ユーザーは提示された行動や発言を反復トレーニングすることで、理想の接客態度に近づくことができる。 Based on this prompt, the generative AI model generates actions and statements appropriate for "considerate customer service" and presents the results to the user. By repeatedly practicing the actions and statements presented, users can get closer to their ideal customer service attitude.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
ユーザーが端末を使用して理想の人間像を設定する。ユーザーはアプリケーションを起動し、理想の人間像(例:「思いやりのある接客」)を入力する。入力データは端末からサーバに送信される。 The user sets their ideal image of a person using their device. The user launches the application and inputs their ideal image of a person (e.g., "thoughtful customer service"). The input data is sent from the device to the server.
入力:理想の人間像 Input: Ideal human image
出力:サーバに送信された理想の人間像データ Output: Ideal human image data sent to the server
ステップ2: Step 2:
サーバは、ユーザーから送信された理想の人間像データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the ideal human image data sent by the user. The server stores this data and uses it for subsequent processing.
入力:理想の人間像データ Input: Ideal human image data
出力:保存された理想の人間像データ Output: Saved ideal human image data
ステップ3: Step 3:
ユーザーが端末を使用して現在の行動や発言を入力する。ユーザーは現在の行動(例:「お客様に対して無愛想な対応をする」)を入力し、端末からサーバに送信する。 The user uses the device to input their current actions and statements. The user inputs their current actions (e.g., "being rude to customers") and sends it from the device to the server.
入力:現在の行動や発言 Input: Current action or statement
出力:サーバに送信された現在の行動や発言データ Output: Current behavior and speech data sent to the server
ステップ4: Step 4:
サーバは、ユーザーから送信された現在の行動や発言データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the current activity and comment data sent by the user. The server stores this data and uses it for further processing.
入力:現在の行動や発言データ Input: Current activity and speech data
出力:保存された現在の行動や発言データ Output: Saved current behavior and speech data
ステップ5: Step 5:
サーバは、保存された理想の人間像データと現在の行動や発言データを組み合わせてプロンプト文を生成する。生成されたプロンプト文は、生成AIモデルに入力される。 The server generates prompts by combining the stored ideal human image data with current behavior and speech data. The generated prompts are then input into the generative AI model.
入力:理想の人間像データ、現在の行動や発言データ Input: Ideal person data, current behavior and speech data
出力:生成されたプロンプト文 Output: Generated prompt text
ステップ6: Step 6:
サーバは、生成されたプロンプト文を生成AIモデルに送信する。生成AIモデルはプロンプト文に基づいて理想の行動や発言を生成する。 The server sends the generated prompt text to the generative AI model, which then generates the ideal behavior or speech based on the prompt text.
入力:生成されたプロンプト文 Input: Generated prompt text
出力:生成AIモデルによって生成された理想の行動や発言 Output: Ideal actions and statements generated by the generative AI model
ステップ7: Step 7:
サーバは、生成AIモデルから返された理想の行動や発言を受信する。サーバはこのデータをユーザー端末に送信する。 The server receives the ideal actions and statements returned by the generative AI model. The server then sends this data to the user's device.
入力:生成AIモデルによって生成された理想の行動や発言 Input: Ideal actions and statements generated by a generative AI model
出力:ユーザー端末に送信された理想の行動や発言データ Output: Ideal behavior and speech data sent to the user's device
ステップ8: Step 8:
ユーザー端末は、サーバから送信された理想の行動や発言データを受信し、ユーザーに提示する。ユーザーは提示された行動や発言を確認し、反復トレーニングを行う。 The user's device receives the ideal behavior and speech data sent from the server and presents it to the user. The user confirms the presented behavior and speech and performs repeated training.
入力:理想の行動や発言データ Input: Ideal behavior and speech data
出力:ユーザーに提示された理想の行動や発言 Output: Ideal actions and statements presented to the user
以上の処理ステップにより、ユーザーは理想の人間像に基づいた行動や発言を学習し、反復トレーニングを通じて理想の態度に近づくことができる。 Through these processing steps, users learn how to behave and speak in a way that is based on the ideal image of a person, and through repeated training, they can move closer to their ideal attitude.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
現代社会において、多くの人々が自己改善や理想の人間像に近づくことを目指しているが、その過程は困難であり、持続的な努力が必要である。また、自己改善のための具体的な行動や発言の指針が不足しているため、効果的なトレーニングが難しいという問題がある。さらに、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするための適切な手段が存在しないため、ユーザーが自身の理想像に近づくことが困難である。 In modern society, many people aim to improve themselves and become closer to their ideal image, but the process is difficult and requires sustained effort. Furthermore, there is a lack of specific guidelines for actions and statements for self-improvement, making effective training difficult. Furthermore, there are no appropriate means for users to customize their actions and statements based on their ideal image, making it difficult for users to become closer to their ideal image.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示する手段と、該提示された行動や発言をユーザーが反復トレーニングする手段と、ユーザーの行動や発言を収集する手段と、収集した行動や発言を解析し、生成AIモデルを使用してカスタムチェンジする手段と、を含む。これにより、ユーザーは具体的な行動や発言の指針を得ることができ、持続的なトレーニングを通じて自身の理想像に近づくことが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and comments based on the ideal human image, means for presenting the custom-changed actions and comments to the user, means for the user to repeatedly train on the presented actions and comments, means for collecting the user's actions and comments, and means for analyzing the collected actions and comments and customizing them using a generative AI model. This allows the user to obtain specific guidelines for actions and comments, and enables them to get closer to their ideal image through continuous training.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的またはテキスト形式で表示するための機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person in visual or text form.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能を指す。 "Means for custom change" refers to the function that allows a user to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに通知または表示するための機能を指す。 "Means of presentation" refers to the function for notifying or displaying custom-changed actions or statements to the user.
「反復トレーニングする手段」とは、ユーザーが提示された行動や発言を繰り返し実行することで、理想の人間像に近づくためのトレーニングを行う機能を指す。 "Means for repeated training" refers to a function that allows users to train themselves to become closer to their ideal image of a person by repeatedly performing suggested actions and statements.
「収集する手段」とは、ユーザーの行動や発言を記録し、データとして保存するための機能を指す。 "Means of collection" refers to the function for recording user actions and comments and saving them as data.
「解析する手段」とは、収集されたユーザーの行動や発言データを分析し、理想の人間像に基づいてカスタムチェンジするための情報を抽出する機能を指す。 "Means of analysis" refers to the function of analyzing collected user behavior and comment data and extracting information for custom changes based on the ideal image of a person.
「生成AIモデル」とは、ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデルを指す。 A "generative AI model" refers to an artificial intelligence model that converts a user's actions and statements based on an ideal image of a human being.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, presenting this to the user for repetitive training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末:ユーザーが使用するスマートフォン、タブレット、またはパソコンなどのデバイス。 Device: The device used by the user, such as a smartphone, tablet, or computer.
サーバ:データの処理と保存を行うためのリモートサーバ。 Server: A remote server for processing and storing data.
ソフトウェア Software
アプリケーション:ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのソフトウェア。 Application: Software that allows users to define their ideal person and check their custom-changed behavior and statements.
生成AIモデル:ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデル(例:GPT-4)。 Generative AI model: An artificial intelligence model (e.g., GPT-4) that transforms user behavior and speech based on an ideal human image.
システムの動作 System Operation
理想の人間像の設定 Establishing the ideal human image
ユーザーは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーの日常的な行動や発言を記録する。例えば、ユーザーが友人と会話している内容や、SNSに投稿した内容を収集する。収集したデータは、リアルタイムでサーバに送信される。 The device records the user's everyday actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media. The collected data is sent to a server in real time.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、受信したユーザーの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。例えば、ユーザーが「今日は忙しいから手伝えない」と言った場合、生成AIモデルはこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変換する。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), it custom-changes the user's behavior and speech based on the ideal person. For example, if a user says, "I'm busy today, so I can't help you," the generative AI model converts this to, "I'm busy today, but please let me know if there's anything I can do to help."
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザーに通知する。ユーザーは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
反復トレーニング Repetitive training
ユーザーは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。これにより、ユーザーは理想の人間像に近づくためのトレーニングを行う。 Users repeatedly execute the custom-changed actions and statements that are presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts. In this way, users train to become closer to their ideal image of the person they want to be.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーはアプリケーションの設定画面で「思いやりのある人」と入力し、保存ボタンをクリックする。 The user enters "compassionate person" in the application's settings screen and clicks the save button.
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーが友人と会話している音声を録音し、テキストに変換する。また、ユーザーがSNSに投稿したテキストデータも収集する。 The device records the user's voice when they are talking to friends and converts it into text. It also collects text data that the user posts on social media.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、収集したテキストデータを生成AIモデルに入力する。生成AIモデルは、プロンプト文を使用して、ユーザーの発言を理想の人間像に基づいて変換する。 The server inputs the collected text data into a generative AI model, which uses prompts to convert the user's speech based on an ideal human image.
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、生成AIモデルが出力したカスタムチェンジされた発言を端末に送信する。端末は、ユーザーに通知を表示し、「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」といった提案を行う。 The server sends the custom-modified utterances output by the generative AI model to the device. The device then displays a notification to the user, suggesting something like, "I'm busy today, but please let me know if there's anything I can do to help you."
反復トレーニング Repetitive training
ユーザーは、毎日の会話やSNS投稿で、サーバから提案された発言を使用する。例えば、友人との会話で「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」と言う。これを繰り返すことで、ユーザーは「思いやりのある人」としての行動や発言が自然にできるようになる。 Users use the comments suggested by the server in their everyday conversations and social media posts. For example, in a conversation with a friend, they might say, "I'm busy today, but please let me know if there's anything I can do to help." By repeating this, users will naturally begin to act and speak in a way that befits a "considerate person."
プロンプト文の例 Example prompt
生成AIモデルに入力するプロンプト文の例は以下の通りである: An example of a prompt to input to the generative AI model is as follows:
ユーザーの現在の発言:「今日は忙しいから手伝えない」 Current user statement: "I'm busy today, so I can't help."
理想の人間像:「思いやりのある人」 Ideal person: "A compassionate person"
生成AIモデルに対するプロンプト文:「ユーザーの発言を、思いやりのある人の発言に変換してください」 Prompt for generative AI model: "Transform the user's utterances into those of a considerate person."
このプロンプト文を生成AIモデルに入力することで、ユーザーの発言が理想の人間像に基づいてカスタムチェンジされる。 By inputting this prompt into a generative AI model, the user's speech is custom-changed based on the ideal human image.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
ユーザは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
入力:ユーザが設定画面で入力した理想の人間像。 Input: The ideal person image entered by the user on the settings screen.
出力:理想の人間像がアプリケーションに保存される。 Output: The ideal image of a person is saved in the application.
ステップ2: Step 2:
端末は、ユーザの日常的な行動や発言を記録する。例えば、ユーザが友人と会話している内容や、SNSに投稿した内容を収集する。 The device records the user's daily actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media.
入力:ユーザの行動や発言。 Input: User actions and statements.
出力:収集された行動や発言データが端末に保存され、リアルタイムでサーバに送信される。 Output: Collected behavioral and speech data is stored on the device and sent to the server in real time.
ステップ3: Step 3:
サーバは、受信したユーザの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザの行動や発言を理想の人間像に基づいてカスタムチェンジする。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), the user's behavior and speech are custom-changed based on the ideal image of a person.
入力:収集された行動や発言データ、理想の人間像。 Input: Collected behavioral and speech data, ideal human image.
出力:カスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements.
具体的な動作:サーバは、収集されたテキストデータを生成AIモデルに入力し、プロンプト文を使用してユーザの発言を変換する。 Specific operation: The server inputs the collected text data into the generative AI model and converts the user's utterances using prompt sentences.
ステップ4: Step 4:
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザに通知する。ユーザは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
入力:カスタムチェンジされた行動や発言。 Input: Custom-changed actions and statements.
出力:ユーザに提示されたカスタムチェンジされた行動や発言。 Output: The custom-changed actions and statements presented to the user.
具体的な動作:端末は、サーバから受信したカスタムチェンジされた発言を通知として表示する。 Specific operation: The device displays the custom-changed message received from the server as a notification.
ステップ5: Step 5:
ユーザは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。 The user repeatedly executes the custom-changed actions and statements presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts.
入力:提示されたカスタムチェンジされた行動や発言。 Input: The proposed custom-changed actions and statements.
出力:ユーザが実行したカスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements performed by the user.
具体的な動作:ユーザは、友人との会話やSNS投稿で、サーバから提案された発言を使用する。これを繰り返すことで、ユーザは理想の人間像に近づくためのトレーニングを行う。 Specific operation: The user uses statements suggested by the server in conversations with friends and in social media posts. By repeating this process, the user trains to become closer to their ideal image of the person they want to be.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を身につけるためのトレーニング方法は限られており、効果的なトレーニングが難しいという課題があった。また、スタッフが理想の接客態度を実践するための具体的なガイドラインやフィードバックが不足しているため、接客品質の向上が困難であった。さらに、スタッフが自身の理想像に近づくための反復トレーニングを効率的に行う手段が求められていた。 In traditional customer service work, there were limited training methods for staff to acquire ideal customer service attitudes, making effective training difficult. Furthermore, there was a lack of specific guidelines or feedback for staff to put ideal customer service attitudes into practice, making it difficult to improve customer service quality. Furthermore, there was a need for an efficient way to provide repeated training to help staff become closer to their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングする手段と、生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する手段と、を含む。これにより、スタッフが理想の接客態度を効率的にトレーニングし、実践することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for training the ideal customer service attitude using smart glasses worn by staff performing customer service duties, and means for generating custom-changed utterances based on the ideal human image using a generative AI model. This enables staff to efficiently train in and practice the ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置またはソフトウェアである。 "Projection means" refers to a device or software that visually or audibly displays the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための装置またはソフトウェアである。 "Means for custom change" refers to a device or software that changes a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための装置またはソフトウェアである。 "Presentation means" refers to a device or software that displays custom-changed actions and statements to the user.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための装置またはソフトウェアである。 "Means for repeated training" refers to a device or software that allows the user to repeatedly practice custom-changed actions or utterances.
「接客業務」とは、顧客に対して商品やサービスを提供する業務である。 "Customer service" refers to the work of providing products and services to customers.
「スマート眼鏡」とは、情報を表示する機能を持つ眼鏡型のデバイスである。 "Smart glasses" are glasses-type devices that have the function of displaying information.
「生成AIモデル」とは、人工知能を用いてテキストや行動を生成するためのアルゴリズムである。 A "generative AI model" is an algorithm that uses artificial intelligence to generate text and behavior.
「カスタムチェンジされた発言」とは、理想の人間像に基づいて変更されたユーザーの発言である。 "Custom-changed statements" are statements made by users that have been altered based on their ideal image of a person.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするためのものである。具体的には、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングすることができる。 The system for implementing this invention projects the ideal image of a person set by the user, custom-changes the user's actions and speech, and repeatedly trains them. Specifically, it can train ideal customer service attitudes using smart glasses worn by staff performing customer service duties.
システムの構成 System Configuration
システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:
1. ユーザー端末:ユーザーが理想の人間像を設定するためのデバイス。スマートフォンやタブレットが該当する。 1. User device: The device on which the user sets their ideal image of the person. This includes smartphones and tablets.
2. スマート眼鏡:接客業務を行うスタッフが装着するデバイス。情報を視覚的に表示する機能を持つ。 2. Smart glasses: A device worn by staff performing customer service duties. It has the function of visually displaying information.
3. サーバ:生成AIモデルを実行し、ユーザーの行動や発言をカスタムチェンジするためのデータ処理を行う。 3. Server: Runs the generative AI model and processes data to custom change user behavior and speech.
4. 生成AIモデル:ユーザーの理想の人間像に基づいてカスタムチェンジされた発言を生成するアルゴリズム。 4. Generative AI model: An algorithm that generates custom-modified statements based on the user's ideal image of the person.
プログラムの処理 Program processing
サーバは、ユーザーが設定した理想の人間像を受け取り、それに基づいてユーザーの行動や発言をカスタムチェンジする。具体的には、以下の手順で処理が行われる: The server receives the user's ideal image of the person and custom-changes the user's behavior and speech based on that image. Specifically, the process is carried out as follows:
1. 理想の人間像の設定:ユーザー端末を用いて、ユーザーが理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想像として設定する。 1. Setting the ideal person: Using the user device, the user sets the ideal person. For example, they can set "kind and polite customer service" as their ideal image.
2. ユーザーの発言の入力:ユーザーが実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」という発言。 2. Enter user utterances: Enter actual utterances made by the user. For example, "Welcome, are you looking for something?"
3. 生成AIモデルの実行:サーバは生成AIモデルを用いて、理想の人間像に基づいたカスタムチェンジされた発言を生成する。 3. Execution of the generative AI model: The server uses the generative AI model to generate custom-modified utterances based on the ideal human image.
4. カスタムチェンジされた発言の提示:スマート眼鏡を通じて、カスタムチェンジされた発言をユーザーに提示する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言。 4. Present customized speech: Present customized speech to the user through smart glasses. For example, "Welcome, we'll help you find the product you're looking for."
5. 反復トレーニング:ユーザーは提示されたカスタムチェンジされた発言を反復して練習する。 5. Repetitive training: Users repeatedly practice the custom-modified utterances presented to them.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア:スマート眼鏡(例:Google Glass)、ユーザー端末(スマートフォン、タブレット) Hardware: Smart glasses (e.g., Google Glass), user devices (smartphones, tablets)
ソフトウェア:生成AIモデル(例:OpenAI API)、データ処理サーバ Software: Generative AI models (e.g., OpenAI API), data processing servers
具体例 Specific examples
例えば、接客スタッフが「親切で丁寧な接客」を理想像として設定し、以下のようなプロンプト文を使用する: For example, let's say the ideal customer service staff member is "friendly and courteous service," and use the following prompt:
プロンプト文の例: Example prompt:
理想の人間像: 親切で丁寧な接客 Ideal personality: Kind and courteous customer service
ユーザーの発言: いらっしゃいませ、何かお探しですか? User says: Welcome, are you looking for something?
理想の人間像に基づいたカスタムチェンジされた発言: Custom-changed statements based on the ideal person:
このプロンプト文を生成AIモデルに入力することで、理想の接客態度に基づいたカスタムチェンジされた発言を生成する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」のような発言が生成される。 By inputting this prompt into the generative AI model, a custom-modified utterance based on the ideal customer service attitude is generated. For example, a utterance such as, "Welcome, we'll help you find the product you're looking for" is generated.
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する。 The user sets their ideal image of the person.
入力:ユーザーが端末(スマートフォンやタブレット)を使用して、理想の人間像を入力する。例えば、「親切で丁寧な接客」。 Input: The user uses a device (smartphone or tablet) to input their ideal image of a person. For example, "kind and polite customer service."
データ加工:端末は入力された理想の人間像をサーバに送信する。 Data processing: The device sends the input image of the ideal person to the server.
出力:サーバに理想の人間像が保存される。 Output: The ideal image of a person is saved on the server.
ステップ2: Step 2:
ユーザーが実際の発言を入力する。 The user enters the actual statement.
入力:ユーザーが端末を使用して、実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」。 Input: The user uses the device to type what they actually say. For example, "Welcome, is there anything I can help you with?"
データ加工:端末は入力された発言をサーバに送信する。 Data processing: The device sends the entered comments to the server.
出力:サーバにユーザーの発言が保存される。 Output: User comments are saved on the server.
ステップ3: Step 3:
サーバが生成AIモデルを実行する。 The server runs the generative AI model.
入力:サーバは保存された理想の人間像とユーザーの発言を取得する。 Input: The server retrieves the stored ideal person image and user statements.
データ演算:サーバは生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する。プロンプト文を生成AIモデルに入力し、カスタムチェンジされた発言を得る。 Data calculation: The server uses the generative AI model to generate custom-changed utterances based on the ideal human image. The prompt text is input into the generative AI model to obtain the custom-changed utterances.
出力:生成されたカスタムチェンジされた発言がサーバに保存される。 Output: The generated custom-changed comments are saved on the server.
ステップ4: Step 4:
カスタムチェンジされた発言をユーザーに提示する。 Present the custom-changed statement to the user.
入力:サーバは生成されたカスタムチェンジされた発言を取得する。 Input: The server receives the generated custom-changed statement.
データ加工:サーバはカスタムチェンジされた発言をスマート眼鏡に送信する。 Data processing: The server sends the custom-modified speech to the smart glasses.
出力:スマート眼鏡にカスタムチェンジされた発言が表示される。 Output: The custom-changed speech is displayed on the smart glasses.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う。 Users perform repetitive training.
入力:ユーザーはスマート眼鏡に表示されたカスタムチェンジされた発言を確認する。 Input: The user sees the custom-changed speech displayed on the smart glasses.
具体的な動作:ユーザーは表示された発言を繰り返し練習する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言を練習する。 Specific behavior: The user repeatedly practices the displayed utterance. For example, they practice saying, "Welcome, we'd love to help you find the product you're looking for."
出力:ユーザーの接客態度が理想の人間像に近づく。 Output: The user's customer service attitude becomes closer to the ideal person.
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
「形態例1」 "Example 1"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
「形態例2」 "Example 2"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがシステムを起動し、自身の理想像を設定する。この理想像は、ユーザーがどのような行動を取り、どのような発言をするかを具体的に示すものである。 Step 1: The user starts the system and sets their ideal self. This ideal self specifically describes how the user will behave and what they will say.
ステップ2:感情エンジンがユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。 Step 2: The emotion engine analyzes the user's emotional state in real time. Specifically, it infers the user's emotional state from their facial expressions, tone of voice, choice of words, etc.
ステップ3:感情エンジンがユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。 Step 3: The emotion engine tracks changes in the user's emotional state. This allows the content of the repetitive training to help the user approach their ideal self to be tailored to the user's emotional state.
ステップ4:ユーザーが自身の理想像に近づくための反復トレーニングを行う。このトレーニングは、ユーザーの感情状態に応じて調整される。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。 Step 4: The user undergoes repeated training to move closer to their ideal self. This training is adjusted according to the user's emotional state. For example, when the user is feeling stressed, training is provided to promote relaxation. On the other hand, when the user is feeling joy, training is provided to encourage behavior that shares that joy.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来のシステムでは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジすることが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、ユーザーが自身の理想像に近づくための効果的なサポートが不足しているという課題があった。 Previous systems had the problem that it was difficult to customise behaviour and speech based on the ideal image of the person set by the user, and the training content was not adjusted according to the user's emotional state, resulting in a lack of effective support to help users get closer to their ideal image.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンから得られたデータを基にトレーニング内容を調整する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための効果的なサポートが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, and means for adjusting the training content based on data obtained from the emotion engine. This enables effective support for the user to get closer to their ideal image.
「ユーザー」とは、システムを利用して自身の理想の人間像に近づくことを目指す個人を指す。 "User" refers to an individual who uses the system to aim to become closer to their ideal image of a person.
「理想の人間像」とは、ユーザーが目標とする人格や行動特性を具体的に設定したものである。 An "ideal person" is a specific set of personality and behavioral characteristics that a user aspires to.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキスト形式で表示する機能を指す。 "Projection means" refers to the function that displays the user's ideal image of a person in visual or text form on the system.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更・調整する機能を指す。 "Means for customizing" refers to the ability to change and adjust a user's behavior and comments based on their ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知または表示する機能を指す。 "Means of presentation" refers to the function of notifying or displaying custom-changed actions or comments to the user.
「反復トレーニングする手段」とは、ユーザーが提示されたカスタムチェンジを基に繰り返し練習する機能を指す。 "Means for repeated training" refers to a function that allows users to repeatedly practice based on the custom changes presented to them.
「感情エンジン」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態をリアルタイムで分析する機能を指す。 The "emotion engine" refers to a function that analyzes a user's emotional state in real time based on their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を変更・調整する機能を指す。 "Means for adjusting training content" refers to the function that changes and adjusts training content according to the user's emotional state based on data obtained from the emotion engine.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: ユーザーが使用するスマートフォン、タブレット、またはPC。 Device: The smartphone, tablet, or PC used by the user.
サーバ: データ処理およびストレージを行うためのクラウドサーバ。 Server: Cloud server for data processing and storage.
カメラおよびマイク: ユーザーの顔表情や声のトーンをリアルタイムでキャプチャするためのデバイス。 Camera and microphone: Devices that capture your facial expressions and tone of voice in real time.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供する。 Application: Provides an interface that allows users to define their ideal person and review their custom-changed behavior and statements.
感情エンジン: ユーザーの感情状態をリアルタイムで分析するためのソフトウェアモジュール。 Emotion engine: A software module for analyzing a user's emotional state in real time.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのAIモデル。 Generative AI model: An AI model that custom-changes a user's behavior and speech based on an ideal human image.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を選択する。 The user launches the application and sets their ideal image of the person. For example, they can select "a compassionate person."
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。これには、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容が含まれる。 The server collects input data, voice data, and text messages from users' smartphones and PCs in real time, including what users chat with friends and what they say to their voice assistants.
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。 The server analyzes the collected data using natural language processing (NLP) technology. For example, if a user says "thank you" infrequently, the server will suggest that they say "thank you" more frequently.
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。例えば、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。 The server then uses the application's notification function to present the custom-changed actions and comments to the user. For example, it could send a notification such as, "Try saying 'Thank you' the next time you talk to a friend."
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。これを繰り返すことで、ユーザーは「思いやりのある人」に近づく。 Based on suggestions from the server, users are made conscious of saying "thank you" more often in their daily lives. By repeating this, users become closer to becoming "considerate people."
感情エンジンがユーザーの感情状態を分析する The emotion engine analyzes the user's emotional state.
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。例えば、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。 The emotion engine uses the user's smartphone camera and microphone to analyze facial expressions and tone of voice in real time. For example, if a user is smiling while speaking, the emotion engine will determine that the user is feeling happy.
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。 The server uses data obtained from the emotion engine to adjust the training content according to the user's emotional state. For example, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax."
具体例 Specific examples
理想の人間像設定 Defining the ideal person
ユーザーがアプリケーションを開き、「思いやりのある人」を理想の人間像として設定する。 The user opens the application and sets "a compassionate person" as their ideal person.
カスタムチェンジの例 Custom Change Example
サーバは、ユーザーが友人と会話する際に「ありがとう」と言う頻度を増やすように提案する。 The server suggests that users say "thank you" more frequently when conversing with friends.
感情エンジンの分析 Emotion Engine Analysis
ユーザーが会話中に笑顔を見せている場合、感情エンジンはユーザーが喜びを感じていると判断する。 If a user smiles during a conversation, the emotion engine will determine that the user is feeling happy.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じている場合、サーバは深呼吸や瞑想を促すトレーニングを提供する。 If the user is feeling stressed, the server will provide deep breathing and meditation training.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのような行動や発言をカスタムチェンジするか提案してください。」 "If the user sets their ideal person as 'a considerate person,' please suggest what actions and statements they would like to customize."
このシステムは、ユーザーが自身の理想像に近づくための具体的な行動や発言を提供し、感情状態に応じたトレーニングを行うことで、ユーザーの成長をサポートする。 The system supports users' growth by providing them with specific actions and statements to help them become closer to their ideal self, and by providing training tailored to their emotional state.
実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションの設定画面で「思いやりのある人」などの選択肢から理想の人間像を選び、設定を保存する。入力はユーザーの選択した理想の人間像であり、出力は設定された理想の人間像のデータである。 The user launches the application and sets their ideal person. Specifically, they select their ideal person from options such as "a considerate person" on the application's settings screen and save the settings. The input is the ideal person selected by the user, and the output is data for the set ideal person.
ステップ2: Step 2:
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。具体的には、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーの行動データであり、出力は収集された行動データのデータベースである。 The server collects input data, voice data, and text messages from the user's smartphone or PC in real time. Specifically, it collects what the user chats with friends and what they say to their voice assistant. The input is user behavioral data, and the output is a database of the collected behavioral data.
ステップ3: Step 3:
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。具体的には、生成AIモデルを使用して、ユーザーの行動や発言を理想の人間像に基づいて変更する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。入力は収集された行動データであり、出力はカスタムチェンジされた行動や発言の提案である。 The server analyzes the collected data using natural language processing (NLP) technology. Specifically, it uses a generative AI model to change the user's behavior and speech based on the ideal person. For example, if the user says "thank you" infrequently, the server will suggest that they say "thank you" more often. The input is the collected behavioral data, and the output is suggested custom-changed behaviors and speech.
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。具体的には、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。入力はカスタムチェンジされた行動や発言の提案であり、出力はユーザーへの通知である。 The server presents the custom-changed actions and utterances to the user using the application's notification function. Specifically, it sends a notification such as, "Try saying 'thank you' the next time you talk to a friend." The input is a suggestion for a custom-changed action or utterance, and the output is a notification to the user.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。具体的には、友人や家族との会話で「ありがとう」と言う機会を増やす。入力はサーバからの提案であり、出力はユーザーの実際の行動である。 Based on suggestions from the server, users are made conscious to say "thank you" more frequently in their daily lives. Specifically, they increase the number of opportunities to say "thank you" in conversations with friends and family. The input is the suggestions from the server, and the output is the user's actual behavior.
ステップ6: Step 6:
感情エンジンがユーザーの感情状態を分析する Emotion engine analyzes the user's emotional state
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。具体的には、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。入力はユーザーの顔表情や声のトーンであり、出力は分析された感情状態のデータである。 The emotion engine uses the camera and microphone on the user's smartphone to analyze facial expressions and tone of voice in real time. Specifically, if the user is smiling and talking, the emotion engine determines that the user is feeling happy. The input is the user's facial expressions and tone of voice, and the output is data on the analyzed emotional state.
ステップ7: Step 7:
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。具体的には、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。入力は分析された感情状態のデータであり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state based on the data obtained from the emotion engine. Specifically, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax." The input is the analyzed emotional state data, and the output is the adjusted training content.
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的なフィードバックが不足しており、また、スタッフの感情状態に応じたトレーニング内容の調整が行われていないため、効果的なトレーニングが難しいという課題があった。 Conventional customer service training systems lacked specific feedback to help staff develop ideal customer service attitudes, and training content was not adjusted to reflect the emotional state of staff, making it difficult to provide effective training.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、ユーザーの感情状態に応じてトレーニング内容を調整する手段と、スマートデバイスを用いてユーザーにフィードバックを提供する手段と、を含む。これにより、スタッフが理想の接客態度を効果的に身につけることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, means for adjusting the training content according to the user's emotional state, and means for providing feedback to the user using a smart device. This enables staff to effectively acquire the ideal customer service attitude.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言のトレーニングを行う個人である。 A "user" is an individual who uses the system to train themselves to behave and speak in a way that reflects their ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な行動や態度のモデルである。 The "ideal person" is a model of specific behaviors and attitudes that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に提示するための方法や装置である。 "Projection means" refers to a method or device for visually or audibly presenting the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための方法や装置である。 "Means for custom change" refers to methods or devices for changing a user's behavior and speech based on an ideal image of a person.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジされた行動や発言を繰り返し練習するための方法や装置である。 "Means for repeated training" refers to methods or devices that allow users to repeatedly practice custom-changed actions and speech in order to become closer to their ideal image of the person.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情を推定するための方法や装置である。 "Means for analyzing emotional states in real time" refers to methods or devices for inferring emotions from a user's facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容を変更するための方法や装置である。 "Means for adjusting training content" refers to a method or device for changing the training content according to the user's emotional state.
「スマートデバイス」とは、カメラ、マイク、スピーカーなどを内蔵し、ユーザーにフィードバックを提供するためのデバイスである。 A "smart device" is a device that has a built-in camera, microphone, speaker, etc. and is used to provide feedback to the user.
「フィードバックを提供する手段」とは、ユーザーに対して理想の行動や発言に関するアドバイスや指示を提供するための方法や装置である。 "Means for providing feedback" refers to methods or devices for providing users with advice or instructions regarding ideal behavior or speech.
この発明を実施するための形態として、実店舗で働くスタッフが理想の接客態度を身につけるためのトレーニングシステムを提供する。システムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための手段を含む。また、ユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する手段も含まれる。 As an embodiment of this invention, we provide a training system that helps staff working in brick-and-mortar stores acquire ideal customer service attitudes. The system includes means for projecting an ideal image of a person set by the user, customizing the user's behavior and speech, and repeatedly training them. It also includes means for analyzing the user's emotional state in real time and adjusting the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア Hardware
スマート眼鏡: カメラ、マイク、スピーカーを内蔵し、ユーザーの行動や発言をキャプチャし、フィードバックを提供する。 Smart glasses: Equipped with a camera, microphone, and speaker, they capture the user's actions and speech and provide feedback.
サーバ: データ処理と分析を行うための中央処理装置。 Server: A central processing unit for data processing and analysis.
ソフトウェア Software
OpenCV: カメラ映像のキャプチャと処理を行うライブラリ。 OpenCV: A library for capturing and processing camera images.
EmotionRecognizer: 顔表情から感情を推定するライブラリ。 EmotionRecognizer: A library that estimates emotions from facial expressions.
SpeechRecognition: 音声認識ライブラリ。 SpeechRecognition: Speech recognition library.
TextToSpeech: テキストを音声に変換するライブラリ。 TextToSpeech: A library for converting text to speech.
IdealBehaviorModel: 理想の行動や発言を生成するモデル。 IdealBehaviorModel: A model that generates ideal behaviors and statements.
データ加工と演算 Data processing and calculations
カメラ映像のキャプチャ Camera footage capture
スマート眼鏡のカメラを使用して、ユーザーの顔表情や行動をリアルタイムでキャプチャする。OpenCVを用いて映像データを取得し、EmotionRecognizerで感情状態を分析する。 The camera in the smart glasses is used to capture the user's facial expressions and behavior in real time. OpenCV is used to acquire video data, and EmotionRecognizer is used to analyze the emotional state.
音声認識 Voice recognition
スマート眼鏡のマイクを使用して、ユーザーの発言をキャプチャする。SpeechRecognitionライブラリを用いて音声データをテキストに変換する。 Use the microphone in the smart glasses to capture what the user is saying. Use the SpeechRecognition library to convert the speech data into text.
フィードバック生成 Feedback generation
IdealBehaviorModelを使用して、ユーザーの感情状態と発言に基づいた理想の行動や発言を生成する。生成されたフィードバックはTextToSpeechライブラリを用いて音声に変換され、スマート眼鏡のスピーカーを通じてユーザーに提供される。 Using IdealBehaviorModel, ideal behaviors and utterances are generated based on the user's emotional state and utterances. The generated feedback is converted into speech using the TextToSpeech library and provided to the user through the smart glasses' speakers.
具体例 Specific examples
シナリオ Scenario
実店舗で働くスタッフが「思いやりのある接客」を目指してトレーニングを行う。 Staff working in physical stores will receive training aimed at providing "considerate customer service."
状況 situation
顧客が商品について質問した際、スタッフが適切な対応を行う。 When customers ask questions about products, staff will respond appropriately.
フィードバック Feedback
スタッフがストレスを感じている場合、システムはリラクゼーションを促すアドバイスを提供する。 If staff are feeling stressed, the system will provide advice to encourage relaxation.
プロンプト文の例 Example prompt
ユーザーが「思いやりのある接客」を目指している場合、顧客からの質問に対してどのように対応すれば良いかを教えてください。ユーザーがストレスを感じている場合は、リラクゼーションを促すアドバイスも提供してください。 If the user aims to provide "caring customer service," tell them how to respond to customer questions. If the user is feeling stressed, provide them with advice on how to promote relaxation.
このようにして、実店舗での接客トレーニングを効果的に行うことができる。 In this way, customer service training can be carried out effectively in physical stores.
応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.
ステップ1: Step 1:
ユーザがスマート眼鏡を装着し、システムを起動する。スマート眼鏡のカメラがユーザの顔表情や行動をリアルタイムでキャプチャし、マイクがユーザの発言をキャプチャする。入力はカメラ映像と音声データであり、出力はキャプチャされた映像と音声データである。 The user puts on the smart glasses and starts the system. The smart glasses' camera captures the user's facial expressions and actions in real time, and the microphone captures the user's speech. The input is camera video and audio data, and the output is the captured video and audio data.
ステップ2: Step 2:
サーバがOpenCVを使用して、スマート眼鏡から送信された映像データを処理する。具体的には、映像データからユーザの顔表情を抽出し、EmotionRecognizerを用いて感情状態を分析する。入力はキャプチャされた映像データであり、出力はユーザの感情状態である。 The server uses OpenCV to process the video data sent from the smart glasses. Specifically, it extracts the user's facial expressions from the video data and analyzes their emotional state using EmotionRecognizer. The input is the captured video data, and the output is the user's emotional state.
ステップ3: Step 3:
サーバがSpeechRecognitionライブラリを使用して、スマート眼鏡から送信された音声データをテキストに変換する。入力はキャプチャされた音声データであり、出力はテキストデータである。 The server uses the SpeechRecognition library to convert the voice data sent from the smart glasses into text. The input is the captured voice data, and the output is text data.
ステップ4: Step 4:
サーバがIdealBehaviorModelを使用して、ユーザの感情状態とテキストデータに基づいて理想の行動や発言を生成する。入力はユーザの感情状態とテキストデータであり、出力は理想の行動や発言のテキストである。 The server uses IdealBehaviorModel to generate ideal behaviors and statements based on the user's emotional state and text data. The input is the user's emotional state and text data, and the output is the text of the ideal behavior or statement.
ステップ5: Step 5:
サーバがTextToSpeechライブラリを使用して、生成された理想の行動や発言のテキストを音声に変換する。入力は理想の行動や発言のテキストであり、出力は音声データである。 The server uses the TextToSpeech library to convert the generated text of ideal actions and statements into speech. The input is the text of the ideal actions and statements, and the output is audio data.
ステップ6: Step 6:
スマート眼鏡のスピーカーを通じて、サーバから送信された音声データをユーザに提供する。入力は音声データであり、出力はユーザが聞く音声フィードバックである。 Audio data sent from the server is provided to the user through the smart glasses' speakers. The input is audio data, and the output is audio feedback heard by the user.
ステップ7: Step 7:
ユーザが提供されたフィードバックに基づいて行動や発言を修正し、再度スマート眼鏡のカメラとマイクを通じて新しいデータをキャプチャする。これにより、ステップ1からステップ6までの処理が繰り返される。入力は修正された行動や発言の映像と音声データであり、出力は新たなフィードバックである。 The user modifies their actions or statements based on the provided feedback, and new data is captured again through the smart glasses' camera and microphone. This repeats the process from step 1 to step 6. The input is video and audio data of the modified actions or statements, and the output is new feedback.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来のシステムでは、ユーザーが自身の理想の人間像に近づくための具体的な行動や発言のカスタマイズが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、効果的なトレーニングが実現できないという課題があった。さらに、ユーザーの感情状態をリアルタイムで分析し、それに基づいてトレーニング内容を調整する機能が欠如していたため、ユーザーの心理的負担を軽減しながら理想像に近づくことが困難であった。 Previous systems had issues with being unable to provide effective training because it was difficult for users to customize the specific actions and comments that would bring them closer to their ideal image of the person they wanted, and the training content was not adjusted according to the user's emotional state. Furthermore, the lack of a function to analyze the user's emotional state in real time and adjust the training content based on that analysis made it difficult to bring users closer to their ideal image while reducing the psychological burden.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、該感情状態に応じてトレーニング内容を調整する手段と、を含む。これにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, and means for adjusting the training content in accordance with the emotional state. This allows the user to receive effective training to approach their ideal image.
「理想の人間像」とは、ユーザーが目指すべき人物像や性格特性を指す。 "Ideal person" refers to the type of person or personality traits that the user should aim to become.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置やソフトウェアを指す。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムを指す。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知するための装置やソフトウェアを指す。 "Means of presentation" refers to devices or software used to notify users of custom-changed actions or statements.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するためのプログラムやシステムを指す。 "Means for repeated training" refers to a program or system that allows users to repeatedly practice custom-changed actions and utterances.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などを解析して感情状態を推定するための装置やソフトウェアを指す。 "Means for analyzing emotional state in real time" refers to devices or software that estimate a user's emotional state by analyzing their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容や方法を変更するためのアルゴリズムやプログラムを指す。 "Means for adjusting training content" refers to algorithms or programs that change the content or method of training according to the user's emotional state.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
システムの構成 System Configuration
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを使用して、自身が目指す理想の人間像を設定する。例えば、「思いやりのある人」を選択する。この設定は、ユーザーの人間関係のトラウマや教養等を考慮して行われる。 Using an application on their device, users can set the ideal person they aspire to be. For example, they can select "a compassionate person." This setting takes into account the user's interpersonal trauma, education, etc.
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。これには、ユーザーが入力したテキストや音声データが含まれる。例えば、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。 The server collects user actions and statements in real time, including text and voice data entered by the user. For example, it collects what users say to friends in chat apps and what they say to voice assistants.
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、自然言語処理(NLP)技術を用いて、ユーザーの発言内容を理解する。ここでは、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用する。 The server analyzes the collected data. Specifically, it uses natural language processing (NLP) technology to understand what the user is saying. It uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4.
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server customizes your actions and speech based on your ideal image of a person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 Based on the analysis results, the server custom-changes the user's actions and comments to match their ideal image of a person. For example, "I'm busy today, so I can't help you" could be changed to "I'm busy today, but please let me know if there's anything I can do to help."
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。 The server presents the custom-changed actions and comments to the user, who can review them and make any necessary corrections.
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。Microsoft AzureのEmotion APIやAffectivaのSDKを使用する。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it analyzes the user's facial expressions, tone of voice, choice of words, etc. It uses Microsoft Azure's Emotion API and Affectiva's SDK.
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it will provide training to promote relaxation, and if the user is feeling joy, it will provide training to encourage behavior that encourages sharing that joy.
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。 The user performs the training content presented by the server. This allows the user to undergo repeated training to get closer to their ideal self.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーがアプリケーションを開き、「理想の人間像を設定」を選択し、「思いやりのある人」を選ぶ。 The user opens the application, selects "Set your ideal person," and chooses "A compassionate person."
行動や発言の収集 Collecting actions and statements
ユーザーが友人とチャットしている内容をアプリケーションがバックグラウンドで収集する。 The application collects chat content between users and friends in the background.
データの解析 Data Analysis
サーバが収集したチャット内容をGoogle Cloud Natural Language APIで解析し、感情分析を行う。また、OpenAIのGPT-4を使用して、ユーザーの発言内容を理解し、適切な応答を生成する。 The chat content collected by the server is analyzed using the Google Cloud Natural Language API to perform sentiment analysis. It also uses OpenAI's GPT-4 to understand what the user is saying and generate appropriate responses.
カスタムチェンジの例 Custom Change Example
ユーザーが「今日は忙しいから手伝えない」と言った場合、サーバがこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 If the user says, "I'm busy today and can't help," the server changes this to "I'm busy today, but please let me know if there's anything I can do to help."
感情エンジンの分析 Emotion Engine Analysis
ユーザーがカメラに向かって話しているとき、サーバがMicrosoft AzureのEmotion APIを使用して、ユーザーの顔表情や声のトーンからストレスを感じていると判断する。 When a user speaks into the camera, the server uses Microsoft Azure's Emotion API to determine whether the user is feeling stressed based on their facial expressions and tone of voice.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じているとき、サーバが「深呼吸をしてリラックスしましょう」といったリラクゼーショントレーニングを提供する。 When a user is feeling stressed, the server provides relaxation training such as "Take a deep breath and relax."
トレーニングの実行 Running the training
ユーザーがサーバから提示されたリラクゼーショントレーニングを実行する。 The user performs relaxation training presented by the server.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのように行動や発言をカスタムチェンジするか教えてください。」 "If a user sets their ideal person as 'a considerate person,' how would they customize their actions and words?"
このシステムにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることができる。 This system allows users to receive effective training to bring them closer to their ideal self.
実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのメニューから「理想の人間像を設定」を選択し、「思いやりのある人」などの選択肢から理想の人間像を選ぶ。入力はユーザーの選択した理想の人間像であり、出力はその設定情報である。 The user launches the application on their device and sets their ideal person. Specifically, they select "Set ideal person" from the application menu and choose their ideal person from options such as "a considerate person." The input is the ideal person selected by the user, and the output is that setting information.
ステップ2: Step 2:
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。具体的には、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーのテキストデータや音声データであり、出力は収集された行動や発言のデータである。 The server collects user behavior and speech in real time. Specifically, it collects the content of user conversations with friends on chat apps and what users say to voice assistants. The input is the user's text data and voice data, and the output is the collected behavior and speech data.
ステップ3: Step 3:
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用して、ユーザーの発言内容を理解し、感情分析やキーフレーズ抽出を行う。入力は収集された行動や発言のデータであり、出力は解析結果である。 The server analyzes the collected data. Specifically, it uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4 to understand what users say and perform sentiment analysis and key phrase extraction. The input is the collected behavioral and utterance data, and the output is the analysis results.
ステップ4: Step 4:
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server custom-changes your behavior and speech based on your ideal person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。入力は解析結果であり、出力はカスタムチェンジされた行動や発言である。 Based on the analysis results, the server custom-changes the user's actions and comments to match the ideal person. For example, "I'm busy today, so I can't help you" is changed to "I'm busy today, but please let me know if there's anything I can do to help." The input is the analysis results, and the output is the custom-changed actions and comments.
ステップ5: Step 5:
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。入力はカスタムチェンジされた行動や発言であり、出力はユーザーに提示された内容である。 The server presents the custom-changed actions and statements to the user, who can review them and make corrections as necessary. The input is the custom-changed actions and statements, and the output is the content presented to the user.
ステップ6: Step 6:
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、Microsoft AzureのEmotion APIやAffectivaのSDKを使用して、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。入力はユーザーの顔表情や声のトーン、言葉の選び方であり、出力は感情状態の分析結果である。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it uses Microsoft Azure's Emotion API and Affectiva's SDK to analyze the user's facial expressions, tone of voice, choice of words, etc. The input is the user's facial expressions, tone of voice, and choice of words, and the output is the analysis of the user's emotional state.
ステップ7: Step 7:
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。入力は感情状態の分析結果であり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it provides training to promote relaxation, and if the user is feeling happy, it provides training to encourage behavior that shares that joy. The input is the analysis result of the emotional state, and the output is the adjusted training content.
ステップ8: Step 8:
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。入力は調整されたトレーニング内容であり、出力はユーザーの実行結果である。 The user performs the training content presented by the server. This allows the user to undergo repeated training to approach their ideal self. The input is the adjusted training content, and the output is the user's execution results.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the headset-type terminal 314 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を維持することは難しく、特に感情状態が不安定な場合には顧客満足度が低下する問題があった。また、スタッフが自身の理想像に近づくためのトレーニングを効果的に行う手段が不足していた。 In traditional customer service work, it was difficult for staff to maintain an ideal customer service attitude, and customer satisfaction declined, particularly when their emotional state was unstable. Furthermore, there was a lack of effective training methods to help staff approach their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンに基づいてトレーニング内容を調整する手段と、スマート眼鏡に表示する手段と、を含む。これにより、スタッフが理想の接客態度を維持しつつ、感情状態に応じた適切なトレーニングを受けることが可能となる。 In this invention, the server includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, a means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, a means for adjusting the training content based on the emotion engine, and a means for displaying on the smart glasses. This enables staff to receive appropriate training according to their emotional state while maintaining an ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示する装置やソフトウェアである。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムである。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに知らせるための表示装置や通知システムである。 "Means of presentation" refers to a display device or notification system that notifies users of custom-changed actions and statements.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジした行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice their custom-changed actions and statements in order to become closer to their ideal image of the person they want to be.
「感情エンジン」とは、ユーザーの感情状態をリアルタイムで分析するためのソフトウェアまたはハードウェアである。 An "emotion engine" is software or hardware that analyzes a user's emotional state in real time.
「トレーニング内容を調整する手段」とは、感情エンジンの分析結果に基づいて、ユーザーに提供するトレーニングの内容を変更するための機能である。 "Means for adjusting training content" is a function for changing the content of training provided to users based on the analysis results of the emotion engine.
「スマート眼鏡」とは、ユーザーが装着することで情報を視覚的に表示することができるウェアラブルデバイスである。 "Smart glasses" are wearable devices that can visually display information when worn by the user.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための一連の手段を含む。さらに、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する機能を備えている。 The system for implementing this invention includes a series of means for projecting the ideal human image set by the user, customizing the user's behavior and speech, and repeatedly training them. It also has the ability to use an emotion engine to analyze the user's emotional state in real time and adjust the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア: スマート眼鏡、カメラ Hardware: Smart glasses, camera
ソフトウェア: OpenCV(顔検出)、EmotionRecognizer(感情認識)、BehaviorSuggestion(行動提案) Software: OpenCV (face detection), EmotionRecognizer (emotion recognition), BehaviorSuggestion (behavior suggestions)
システムの構成 System Configuration
1. ユーザーが設定した理想の人間像を投影する手段: 1. A way to project the user's ideal image of a person:
ユーザーはアプリケーションを通じて理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想とする場合、システムはこの情報を基に行動や発言をカスタムチェンジする。 Users can set their ideal image of a person through the application. For example, if their ideal is "kind and polite customer service," the system will use this information to customize their behavior and speech.
2. ユーザーの行動や発言をカスタムチェンジする手段: 2. How to customise user behaviour and comments:
システムは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するためのアルゴリズムを実行する。例えば、ユーザーがストレスを感じている場合、リラクゼーションを促す提案を行う。 The system runs algorithms to change the user's current behavior and speech based on the ideal person. For example, if the user is feeling stressed, it will make suggestions to encourage relaxation.
3. カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段: 3. A method for presenting custom-changed actions and statements to users and repeatedly training them:
カスタムチェンジされた行動や発言は、スマート眼鏡のディスプレイに表示される。ユーザーはこれを見て、理想の行動や発言を繰り返し練習する。 Custom-changed actions and speech are displayed on the smart glasses' display. Users can view these and repeatedly practice their ideal actions and speech.
4. 感情エンジン: 4. Emotion Engine:
カメラを用いてユーザーの顔表情をキャプチャし、EmotionRecognizerを用いて感情状態をリアルタイムで分析する。これにより、ユーザーの感情状態に応じたトレーニング内容を提供する。 The camera captures the user's facial expressions and EmotionRecognizer analyzes their emotional state in real time. This allows the system to provide training content tailored to the user's emotional state.
5. トレーニング内容を調整する手段: 5. Ways to adjust training content:
感情エンジンの分析結果に基づいて、BehaviorSuggestionエンジンが適切な行動や発言を提案する。例えば、ユーザーが喜びを感じている場合、その喜びを共有するような行動を促すトレーニングを提供する。 Based on the analysis results of the emotion engine, the BehaviorSuggestion engine suggests appropriate actions and statements. For example, if the user is feeling happy, it provides training to encourage behavior that shares that joy.
6. スマート眼鏡に表示する手段: 6. Display method on smart glasses:
提案された行動や発言は、スマート眼鏡のディスプレイにリアルタイムで表示される。これにより、ユーザーは接客中に理想の態度を維持することができる。 Suggested actions and comments are displayed in real time on the smart glasses' display, allowing users to maintain ideal behavior while serving customers.
具体例 Specific examples
シナリオ: 実店舗のスタッフがスマート眼鏡を装着し、接客中に「親切で丁寧な接客」を維持するための支援を受ける。 Scenario: Store staff wear smart glasses to help them maintain a "friendly and courteous" attitude while serving customers.
感情状態: スタッフがストレスを感じている場合、リラクゼーションを促す提案(例:「深呼吸をしてリラックスしましょう」)。 Emotional state: If staff are feeling stressed, offer relaxation suggestions (e.g., "Take a deep breath and relax").
行動提案: 顧客に対して「お困りのことがあれば何でもおっしゃってください」といった親切な発言を提案。 Action suggestion: Suggest a kind statement to customers such as, "Please let me know if you need any help."
プロンプト文の例 Example prompt
ユーザーが設定した理想の接客態度に基づいて、リアルタイムで行動や発言をカスタムチェンジし、スマート眼鏡のディスプレイに表示するアプリケーションを開発してください。感情エンジンを用いてユーザーの感情状態を分析し、適切なトレーニングを提供する機能も含めてください。 Develop an application that custom changes actions and comments in real time based on the ideal customer service attitude set by the user, and displays them on the smart glasses display. Include a function that uses an emotion engine to analyze the user's emotional state and provide appropriate training.
応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 is explained using Figure 18.
ステップ1: Step 1:
ユーザがアプリケーションを起動し、理想の人間像を設定する。ユーザは「親切で丁寧な接客」などの理想像を入力する。この入力データはサーバに送信され、保存される。 The user launches the application and sets their ideal image of the person. The user inputs an ideal image such as "kind and polite customer service." This input data is sent to the server and saved.
ステップ2: Step 2:
サーバは、ユーザの理想の人間像に基づいて行動や発言をカスタムチェンジするアルゴリズムを実行する。入力として理想の人間像とユーザの現在の行動データを受け取り、出力としてカスタムチェンジされた行動や発言を生成する。 The server runs an algorithm that custom-changes behavior and speech based on the user's ideal image of the person. It receives the ideal image of the person and the user's current behavioral data as input, and generates custom-changed behavior and speech as output.
ステップ3: Step 3:
サーバは、カスタムチェンジされた行動や発言をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、理想の行動や発言を実践する。 The server sends the custom-changed actions and statements to the smart glasses, which receive them and display them on the screen. The user then views these and practices their ideal actions and statements.
ステップ4: Step 4:
カメラがユーザの顔表情をキャプチャし、リアルタイムでサーバに送信する。サーバはEmotionRecognizerを用いて、入力された顔表情データからユーザの感情状態を分析する。出力として感情状態データを生成する。 The camera captures the user's facial expressions and transmits them to the server in real time. The server uses EmotionRecognizer to analyze the user's emotional state from the input facial expression data, and generates emotional state data as output.
ステップ5: Step 5:
サーバは、感情状態データに基づいてトレーニング内容を調整する。BehaviorSuggestionエンジンが感情状態データと理想の人間像を入力として受け取り、適切な行動や発言を提案する。出力として調整されたトレーニング内容を生成する。 The server adjusts the training content based on the emotional state data. The BehaviorSuggestion engine receives the emotional state data and the ideal human image as input and suggests appropriate actions and statements. The adjusted training content is generated as output.
ステップ6: Step 6:
サーバは、調整されたトレーニング内容をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、感情状態に応じたトレーニングを実践する。 The server sends the adjusted training content to the smart glasses, which receive it and display it on the screen. The user then views it and practices training that corresponds to their emotional state.
ステップ7: Step 7:
ユーザがトレーニングを実践する過程で、サーバは感情状態の変化をトラッキングし、必要に応じてトレーニング内容を再調整する。これにより、ユーザは理想の人間像に近づくための最適なトレーニングを受けることができる。 As the user practices the training, the server tracks changes in their emotional state and readjusts the training content as needed. This allows the user to receive optimal training to bring them closer to their ideal image of the person they want to be.
特定処理部290は、特定処理の結果をヘッドセット型端末314に送信する。ヘッドセット型端末314では、制御部46Aが、スピーカ240及びディスプレイ343に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the headset terminal 314. In the headset terminal 314, the control unit 46A causes the speaker 240 and display 343 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating voice, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>).
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ヘッドセット型端末314によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the headset-type terminal 314.
[第4実施形態] [Fourth embodiment]
図7には、第4実施形態に係るデータ処理システム410の構成の一例が示されている。 Figure 7 shows an example of the configuration of a data processing system 410 according to the fourth embodiment.
図7に示すように、データ処理システム410は、データ処理装置12及びロボット414を備えている。データ処理装置12の一例としては、サーバが挙げられる。 As shown in FIG. 7, the data processing system 410 includes a data processing device 12 and a robot 414. An example of the data processing device 12 is a server.
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。 The data processing device 12 includes a computer 22, a database 24, and a communication I/F 26. The computer 22 is an example of a "computer" according to the technology of the present disclosure. The computer 22 includes a processor 28, RAM 30, and storage 32. The processor 28, RAM 30, and storage 32 are connected to a bus 34. The database 24 and communication I/F 26 are also connected to the bus 34. The communication I/F 26 is connected to a network 54. Examples of the network 54 include a WAN (Wide Area Network) and/or a LAN (Local Area Network).
ロボット414は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及び制御対象443を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及び制御対象443も、バス52に接続されている。 The robot 414 includes a computer 36, a microphone 238, a speaker 240, a camera 42, a communication I/F 44, and a control target 443. The computer 36 includes a processor 46, RAM 48, and storage 50. The processor 46, RAM 48, and storage 50 are connected to a bus 52. The microphone 238, speaker 240, camera 42, and control target 443 are also connected to the bus 52.
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。 The microphone 238 receives instructions and the like from the user 20 by receiving voice uttered by the user 20. The microphone 238 captures the voice uttered by the user 20, converts the captured voice into audio data, and outputs it to the processor 46. The speaker 240 outputs audio in accordance with instructions from the processor 46.
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。 Camera 42 is a small digital camera equipped with an optical system including a lens, aperture, and shutter, and an imaging element such as a CMOS (Complementary Metal-Oxide-Semiconductor) image sensor or a CCD (Charge Coupled Device) image sensor, and captures images of the user 20's surroundings (e.g., an imaging range defined by an angle of view equivalent to the field of vision of a typical healthy person).
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。 The communication I/F 44 is connected to the network 54. The communication I/Fs 44 and 26 are responsible for the exchange of various information between the processor 46 and the processor 28 via the network 54. The exchange of various information between the processor 46 and the processor 28 using the communication I/Fs 44 and 26 is carried out in a secure manner.
制御対象443は、表示装置、目部のLED、並びに、腕、手及び足等を駆動するモータ等を含む。ロボット414の姿勢や仕草は、腕、手及び足等のモータを制御することにより制御される。ロボット414の感情の一部は、これらのモータを制御することにより表現できる。また、ロボット414の目部のLEDの発光状態を制御することによっても、ロボット414の表情を表現できる。 The control object 443 includes a display device, LEDs in the eyes, and motors that drive the arms, hands, and feet. The posture and gestures of the robot 414 are controlled by controlling the motors of the arms, hands, and feet. Some of the emotions of the robot 414 can be expressed by controlling these motors. In addition, the facial expressions of the robot 414 can also be expressed by controlling the light emission state of the LEDs in the eyes of the robot 414.
図8には、データ処理装置12及びロボット414の要部機能の一例が示されている。図8に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。 Figure 8 shows an example of the main functions of the data processing device 12 and the robot 414. As shown in Figure 8, in the data processing device 12, specific processing is performed by the processor 28. A specific processing program 56 is stored in the storage 32.
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。 The specific processing program 56 is an example of a "program" according to the technology of the present disclosure. The processor 28 reads the specific processing program 56 from the storage 32 and executes the read specific processing program 56 on the RAM 30. The specific processing is realized by the processor 28 operating as the specific processing unit 290 in accordance with the specific processing program 56 executed on the RAM 30.
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。 Storage 32 stores a data generation model 58 and an emotion identification model 59. The data generation model 58 and the emotion identification model 59 are used by the identification processing unit 290.
ロボット414では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。 In the robot 414, the reception output process is performed by the processor 46. A reception output program 60 is stored in the storage 50. The processor 46 reads the reception output program 60 from the storage 50 and executes the read reception output program 60 on the RAM 48. The reception output process is realized by the processor 46 operating as the control unit 46A in accordance with the reception output program 60 executed on the RAM 48.
次に、データ処理装置12の特定処理部290による特定処理について説明する。 Next, we will explain the identification process performed by the identification processing unit 290 of the data processing device 12.
「形態例1」 "Example 1"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
「形態例2」 "Example 2"
本発明のシステムは、ユーザーが設定した理想の人間像を投影する手段、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含む。具体的には、ユーザーがアプリケーション上で理想の人間像を設定する。例えば、理想の人間像として「思いやりのある人」を設定した場合、システムはユーザーの行動や発言を「思いやりのある人」に基づいてカスタムチェンジする。その後、システムはカスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングすることで、ユーザーが自身の理想像に近づくことを促進する。 The system of the present invention includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them. Specifically, the user sets an ideal human image on the application. For example, if the user sets a "compassionate person" as their ideal human image, the system custom-changes the user's actions and speech based on the "compassionate person." The system then presents the custom-changed actions and speech to the user and repeatedly trains them, encouraging the user to approach their ideal image.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがアプリケーション上で理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 Step 1: The user sets their ideal person in the application. For example, they can set "a compassionate person" as their ideal person.
ステップ2:システムがユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。具体的には、「思いやりのある人」に基づいてユーザーの行動や発言を分析し、それに適した行動や発言を生成する。 Step 2: The system custom-changes the user's behavior and comments based on the ideal image of a person. Specifically, it analyzes the user's behavior and comments based on the image of a "compassionate person" and generates appropriate behavior and comments.
ステップ3:システムがカスタムチェンジした行動や発言をユーザーに提示する。例えば、ユーザーが他人に対して思いやりのある行動をとるようにアドバイスを提供する。 Step 3: The system presents the user with the customized actions and statements. For example, it may provide advice to encourage the user to behave more considerately toward others.
ステップ4:ユーザーが提示された行動や発言を反復トレーニングする。これにより、ユーザーは自身の理想像に近づくことが可能となる。 Step 4: The user repeatedly practices the suggested actions and statements, allowing them to get closer to their ideal self.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来の自己改善システムでは、ユーザーが設定した理想の人間像に基づいて具体的な行動や発言をカスタムチェンジすることが難しく、またその反復トレーニングの進捗を効果的に記録しフィードバックを提供する手段が不足している。このため、ユーザーが自身の理想像に近づくための効果的なサポートが提供されていないという課題がある。 Existing self-improvement systems have difficulty customizing specific actions and speech based on the ideal person the user sets, and lack a means to effectively record the progress of this repetitive training and provide feedback. This poses a challenge in that they do not provide effective support to help users get closer to their ideal self.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、生成AIモデルを用いて該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、該反復トレーニングの進捗を記録し、フィードバックを提供する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための具体的な行動や発言を学び、実践し、その進捗を効果的に管理することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image using a generative AI model, means for presenting the custom-changed actions and speech to the user and repeatedly training them, and means for recording the progress of the repeated training and providing feedback. This enables the user to learn and practice specific actions and speech that will bring them closer to their ideal image, and effectively manage their progress.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「生成AIモデル」とは、人工知能を用いてデータを生成し、ユーザーの行動や発言をカスタムチェンジするためのアルゴリズムやプログラムを指す。 A "generative AI model" refers to an algorithm or program that uses artificial intelligence to generate data and custom-change user behavior and speech.
「カスタムチェンジ」とは、ユーザーの行動や発言を理想の人間像に基づいて変更することを指す。 "Custom Change" refers to changing a user's behavior and words based on an ideal image of a person.
「反復トレーニング」とは、ユーザーが提示されたカスタムチェンジされた行動や発言を繰り返し実践することを指す。 "Repeated training" refers to the user repeatedly practicing the custom-changed actions and utterances that are presented to them.
「フィードバック」とは、ユーザーの反復トレーニングの進捗に基づいて提供される評価やアドバイスを指す。 "Feedback" refers to evaluations and advice provided based on the user's progress through repeated training.
「進捗を記録する」とは、ユーザーが行った反復トレーニングの内容や成果をデータとして保存することを指す。 "Recording progress" refers to saving the content and results of the user's repeated training as data.
「提示する」とは、サーバが生成したカスタムチェンジされた行動や発言をユーザーに見せることを指す。 "Presenting" refers to showing the custom-changed actions and statements generated by the server to the user.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それを反復トレーニングすることでユーザーが自身の理想像に近づくことを促進するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes actions and speech based on the ideal person image set by the user, and encourages the user to approach their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: スマートフォン、パソコン、タブレットなどのユーザーが操作するデバイス。 Device: A device operated by the user, such as a smartphone, computer, or tablet.
サーバ: データ処理および生成AIモデルの実行を行うためのサーバ。 Server: A server for processing data and running generative AI models.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供するソフトウェア。 Application: Software that provides an interface for users to define their ideal person and review their custom-changed behavior and statements.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのアルゴリズム。具体的には、OpenAIのGPT-4などの生成AIモデルを使用する。 Generative AI model: An algorithm that custom-changes a user's behavior and speech based on an ideal human image. Specifically, it uses a generative AI model such as OpenAI's GPT-4.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を理想の人間像として設定する。 The user launches the application and sets their ideal image of a person. For example, they can set "a considerate person" as their ideal image of a person.
端末が設定データをサーバに送信する The device sends configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。このデータには、ユーザーの選択した理想の人間像に関する情報が含まれる。 The device sends data about the ideal person set by the user to the server. This data includes information about the ideal person selected by the user.
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信したデータを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データを収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received data to analyze the user's behavior and comments. Specifically, the server collects data on the user's past behavior and comments and customizes it based on the ideal image of the person.
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。このデータには、ユーザーが実践すべき具体的な行動や発言の例が含まれる。 The server then sends the generated custom-changed behavior and speech data to the device. This data includes specific examples of behaviors and speech that the user should practice.
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。 Users practice the proposed custom-changed actions and utterances, practicing repeatedly. The application records the user's progress and provides feedback as needed.
具体例 Specific examples
例えば、ユーザーが「思いやりのある人」を理想の人間像として設定した場合、以下のようなプロンプト文を生成AIモデルに入力する。 For example, if a user sets "a compassionate person" as their ideal person, the following prompt sentence would be input into the generative AI model:
プロンプト文の例 Example prompt
「ユーザーが友人と会話しているときに、思いやりのある発言をするためのアドバイスを提供してください。」 "Please provide advice to help users be more considerate when speaking with friends."
生成AIモデルは、このプロンプト文に基づいて、ユーザーが友人と会話する際に使える具体的な発言例を生成する。例えば、「友人が困っているときに『何か手伝えることがあれば教えてね』と言う」といったアドバイスを提供する。 Based on this prompt, the generative AI model generates specific example utterances that the user can use when conversing with friends. For example, it provides advice such as, "When a friend is in trouble, say, 'Let me know if there's anything I can help you with.'"
このようにして、ユーザーは理想の人間像に基づいた行動や発言を学び、実践することができる。 In this way, users can learn and practice behaviors and speech based on their ideal image of a person.
実施例1における特定処理の流れについて図11を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 11.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、アプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのインターフェース上で「理想の人間像を設定する」ボタンをクリックし、ドロップダウンメニューから「思いやりのある人」を選択し、「設定」ボタンを押す。 The user launches the application and sets their ideal person. Specifically, they click the "Set Ideal Person" button on the application interface, select "Compassionate Person" from the drop-down menu, and press the "Set" button.
入力: ユーザーの選択した理想の人間像(例:「思いやりのある人」) Input: User's chosen ideal person (e.g., "a caring person")
出力: 理想の人間像の設定データ Output: Ideal human image configuration data
ステップ2: Step 2:
端末が設定データをサーバに送信する The device sends the configuration data to the server.
端末は、ユーザーが設定した理想の人間像のデータをサーバに送信する。この送信は、HTTPSプロトコルを使用して安全に行われる。 The device sends data about the user's ideal person profile to a server. This transmission is secure using the HTTPS protocol.
入力: 理想の人間像の設定データ Input: Ideal human image data
出力: サーバに送信された設定データ Output: Configuration data sent to the server
ステップ3: Step 3:
サーバが生成AIモデルを使用してデータを解析する The server analyzes the data using a generative AI model.
サーバは、受信した設定データを基に生成AIモデルを使用してユーザーの行動や発言を解析する。具体的には、サーバはユーザーの過去の行動や発言データ(例:チャットログやSNSの投稿)を収集し、それを理想の人間像に基づいてカスタムチェンジする。 The server uses a generative AI model based on the received configuration data to analyze the user's behavior and comments. Specifically, the server collects the user's past behavior and comment data (e.g., chat logs and social media posts) and customizes it based on the ideal image of the person.
入力: 設定データ、ユーザーの過去の行動や発言データ Input: Configuration data, user past behavior and comment data
出力: カスタムチェンジされた行動や発言データ Output: Custom-changed behavior and speech data
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言を生成する The server generates custom-modified actions and statements.
サーバは、生成AIモデルを用いて、ユーザーの理想の人間像に基づいた行動や発言を生成する。例えば、「思いやりのある人」としての行動や発言の具体例を生成する。 The server uses a generative AI model to generate actions and statements based on the user's ideal image of a person. For example, it generates specific examples of actions and statements that would be expected of a "compassionate person."
入力: カスタムチェンジされた行動や発言データ Input: Custom-changed behavior and speech data
出力: 生成された具体的な行動や発言の例 Output: Examples of specific actions and statements generated
ステップ5: Step 5:
サーバが生成したデータを端末に送信する The server sends the generated data to the device.
サーバは、生成したカスタムチェンジされた行動や発言のデータを端末に送信する。この送信も、HTTPSプロトコルを使用して行われる。 The server then sends the generated custom-changed behavior and speech data to the device. This transmission is also done using the HTTPS protocol.
入力: 生成された具体的な行動や発言の例 Input: Examples of specific actions or statements to be generated
出力: 端末に送信されたデータ Output: Data sent to the device
ステップ6: Step 6:
端末がユーザーにデータを提示する The device presents the data to the user.
端末は、受信したデータをユーザーに提示する。ユーザーは、アプリケーションのインターフェースを通じて、カスタムチェンジされた行動や発言の具体例を確認する。 The device then presents the received data to the user, who can then view specific examples of the custom-changed actions and statements through the application interface.
入力: 端末に送信されたデータ Input: Data sent to the device
出力: ユーザーに提示された具体的な行動や発言の例 Output: Examples of specific actions and statements presented to the user
ステップ7: Step 7:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、提示されたカスタムチェンジされた行動や発言を実際に実践し、反復トレーニングを行う。アプリケーションは、ユーザーの進捗を記録し、必要に応じてフィードバックを提供する。例えば、ユーザーが「今日、友人に思いやりのある発言をした」とアプリケーションに入力する。 The user then practices the custom-changed actions and statements presented to them, repeatedly practicing. The application records the user's progress and provides feedback as needed. For example, a user might enter into the application, "Today, I made a kind statement to a friend."
入力: ユーザーの実践結果 Input: User practice results
出力: 記録された進捗データおよび提供されたフィードバック Output: Recorded progress data and provided feedback
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的な行動や発言のカスタムチェンジが難しく、効果的なトレーニングが行えないという問題があった。また、スタッフが理想の接客態度に近づくための反復トレーニングが不足しており、実際の接客において理想の態度を維持することが困難であった。 Traditional customer service training systems had the problem of being unable to provide effective training because it was difficult to customize specific actions and comments to help staff develop the ideal customer service attitude. Furthermore, there was a lack of repetitive training to help staff approach the ideal customer service attitude, making it difficult for them to maintain the ideal attitude when actually serving customers.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する手段と、該生成された行動や発言をプロンプト文としてユーザーに提示する手段と、を含む。これにより、スタッフが理想の接客態度を具体的に理解し、反復トレーニングを通じて実際の接客において理想の態度を維持することが可能となる。 The identification processing by the identification processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means. In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for generating actions and utterances based on the ideal human image using a generative AI model, and means for presenting the generated actions and utterances to the user as prompt sentences. This enables staff to concretely understand the ideal customer service attitude and maintain the ideal attitude in actual customer service through repeated training.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言を学習しようとする個人である。 A "user" is an individual who uses the system to learn to behave and speak in a way that is consistent with the ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や態度のことであり、システムがそれに基づいて行動や発言をカスタムチェンジする基準となるものである。 The "ideal person" is the specific character and attitude that the user should strive for, and serves as the standard by which the system will custom-change their behavior and speech.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキストとして表示する機能である。 "Projection means" is a function that displays the user's ideal image of a person visually or as text on the system.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能である。 "Means for custom change" is a function that allows users to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための機能である。 "Means of presentation" is a function for displaying custom-changed actions and comments to users.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice custom-changed actions and statements.
「生成AIモデル」とは、ユーザーが設定した理想の人間像に基づいて行動や発言を生成するための人工知能モデルである。 A "generative AI model" is an artificial intelligence model that generates actions and statements based on the ideal human image set by the user.
「プロンプト文」とは、生成AIモデルが理想の人間像に基づいて生成した行動や発言をユーザーに提示するためのテキスト形式の指示文である。 A "prompt" is a text-based instruction that presents the user with actions and statements generated by the generative AI model based on an ideal human image.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うものである。以下に、このシステムの具体的な実施形態について説明する。 The system for implementing this invention custom-changes behavior and speech based on the ideal person image set by the user, and presents this to the user for repetitive training. Specific embodiments of this system are described below.
システムの構成 System Configuration
システムは、以下の主要なコンポーネントから構成される。 The system consists of the following main components:
1. ユーザー端末: スマートフォンやタブレットなどのデバイスで、ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するために使用する。 1. User device: A device such as a smartphone or tablet that allows the user to define their ideal person and check their custom-changed behavior and statements.
2. サーバ: ユーザーの入力データを処理し、生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する。 2. Server: Processes user input data and uses a generative AI model to generate behaviors and statements based on the ideal human image.
3. 生成AIモデル: OpenAIのGPT-3などの生成AIモデルを使用し、ユーザーが設定した理想の人間像に基づいて行動や発言を生成する。 3. Generative AI models: Using generative AI models such as OpenAI's GPT-3, actions and statements are generated based on the ideal human image set by the user.
プログラムの処理 Program processing
サーバは、ユーザー端末から送信された理想の人間像と現在の行動や発言のデータを受け取り、生成AIモデルにプロンプト文として入力する。生成AIモデルは、理想の人間像に基づいた行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server receives the ideal human image and current behavior and speech data sent from the user's device and inputs this as prompt text into the generative AI model. The generative AI model generates behavior and speech based on the ideal human image and returns the results to the server. The server then sends the generated behavior and speech to the user's device and presents them to the user.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア: スマートフォン、タブレット、サーバ Hardware: Smartphones, tablets, servers
ソフトウェア: Python、OpenAI API、ユーザーインターフェースアプリケーション Software: Python, OpenAI API, user interface application
データ加工およびデータ演算 Data processing and calculation
サーバは、ユーザーが設定した理想の人間像と現在の行動や発言をプロンプト文として生成AIモデルに送信する。生成AIモデルは、プロンプト文に基づいて理想の行動や発言を生成し、その結果をサーバに返す。サーバは、生成された行動や発言をユーザー端末に送信し、ユーザーに提示する。 The server sends the user's ideal image of a person and their current actions and statements as prompts to the generative AI model. The generative AI model generates the ideal actions and statements based on the prompts and returns the results to the server. The server then sends the generated actions and statements to the user's device and presents them to the user.
具体例 Specific examples
例えば、ユーザーが「思いやりのある接客」を理想の人間像として設定し、現在の行動が「お客様に対して無愛想な対応をする」である場合、プロンプト文は以下のようになる。 For example, if the user defines their ideal person as "attentive customer service" and their current behavior is "treating customers in an unfriendly manner," the prompt would be as follows:
プロンプト文の例: Example prompt:
理想の人間像: 思いやりのある接客 Ideal person: Attentive customer service
ユーザーの行動: お客様に対して無愛想な対応をする User behavior: Treating customers rudely
理想の人間像に基づいた行動: Acting based on the ideal human image:
生成AIモデルは、このプロンプト文に基づいて「思いやりのある接客」に適した行動や発言を生成し、その結果をユーザーに提示する。ユーザーは提示された行動や発言を反復トレーニングすることで、理想の接客態度に近づくことができる。 Based on this prompt, the generative AI model generates actions and statements appropriate for "considerate customer service" and presents the results to the user. By repeatedly practicing the actions and statements presented, users can get closer to their ideal customer service attitude.
応用例1における特定処理の流れについて図12を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 12.
ステップ1: Step 1:
ユーザーが端末を使用して理想の人間像を設定する。ユーザーはアプリケーションを起動し、理想の人間像(例:「思いやりのある接客」)を入力する。入力データは端末からサーバに送信される。 The user sets their ideal person image using their device. The user launches the application and inputs their ideal person image (e.g., "thorough customer service"). The input data is sent from the device to the server.
入力:理想の人間像 Input: Ideal human image
出力:サーバに送信された理想の人間像データ Output: Ideal human image data sent to the server
ステップ2: Step 2:
サーバは、ユーザーから送信された理想の人間像データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the ideal human image data sent by the user. The server stores this data and uses it for subsequent processing.
入力:理想の人間像データ Input: Ideal human image data
出力:保存された理想の人間像データ Output: Saved ideal human image data
ステップ3: Step 3:
ユーザーが端末を使用して現在の行動や発言を入力する。ユーザーは現在の行動(例:「お客様に対して無愛想な対応をする」)を入力し、端末からサーバに送信する。 The user uses the device to input their current actions and statements. The user inputs their current actions (e.g., "being rude to customers") and sends it from the device to the server.
入力:現在の行動や発言 Input: Current action or statement
出力:サーバに送信された現在の行動や発言データ Output: Current behavior and speech data sent to the server
ステップ4: Step 4:
サーバは、ユーザーから送信された現在の行動や発言データを受信する。サーバはこのデータを保存し、次の処理に使用する。 The server receives the current activity and comment data sent by the user. The server stores this data and uses it for further processing.
入力:現在の行動や発言データ Input: Current activity and speech data
出力:保存された現在の行動や発言データ Output: Saved current behavior and speech data
ステップ5: Step 5:
サーバは、保存された理想の人間像データと現在の行動や発言データを組み合わせてプロンプト文を生成する。生成されたプロンプト文は、生成AIモデルに入力される。 The server generates prompts by combining the stored ideal human image data with current behavior and speech data. The generated prompts are then input into the generative AI model.
入力:理想の人間像データ、現在の行動や発言データ Input: Ideal person data, current behavior and speech data
出力:生成されたプロンプト文 Output: Generated prompt text
ステップ6: Step 6:
サーバは、生成されたプロンプト文を生成AIモデルに送信する。生成AIモデルはプロンプト文に基づいて理想の行動や発言を生成する。 The server sends the generated prompt text to the generative AI model, which then generates the ideal behavior or speech based on the prompt text.
入力:生成されたプロンプト文 Input: Generated prompt text
出力:生成AIモデルによって生成された理想の行動や発言 Output: Ideal actions and statements generated by the generative AI model
ステップ7: Step 7:
サーバは、生成AIモデルから返された理想の行動や発言を受信する。サーバはこのデータをユーザー端末に送信する。 The server receives the ideal actions and statements returned by the generative AI model. The server then sends this data to the user's device.
入力:生成AIモデルによって生成された理想の行動や発言 Input: Ideal actions and statements generated by a generative AI model
出力:ユーザー端末に送信された理想の行動や発言データ Output: Ideal behavior and speech data sent to the user's device
ステップ8: Step 8:
ユーザー端末は、サーバから送信された理想の行動や発言データを受信し、ユーザーに提示する。ユーザーは提示された行動や発言を確認し、反復トレーニングを行う。 The user's device receives the ideal behavior and speech data sent from the server and presents it to the user. The user confirms the presented behavior and speech and performs repeated training.
入力:理想の行動や発言データ Input: Ideal behavior and speech data
出力:ユーザーに提示された理想の行動や発言 Output: Ideal actions and statements presented to the user
以上の処理ステップにより、ユーザーは理想の人間像に基づいた行動や発言を学習し、反復トレーニングを通じて理想の態度に近づくことができる。 Through these processing steps, users learn how to behave and speak in a way that is based on the ideal image of a person, and through repeated training, they can move closer to their ideal attitude.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
現代社会において、多くの人々が自己改善や理想の人間像に近づくことを目指しているが、その過程は困難であり、持続的な努力が必要である。また、自己改善のための具体的な行動や発言の指針が不足しているため、効果的なトレーニングが難しいという問題がある。さらに、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするための適切な手段が存在しないため、ユーザーが自身の理想像に近づくことが困難である。 In modern society, many people aim to improve themselves and become closer to their ideal image, but the process is difficult and requires sustained effort. Furthermore, there is a lack of specific guidelines for actions and statements for self-improvement, making effective training difficult. Furthermore, there are no appropriate means for users to customize their actions and statements based on their ideal image, making it difficult for users to become closer to their ideal image.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示する手段と、該提示された行動や発言をユーザーが反復トレーニングする手段と、ユーザーの行動や発言を収集する手段と、収集した行動や発言を解析し、生成AIモデルを使用してカスタムチェンジする手段と、を含む。これにより、ユーザーは具体的な行動や発言の指針を得ることができ、持続的なトレーニングを通じて自身の理想像に近づくことが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and comments based on the ideal human image, means for presenting the custom-changed actions and comments to the user, means for the user to repeatedly train on the presented actions and comments, means for collecting the user's actions and comments, and means for analyzing the collected actions and comments and customizing them using a generative AI model. This allows the user to obtain specific guidelines for actions and comments, and enables them to get closer to their ideal image through continuous training.
「理想の人間像」とは、ユーザーが目指すべき具体的な人物像や性格特性を指す。 "Ideal person" refers to the specific person or personality traits that a user should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的またはテキスト形式で表示するための機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person in visual or text form.
「カスタムチェンジする手段」とは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するための機能を指す。 "Means for custom change" refers to the function that allows a user to change their current behavior and comments based on their ideal image of the person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに通知または表示するための機能を指す。 "Means of presentation" refers to the function for notifying or displaying custom-changed actions or statements to the user.
「反復トレーニングする手段」とは、ユーザーが提示された行動や発言を繰り返し実行することで、理想の人間像に近づくためのトレーニングを行う機能を指す。 "Means for repeated training" refers to a function that allows users to train themselves to become closer to their ideal image of a person by repeatedly performing suggested actions and statements.
「収集する手段」とは、ユーザーの行動や発言を記録し、データとして保存するための機能を指す。 "Means of collection" refers to the function for recording user actions and comments and saving them as data.
「解析する手段」とは、収集されたユーザーの行動や発言データを分析し、理想の人間像に基づいてカスタムチェンジするための情報を抽出する機能を指す。 "Means of analysis" refers to the function of analyzing collected user behavior and comment data and extracting information for custom changes based on the ideal image of a person.
「生成AIモデル」とは、ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデルを指す。 A "generative AI model" refers to an artificial intelligence model that converts a user's actions and statements based on an ideal image of a human being.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、それをユーザーに提示して反復トレーニングを行うシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes actions and speech based on the ideal person image set by the user, and presents this to the user for repetitive training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末:ユーザーが使用するスマートフォン、タブレット、またはパソコンなどのデバイス。 Device: The device used by the user, such as a smartphone, tablet, or computer.
サーバ:データの処理と保存を行うためのリモートサーバ。 Server: A remote server for processing and storing data.
ソフトウェア Software
アプリケーション:ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのソフトウェア。 Application: Software that allows users to define their ideal person and check their custom-changed behavior and statements.
生成AIモデル:ユーザーの行動や発言を理想の人間像に基づいて変換するための人工知能モデル(例:GPT-4)。 Generative AI model: An artificial intelligence model (e.g., GPT-4) that transforms user behavior and speech based on an ideal human image.
システムの動作 System Operation
理想の人間像の設定 Establishing the ideal human image
ユーザーは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーの日常的な行動や発言を記録する。例えば、ユーザーが友人と会話している内容や、SNSに投稿した内容を収集する。収集したデータは、リアルタイムでサーバに送信される。 The device records the user's everyday actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media. The collected data is sent to a server in real time.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、受信したユーザーの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジする。例えば、ユーザーが「今日は忙しいから手伝えない」と言った場合、生成AIモデルはこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変換する。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), it custom-changes the user's behavior and speech based on the ideal person. For example, if a user says, "I'm busy today, so I can't help you," the generative AI model converts this to, "I'm busy today, but please let me know if there's anything I can do to help."
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザーに通知する。ユーザーは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
反復トレーニング Repetitive training
ユーザーは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。これにより、ユーザーは理想の人間像に近づくためのトレーニングを行う。 Users repeatedly execute the custom-changed actions and statements that are presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts. In this way, users train to become closer to their ideal image of the person they want to be.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーはアプリケーションの設定画面で「思いやりのある人」と入力し、保存ボタンをクリックする。 The user enters "compassionate person" in the application's settings screen and clicks the save button.
ユーザーの行動や発言の収集 Collecting user behavior and comments
端末は、ユーザーが友人と会話している音声を録音し、テキストに変換する。また、ユーザーがSNSに投稿したテキストデータも収集する。 The device records the user's voice when they are talking to friends and converts it into text. It also collects text data that the user posts on social media.
行動や発言のカスタムチェンジ Customize your actions and speech
サーバは、収集したテキストデータを生成AIモデルに入力する。生成AIモデルは、プロンプト文を使用して、ユーザーの発言を理想の人間像に基づいて変換する。 The server inputs the collected text data into a generative AI model, which uses prompts to convert the user's speech based on an ideal human image.
カスタムチェンジした行動や発言の提示 Displaying custom actions and statements
サーバは、生成AIモデルが出力したカスタムチェンジされた発言を端末に送信する。端末は、ユーザーに通知を表示し、「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」といった提案を行う。 The server sends the custom-modified utterances output by the generative AI model to the device. The device then displays a notification to the user, suggesting something like, "I'm busy today, but please let me know if there's anything I can do to help you."
反復トレーニング Repetitive training
ユーザーは、毎日の会話やSNS投稿で、サーバから提案された発言を使用する。例えば、友人との会話で「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」と言う。これを繰り返すことで、ユーザーは「思いやりのある人」としての行動や発言が自然にできるようになる。 Users use the suggestions from the server in their everyday conversations and social media posts. For example, in a conversation with a friend, they might say, "I'm busy today, but please let me know if there's anything I can do to help." By repeating this, users will naturally begin to act and speak in a way that befits a "considerate person."
プロンプト文の例 Example prompt
生成AIモデルに入力するプロンプト文の例は以下の通りである: An example of a prompt to input to the generative AI model is as follows:
ユーザーの現在の発言:「今日は忙しいから手伝えない」 Current user statement: "I'm busy today, so I can't help."
理想の人間像:「思いやりのある人」 Ideal person: "A compassionate person"
生成AIモデルに対するプロンプト文:「ユーザーの発言を、思いやりのある人の発言に変換してください」 Prompt for generative AI model: "Transform the user's utterances into those of a considerate person."
このプロンプト文を生成AIモデルに入力することで、ユーザーの発言が理想の人間像に基づいてカスタムチェンジされる。 By inputting this prompt into a generative AI model, the user's speech is custom-changed based on the ideal human image.
実施例2における特定処理の流れについて図13を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 13.
ステップ1: Step 1:
ユーザは、アプリケーションを起動し、設定画面に移動する。そこで、理想の人間像を入力する。例えば、「思いやりのある人」と入力する。 The user launches the application and goes to the settings screen. There, they enter their ideal image of a person. For example, they might enter "a considerate person."
入力:ユーザが設定画面で入力した理想の人間像。 Input: The ideal person image entered by the user on the settings screen.
出力:理想の人間像がアプリケーションに保存される。 Output: The ideal image of a person is saved in the application.
ステップ2: Step 2:
端末は、ユーザの日常的な行動や発言を記録する。例えば、ユーザが友人と会話している内容や、SNSに投稿した内容を収集する。 The device records the user's daily actions and comments. For example, it collects the content of the user's conversations with friends and the content posted on social media.
入力:ユーザの行動や発言。 Input: User actions and statements.
出力:収集された行動や発言データが端末に保存され、リアルタイムでサーバに送信される。 Output: Collected behavioral and speech data is stored on the device and sent to the server in real time.
ステップ3: Step 3:
サーバは、受信したユーザの行動や発言データを解析する。生成AIモデル(例:GPT-4)を使用して、ユーザの行動や発言を理想の人間像に基づいてカスタムチェンジする。 The server analyzes the received user behavior and speech data. Using a generative AI model (e.g., GPT-4), the user's behavior and speech are custom-changed based on the ideal image of a person.
入力:収集された行動や発言データ、理想の人間像。 Input: Collected behavioral and speech data, ideal human image.
出力:カスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements.
具体的な動作:サーバは、収集されたテキストデータを生成AIモデルに入力し、プロンプト文を使用してユーザの発言を変換する。 Specific operation: The server inputs the collected text data into the generative AI model and converts the user's utterances using prompts.
ステップ4: Step 4:
サーバは、カスタムチェンジした行動や発言を端末に送信する。端末は、これをユーザに通知する。ユーザは、通知を確認し、カスタムチェンジされた行動や発言を実際に使用する。 The server sends the custom-changed actions and statements to the device. The device notifies the user. The user confirms the notification and actually uses the custom-changed actions and statements.
入力:カスタムチェンジされた行動や発言。 Input: Custom-changed actions and statements.
出力:ユーザに提示されたカスタムチェンジされた行動や発言。 Output: The custom-changed actions and statements presented to the user.
具体的な動作:端末は、サーバから受信したカスタムチェンジされた発言を通知として表示する。 Specific operation: The device displays the custom-changed message received from the server as a notification.
ステップ5: Step 5:
ユーザは、提示されたカスタムチェンジした行動や発言を繰り返し実行する。例えば、毎日の会話やSNS投稿で、生成AIモデルが提案した発言を使用する。 The user repeatedly executes the custom-changed actions and statements presented to them. For example, they use statements suggested by the generative AI model in their daily conversations and social media posts.
入力:提示されたカスタムチェンジされた行動や発言。 Input: The proposed custom-changed actions and statements.
出力:ユーザが実行したカスタムチェンジされた行動や発言。 Output: Custom-changed actions and statements performed by the user.
具体的な動作:ユーザは、友人との会話やSNS投稿で、サーバから提案された発言を使用する。これを繰り返すことで、ユーザは理想の人間像に近づくためのトレーニングを行う。 Specific operation: The user uses statements suggested by the server in conversations with friends and in social media posts. By repeating this process, the user trains to become closer to their ideal image of the person they want to be.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を身につけるためのトレーニング方法は限られており、効果的なトレーニングが難しいという課題があった。また、スタッフが理想の接客態度を実践するための具体的なガイドラインやフィードバックが不足しているため、接客品質の向上が困難であった。さらに、スタッフが自身の理想像に近づくための反復トレーニングを効率的に行う手段が求められていた。 In traditional customer service work, there were limited training methods for staff to acquire ideal customer service attitudes, making effective training difficult. Furthermore, there was a lack of specific guidelines or feedback for staff to put ideal customer service attitudes into practice, making it difficult to improve customer service quality. Furthermore, there was a need for an efficient way to provide repeated training to help staff become closer to their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングする手段と、生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する手段と、を含む。これにより、スタッフが理想の接客態度を効率的にトレーニングし、実践することが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and utterances based on the ideal human image, means for presenting the custom-changed actions and utterances to the user and repeatedly training them, means for training the ideal customer service attitude using smart glasses worn by staff performing customer service duties, and means for generating custom-changed utterances based on the ideal human image using a generative AI model. This enables staff to efficiently train in and practice the ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置またはソフトウェアである。 "Projection means" refers to a device or software that visually or audibly displays the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための装置またはソフトウェアである。 "Means for custom change" refers to a device or software that changes a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジされた行動や発言をユーザーに表示するための装置またはソフトウェアである。 "Presentation means" refers to a device or software that displays custom-changed actions and statements to the user.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するための装置またはソフトウェアである。 "Means for repeated training" refers to a device or software that allows the user to repeatedly practice custom-changed actions or utterances.
「接客業務」とは、顧客に対して商品やサービスを提供する業務である。 "Customer service" refers to the work of providing products and services to customers.
「スマート眼鏡」とは、情報を表示する機能を持つ眼鏡型のデバイスである。 "Smart glasses" are glasses-type devices that have the function of displaying information.
「生成AIモデル」とは、人工知能を用いてテキストや行動を生成するためのアルゴリズムである。 A "generative AI model" is an algorithm that uses artificial intelligence to generate text and behavior.
「カスタムチェンジされた発言」とは、理想の人間像に基づいて変更されたユーザーの発言である。 "Custom-changed statements" are statements made by users that have been altered based on their ideal image of a person.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするためのものである。具体的には、接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングすることができる。 The system for implementing this invention projects the ideal image of a person set by the user, custom-changes the user's actions and speech, and repeatedly trains them. Specifically, it can train ideal customer service attitudes using smart glasses worn by staff performing customer service duties.
システムの構成 System Configuration
システムは以下の主要なコンポーネントから構成される: The system consists of the following main components:
1. ユーザー端末:ユーザーが理想の人間像を設定するためのデバイス。スマートフォンやタブレットが該当する。 1. User device: The device on which the user sets their ideal image of the person. This includes smartphones and tablets.
2. スマート眼鏡:接客業務を行うスタッフが装着するデバイス。情報を視覚的に表示する機能を持つ。 2. Smart glasses: A device worn by staff performing customer service duties. It has the function of visually displaying information.
3. サーバ:生成AIモデルを実行し、ユーザーの行動や発言をカスタムチェンジするためのデータ処理を行う。 3. Server: Runs the generative AI model and processes data to custom change user behavior and speech.
4. 生成AIモデル:ユーザーの理想の人間像に基づいてカスタムチェンジされた発言を生成するアルゴリズム。 4. Generative AI model: An algorithm that generates custom-modified statements based on the user's ideal image of the person.
プログラムの処理 Program processing
サーバは、ユーザーが設定した理想の人間像を受け取り、それに基づいてユーザーの行動や発言をカスタムチェンジする。具体的には、以下の手順で処理が行われる: The server receives the user's ideal image of the person and custom-changes the user's behavior and speech based on that image. Specifically, the process is carried out as follows:
1. 理想の人間像の設定:ユーザー端末を用いて、ユーザーが理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想像として設定する。 1. Setting the ideal person: Using the user device, the user sets the ideal person. For example, they can set "kind and polite customer service" as their ideal image.
2. ユーザーの発言の入力:ユーザーが実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」という発言。 2. Enter user utterances: Enter actual utterances made by the user. For example, "Welcome, are you looking for something?"
3. 生成AIモデルの実行:サーバは生成AIモデルを用いて、理想の人間像に基づいたカスタムチェンジされた発言を生成する。 3. Execution of the generative AI model: The server uses the generative AI model to generate custom-modified utterances based on the ideal human image.
4. カスタムチェンジされた発言の提示:スマート眼鏡を通じて、カスタムチェンジされた発言をユーザーに提示する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言。 4. Present customized speech: Present customized speech to the user through smart glasses. For example, "Welcome, we'll help you find the product you're looking for."
5. 反復トレーニング:ユーザーは提示されたカスタムチェンジされた発言を反復して練習する。 5. Repetitive training: Users repeatedly practice the custom-modified utterances presented to them.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア:スマート眼鏡(例:Google Glass)、ユーザー端末(スマートフォン、タブレット) Hardware: Smart glasses (e.g., Google Glass), user devices (smartphones, tablets)
ソフトウェア:生成AIモデル(例:OpenAI API)、データ処理サーバ Software: Generative AI models (e.g., OpenAI API), data processing servers
具体例 Specific examples
例えば、接客スタッフが「親切で丁寧な接客」を理想像として設定し、以下のようなプロンプト文を使用する: For example, let's say the ideal customer service staff member is "friendly and courteous service," and use the following prompt:
プロンプト文の例: Example prompt:
理想の人間像: 親切で丁寧な接客 Ideal personality: Kind and courteous customer service
ユーザーの発言: いらっしゃいませ、何かお探しですか? User says: Welcome, are you looking for something?
理想の人間像に基づいたカスタムチェンジされた発言: Custom-changed statements based on the ideal person:
このプロンプト文を生成AIモデルに入力することで、理想の接客態度に基づいたカスタムチェンジされた発言を生成する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」のような発言が生成される。 By inputting this prompt into the generative AI model, a custom-modified utterance based on the ideal customer service attitude is generated. For example, a utterance such as, "Welcome, we'll help you find the product you're looking for" is generated.
応用例2における特定処理の流れについて図14を用いて説明する。 The flow of the specific processing in Application Example 2 will be explained using Figure 14.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する。 The user sets their ideal image of the person.
入力:ユーザーが端末(スマートフォンやタブレット)を使用して、理想の人間像を入力する。例えば、「親切で丁寧な接客」。 Input: The user uses a device (smartphone or tablet) to input their ideal image of a person. For example, "kind and polite customer service."
データ加工:端末は入力された理想の人間像をサーバに送信する。 Data processing: The device sends the input image of the ideal person to the server.
出力:サーバに理想の人間像が保存される。 Output: The ideal image of a person is saved on the server.
ステップ2: Step 2:
ユーザーが実際の発言を入力する。 The user enters the actual statement.
入力:ユーザーが端末を使用して、実際に行った発言を入力する。例えば、「いらっしゃいませ、何かお探しですか?」。 Input: The user uses the device to type what they actually say. For example, "Welcome, is there anything I can help you with?"
データ加工:端末は入力された発言をサーバに送信する。 Data processing: The device sends the entered comments to the server.
出力:サーバにユーザーの発言が保存される。 Output: User comments are saved on the server.
ステップ3: Step 3:
サーバが生成AIモデルを実行する。 The server runs the generative AI model.
入力:サーバは保存された理想の人間像とユーザーの発言を取得する。 Input: The server retrieves the stored ideal person image and user statements.
データ演算:サーバは生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する。プロンプト文を生成AIモデルに入力し、カスタムチェンジされた発言を得る。 Data calculation: The server uses the generative AI model to generate custom-changed utterances based on the ideal human image. The prompt text is input into the generative AI model to obtain the custom-changed utterances.
出力:生成されたカスタムチェンジされた発言がサーバに保存される。 Output: The generated custom-changed comments are saved on the server.
ステップ4: Step 4:
カスタムチェンジされた発言をユーザーに提示する。 Present the custom-changed statement to the user.
入力:サーバは生成されたカスタムチェンジされた発言を取得する。 Input: The server receives the generated custom-changed statement.
データ加工:サーバはカスタムチェンジされた発言をスマート眼鏡に送信する。 Data processing: The server sends the custom-modified speech to the smart glasses.
出力:スマート眼鏡にカスタムチェンジされた発言が表示される。 Output: The custom-changed speech is displayed on the smart glasses.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う。 Users perform repetitive training.
入力:ユーザーはスマート眼鏡に表示されたカスタムチェンジされた発言を確認する。 Input: The user sees the custom-changed speech displayed on the smart glasses.
具体的な動作:ユーザーは表示された発言を繰り返し練習する。例えば、「いらっしゃいませ、お客様がご希望の商品をお探しするお手伝いをさせていただきます。」という発言を練習する。 Specific behavior: The user repeatedly practices the displayed utterance. For example, they practice saying, "Welcome, we'd love to help you find the product you're looking for."
出力:ユーザーの接客態度が理想の人間像に近づく。 Output: The user's customer service attitude becomes closer to the ideal person.
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。 It is also possible to further combine an emotion engine that estimates the user's emotion. That is, the identification processing unit 290 may estimate the user's emotion using the emotion identification model 59 and perform identification processing using the user's emotion.
「形態例1」 "Example 1"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
「形態例2」 "Example 2"
本発明の一実施形態では、感情エンジンが組み込まれている。この感情エンジンは、ユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。また、この感情エンジンは、ユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。これにより、ユーザーは自身の感情状態に適した形で、自身の理想像に近づくトレーニングを行うことができる。 One embodiment of the present invention incorporates an emotion engine. This emotion engine analyzes the user's emotional state in real time. Specifically, it infers the emotional state from the user's facial expressions, tone of voice, choice of words, etc. The emotion engine also tracks changes in the user's emotional state. This makes it possible to adjust the content of repetitive training to help the user approach their ideal self in accordance with the user's emotional state. For example, when the user is feeling stressed, training that encourages relaxation is provided. On the other hand, when the user is feeling joy, training that encourages behavior that shares that joy is provided. This allows the user to train to approach their ideal self in a way that is appropriate for their emotional state.
以下に、各形態例の処理の流れについて説明する。 The processing flow for each example form is explained below.
「形態例1」 "Example 1"
ステップ1:ユーザーがシステムを起動し、自身の理想像を設定する。この理想像は、ユ Step 1: The user boots up the system and sets their ideal image. This ideal image is the user's
ーザーがどのような行動を取り、どのような発言をするかを具体的に示すものである。 It specifically shows what actions a user will take and what they will say.
ステップ2:感情エンジンがユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態を推定する。 Step 2: The emotion engine analyzes the user's emotional state in real time. Specifically, it infers the user's emotional state from their facial expressions, tone of voice, choice of words, etc.
ステップ3:感情エンジンがユーザーの感情状態の変化をトラッキングする。これにより、ユーザーが自身の理想像に近づくための反復トレーニングの内容を、ユーザーの感情状態に応じて調整することが可能となる。 Step 3: The emotion engine tracks changes in the user's emotional state. This allows the content of the repetitive training to help the user approach their ideal self to be tailored to the user's emotional state.
ステップ4:ユーザーが自身の理想像に近づくための反復トレーニングを行う。このトレーニングは、ユーザーの感情状態に応じて調整される。例えば、ユーザーがストレスを感じているときには、リラクゼーションを促すようなトレーニングを提供する。一方、ユーザーが喜びを感じているときには、その喜びを共有するような行動を促すトレーニングを提供する。 Step 4: The user undergoes repeated training to move closer to their ideal self. This training is adjusted according to the user's emotional state. For example, when the user is feeling stressed, training is provided to promote relaxation. On the other hand, when the user is feeling joy, training is provided to encourage behavior that shares that joy.
(実施例1) (Example 1)
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 1 of Form Example 1 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来のシステムでは、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジすることが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、ユーザーが自身の理想像に近づくための効果的なサポートが不足しているという課題があった。 Previous systems had the problem that it was difficult to customise behaviour and speech based on the ideal image of the person set by the user, and the training content was not adjusted according to the user's emotional state, resulting in a lack of effective support to help users get closer to their ideal image.
実施例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンから得られたデータを基にトレーニング内容を調整する手段と、を含む。これにより、ユーザーが自身の理想像に近づくための効果的なサポートが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, and means for adjusting the training content based on data obtained from the emotion engine. This enables effective support for the user to get closer to their ideal image.
「ユーザー」とは、システムを利用して自身の理想の人間像に近づくことを目指す個人を指す。 "User" refers to an individual who uses the system to aim to become closer to their ideal image of a person.
「理想の人間像」とは、ユーザーが目標とする人格や行動特性を具体的に設定したものである。 An "ideal person" is a specific set of personality and behavioral characteristics that a user aspires to.
「投影する手段」とは、ユーザーが設定した理想の人間像をシステム上で視覚的またはテキスト形式で表示する機能を指す。 "Projection means" refers to the function that displays the user's ideal image of the person on the system in visual or text format.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更・調整する機能を指す。 "Means for customizing" refers to the ability to change and adjust a user's behavior and comments based on their ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知または表示する機能を指す。 "Means of presentation" refers to the function of notifying or displaying custom-changed actions or comments to the user.
「反復トレーニングする手段」とは、ユーザーが提示されたカスタムチェンジを基に繰り返し練習する機能を指す。 "Means for repeated training" refers to a function that allows users to repeatedly practice based on the custom changes presented to them.
「感情エンジン」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情状態をリアルタイムで分析する機能を指す。 The "emotion engine" refers to a function that analyzes a user's emotional state in real time based on their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を変更・調整する機能を指す。 "Means for adjusting training content" refers to the function that changes and adjusts training content according to the user's emotional state based on data obtained from the emotion engine.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
使用するハードウェアおよびソフトウェア Hardware and software used
ハードウェア Hardware
端末: ユーザーが使用するスマートフォン、タブレット、またはPC。 Device: The smartphone, tablet, or PC used by the user.
サーバ: データ処理およびストレージを行うためのクラウドサーバ。 Server: Cloud server for data processing and storage.
カメラおよびマイク: ユーザーの顔表情や声のトーンをリアルタイムでキャプチャするためのデバイス。 Camera and microphone: Devices that capture your facial expressions and tone of voice in real time.
ソフトウェア Software
アプリケーション: ユーザーが理想の人間像を設定し、カスタムチェンジされた行動や発言を確認するためのインターフェースを提供する。 Application: Provides an interface that allows users to define their ideal person and review their custom-changed behavior and statements.
感情エンジン: ユーザーの感情状態をリアルタイムで分析するためのソフトウェアモジュール。 Emotion engine: A software module for analyzing a user's emotional state in real time.
生成AIモデル: ユーザーの行動や発言を理想の人間像に基づいてカスタムチェンジするためのAIモデル。 Generative AI model: An AI model that custom-changes a user's behavior and speech based on an ideal human image.
データ加工およびデータ演算 Data processing and calculation
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。例えば、「思いやりのある人」を選択する。 The user launches the application and sets their ideal image of the person. For example, they can select "a compassionate person."
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。これには、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容が含まれる。 The server collects input data, voice data, and text messages from users' smartphones and PCs in real time, including what users chat with friends and what they say to their voice assistants.
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。 The server analyzes the collected data using natural language processing (NLP) technology. For example, if a user says "thank you" infrequently, the server will suggest that they say "thank you" more frequently.
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。例えば、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。 The server then uses the application's notification function to present the custom-changed actions and comments to the user. For example, it could send a notification such as, "Try saying 'Thank you' the next time you talk to a friend."
ユーザーが反復トレーニングを行う Users perform repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。これを繰り返すことで、ユーザーは「思いやりのある人」に近づく。 Based on suggestions from the server, users are made conscious of saying "thank you" more often in their daily lives. By repeating this, users become closer to becoming "considerate people."
感情エンジンがユーザーの感情状態を分析する The emotion engine analyzes the user's emotional state.
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。例えば、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。 The emotion engine uses the user's smartphone camera and microphone to analyze facial expressions and tone of voice in real time. For example, if a user is smiling while speaking, the emotion engine will determine that the user is feeling happy.
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。 The server uses data obtained from the emotion engine to adjust the training content according to the user's emotional state. For example, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax."
具体例 Specific examples
理想の人間像設定 Defining the ideal person
ユーザーがアプリケーションを開き、「思いやりのある人」を理想の人間像として設定する。 The user opens the application and sets "a compassionate person" as their ideal person.
カスタムチェンジの例 Custom Change Example
サーバは、ユーザーが友人と会話する際に「ありがとう」と言う頻度を増やすように提案する。 The server suggests that users say "thank you" more frequently when conversing with friends.
感情エンジンの分析 Emotion Engine Analysis
ユーザーが会話中に笑顔を見せている場合、感情エンジンはユーザーが喜びを感じていると判断する。 If a user smiles during a conversation, the emotion engine will determine that the user is feeling happy.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じている場合、サーバは深呼吸や瞑想を促すトレーニングを提供する。 If the user is feeling stressed, the server will provide deep breathing and meditation training.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのような行動や発言をカスタムチェンジするか提案してください。」 "If the user sets their ideal person as 'a considerate person,' please suggest what actions and statements they would like to customize."
このシステムは、ユーザーが自身の理想像に近づくための具体的な行動や発言を提供し、感情状態に応じたトレーニングを行うことで、ユーザーの成長をサポートする。 The system supports users' growth by providing them with specific actions and statements to help them become closer to their ideal self, and by providing training tailored to their emotional state.
実施例1における特定処理の流れについて図15を用いて説明する。 The flow of the identification process in Example 1 will be explained using Figure 15.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーはアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションの設定画面で「思いやりのある人」などの選択肢から理想の人間像を選び、設定を保存する。入力はユーザーの選択した理想の人間像であり、出力は設定された理想の人間像のデータである。 The user launches the application and sets their ideal person. Specifically, they select their ideal person from options such as "a considerate person" on the application's settings screen and save the settings. The input is the ideal person selected by the user, and the output is data for the set ideal person.
ステップ2: Step 2:
サーバがユーザーの行動データを収集する The server collects user behavior data.
サーバは、ユーザーのスマートフォンやPCからの入力データ、音声データ、テキストメッセージをリアルタイムで収集する。具体的には、ユーザーが友人とチャットしている内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーの行動データであり、出力は収集された行動データのデータベースである。 The server collects input data, voice data, and text messages from the user's smartphone or PC in real time. Specifically, it collects what the user chats with friends and what they say to their voice assistant. The input is user behavioral data, and the output is a database of the collected behavioral data.
ステップ3: Step 3:
サーバがデータを分析し、カスタムチェンジを行う The server analyzes the data and performs custom changes.
サーバは、収集したデータを自然言語処理(NLP)技術を用いて分析する。具体的には、生成AIモデルを使用して、ユーザーの行動や発言を理想の人間像に基づいて変更する。例えば、ユーザーが「ありがとう」と言う頻度が少ない場合、サーバは「ありがとう」と言う頻度を増やすように提案する。入力は収集された行動データであり、出力はカスタムチェンジされた行動や発言の提案である。 The server analyzes the collected data using natural language processing (NLP) technology. Specifically, it uses a generative AI model to change the user's behavior and speech based on the ideal person. For example, if the user says "thank you" infrequently, the server will suggest that they say "thank you" more often. The input is the collected behavioral data, and the output is suggested custom-changed behaviors and speech.
ステップ4: Step 4:
サーバがカスタムチェンジした行動や発言をユーザーに提示する The server presents custom-changed actions and comments to the user.
サーバは、カスタムチェンジした行動や発言をアプリケーションの通知機能を使ってユーザーに提示する。具体的には、「次回友人と話すときに『ありがとう』と言ってみましょう」といった通知を送る。入力はカスタムチェンジされた行動や発言の提案であり、出力はユーザーへの通知である。 The server presents the custom-changed actions and utterances to the user using the application's notification function. Specifically, it sends a notification such as, "Try saying 'thank you' the next time you talk to a friend." The input is a suggestion for a custom-changed action or utterance, and the output is a notification to the user.
ステップ5: Step 5:
ユーザーが反復トレーニングを行う Users engage in repetitive training.
ユーザーは、サーバからの提案を基に、日常生活で「ありがとう」と言う頻度を増やすように意識する。具体的には、友人や家族との会話で「ありがとう」と言う機会を増やす。入力はサーバからの提案であり、出力はユーザーの実際の行動である。 Based on suggestions from the server, users are made conscious to say "thank you" more frequently in their daily lives. Specifically, they increase the number of opportunities to say "thank you" in conversations with friends and family. The input is the suggestions from the server, and the output is the user's actual behavior.
ステップ6: Step 6:
感情エンジンがユーザーの感情状態を分析する Emotion engine analyzes the user's emotional state
感情エンジンは、ユーザーのスマートフォンのカメラやマイクを使って、顔表情や声のトーンをリアルタイムで分析する。具体的には、ユーザーが笑顔で話している場合、感情エンジンはユーザーが喜びを感じていると判断する。入力はユーザーの顔表情や声のトーンであり、出力は分析された感情状態のデータである。 The emotion engine uses the camera and microphone on the user's smartphone to analyze facial expressions and tone of voice in real time. Specifically, if the user is smiling and talking, the emotion engine determines that the user is feeling happy. The input is the user's facial expressions and tone of voice, and the output is data on the analyzed emotional state.
ステップ7: Step 7:
サーバがトレーニング内容を調整する The server adjusts the training content.
サーバは、感情エンジンから得られたデータを基に、ユーザーの感情状態に応じてトレーニング内容を調整する。具体的には、ユーザーがストレスを感じている場合、サーバは「深呼吸をしてリラックスしましょう」といったトレーニングを提供する。入力は分析された感情状態のデータであり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state based on the data obtained from the emotion engine. Specifically, if the user is feeling stressed, the server will provide training such as "Take a deep breath and relax." The input is the analyzed emotional state data, and the output is the adjusted training content.
(応用例1) (Application Example 1)
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 1 of Form Example 1. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来の接客トレーニングシステムでは、スタッフが理想の接客態度を身につけるための具体的なフィードバックが不足しており、また、スタッフの感情状態に応じたトレーニング内容の調整が行われていないため、効果的なトレーニングが難しいという課題があった。 Traditional customer service training systems lacked specific feedback to help staff develop ideal customer service attitudes, and training content was not adjusted to reflect the emotional state of staff, making it difficult to provide effective training.
応用例1におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 1 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、ユーザーの感情状態に応じてトレーニング内容を調整する手段と、スマートデバイスを用いてユーザーにフィードバックを提供する手段と、を含む。これにより、スタッフが理想の接客態度を効果的に身につけることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, means for adjusting the training content according to the user's emotional state, and means for providing feedback to the user using a smart device. This enables staff to effectively acquire the ideal customer service attitude.
「ユーザー」とは、システムを利用して理想の人間像に基づいた行動や発言のトレーニングを行う個人である。 A "user" is an individual who uses the system to train themselves to behave and speak in a way that reflects their ideal image of a person.
「理想の人間像」とは、ユーザーが目指すべき具体的な行動や態度のモデルである。 The "ideal person" is a model of specific behaviors and attitudes that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に提示するための方法や装置である。 "Projection means" refers to a method or device for visually or audibly presenting the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するための方法や装置である。 "Means for custom change" refers to methods or devices for changing a user's behavior and speech based on an ideal image of a person.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジされた行動や発言を繰り返し練習するための方法や装置である。 "Means for repeated training" refers to methods or devices that allow users to repeatedly practice custom-changed actions and speech in order to become closer to their ideal image of the person.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などから感情を推定するための方法や装置である。 "Means for analyzing emotional state in real time" refers to methods or devices for inferring emotions from a user's facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容を変更するための方法や装置である。 "Means for adjusting training content" refers to a method or device for changing the training content according to the user's emotional state.
「スマートデバイス」とは、カメラ、マイク、スピーカーなどを内蔵し、ユーザーにフィードバックを提供するためのデバイスである。 A "smart device" is a device that has a built-in camera, microphone, speaker, etc. and is used to provide feedback to the user.
「フィードバックを提供する手段」とは、ユーザーに対して理想の行動や発言に関するアドバイスや指示を提供するための方法や装置である。 "Means for providing feedback" refers to methods or devices for providing users with advice or instructions regarding ideal behavior or speech.
この発明を実施するための形態として、実店舗で働くスタッフが理想の接客態度を身につけるためのトレーニングシステムを提供する。システムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための手段を含む。また、ユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する手段も含まれる。 As an embodiment of this invention, we provide a training system that helps staff working in brick-and-mortar stores acquire ideal customer service attitudes. The system includes means for projecting an ideal image of a person set by the user, customizing the user's behavior and speech, and repeatedly training them. It also includes means for analyzing the user's emotional state in real time and adjusting the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア Hardware
スマート眼鏡: カメラ、マイク、スピーカーを内蔵し、ユーザーの行動や発言をキャプチャし、フィードバックを提供する。 Smart glasses: Equipped with a camera, microphone, and speaker, they capture the user's actions and speech and provide feedback.
サーバ: データ処理と分析を行うための中央処理装置。 Server: A central processing unit for data processing and analysis.
ソフトウェア Software
OpenCV: カメラ映像のキャプチャと処理を行うライブラリ。 OpenCV: A library for capturing and processing camera images.
EmotionRecognizer: 顔表情から感情を推定するライブラリ。 EmotionRecognizer: A library that estimates emotions from facial expressions.
SpeechRecognition: 音声認識ライブラリ。 SpeechRecognition: Speech recognition library.
TextToSpeech: テキストを音声に変換するライブラリ。 TextToSpeech: A library for converting text to speech.
IdealBehaviorModel: 理想の行動や発言を生成するモデル。 IdealBehaviorModel: A model that generates ideal behaviors and statements.
データ加工と演算 Data processing and calculations
カメラ映像のキャプチャ Camera footage capture
スマート眼鏡のカメラを使用して、ユーザーの顔表情や行動をリアルタイムでキャプチャする。OpenCVを用いて映像データを取得し、EmotionRecognizerで感情状態を分析する。 The camera in the smart glasses is used to capture the user's facial expressions and behavior in real time. OpenCV is used to acquire video data, and EmotionRecognizer is used to analyze the emotional state.
音声認識 Voice recognition
スマート眼鏡のマイクを使用して、ユーザーの発言をキャプチャする。SpeechRecognitionライブラリを用いて音声データをテキストに変換する。 Use the microphone in the smart glasses to capture what the user is saying. Use the SpeechRecognition library to convert the speech data into text.
フィードバック生成 Feedback generation
IdealBehaviorModelを使用して、ユーザーの感情状態と発言に基づいた理想の行動や発言を生成する。生成されたフィードバックはTextToSpeechライブラリを用いて音声に変換され、スマート眼鏡のスピーカーを通じてユーザーに提供される。 Using IdealBehaviorModel, ideal behaviors and utterances are generated based on the user's emotional state and utterances. The generated feedback is converted into speech using the TextToSpeech library and provided to the user through the smart glasses' speakers.
具体例 Specific examples
シナリオ Scenario
実店舗で働くスタッフが「思いやりのある接客」を目指してトレーニングを行う。 Staff working in physical stores will receive training aimed at providing "considerate customer service."
状況 situation
顧客が商品について質問した際、スタッフが適切な対応を行う。 When customers ask questions about products, staff will respond appropriately.
フィードバック Feedback
スタッフがストレスを感じている場合、システムはリラクゼーションを促すアドバイスを提供する。 If staff are feeling stressed, the system will provide advice to encourage relaxation.
プロンプト文の例 Example prompt
ユーザーが「思いやりのある接客」を目指している場合、顧客からの質問に対してどのように対応すれば良いかを教えてください。ユーザーがストレスを感じている場合は、リラクゼーションを促すアドバイスも提供してください。 If the user aims to provide "caring customer service," tell them how to respond to customer questions. If the user is feeling stressed, provide them with advice on how to promote relaxation.
このようにして、実店舗での接客トレーニングを効果的に行うことができる。 In this way, customer service training can be carried out effectively in physical stores.
応用例1における特定処理の流れについて図16を用いて説明する。 The flow of the specific processing in Application Example 1 will be explained using Figure 16.
ステップ1: Step 1:
ユーザがスマート眼鏡を装着し、システムを起動する。スマート眼鏡のカメラがユーザの顔表情や行動をリアルタイムでキャプチャし、マイクがユーザの発言をキャプチャする。入力はカメラ映像と音声データであり、出力はキャプチャされた映像と音声データである。 The user puts on the smart glasses and starts the system. The smart glasses' camera captures the user's facial expressions and actions in real time, and the microphone captures the user's speech. The input is camera video and audio data, and the output is the captured video and audio data.
ステップ2: Step 2:
サーバがOpenCVを使用して、スマート眼鏡から送信された映像データを処理する。具体的には、映像データからユーザの顔表情を抽出し、EmotionRecognizerを用いて感情状態を分析する。入力はキャプチャされた映像データであり、出力はユーザの感情状態である。 The server uses OpenCV to process the video data sent from the smart glasses. Specifically, it extracts the user's facial expressions from the video data and analyzes their emotional state using EmotionRecognizer. The input is the captured video data, and the output is the user's emotional state.
ステップ3: Step 3:
サーバがSpeechRecognitionライブラリを使用して、スマート眼鏡から送信された音声データをテキストに変換する。入力はキャプチャされた音声データであり、出力はテキストデータである。 The server uses the SpeechRecognition library to convert the voice data sent from the smart glasses into text. The input is the captured voice data, and the output is text data.
ステップ4: Step 4:
サーバがIdealBehaviorModelを使用して、ユーザの感情状態とテキストデータに基づいて理想の行動や発言を生成する。入力はユーザの感情状態とテキストデータであり、出力は理想の行動や発言のテキストである。 The server uses IdealBehaviorModel to generate ideal behaviors and statements based on the user's emotional state and text data. The input is the user's emotional state and text data, and the output is the text of the ideal behavior or statement.
ステップ5: Step 5:
サーバがTextToSpeechライブラリを使用して、生成された理想の行動や発言のテキストを音声に変換する。入力は理想の行動や発言のテキストであり、出力は音声データである。 The server uses the TextToSpeech library to convert the generated text of ideal actions and statements into speech. The input is the text of the ideal actions and statements, and the output is audio data.
ステップ6: Step 6:
スマート眼鏡のスピーカーを通じて、サーバから送信された音声データをユーザに提供する。入力は音声データであり、出力はユーザが聞く音声フィードバックである。 Audio data sent from the server is provided to the user through the smart glasses' speakers. The input is audio data, and the output is audio feedback heard by the user.
ステップ7: Step 7:
ユーザが提供されたフィードバックに基づいて行動や発言を修正し、再度スマート眼鏡のカメラとマイクを通じて新しいデータをキャプチャする。これにより、ステップ1からステップ6までの処理が繰り返される。入力は修正された行動や発言の映像と音声データであり、出力は新たなフィードバックである。 The user modifies their actions or statements based on the provided feedback, and new data is captured again through the smart glasses' camera and microphone. This repeats the process from step 1 to step 6. The input is video and audio data of the modified actions or statements, and the output is new feedback.
(実施例2) (Example 2)
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, Example 2 of Form Example 2 will be described. In the following description, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来のシステムでは、ユーザーが自身の理想の人間像に近づくための具体的な行動や発言のカスタマイズが難しく、また、ユーザーの感情状態に応じたトレーニング内容の調整が行われないため、効果的なトレーニングが実現できないという課題があった。さらに、ユーザーの感情状態をリアルタイムで分析し、それに基づいてトレーニング内容を調整する機能が欠如していたため、ユーザーの心理的負担を軽減しながら理想像に近づくことが困難であった。 Previous systems had issues with being unable to provide effective training because it was difficult for users to customize the specific actions and comments that would bring them closer to their ideal image of the person they wanted, and the training content was not adjusted according to the user's emotional state. Furthermore, the lack of a function to analyze the user's emotional state in real time and adjust the training content based on that analysis made it difficult to bring users closer to their ideal image while reducing the psychological burden.
実施例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する手段と、該感情状態に応じてトレーニング内容を調整する手段と、を含む。これにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることが可能となる。 In this invention, the server includes means for projecting an ideal human image set by the user, means for customizing the user's actions and speech based on the ideal human image, means for presenting the custom-changed actions and speech to the user and repeatedly training them, means for analyzing the user's emotional state in real time, and means for adjusting the training content in accordance with the emotional state. This allows the user to receive effective training to approach their ideal image.
「理想の人間像」とは、ユーザーが目指すべき人物像や性格特性を指す。 "Ideal person" refers to the type of person or personality traits that the user should aim to become.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示するための装置やソフトウェアを指す。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムを指す。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに通知するための装置やソフトウェアを指す。 "Means of presentation" refers to devices or software used to notify users of custom-changed actions or statements.
「反復トレーニングする手段」とは、ユーザーがカスタムチェンジされた行動や発言を繰り返し練習するためのプログラムやシステムを指す。 "Means for repeated training" refers to a program or system that allows users to repeatedly practice custom-changed actions and utterances.
「感情状態をリアルタイムで分析する手段」とは、ユーザーの顔表情、声のトーン、言葉の選び方などを解析して感情状態を推定するための装置やソフトウェアを指す。 "Means for analyzing emotional state in real time" refers to devices or software that estimate a user's emotional state by analyzing their facial expressions, tone of voice, choice of words, etc.
「トレーニング内容を調整する手段」とは、ユーザーの感情状態に応じてトレーニングの内容や方法を変更するためのアルゴリズムやプログラムを指す。 "Means for adjusting training content" refers to algorithms or programs that change the content or method of training according to the user's emotional state.
この発明は、ユーザーが設定した理想の人間像に基づいて行動や発言をカスタムチェンジし、反復トレーニングを通じてユーザーが自身の理想像に近づくことを支援するシステムである。以下に、このシステムの具体的な実施形態を説明する。 This invention is a system that custom-changes behavior and speech based on the ideal person image set by the user, and helps the user get closer to their ideal image through repeated training. Specific embodiments of this system are described below.
システムの構成 System Configuration
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを使用して、自身が目指す理想の人間像を設定する。例えば、「思いやりのある人」を選択する。この設定は、ユーザーの人間関係のトラウマや教養等を考慮して行われる。 Using an application on their device, users can set the ideal person they aspire to be. For example, they can select "a compassionate person." This setting takes into account the user's interpersonal trauma, education, etc.
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。これには、ユーザーが入力したテキストや音声データが含まれる。例えば、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。 The server collects user actions and statements in real time, including text and voice data entered by the user. For example, it collects what users say to friends in chat apps and what they say to voice assistants.
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、自然言語処理(NLP)技術を用いて、ユーザーの発言内容を理解する。ここでは、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用する。 The server analyzes the collected data. Specifically, it uses natural language processing (NLP) technology to understand what the user is saying. It uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4.
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server customizes your actions and speech based on your ideal image of a person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 Based on the analysis results, the server custom-changes the user's actions and comments to match their ideal image of a person. For example, "I'm busy today, so I can't help you" could be changed to "I'm busy today, but please let me know if there's anything I can do to help."
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。 The server presents the custom-changed actions and comments to the user, who can review them and make any necessary corrections.
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。Microsoft AzureのEmotion APIやAffectivaのSDKを使用する。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it analyzes the user's facial expressions, tone of voice, choice of words, etc. It uses Microsoft Azure's Emotion API and Affectiva's SDK.
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it will provide training to promote relaxation, and if the user is feeling joy, it will provide training to encourage behavior that encourages sharing that joy.
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。 The user performs the training content presented by the server. This allows the user to undergo repeated training to get closer to their ideal self.
具体例 Specific examples
理想の人間像の設定 Establishing the ideal human image
ユーザーがアプリケーションを開き、「理想の人間像を設定」を選択し、「思いやりのある人」を選ぶ。 The user opens the application, selects "Set your ideal person," and chooses "A compassionate person."
行動や発言の収集 Collecting actions and statements
ユーザーが友人とチャットしている内容をアプリケーションがバックグラウンドで収集する。 The application collects chat content between users and friends in the background.
データの解析 Data Analysis
サーバが収集したチャット内容をGoogle Cloud Natural Language APIで解析し、感情分析を行う。また、OpenAIのGPT-4を使用して、ユーザーの発言内容を理解し、適切な応答を生成する。 The chat content collected by the server is analyzed using the Google Cloud Natural Language API to perform sentiment analysis. It also uses OpenAI's GPT-4 to understand what the user is saying and generate appropriate responses.
カスタムチェンジの例 Custom Change Example
ユーザーが「今日は忙しいから手伝えない」と言った場合、サーバがこれを「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。 If the user says, "I'm busy today and can't help," the server changes this to "I'm busy today, but please let me know if there's anything I can do to help."
感情エンジンの分析 Emotion Engine Analysis
ユーザーがカメラに向かって話しているとき、サーバがMicrosoft AzureのEmotion APIを使用して、ユーザーの顔表情や声のトーンからストレスを感じていると判断する。 When a user speaks into the camera, the server uses Microsoft Azure's Emotion API to determine whether the user is feeling stressed based on their facial expressions and tone of voice.
トレーニング内容の調整 Adjusting training content
ユーザーがストレスを感じているとき、サーバが「深呼吸をしてリラックスしましょう」といったリラクゼーショントレーニングを提供する。 When a user is feeling stressed, the server provides relaxation training such as "Take a deep breath and relax."
トレーニングの実行 Running the training
ユーザーがサーバから提示されたリラクゼーショントレーニングを実行する。 The user performs relaxation training presented by the server.
プロンプト文の例 Example prompt
「ユーザーが理想の人間像として『思いやりのある人』を設定した場合、どのように行動や発言をカスタムチェンジするか教えてください。」 "If a user sets their ideal person as 'a considerate person,' how would they customize their behavior and speech?"
このシステムにより、ユーザーは自身の理想像に近づくための効果的なトレーニングを受けることができる。 This system allows users to receive effective training to bring them closer to their ideal self.
実施例2における特定処理の流れについて図17を用いて説明する。 The flow of the identification process in Example 2 will be explained using Figure 17.
ステップ1: Step 1:
ユーザーが理想の人間像を設定する Users define their ideal image of a person.
ユーザーは、端末上のアプリケーションを起動し、理想の人間像を設定する。具体的には、アプリケーションのメニューから「理想の人間像を設定」を選択し、「思いやりのある人」などの選択肢から理想の人間像を選ぶ。入力はユーザーの選択した理想の人間像であり、出力はその設定情報である。 The user launches the application on their device and sets their ideal person. Specifically, they select "Set ideal person" from the application menu and choose their ideal person from options such as "a considerate person." The input is the ideal person selected by the user, and the output is that setting information.
ステップ2: Step 2:
サーバがユーザーの行動や発言を収集する The server collects user behavior and comments.
サーバは、ユーザーの行動や発言をリアルタイムで収集する。具体的には、ユーザーがチャットアプリで友人と会話している内容や、音声アシスタントに話しかける内容を収集する。入力はユーザーのテキストデータや音声データであり、出力は収集された行動や発言のデータである。 The server collects user behavior and speech in real time. Specifically, it collects the content of user conversations with friends on chat apps and what users say to voice assistants. The input is the user's text data and voice data, and the output is the collected behavior and speech data.
ステップ3: Step 3:
サーバが収集したデータを解析する Analyze the data collected by the server
サーバは、収集したデータを解析する。具体的には、Google Cloud Natural Language APIやOpenAIのGPT-4などの生成AIモデルを使用して、ユーザーの発言内容を理解し、感情分析やキーフレーズ抽出を行う。入力は収集された行動や発言のデータであり、出力は解析結果である。 The server analyzes the collected data. Specifically, it uses generative AI models such as Google Cloud Natural Language API and OpenAI's GPT-4 to understand what users say and perform sentiment analysis and key phrase extraction. The input is the collected behavioral and utterance data, and the output is the analysis results.
ステップ4: Step 4:
サーバが理想の人間像に基づいて行動や発言をカスタムチェンジする The server custom-changes your behavior and speech based on your ideal person.
サーバは、解析結果を基に、ユーザーの行動や発言を理想の人間像に合わせてカスタムチェンジする。例えば、「今日は忙しいから手伝えない」を「今日は忙しいけれど、少しでも手伝えることがあれば教えてください」に変更する。入力は解析結果であり、出力はカスタムチェンジされた行動や発言である。 Based on the analysis results, the server custom-changes the user's actions and comments to match the ideal person. For example, "I'm busy today, so I can't help you" is changed to "I'm busy today, but please let me know if there's anything I can do to help." The input is the analysis results, and the output is the custom-changed actions and comments.
ステップ5: Step 5:
サーバがカスタムチェンジした内容をユーザーに提示する The server presents the custom changes to the user.
サーバは、カスタムチェンジした行動や発言をユーザーに提示する。ユーザーはこれを確認し、必要に応じて修正する。入力はカスタムチェンジされた行動や発言であり、出力はユーザーに提示された内容である。 The server presents the custom-changed actions and statements to the user, who can review them and make corrections as necessary. The input is the custom-changed actions and statements, and the output is the content presented to the user.
ステップ6: Step 6:
サーバが感情エンジンを用いてユーザーの感情状態を分析する The server uses an emotion engine to analyze the user's emotional state.
サーバは、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析する。具体的には、Microsoft AzureのEmotion APIやAffectivaのSDKを使用して、ユーザーの顔表情、声のトーン、言葉の選び方などを解析する。入力はユーザーの顔表情や声のトーン、言葉の選び方であり、出力は感情状態の分析結果である。 The server uses an emotion engine to analyze the user's emotional state in real time. Specifically, it uses Microsoft Azure's Emotion API and Affectiva's SDK to analyze the user's facial expressions, tone of voice, choice of words, etc. The input is the user's facial expressions, tone of voice, and choice of words, and the output is the analysis of the user's emotional state.
ステップ7: Step 7:
サーバがユーザーの感情状態に応じてトレーニング内容を調整する The server adjusts the training content based on the user's emotional state.
サーバは、ユーザーの感情状態に応じてトレーニング内容を調整する。例えば、ユーザーがストレスを感じている場合にはリラクゼーションを促すトレーニングを提供し、喜びを感じている場合にはその喜びを共有するような行動を促すトレーニングを提供する。入力は感情状態の分析結果であり、出力は調整されたトレーニング内容である。 The server adjusts the training content according to the user's emotional state. For example, if the user is feeling stressed, it provides training to promote relaxation, and if the user is feeling happy, it provides training to encourage behavior that shares that joy. The input is the analysis result of the emotional state, and the output is the adjusted training content.
ステップ8: Step 8:
ユーザーがトレーニングを実行する User performs training
ユーザーは、サーバから提示されたトレーニング内容を実行する。これにより、ユーザーは自身の理想像に近づくための反復トレーニングを行う。入力は調整されたトレーニング内容であり、出力はユーザーの実行結果である。 The user performs the training content presented by the server. This allows the user to undergo repeated training to approach their ideal self. The input is the adjusted training content, and the output is the user's execution results.
(応用例2) (Application Example 2)
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。 Next, we will explain Application Example 2 of Form Example 2. In the following explanation, the data processing device 12 will be referred to as the "server" and the robot 414 will be referred to as the "terminal."
従来の接客業務において、スタッフが理想の接客態度を維持することは難しく、特に感情状態が不安定な場合には顧客満足度が低下する問題があった。また、スタッフが自身の理想像に近づくためのトレーニングを効果的に行う手段が不足していた。 In traditional customer service work, it was difficult for staff to maintain an ideal customer service attitude, and customer satisfaction declined, particularly when their emotional state was unstable. Furthermore, there was a lack of effective training methods to help staff approach their ideal image.
応用例2におけるデータ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。 The specific processing performed by the specific processing unit 290 of the data processing device 12 in Application Example 2 is realized by the following means.
この発明では、サーバは、ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、ユーザーの感情状態をリアルタイムで分析する感情エンジンと、該感情エンジンに基づいてトレーニング内容を調整する手段と、スマート眼鏡に表示する手段と、を含む。これにより、スタッフが理想の接客態度を維持しつつ、感情状態に応じた適切なトレーニングを受けることが可能となる。 In this invention, the server includes a means for projecting an ideal human image set by the user, a means for customizing the user's actions and speech based on the ideal human image, a means for presenting the custom-changed actions and speech to the user and repeatedly training them, an emotion engine for analyzing the user's emotional state in real time, a means for adjusting the training content based on the emotion engine, and a means for displaying on the smart glasses. This enables staff to receive appropriate training according to their emotional state while maintaining an ideal customer service attitude.
「ユーザー」とは、システムを利用する個人または団体である。 "User" means an individual or organization that uses the system.
「理想の人間像」とは、ユーザーが目指すべき行動や態度のモデルである。 The "ideal person" is a model of behavior and attitude that users should aim for.
「投影する手段」とは、ユーザーが設定した理想の人間像を視覚的または聴覚的に表示する装置やソフトウェアである。 "Projection means" refers to devices or software that visually or audibly display the ideal human image set by the user.
「カスタムチェンジする手段」とは、ユーザーの行動や発言を理想の人間像に基づいて変更するためのアルゴリズムやプログラムである。 "Means for custom change" refers to algorithms or programs that change a user's behavior and speech based on an ideal image of a person.
「提示する手段」とは、カスタムチェンジした行動や発言をユーザーに知らせるための表示装置や通知システムである。 "Means of presentation" refers to a display device or notification system that notifies users of custom-changed actions and statements.
「反復トレーニングする手段」とは、ユーザーが理想の人間像に近づくために、カスタムチェンジした行動や発言を繰り返し練習するための機能である。 "Means for repeated training" is a function that allows users to repeatedly practice their custom-changed actions and statements in order to become closer to their ideal image of the person they want to be.
「感情エンジン」とは、ユーザーの感情状態をリアルタイムで分析するためのソフトウェアまたはハードウェアである。 An "emotion engine" is software or hardware that analyzes a user's emotional state in real time.
「トレーニング内容を調整する手段」とは、感情エンジンの分析結果に基づいて、ユーザーに提供するトレーニングの内容を変更するための機能である。 "Means for adjusting training content" is a function for changing the content of training provided to users based on the analysis results of the emotion engine.
「スマート眼鏡」とは、ユーザーが装着することで情報を視覚的に表示することができるウェアラブルデバイスである。 "Smart glasses" are wearable devices that can visually display information when worn by the user.
この発明を実施するためのシステムは、ユーザーが設定した理想の人間像を投影し、ユーザーの行動や発言をカスタムチェンジし、それを反復トレーニングするための一連の手段を含む。さらに、感情エンジンを用いてユーザーの感情状態をリアルタイムで分析し、トレーニング内容を調整する機能を備えている。 The system for implementing this invention includes a series of means for projecting the ideal human image set by the user, customizing the user's behavior and speech, and repeatedly training them. It also has the ability to use an emotion engine to analyze the user's emotional state in real time and adjust the training content.
使用するハードウェアとソフトウェア Hardware and software used
ハードウェア: スマート眼鏡、カメラ Hardware: Smart glasses, camera
ソフトウェア: OpenCV(顔検出)、EmotionRecognizer(感情認識)、BehaviorSuggestion(行動提案) Software: OpenCV (face detection), EmotionRecognizer (emotion recognition), BehaviorSuggestion (behavior suggestions)
システムの構成 System Configuration
1. ユーザーが設定した理想の人間像を投影する手段: 1. A way to project the user's ideal image of a person:
ユーザーはアプリケーションを通じて理想の人間像を設定する。例えば、「親切で丁寧な接客」を理想とする場合、システムはこの情報を基に行動や発言をカスタムチェンジする。 Users can set their ideal image of a person through the application. For example, if their ideal is "kind and polite customer service," the system will use this information to customize their behavior and speech.
2. ユーザーの行動や発言をカスタムチェンジする手段: 2. How to customise user behaviour and comments:
システムは、ユーザーの現在の行動や発言を理想の人間像に基づいて変更するためのアルゴリズムを実行する。例えば、ユーザーがストレスを感じている場合、リラクゼーションを促す提案を行う。 The system runs algorithms to change the user's current behavior and speech based on the ideal person. For example, if the user is feeling stressed, it will make suggestions to encourage relaxation.
3. カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段: 3. A method for presenting custom-changed actions and statements to users and repeatedly training them:
カスタムチェンジされた行動や発言は、スマート眼鏡のディスプレイに表示される。ユーザーはこれを見て、理想の行動や発言を繰り返し練習する。 Custom-changed actions and speech are displayed on the smart glasses' display. Users can view these and repeatedly practice their ideal actions and speech.
4. 感情エンジン: 4. Emotion Engine:
カメラを用いてユーザーの顔表情をキャプチャし、EmotionRecognizerを用いて感情状態をリアルタイムで分析する。これにより、ユーザーの感情状態に応じたトレーニング内容を提供する。 The camera captures the user's facial expressions and EmotionRecognizer analyzes their emotional state in real time. This allows the system to provide training content tailored to the user's emotional state.
5. トレーニング内容を調整する手段: 5. Ways to adjust training content:
感情エンジンの分析結果に基づいて、BehaviorSuggestionエンジンが適切な行動や発言を提案する。例えば、ユーザーが喜びを感じている場合、その喜びを共有するような行動を促すトレーニングを提供する。 Based on the analysis results of the emotion engine, the BehaviorSuggestion engine suggests appropriate actions and statements. For example, if the user is feeling happy, it provides training to encourage behavior that shares that joy.
6. スマート眼鏡に表示する手段: 6. Display method on smart glasses:
提案された行動や発言は、スマート眼鏡のディスプレイにリアルタイムで表示される。これにより、ユーザーは接客中に理想の態度を維持することができる。 Suggested actions and comments are displayed in real time on the smart glasses' display, allowing users to maintain ideal behavior while serving customers.
具体例 Specific examples
シナリオ: 実店舗のスタッフがスマート眼鏡を装着し、接客中に「親切で丁寧な接客」を維持するための支援を受ける。 Scenario: Store staff wear smart glasses to help them maintain a "friendly and courteous" attitude while serving customers.
感情状態: スタッフがストレスを感じている場合、リラクゼーションを促す提案(例:「深呼吸をしてリラックスしましょう」)。 Emotional state: If staff are feeling stressed, offer relaxation suggestions (e.g., "Take a deep breath and relax").
行動提案: 顧客に対して「お困りのことがあれば何でもおっしゃってください」といった親切な発言を提案。 Action suggestion: Suggest a kind statement to customers such as, "Please let me know if you need any help."
プロンプト文の例 Example prompt
ユーザーが設定した理想の接客態度に基づいて、リアルタイムで行動や発言をカスタムチェンジし、スマート眼鏡のディスプレイに表示するアプリケーションを開発してください。感情エンジンを用いてユーザーの感情状態を分析し、適切なトレーニングを提供する機能も含めてください。 Develop an application that custom changes actions and comments in real time based on the ideal customer service attitude set by the user, and displays them on the smart glasses display. Include a function that uses an emotion engine to analyze the user's emotional state and provide appropriate training.
応用例2における特定処理の流れについて図18を用いて説明する。 The flow of the specific processing in Application Example 2 is explained using Figure 18.
ステップ1: Step 1:
ユーザがアプリケーションを起動し、理想の人間像を設定する。ユーザは「親切で丁寧な接客」などの理想像を入力する。この入力データはサーバに送信され、保存される。 The user launches the application and sets their ideal image of the person. The user inputs an ideal image such as "kind and polite customer service." This input data is sent to the server and saved.
ステップ2: Step 2:
サーバは、ユーザの理想の人間像に基づいて行動や発言をカスタムチェンジするアルゴリズムを実行する。入力として理想の人間像とユーザの現在の行動データを受け取り、出力としてカスタムチェンジされた行動や発言を生成する。 The server runs an algorithm that custom-changes behavior and speech based on the user's ideal image of the person. It receives the ideal image of the person and the user's current behavioral data as input, and generates custom-changed behavior and speech as output.
ステップ3: Step 3:
サーバは、カスタムチェンジされた行動や発言をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、理想の行動や発言を実践する。 The server sends the custom-changed actions and statements to the smart glasses, which receive them and display them on the screen. The user then views these and practices their ideal actions and statements.
ステップ4: Step 4:
カメラがユーザの顔表情をキャプチャし、リアルタイムでサーバに送信する。サーバはEmotionRecognizerを用いて、入力された顔表情データからユーザの感情状態を分析する。出力として感情状態データを生成する。 The camera captures the user's facial expressions and transmits them to the server in real time. The server uses EmotionRecognizer to analyze the user's emotional state from the input facial expression data, and generates emotional state data as output.
ステップ5: Step 5:
サーバは、感情状態データに基づいてトレーニング内容を調整する。BehaviorSuggestionエンジンが感情状態データと理想の人間像を入力として受け取り、適切な行動や発言を提案する。出力として調整されたトレーニング内容を生成する。 The server adjusts the training content based on the emotional state data. The BehaviorSuggestion engine receives the emotional state data and the ideal human image as input and suggests appropriate actions and statements. The adjusted training content is generated as output.
ステップ6: Step 6:
サーバは、調整されたトレーニング内容をスマート眼鏡に送信する。スマート眼鏡はこれを受信し、ディスプレイに表示する。ユーザはこれを見て、感情状態に応じたトレーニングを実践する。 The server sends the adjusted training content to the smart glasses, which receive it and display it on the screen. The user then views it and practices training that corresponds to their emotional state.
ステップ7: Step 7:
ユーザがトレーニングを実践する過程で、サーバは感情状態の変化をトラッキングし、必要に応じてトレーニング内容を再調整する。これにより、ユーザは理想の人間像に近づくための最適なトレーニングを受けることができる。 As the user practices the training, the server tracks changes in their emotional state and readjusts the training content as needed. This allows the user to receive optimal training to bring them closer to their ideal image of the person they want to be.
特定処理部290は、特定処理の結果をロボット414に送信する。ロボット414では、制御部46Aが、スピーカ240及び制御対象443に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。 The specific processing unit 290 transmits the results of the specific processing to the robot 414. In the robot 414, the control unit 46A causes the speaker 240 and the control target 443 to output the results of the specific processing. The microphone 238 acquires audio indicating the user input regarding the results of the specific processing. The control unit 46A transmits audio data indicating the user input acquired by the microphone 238 to the data processing device 12. In the data processing device 12, the specific processing unit 290 acquires the audio data.
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。 Data generation model 58 is what is known as generative AI (artificial intelligence). An example of data generation model 58 is generative AI such as ChatGPT (Internet search <URL: https://openai.com/blog/chatgpt>). Data generation model 58 is obtained by performing deep learning on a neural network. A prompt containing an instruction is input to data generation model 58, and inference data such as voice data indicating voice, text data indicating text, and image data indicating an image is also input. Data generation model 58 performs inference on the input inference data in accordance with the instructions indicated by the prompt, and outputs the inference results in the form of data such as voice data and text data. Here, inference refers to, for example, analysis, classification, prediction, and/or summarization.
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。 Another example of generative AI is Gemini (Internet search <URL: https://gemini.google.com/?hl=ja>).
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ロボット414によって特定処理が行われるようにしてもよい。 In the above embodiment, an example was given in which the specific processing was performed by the data processing device 12, but the technology disclosed herein is not limited to this, and the specific processing may also be performed by the robot 414.
なお、感情エンジンとしての感情特定モデル59は、特定のマッピングに従い、ユーザの感情を決定してよい。具体的には、感情特定モデル59は、特定のマッピングである感情マップ(図9参照)に従い、ユーザの感情を決定してよい。また、感情特定モデル59は、同様に、ロボットの感情を決定し、特定処理部290は、ロボットの感情を用いた特定処理を行うようにしてもよい。 The emotion identification model 59, which serves as an emotion engine, may determine the user's emotion according to a specific mapping. Specifically, the emotion identification model 59 may determine the user's emotion according to an emotion map (see Figure 9), which is a specific mapping. Similarly, the emotion identification model 59 may determine the robot's emotion, and the identification processing unit 290 may perform identification processing using the robot's emotion.
図9は、複数の感情がマッピングされる感情マップ400を示す図である。感情マップ400において、感情は、中心から放射状に同心円に配置されている。同心円の中心に近いほど、原始的状態の感情が配置されている。同心円のより外側には、心境から生まれる状態や行動を表す感情が配置されている。感情とは、情動や心的状態も含む概念である。同心円の左側には、概して脳内で起きる反応から生成される感情が配置されている。同心円の右側には概して、状況判断で誘導される感情が配置されている。同心円の上方向及び下方向には、概して脳内で起きる反応から生成され、かつ、状況判断で誘導される感情が配置されている。また、同心円の上側には、「快」の感情が配置され、下側には、「不快」の感情が配置されている。このように、感情マップ400では、感情が生まれる構造に基づいて複数の感情がマッピングされており、同時に生じやすい感情が、近くにマッピングされている。 Figure 9 shows an emotion map 400 on which multiple emotions are mapped. In emotion map 400, emotions are arranged in concentric circles radiating from the center. Emotions closer to the center of the concentric circles are more primitive. Emotions representing states and actions arising from a state of mind are arranged on the outer edges of the concentric circles. The concept of emotion includes both emotions and mental states. Emotions that are generally generated from reactions that occur in the brain are arranged on the left side of the concentric circles. Emotions that are generally induced by situational judgment are arranged on the right side of the concentric circles. Emotions that are generally generated from reactions that occur in the brain and are induced by situational judgment are arranged above and below the concentric circles. Furthermore, the emotion of "pleasure" is arranged on the top side of the concentric circles, and the emotion of "discomfort" is arranged on the bottom side. In this way, emotion map 400 maps multiple emotions based on the structure by which emotions are generated, with emotions that tend to occur simultaneously being mapped close together.
これらの感情は、感情マップ400の3時の方向に分布しており、普段は安心と不安のあたりを行き来する。感情マップ400の右半分では、内部的な感覚よりも状況認識の方が優位に立つため、落ち着いた印象になる。 These emotions are distributed in the 3 o'clock direction on emotion map 400, and usually fluctuate between relief and anxiety. In the right half of emotion map 400, situational awareness takes precedence over internal sensations, resulting in a calm impression.
感情マップ400の内側は心の中、感情マップ400の外側は行動を表すため、感情マップ400の外側に行くほど、感情が目に見える(行動に表れる)ようになる。 The inside of emotion map 400 represents what is going on in the mind, and the outside of emotion map 400 represents behavior, so the further out you go on emotion map 400, the more visible (expressed in behavior) the emotion becomes.
ここで、人の感情は、姿勢や血糖値のような様々なバランスを基礎としており、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示す。ロボットや自動車やバイク等においても、姿勢やバッテリー残量のような様々なバランスを基礎として、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示すように感情を作ることができる。感情マップは、例えば、光吉博士の感情地図(音声感情認識及び情動の脳生理信号分析システムに関する研究、徳島大学、博士論文:https://ci.nii.ac.jp/naid/500000375379)に基づいて生成されてよい。感情地図の左半分には、感覚が優位にたつ「反応」と呼ばれる領域に属する感情が並ぶ。また、感情地図の右半分には、状況認識が優位にたつ「状況」と呼ばれる領域に属する感情が並ぶ。 Here, human emotions are based on various balances such as posture and blood sugar levels, and when these balances deviate from the ideal, it indicates discomfort, and when they approach the ideal, it indicates pleasure. Emotions can also be created for robots, cars, motorcycles, etc., based on various balances such as posture and remaining battery life, so that when these balances deviate from the ideal, it indicates discomfort, and when they approach the ideal, it indicates pleasure. Emotion maps may be generated, for example, based on Dr. Mitsuyoshi's emotion map (Research on speech emotion recognition and emotional brain physiological signal analysis systems, Tokushima University, doctoral dissertation: https://ci.nii.ac.jp/naid/500000375379). The left half of the emotion map is lined with emotions belonging to an area called "reaction," where sensation is dominant. The right half of the emotion map is lined with emotions belonging to an area called "situation," where situational awareness is dominant.
感情マップでは学習を促す感情が2つ定義される。1つは、状況側にあるネガティブな「懺悔」や「反省」の真ん中周辺の感情である。つまり、「もう2度とこんな想いはしたくない」「もう叱られたくない」というネガティブな感情がロボットに生じたときである。もう1つは、反応側にあるポジティブな「欲」のあたりの感情である。つまり、「もっと欲しい」「もっと知りたい」というポジティブな気持ちのときである。 The emotion map defines two emotions that encourage learning. One is the negative emotion around the middle of "repentance" or "reflection" on the situation side. In other words, this is when the robot experiences negative emotions such as "I never want to feel this way again" or "I don't want to be scolded again." The other is the positive emotion around "desire" on the response side. In other words, this is when the robot experiences positive feelings such as "I want more" or "I want to know more."
感情特定モデル59は、ユーザ入力を、予め学習されたニューラルネットワークに入力し、感情マップ400に示す各感情を示す感情値を取得し、ユーザの感情を決定する。このニューラルネットワークは、ユーザ入力と、感情マップ400に示す各感情を示す感情値との組み合わせである複数の学習データに基づいて予め学習されたものである。また、このニューラルネットワークは、図10に示す感情マップ900のように、近くに配置されている感情同士は、近い値を持つように学習される。図10では、「安心」、「安穏」、「心強い」という複数の感情が、近い感情値となる例を示している。 The emotion identification model 59 inputs user input into a pre-trained neural network, obtains emotion values indicating each emotion shown in the emotion map 400, and determines the user's emotion. This neural network is pre-trained based on multiple pieces of training data that are combinations of user input and emotion values indicating each emotion shown in the emotion map 400. Furthermore, this neural network is trained so that emotions that are close to each other have similar values, as in the emotion map 900 shown in Figure 10. Figure 10 shows an example in which multiple emotions, such as "relieved," "calm," and "reassuring," have similar emotion values.
上記実施形態では、1台のコンピュータ22によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、コンピュータ22を含めた複数のコンピュータによる特定処理に対する分散処理が行われるようにしてもよい。 In the above embodiment, an example was given in which a specific process is performed by a single computer 22, but the technology disclosed herein is not limited to this, and distributed processing of the specific process may also be performed by multiple computers, including computer 22.
上記実施形態では、ストレージ32に特定処理プログラム56が格納されている形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、特定処理プログラム56がUSB(Universal Serial Bus)メモリなどの可搬型のコンピュータ読み取り可能な非一時的格納媒体に格納されていてもよい。非一時的格納媒体に格納されている特定処理プログラム56は、データ処理装置12のコンピュータ22にインストールされる。プロセッサ28は、特定処理プログラム56に従って特定処理を実行する。 In the above embodiment, an example was described in which the specific processing program 56 is stored in the storage 32, but the technology of the present disclosure is not limited to this. For example, the specific processing program 56 may be stored in a portable, computer-readable, non-transitory storage medium such as a USB (Universal Serial Bus) memory. The specific processing program 56 stored in the non-transitory storage medium is installed in the computer 22 of the data processing device 12. The processor 28 executes the specific processing in accordance with the specific processing program 56.
また、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56を格納させておき、データ処理装置12の要求に応じて特定処理プログラム56がダウンロードされ、コンピュータ22にインストールされるようにしてもよい。 Alternatively, the specific processing program 56 may be stored in a storage device such as a server connected to the data processing device 12 via the network 54, and the specific processing program 56 may be downloaded and installed on the computer 22 in response to a request from the data processing device 12.
なお、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56の全てを格納させておいたり、ストレージ32に特定処理プログラム56の全てを記憶させたりしておく必要はなく、特定処理プログラム56の一部を格納させておいてもよい。 It is not necessary to store the entire specific processing program 56 in a storage device such as a server connected to the data processing device 12 via the network 54, or to store the entire specific processing program 56 in the storage 32; only a portion of the specific processing program 56 may be stored.
特定処理を実行するハードウェア資源としては、次に示す各種のプロセッサを用いることができる。プロセッサとしては、例えば、ソフトウェア、すなわち、プログラムを実行することで、特定処理を実行するハードウェア資源として機能する汎用的なプロセッサであるCPUが挙げられる。また、プロセッサとしては、例えば、FPGA(Field-Programmable Gate Array)、PLD(Programmable Logic Device)、又はASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路が挙げられる。何れのプロセッサにもメモリが内蔵又は接続されており、何れのプロセッサもメモリを使用することで特定処理を実行する。 The following types of processors can be used as hardware resources for executing specific processes. Examples of processors include a CPU, a general-purpose processor that functions as a hardware resource for executing specific processes by executing software, i.e., a program. Other examples of processors include dedicated electrical circuits, such as FPGAs (Field-Programmable Gate Arrays), PLDs (Programmable Logic Devices), or ASICs (Application Specific Integrated Circuits), which are processors with a circuit configuration designed specifically for executing specific processes. All processors have built-in or connected memory, and all use the memory to execute specific processes.
特定処理を実行するハードウェア資源は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせ、又はCPUとFPGAとの組み合わせ)で構成されてもよい。また、特定処理を実行するハードウェア資源は1つのプロセッサであってもよい。 The hardware resource that executes the specific processing may be composed of one of these various processors, or may be composed of a combination of two or more processors of the same or different types (for example, a combination of multiple FPGAs, or a combination of a CPU and an FPGA). The hardware resource that executes the specific processing may also be a single processor.
1つのプロセッサで構成する例としては、第1に、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが、特定処理を実行するハードウェア資源として機能する形態がある。第2に、SoC(System-on-a-chip)などに代表されるように、特定処理を実行する複数のハードウェア資源を含むシステム全体の機能を1つのICチップで実現するプロセッサを使用する形態がある。このように、特定処理は、ハードウェア資源として、上記各種のプロセッサの1つ以上を用いて実現される。 As an example of a configuration using a single processor, first, there is a configuration in which one processor is configured using a combination of one or more CPUs and software, and this processor functions as a hardware resource that executes specific processing. Second, there is a configuration in which a processor is used to realize the functions of an entire system, including multiple hardware resources that execute specific processing, on a single IC chip, as typified by SoC (System-on-a-chip). In this way, specific processing is realized using one or more of the various processors listed above as hardware resources.
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路を用いることができる。また、上記の特定処理はあくまでも一例である。従って、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。 More specifically, the hardware structure of these various processors can be an electrical circuit that combines circuit elements such as semiconductor devices. Furthermore, the specific processing described above is merely an example. Therefore, it goes without saying that unnecessary steps can be deleted, new steps can be added, or the processing order can be rearranged, all within the scope of the spirit of the invention.
以上に示した記載内容及び図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、及び効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、及び効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容及び図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことは言うまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容及び図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。 The above-described written content and illustrations are a detailed explanation of the parts related to the technology of the present disclosure and are merely an example of the technology of the present disclosure. For example, the above explanation of the configuration, functions, actions, and effects is an explanation of an example of the configuration, functions, actions, and effects of the parts related to the technology of the present disclosure. Therefore, it goes without saying that unnecessary parts may be deleted, new elements may be added, or substitutions may be made to the above-described written content and illustrations, as long as they do not deviate from the spirit of the technology of the present disclosure. Furthermore, to avoid confusion and facilitate understanding of the parts related to the technology of the present disclosure, the above-described written content and illustrations omit explanations of common technical knowledge that do not require particular explanation to enable the implementation of the technology of the present disclosure.
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。 All publications, patent applications, and technical standards mentioned in this specification are incorporated by reference herein to the same extent as if each individual publication, patent application, and technical standard was specifically and individually indicated to be incorporated by reference.
以上の実施形態に関し、更に以下を開示する。 The following is further disclosed regarding the above embodiments.
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段を含むシステム。
(Claim 1)
The system includes a means for projecting an ideal human image set by a user, a means for custom-changing the user's actions and speech based on the ideal human image, and a means for presenting the custom-changed actions and speech to the user and repeatedly training them.
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
(請求項4)
前記理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段が、ユーザーの感情を認識する感情エンジンを含む、請求項1記載のシステム。
(Claim 4)
The system according to claim 1 , wherein the means for custom-changing the user's actions and speech based on the ideal human image includes an emotion engine that recognizes the user's emotions.
(請求項5)
前記感情エンジンが、ユーザーの感情状態をリアルタイムで分析し、その結果を基にユーザーの行動や発言をカスタムチェンジする、請求項4記載のシステム。
(Claim 5)
5. The system according to claim 4, wherein the emotion engine analyzes the user's emotional state in real time and custom-changes the user's behavior and speech based on the results of the analysis.
(請求項6)
前記感情エンジンが、ユーザーの感情状態の変化をトラッキングし、その変化を基に反復トレーニングの内容を調整する、請求項4記載のシステム。
(Claim 6)
5. The system of claim 4, wherein the emotional engine tracks changes in the user's emotional state and adjusts the repetitive training based on the changes.
「実施例1」 "Example 1"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言を生成AIモデルを用いてカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
該反復トレーニングの進捗を記録し、フィードバックを提供する手段と、
を含むシステム。
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image using a generative AI model;
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
means for recording the progress of said repetitive training and providing feedback;
A system including:
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「応用例1」 "Application Example 1"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
生成AIモデルを用いて理想の人間像に基づいた行動や発言を生成する手段と、
該生成された行動や発言をプロンプト文としてユーザーに提示する手段と、
を含むシステム。
(Claim 1)
A means to project the ideal image of a person set by the user,
A way to customize user behavior and speech based on the ideal person,
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
A method for generating actions and statements based on an ideal human image using a generative AI model, and
means for presenting the generated actions or utterances to the user as prompt sentences;
A system including:
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「実施例2」 "Example 2"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示する手段と、
該提示された行動や発言をユーザーが反復トレーニングする手段と、
ユーザーの行動や発言を収集する手段と、
収集した行動や発言を解析し、生成AIモデルを使用してカスタムチェンジする手段と、
を含むシステム。
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image;
A means for presenting the custom-changed actions and statements to a user;
A means for the user to repeatedly train the suggested actions and utterances;
A means of collecting user actions and comments,
A method to analyze collected actions and comments and use generative AI models to make custom changes.
A system including:
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「応用例2」 "Application Example 2"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
接客業務を行うスタッフが装着するスマート眼鏡を用いて、理想の接客態度をトレーニングする手段と、
生成AIモデルを使用して、理想の人間像に基づいたカスタムチェンジされた発言を生成する手段と、
を含むシステム。
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image;
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
A method for training ideal customer service attitudes using smart glasses worn by staff performing customer service duties.
A means for generating custom-modified utterances based on an ideal human profile using a generative AI model; and
A system including:
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「感情エンジンを組み合わせた場合の実施例1」 "Example 1: Combining Emotion Engines"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
ユーザーの感情状態をリアルタイムで分析する感情エンジンと、
該感情エンジンから得られたデータを基にトレーニング内容を調整する手段と、
を含むシステム。
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image;
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
An emotion engine that analyzes the user's emotional state in real time,
a means for adjusting training content based on data obtained from the emotion engine;
A system including:
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「感情エンジンを組み合わせた場合の応用例1」 "Application example 1: Combining emotion engines"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
ユーザーの感情状態をリアルタイムで分析する手段と、
ユーザーの感情状態に応じてトレーニング内容を調整する手段と、
スマートデバイスを用いてユーザーにフィードバックを提供する手段と、
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image;
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
A means of analyzing the user's emotional state in real time;
a means for adjusting training content according to the user's emotional state;
a means for providing feedback to the user using a smart device;
を含むシステム。 A system including
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「感情エンジンを組み合わせた場合の実施例2」 "Example 2: Combining Emotion Engines"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
ユーザーの感情状態をリアルタイムで分析する手段と、
該感情状態に応じてトレーニング内容を調整する手段と、
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image;
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
A means of analyzing the user's emotional state in real time;
a means for adjusting training content in response to said emotional state;
を含むシステム。 A system including
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
「感情エンジンを組み合わせた場合の応用例2」 "Application Example 2: Combining Emotion Engines"
(請求項1)
ユーザーが設定した理想の人間像を投影する手段と、
該理想の人間像に基づいてユーザーの行動や発言をカスタムチェンジする手段と、
該カスタムチェンジした行動や発言をユーザーに提示し、それを反復トレーニングする手段と、
ユーザーの感情状態をリアルタイムで分析する感情エンジンと、
該感情エンジンに基づいてトレーニング内容を調整する手段と、
スマート眼鏡に表示する手段と、
を含むシステム。
(Claim 1)
A means to project the ideal image of a person set by the user,
A means for customizing the user's actions and comments based on the ideal human image;
A means for presenting the customized behaviors and utterances to the user and repeatedly training them;
An emotion engine that analyzes the user's emotional state in real time,
a means for adjusting training content based on the emotion engine;
a means for displaying on the smart glasses;
A system including:
(請求項2)
前記理想の人間像は、ユーザーの人間関係のトラウマや教養等を考慮して設定される、請求項1記載のシステム。
(Claim 2)
The system according to claim 1 , wherein the ideal person image is set taking into consideration the user's traumatic relationships, education, etc.
(請求項3)
前記反復トレーニングにより、ユーザーが自身の理想像に近づくことを促進する、請求項1記載のシステム。
(Claim 3)
The system of claim 1 , wherein the repetitive training encourages the user to approach their ideal image.
10、210、310、410 データ処理システム
12 データ処理装置
14 スマートデバイス
214 スマート眼鏡
314 ヘッドセット型端末
414 ロボット
10, 210, 310, 410 Data processing system 12 Data processing device 14 Smart device 214 Smart glasses 314 Headset type terminal 414 Robot
Claims (3)
ユーザーの行動及び発言の少なくとも1つをデータとして収集する手段と、
前記ユーザーが設定した理想の人間像に関する情報と、収集されたユーザーの行動及び発言の少なくとも1つのデータに基づいて、当該ユーザーの行動及び発言の少なくとも1つをカスタムチェンジする指示を生成するプロンプト文を生成する手段と、
生成されたプロンプト文と、生成AIモデルとを用いて、前記ユーザーの行動及び発言の少なくとも1つをカスタムチェンジした行動及び発言の少なくとも1つを含む提案メッセージを生成する手段と、
生成された提案メッセージを、前記ユーザーに対して提示する手段と、を含むシステム。 means for storing information about an ideal human image set by a user;
A means for collecting at least one of user actions and statements as data;
A means for generating a prompt sentence that generates an instruction to custom change at least one of the user's behavior and speech based on information about the ideal person image set by the user and at least one of the collected data about the user's behavior and speech;
A means for generating a suggested message including at least one of an action and a utterance obtained by custom-changing at least one of the user's action and utterance using the generated prompt sentence and a generation AI model;
and means for presenting the generated suggestion message to the user.
前記プロンプト文を生成する手段は、前記ユーザーが設定した理想の人間像に関する情報と、収集されたユーザーの行動及び発言の少なくとも1つのデータと、特定された前記ユーザーの感情状態に基づいて、当該ユーザーの行動及び発言の少なくとも1つをカスタムチェンジする指示を生成するプロンプト文を生成する、請求項1記載のシステム。 means for identifying an emotional state of the user using an emotion engine;
The system of claim 1, wherein the means for generating the prompt sentence generates a prompt sentence that generates instructions to custom change at least one of the user's behavior and utterances based on information about the ideal person image set by the user, collected data about at least one of the user's behavior and utterances, and the identified emotional state of the user.
The system of claim 1 , wherein the means for presenting to the user is a display of smart glasses.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023155948 | 2023-09-21 | ||
| JP2023155948 | 2023-09-21 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025049219A JP2025049219A (en) | 2025-04-03 |
| JP7742466B2 true JP7742466B2 (en) | 2025-09-19 |
Family
ID=95209700
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024164528A Active JP7742466B2 (en) | 2023-09-21 | 2024-09-20 | system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7742466B2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013003643A (en) | 2011-06-13 | 2013-01-07 | Sony Corp | Information processing apparatus, information processing method, and program |
| WO2018179745A1 (en) | 2017-03-31 | 2018-10-04 | ソニー株式会社 | Information processing device, information processing method, and program |
| JP2019212238A (en) | 2018-06-08 | 2019-12-12 | 株式会社リコー | Education support system |
-
2024
- 2024-09-20 JP JP2024164528A patent/JP7742466B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013003643A (en) | 2011-06-13 | 2013-01-07 | Sony Corp | Information processing apparatus, information processing method, and program |
| WO2018179745A1 (en) | 2017-03-31 | 2018-10-04 | ソニー株式会社 | Information processing device, information processing method, and program |
| JP2019212238A (en) | 2018-06-08 | 2019-12-12 | 株式会社リコー | Education support system |
Non-Patent Citations (1)
| Title |
|---|
| 土田 修平,身体の動きによって「なりたい自分になる!」を支援するAIを作る,[online],2023年03月29日,取得先<https://www.jst.go.jp/sis/scenario/list/2023/03/202303-03.html>,[取得日 2025.08.21] |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2025049219A (en) | 2025-04-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7742466B2 (en) | system | |
| JP2026023438A (en) | system | |
| JP2026033039A (en) | system | |
| JP2025059094A (en) | system | |
| JP2026038832A (en) | system | |
| JP2026030048A (en) | system | |
| JP2026050908A (en) | system | |
| JP2026024740A (en) | system | |
| JP2026037376A (en) | system | |
| JP2026025268A (en) | system | |
| JP2026028815A (en) | system | |
| JP2026033960A (en) | system | |
| JP2026025273A (en) | system | |
| JP2026032971A (en) | system | |
| JP2026029446A (en) | system | |
| JP2026018742A (en) | system | |
| JP2026033175A (en) | system | |
| JP2026032972A (en) | system | |
| JP2026016184A (en) | system | |
| JP2026037374A (en) | system | |
| JP2026018793A (en) | system | |
| JP2026030074A (en) | system | |
| JP2026032885A (en) | system | |
| JP2026024587A (en) | system | |
| JP2026029530A (en) | system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250219 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250902 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250908 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7742466 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |