JP7794866B2 - 新たな現実世界オブジェクトに関する注釈付けされたオブジェクト・モデルを作成するための方法およびシステム - Google Patents
新たな現実世界オブジェクトに関する注釈付けされたオブジェクト・モデルを作成するための方法およびシステムInfo
- Publication number
- JP7794866B2 JP7794866B2 JP2024028378A JP2024028378A JP7794866B2 JP 7794866 B2 JP7794866 B2 JP 7794866B2 JP 2024028378 A JP2024028378 A JP 2024028378A JP 2024028378 A JP2024028378 A JP 2024028378A JP 7794866 B2 JP7794866 B2 JP 7794866B2
- Authority
- JP
- Japan
- Prior art keywords
- operator
- model
- object model
- properties
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/016—Input arrangements with force or tactile feedback as computer generated output to the user
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating three-dimensional [3D] models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating three-dimensional [3D] models or images for computer graphics
- G06T19/20—Editing of three-dimensional [3D] images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/21—Collision detection, intersection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/004—Annotating, labelling
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2021—Shape modification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Architecture (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Description
2 プロセッサ
3 拡張現実または仮想現実ディスプレイ出力デバイス
4 データ・ストレージ
5 カメラ
6 知覚デバイス
7 カメラ
8 アイ・トラッカー
9 マイクロフォン
Claims (17)
- 現実世界オブジェクトの注釈付けされたオブジェクト・モデルを作成するための方法であって、
注釈付けされたオブジェクト・モデルが作成されることになるオブジェクトに関する初期オブジェクト・モデルを提供する方法ステップと、
前記初期オブジェクト・モデルに関して予測された前記オブジェクトの特性を、テンプレート・モデルを前記初期オブジェクト・モデル上にモーフィングすること、および前記テンプレート・モデルに関して知られている特性を前記予測された特性として前記初期オブジェクト・モデルに引き継ぐこと、によって生成することで、前記オブジェクトの特性を予測する方法ステップと、
前記初期オブジェクト・モデルに基づいて前記オブジェクトの表示を視覚化する方法ステップであって、前記オブジェクトの前記予測された特性が、前記表示に関連付けられて表示される、方法ステップと、
ユーザ知覚デバイスによって知覚されたユーザのジェスチャー、ユーザの指し示す操作、ユーザの音声入力、およびユーザの視線のうちの少なくとも1つに基づいて選択情報を入手する方法ステップと、
前記選択情報に対応する前記オブジェクトの部位を特定する方法ステップと、
ユーザ入力から特性情報を受け取る方法ステップと、
前記入力された特性情報を前記オブジェクトの前記対応する部位に関連付ける方法ステップと、を含む方法。 - 前記表示が、拡張現実(AR、Augmented Reality)ディスプレイまたは仮想現実(VR、Virtual Reality)ディスプレイを使用して視覚化される、
請求項1に記載の方法。 - 前記選択情報が、オペレータによって入力されたコマンドによって強化される、
請求項1に記載の方法。 - 前記選択情報が、少なくとも第1の選択情報および第2の選択情報を含み、前記特性情報が、前記少なくとも第1および第2の選択情報に対応する前記オブジェクトの前記部位間における関係、または前記部位に共通する特性を定義する、
請求項1に記載の方法。 - 前記オブジェクトの前記部位の前記特定が、ジェスチャーのタイプ、前記オブジェクトの前記表示と知覚されたオペレータの手との間における衝突の位置、および前記表示された表示上の指し示されている位置のうちの少なくとも1つに依存する、
請求項1に記載の方法。 - 前記オブジェクトの前記表示と前記知覚されたオペレータの手との間における衝突が特定された場合、フィードバックがオペレータに提供される、
請求項5に記載の方法。 - 前記予測された特性が、少なくとも、前記オブジェクトの部分を定義するセグメントの定義を含む、
請求項1に記載の方法。 - 前記予測された特性が、少なくともセグメントの定義を含み、前記オブジェクトの前記セグメントが、前記オブジェクトの前記表示の上のオーバーレイとして視覚化される、
請求項1に記載の方法。 - 前記オブジェクトの前記予測された特性の前記関連付けられている表示が、それぞれの予測された特性を、前記オブジェクトの前記特性が予測される前記オブジェクトのそれぞれの部位に対する空間的関係で表示し、前記オブジェクトの前記表示が、前記オブジェクトの前記関連付けられている予測された特性とともに、オペレータから受け取った操作入力に従って操作される、
請求項1に記載の方法。 - 知覚されたオペレータ入力に基づいて、前記初期オブジェクト・モデルが適合され、前記表示された表示が、それに従って更新される、
請求項1に記載の方法。 - 前記初期オブジェクト・モデルが、データベース情報、および注釈付けされたオブジェクト・モデル・プロセスの作成中におけるオペレータからの以前に受け取った情報のうちの少なくとも1つに基づいて前記オブジェクトの自動化されたセグメント化のためにオブジェクト部分検出器によって分析される、
請求項1に記載の方法。 - 現実世界オブジェクトの注釈付けされたオブジェクト・モデルを作成するためのシステムであって、プロセッサ、出力デバイス、およびオペレータ知覚デバイスを含み、前記プロセッサが、注釈付けされたオブジェクト・モデルが作成されることになるオブジェクトに関する初期オブジェクト・モデルを提供されるように、前記初期オブジェクト・モデルに関して予測された前記オブジェクトの特性を、テンプレート・モデルを前記初期オブジェクト・モデル上にモーフィングすること、および前記テンプレート・モデルに関して知られている特性を前記予測された特性として前記初期オブジェクト・モデルに引き継ぐこと、によって生成することで、前記オブジェクトの特性を予測するように、前記出力デバイスを制御して、前記初期オブジェクト・モデルに基づいて前記オブジェクトの表示を視覚化するように構成され、前記オブジェクトの前記予測された特性が、前記表示に関連付けられて表示される、視覚化することを行うように、前記オペレータ知覚デバイスによって知覚されたユーザのジェスチャー、ユーザの指し示す操作、ユーザの音声入力、およびユーザの視線のうちの少なくとも1つに基づいて前記オペレータ知覚デバイスによって入手された選択情報に対応する前記オブジェクトの部位を特定するように、ならびにオペレータによって入力された特性情報を前記オブジェクトの前記対応する部位に関連付けるように構成されている、システム。
- 前記出力デバイスが、拡張現実(AR、Augmented Reality)または仮想現実(VR、Virtual Reality)ディスプレイを含む、請求項12に記載のシステム。
- 前記オペレータ知覚デバイスが、少なくとも、オペレータの動きを知覚するためのカメラを含む、請求項12に記載のシステム。
- 前記オペレータ知覚デバイスが、少なくともマイクロフォンを含む、請求項12に記載のシステム。
- 前記システムが、前記オブジェクトの前記視覚化された提示との特定された接触について前記オペレータに知らせるためのフィードバック・デバイスを含む、請求項12に記載のシステム。
- 前記プロセッサが、データベースに接続されており、前記プロセッサが、前記注釈付けされたオブジェクト・モデルを前記データベースに格納するように構成されている、請求項12に記載のシステム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US18/129,085 | 2023-03-31 | ||
| US18/129,085 US12243181B2 (en) | 2023-03-31 | 2023-03-31 | Method and system for creating an annotated object model for a new real-world object |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024146778A JP2024146778A (ja) | 2024-10-15 |
| JP7794866B2 true JP7794866B2 (ja) | 2026-01-06 |
Family
ID=92896803
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024028378A Active JP7794866B2 (ja) | 2023-03-31 | 2024-02-28 | 新たな現実世界オブジェクトに関する注釈付けされたオブジェクト・モデルを作成するための方法およびシステム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12243181B2 (ja) |
| JP (1) | JP7794866B2 (ja) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021131853A (ja) | 2020-02-19 | 2021-09-09 | パロ アルト リサーチ センター インコーポレイテッド | Arオーバーレイを使用した変化検出方法及びシステム |
| WO2021235316A1 (ja) | 2020-05-21 | 2021-11-25 | ソニーグループ株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013020248A1 (en) * | 2011-08-09 | 2013-02-14 | Intel Corporation | Image-based multi-view 3d face generation |
| CN103793060B (zh) | 2014-02-14 | 2017-07-28 | 杨智 | 一种用户交互系统和方法 |
| US10353532B1 (en) | 2014-12-18 | 2019-07-16 | Leap Motion, Inc. | User interface for integrated gestural interaction and multi-user collaboration in immersive virtual reality environments |
| US10769438B2 (en) | 2017-05-23 | 2020-09-08 | Samsung Electronics Company, Ltd. | Augmented reality |
| CN107463261B (zh) | 2017-08-11 | 2021-01-15 | 北京铂石空间科技有限公司 | 立体交互系统及方法 |
| US20190180506A1 (en) * | 2017-12-11 | 2019-06-13 | Tsunami VR, Inc. | Systems and methods for adding annotations to virtual objects in a virtual environment |
| EP3686704B1 (en) * | 2019-01-22 | 2023-08-09 | Honda Research Institute Europe GmbH | Method for generating a representation and system for teaching an autonomous device operating based on such representation |
| EP4115395A4 (en) * | 2020-03-06 | 2024-02-14 | Yembo, Inc. | IDENTIFICATION OF FLOOD DAMAGE IN AN INDOOR ENVIRONMENT USING A VIRTUAL REPRESENTATION |
| US11514648B2 (en) * | 2020-12-23 | 2022-11-29 | Microsoft Technology Licensing, Llc | Aligning input image data with model input data to generate image annotations |
| US20230068798A1 (en) * | 2021-09-02 | 2023-03-02 | Amazon Technologies, Inc. | Active speaker detection using image data |
-
2023
- 2023-03-31 US US18/129,085 patent/US12243181B2/en active Active
-
2024
- 2024-02-28 JP JP2024028378A patent/JP7794866B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021131853A (ja) | 2020-02-19 | 2021-09-09 | パロ アルト リサーチ センター インコーポレイテッド | Arオーバーレイを使用した変化検出方法及びシステム |
| WO2021235316A1 (ja) | 2020-05-21 | 2021-11-25 | ソニーグループ株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US12243181B2 (en) | 2025-03-04 |
| JP2024146778A (ja) | 2024-10-15 |
| US20240331321A1 (en) | 2024-10-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102014385B1 (ko) | 수술영상 학습 및 학습 기반 수술동작 인식 방법 및 장치 | |
| WO2019041900A1 (zh) | 增强现实环境中识别装配操作、模拟装配的方法和装置 | |
| CN108475113B (zh) | 用于检测用户的手部姿态的方法、系统和介质 | |
| Wang et al. | Immersive human–computer interactive virtual environment using large-scale display system | |
| Yin et al. | Enhancing human-guided robotic assembly: AR-assisted DT for skill-based and low-code programming | |
| JP2017505965A (ja) | モバイル機器用三次元ジェスチャのリアルタイム認識及び追跡システム | |
| CN118893633B (zh) | 一种模型训练方法、装置和机械臂系统 | |
| WO2024078088A1 (zh) | 互动处理方法及装置 | |
| KR102335212B1 (ko) | 제스처 인식 방법 및 장치 | |
| CN112527112A (zh) | 一种多通道沉浸式流场可视化人机交互方法 | |
| WO2020195017A1 (ja) | 経路認識方法、経路認識装置、経路認識プログラム、及び経路認識プログラム記録媒体 | |
| JP2015148706A (ja) | 手話単語分類情報生成装置およびそのプログラム、ならびに、手話単語検索装置およびそのプログラム | |
| CN119871410A (zh) | 机器人操作方法、机器人、介质、设备和程序产品 | |
| Ribeiro de Oliveira et al. | Systematic review of virtual reality solutions employing artificial intelligence methods | |
| WO2019022829A1 (en) | HUMAN FEEDBACK IN A 3D MODEL ADJUSTMENT | |
| CN116185205B (zh) | 非接触手势交互方法和装置 | |
| JP7794866B2 (ja) | 新たな現実世界オブジェクトに関する注釈付けされたオブジェクト・モデルを作成するための方法およびシステム | |
| CN118397706B (zh) | 基于推荐算法的模板匹配手势识别方法、系统、设备及介质 | |
| Fan | The improvements for the hands gesture recognition based on the mediapipe | |
| Saremi et al. | Optimisation algorithms for hand posture estimation | |
| Gupta et al. | Hand gesture recognition system using deep learning | |
| Zou et al. | Gesture Builder: Flexible Gesture Customization and Efficient Recognition on VR Devices | |
| JP7806098B2 (ja) | ロボットアーム制御方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 | |
| US12051135B2 (en) | System and method for a precise semantic segmentation | |
| JPH1124813A (ja) | マルチモーダル入力統合システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240701 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250422 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250507 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250723 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20250829 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250902 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251016 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20251209 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251218 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7794866 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |