JP7651833B2 - IMAGE EDITING DEVICE, IMAGE EDITING METHOD, AND IMAGE EDITING PROGRAM - Google Patents
IMAGE EDITING DEVICE, IMAGE EDITING METHOD, AND IMAGE EDITING PROGRAM Download PDFInfo
- Publication number
- JP7651833B2 JP7651833B2 JP2020172874A JP2020172874A JP7651833B2 JP 7651833 B2 JP7651833 B2 JP 7651833B2 JP 2020172874 A JP2020172874 A JP 2020172874A JP 2020172874 A JP2020172874 A JP 2020172874A JP 7651833 B2 JP7651833 B2 JP 7651833B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- dimensional
- editing
- display
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明は、画像編集装置、画像編集方法、及び画像編集プログラムに関する。 The present invention relates to an image editing device, an image editing method, and an image editing program.
コミュニケーションの場面では、効率的に正確な情報伝達を行うために、言語情報によるコミュニケーションだけでは不十分であることがある。例えば、新しい企画やアイデアを考える際に行われる会議では、意思疎通のために視覚情報の活用が有効である。コミュニケーションの場面では、正確な視覚情報化の手段が望まれる。 In communication situations, verbal communication alone may not be sufficient to transmit information efficiently and accurately. For example, in meetings held to think up new plans or ideas, it is effective to use visual information to communicate. In communication situations, accurate means of visual information are desirable.
特許文献1には、グラフィックレコーディングシステムの議事録編集画面において、イラスト検索結果表示領域に表示されたイラストが選択され、選択されたイラストが議事録に貼り付けられて、イラストを交えた議事録が作成される。イラストを交えた議事録を眺めることで会議の振り返りを効率的に行うことができることが記載されている。
特許文献1に記載の技術では、グラフィックレコーディングシステムに設定されたイラストを選択することしかできず、設定されたイラストによっては、ユーザの意図を十分に情報伝達できない可能性がある。
The technology described in
本発明は、上記に鑑みてなされたものであって、ユーザによって編集可能な視覚情報を提示できる画像編集装置、画像編集方法、及び画像編集プログラムを提供することを目的とする。 The present invention has been made in consideration of the above, and aims to provide an image editing device, an image editing method, and an image editing program that can present visual information that can be edited by a user.
上述した課題を解決し、目的を達成するために、本発明の1つの側面にかかる画像編集装置は、画像データを表示する表示手段と、前記表示手段に表示される画像データのうち第1のデータフォーマットを有する第1の画像データに第1の編集処理を施す第1の編集手段と、前記表示手段に表示される画像データのうち前記第1のデータフォーマットとは異なる第2のデータフォーマットを有する第2の画像データに第2の編集処理を施す第2の編集手段と、前記第1のデータフォーマットを前記第2のデータフォーマットに変換する変換手段と、を有し、前記表示手段は、前記第1の編集手段によって前記第1の編集処理が施された場合に、前記第1の画像データの表示が前記第1の編集処理後の画像データに表示が変更され、前記変換手段によって変換された前記第2の画像データに前記第2の編集処理が施された場合に、前記第2の画像データの表示が前記第2の編集処理後の表示に変更される。 In order to solve the above-mentioned problems and achieve the object, an image editing device according to one aspect of the present invention has a display means for displaying image data, a first editing means for performing a first editing process on first image data having a first data format among the image data displayed on the display means, a second editing means for performing a second editing process on second image data having a second data format different from the first data format among the image data displayed on the display means, and a conversion means for converting the first data format into the second data format, and when the first editing process is performed by the first editing means, the display of the first image data is changed to the image data after the first editing process, and when the second editing process is performed on the second image data converted by the conversion means, the display of the second image data is changed to the display after the second editing process.
本発明によれば、ユーザによって編集可能な視覚情報を提示できるという効果を奏する。 The present invention has the advantage of being able to present visual information that can be edited by the user.
(実施形態)
実施形態にかかるビジュアルコミュニケーションシステムは、コミュニケーションを支援する機能を有する。コミュニケーションの場面では、効率的に正確な情報伝達を行うために、言語情報によるコミュニケーションだけでは不十分であることがある。例えば、新しい企画やアイデアを考える際に行われる会議では、意思疎通のために視覚情報の活用が有効である。視覚情報化の手段として手でアイデアの絵をスケッチすることが考えられるが、頭の中の情景そのものを0から視覚情報化することが容易でないことがある。そのため、誰でも扱いが簡単な言語情報を基に視覚情報に変換する第1の技術が知られている。
(Embodiment)
The visual communication system according to the embodiment has a function of supporting communication. In communication situations, communication by language information alone may not be sufficient to efficiently and accurately transmit information. For example, in a meeting held when thinking of new plans or ideas, it is effective to use visual information for communication. One possible way to visualize information is to sketch a picture of an idea by hand, but it may not be easy to visualize the scene in one's head from scratch. For this reason, a first technology is known that converts information into visual information based on language information that is easy for anyone to use.
しかし、言語情報を基に視覚情報に変換する第1の技術では、予め用意されたイラストが検索されるにすぎない。具体的に説明すると、頭の中に存在する伝えたい情景と一致する向きや組み合わせのイラストが存在せず適切に情報伝達ができない場合が多い。予め用意されたイラストの数を増加させていけば、頭の中の情景と一致するイラストが存在する確率は高まっていくが、イラストの数の増加に伴って、選択するための時間が長時間化してしまう。また、頭の中の情景を正確に再現するために、イラストを基に自分で編集しようとしても、簡易な編集機能しかなければ、編集後のイラストは、頭の中の情景に近いものとなりにくい。そのため、第1の技術では、会議などのコミュニケーションの場で正確に情報伝達ができない可能性がある。 However, the first technology, which converts language information into visual information, merely searches for illustrations prepared in advance. More specifically, there are many cases where the information cannot be properly transmitted because there are no illustrations with orientations or combinations that match the scene in one's head. Increasing the number of prepared illustrations increases the probability that an illustration matching the scene in one's head is present, but as the number of illustrations increases, the time required to select increases. Furthermore, even if one tries to edit the illustrations themselves in order to accurately reproduce the scene in one's head, if there is only a simple editing function, the edited illustration is unlikely to be close to the scene in one's head. For this reason, the first technology may not be able to accurately transmit information in communication situations such as meetings.
そこで、本実施形態では、ビジュアルコミュニケーションシステムにおいて、ユーザから受け付けた言語情報に対応するイラストを検索して表示し、表示されたイラストに対して表示形態を変更させながら2段階の編集処理を可能とすることで、コミュニケーションの場面における正確な情報伝達の支援を図る。 In this embodiment, the visual communication system searches for and displays illustrations that correspond to the language information received from the user, and enables a two-stage editing process in which the display form of the displayed illustration is changed, thereby supporting accurate information transmission in communication situations.
具体的には、ビジュアルコミュニケーションシステムは、言語情報を基に思い通りに編集可能な視覚情報に変換し、会議などのコミュニケーションの場で頭の中の情景の短時間での正確な意思疎通を可能にする。ビジュアルコミュニケーションシステムは、コミュニケーションの場における発話や文字入力などの言語情報をリアルタイムで解析し、解析すると同時に言語情報に関連するイラストの候補として1以上のサムネイル画像を特定エリアに表示する。ビジュアルコミュニケーションシステムは、言語情報とサムネイル画像とが対応付けられた第1の対応情報を有しており、言語情報を受け付けると、第1の対応情報におけるその言語情報に対応する1以上のサムネイル画像を特定して表示する。また、ビジュアルコミュニケーションシステムは、サムネイル画像とイラストとが対応付けられた第2の対応情報を有している。イラストが3次元画像である場合に、サムネイル画像を2次元画像とすることで、ビジュアルコミュニケーションシステムは、イラストを表示する場合に比べて、サムネイル画像を高速に表示できる。ユーザからの言語情報が受け付けられるたびに、表示画面上のサムネイル画像が新しく切り替わって高速に更新表示され得る。これにより、ユーザが会話を止めずにその中から、発話又は文字入力された際の頭の中の情景に近い1以上のサムネイル画像を選択できる。第2の対応情報に応じて、選択されたサムネイル画像に紐づけられた3次元イラストデータが検索され、特定された3次元イラストデータが表示される。これにより、3次元イラストデータに対して3次元的な編集処理(3次元的な移動、拡縮、回転)を行うことができる。その後に、ビジュアルコミュニケーションシステムは、3次元的な編集処理が可能な3次元イラストデータを2次元的な編集処理が可能な2次元イラストデータに変換(固定化)する。これに応じて、2次元イラストデータに対して、2次元的な編集処理(一部を自由に消したり上から付け加えたり色を塗ったりすること)が可能である。この言語情報の自動認識をトリガーとする2段階の編集処理により、リアルタイムのコミュニケーションの場で、頭の中の情景を短時間で正確に表現でき、迅速かつ正確な意思疎通が可能となる。 Specifically, the visual communication system converts language information into visual information that can be edited as desired, enabling accurate communication of the scene in one's head in a short time in a communication situation such as a conference. The visual communication system analyzes language information such as speech and character input in a communication situation in real time, and at the same time displays one or more thumbnail images in a specific area as candidates for illustrations related to the language information. The visual communication system has first correspondence information in which language information and thumbnail images are associated, and when language information is received, one or more thumbnail images corresponding to the language information in the first correspondence information are specified and displayed. In addition, the visual communication system has second correspondence information in which thumbnail images are associated with illustrations. When the illustration is a three-dimensional image, the visual communication system can display the thumbnail image at a higher speed than when displaying an illustration by making the thumbnail image a two-dimensional image. Each time language information from a user is received, the thumbnail image on the display screen can be switched to a new one and updated and displayed at a high speed. This allows the user to select one or more thumbnail images that are close to the scene in his or her head when the speech or character input is received from among them without stopping the conversation. According to the second correspondence information, three-dimensional illustration data associated with the selected thumbnail image is searched for, and the identified three-dimensional illustration data is displayed. This allows three-dimensional editing (three-dimensional movement, enlargement, reduction, and rotation) of the three-dimensional illustration data. The visual communication system then converts (fixes) the three-dimensional illustration data that can be three-dimensionally edited into two-dimensional illustration data that can be two-dimensionally edited. In response to this, two-dimensional editing (freely erasing parts, adding on top, or painting) of the two-dimensional illustration data is possible. This two-stage editing process triggered by automatic recognition of language information allows the scene in one's head to be accurately expressed in a short time in a real-time communication situation, enabling rapid and accurate communication.
より具体的には、ビジュアルコミュニケーションシステム4は、図1に示すように構成され得る。図1は、ビジュアルコミュニケーションシステム4の構成を示す図である。
More specifically, the
ビジュアルコミュニケーションシステム4は、クライアント端末1、サーバ2、及び接続部3を有する。接続部3は、クライアント端末1及びサーバ2を互いに通信可能に接続する。
The
クライアント端末1は、言語情報入力部100、イラスト表示部200、描画操作部300を有する。サーバ2は、描画表示部400及び記憶部500を有する。記憶部500は、プログラム500aを格納する。
The
ビジュアルコミュニケーションシステム4は、ユーザからの起動要求をクライアント端末1で受け付けると、起動要求がクライアント端末1からサーバ2へ送信され、サーバ2で起動要求に応じてプログラム500aが記憶部500から読み出される。ビジュアルコミュニケーションシステム4は、プログラム500aに従い、例えば図1に例示するように、クライアント端末1内に言語情報入力部100、イラスト表示部200、描画操作部300を機能的に構成し、サーバ2内に描画表示部400を機能的に構成する。
When the
なお、ビジュアルコミュニケーションシステム4は、クライアント端末1内のイラスト表示部200と描画操作部300とをサーバ2または別のサーバ内に構成してもよい。あるいは、ビジュアルコミュニケーションシステム4は、言語情報入力部100、イラスト表示部200、描画操作部300、描画表示部400を含むすべての機能構成をクライアント端末1内で完結するように構成しても良い。あるいは、ビジュアルコミュニケーションシステム4は、イラスト表示部200に含まれる複数の要素の一部(例えば、ユーザインタフェース及びそれに近い部分)をクライアント端末1内に構成し、残りの部分をサーバ2または別のサーバ内に構成してもよい。同様に、ビジュアルコミュニケーションシステム4は、描画操作部300に含まれる複数の要素の一部(例えば、ユーザインタフェース及びそれに近い部分)をクライアント端末1内に構成し、残りの部分をサーバ2または別のサーバ内に構成してもよい。
In addition, the
接続部3は、有線通信回線及び/又は無線通信回線であってもよく、いわゆる通信ネットワークであってもよいし、通信ケーブル等であってもよい。接続部3は、インターネット、移動体通信網、LAN(Local Area Network)等のうち1つ以上を用いて構築されていてもよい。接続部3は、有線通信だけでなく、3G(3rd Generation)、4G(4th Generation)、5G(5th Generation)、Wi-Fi(Wireless Fidelity)(登録商標)、WiMAX(Worldwide Interoperability for Microwave Access)またはLTE(Long Term Evolution)等の無線通信によるネットワークが含まれてもよい。プログラム500aがクライアント端末1内に格納され各機能構成がクライアント端末1内で完結するように構成される場合、接続部3は省略されてもよい。
The
クライアント端末1において、言語情報入力手段としての言語情報入力部100は、ユーザによる言語情報の入力を受け付ける。イラスト表示部200は、ディスプレイに文字・イラスト等の画像を表示する。描画操作部300は、ユーザによる描画操作を受け付ける。ここで、描画とは、手書きだけでなく、ディスプレイへの描画を目的としたディスプレイ上での選択動作等も含まれる。クライアント端末1の描画操作部300は、サーバ2の描画表示部400へ描画操作要求を送信する。サーバ2の描画表示部400は、描画操作要求に応じて、表示画像の表示形態を変化させるように表示情報を更新してクライアント端末1へ送信する。クライアント端末1は、更新後の表示情報を受信し、その表示情報に応じた画像をディスプレイに表示する。これにより、ユーザによる描画操作の結果がクライアント端末1のディスプレイに表示される。
In the
クライアント端末1、サーバ2は、それぞれ、図2に示すようなコンピュータ5でハードウェア的に構成されてもよい。図2は、ビジュアルコミュニケーションシステム4に適用されるコンピュータ5のハードウェア構成を示す図である。
The
コンピュータ5は、図2に示されているように、CPU501、ROM502、RAM503、HD504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、データバス510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516、動作取得デバイス517、マイク518、スピーカ519、カメラ520を備えている。
As shown in FIG. 2, the computer 5 includes a
これらのうち、CPU501は、コンピュータ5全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム500a等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出し又は書き込みを制御する。表示手段としてのディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、接続部3を利用してデータ通信をするためのインターフェースである。バスライン510は、図2に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
Of these, the
また、キーボード511は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出し又は書き込み(記憶)を制御する。
The
動作取得デバイス517は、ユーザの動作を検出し、電気信号に変える回路で、入力手段の一種である。ユーザの動作の検出は、光の反射を検出する光学式、ユーザに取り付けられた磁器センサ、機械式センサ、磁気センサの検出結果を用いるもの、またはユーザの画像を解析する方式等いずれか、またはそれらを組み合わせてもよい。
The
マイク518は、音を電気信号に変える内蔵型の回路である。スピーカ519は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。 The microphone 518 is a built-in circuit that converts sound into an electrical signal. The speaker 519 is a built-in circuit that converts the electrical signal into physical vibrations to produce sounds such as music or voice.
スピーカ519は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。 Speaker 519 is a built-in circuit that converts electrical signals into physical vibrations to produce sounds such as music and voice.
カメラ520は、被写体を撮像して画像データを得る内蔵型の撮像手段の一種である。
なお、サーバ2に適用されるコンピュータ5において、HD504は、記憶部500に対応し、プログラム500aを格納する。クライアント端末1に適用されるコンピュータ5において、サーバ2から接続部3経由でプログラム500aがダウンロードされHD504に格納され、CPU501によりプログラム500aがHD504から読み出され実行されることで、RAM503内に図1に示すような機能構成が、コンパイル時に一括して又は処理の進行に応じて順次に展開され得る。また、サーバ2に適用されるコンピュータ5において、プログラム500aがCPU501により実行されることで、RAM503内に図1に示すような機能構成が、コンパイル時に一括して又は処理の進行に応じて展開され得る。
In the computer 5 applied to the
また、サーバ2に適用されるコンピュータ5は、ユーザインタフェースに関する構成が省略されていてもよく、ディスプレイ506、キーボード511、及びポインティングデバイス512、動作取得デバイス517のうち少なくとも1つが省略されていてもよい。
In addition, the computer 5 applied to the
また、クライアント端末1、サーバ2は、コンピュータ5以外にも、IWB(Interactive White Board:相互通信が可能な電子式の黒板機能を有する白板)、デジタルサイネージ等の出力装置、HUD(Head Up Display)装置、産業機械、医療機器、ネットワーク家電、自動車(Connected Car)、携帯電話、スマートフォン、タブレット端末、ゲーム機、PDA(Personal Digital Assistant)等であってもよい。
In addition to the computer 5, the
図1に示す言語情報入力部100は、機能的に、図3に示すように構成され得る。図3は、言語情報入力部100の構成を示す図である。
The language
言語情報入力部100は、音声入力部101、文字入力部102、認識部103、及び送信部104を備える。これら各部は、HD504からRAM503上に展開されたプログラムに従ったCPU501からの命令によって動作することで実現される機能または手段である。
The language
音声入力部101は、マイク318によってユーザの音声が変換された音声信号、またはネットワークI/F509経由で受信された音声信号を言語情報として受け付ける。音声入力部101は、音声信号を認識部103へ供給する。
The
文字入力部102は、キーボード541、ポインティングデバイス512、動作取得デバイス517によってユーザから入力された文字信号、またはネットワークI/F経由で受信された文字信号を言語情報として受け付ける。文字入力部102は、文字信号を認識部103へ供給する。文字入力部102への文字の入力は、キーボード541へのタイピングまたは、ポインティングデバイス512や動作取得デバイス517による手書き入力を想定する。
The
認識部103は、音声入力部101又は文字入力部102から言語情報を受けると、言語情報に対して文字情報の認識を行う。
When the
認識部103は、音声信号を音声入力部101から受けると、音声信号に対して音声認識処理を行い文字情報へ変換する。認識部103は、文字ごとにテンプレート音声信号を有する。認識部103は、音声信号に対してテンプレート音声信号を用いたマッチング処理を行い、そのマッチングスコアに基づいて音声ごとに文字を認識できる。これにより、認識部103は、音声信号に対する認識結果として文字情報を生成する。
When the
認識部103は、文字信号を文字入力部102から受けると、文字信号に対する認識結果として文字情報を生成する。認識部103は、キーボード541へのタイピングによる文字情報を受けた場合、その文字情報を認識結果とする。認識部103は、ポインティングデバイス512や動作取得デバイス517による手書き文字画像を受けた場合、手書き文字画像に対してテキスト認識処理を行い文字情報へ変換する。認識部103は、文字ごとにテンプレート文字画像を有する。認識部103は、手書き文字画像に対してテンプレート文字画像を用いたマッチング処理を行い、そのマッチングスコアに基づいて手書き文字画像ごとに文字を認識できる。これにより、認識部103は、手書き文字画像に対する認識結果として文字情報を生成する。
When the
認識部103は、認識結果を送信部104へ供給する。送信部104は、認識結果をイラスト表示部200に送信する。
The
図1に示すイラスト表示部200は、機能的に、図4に示すように構成され得る。図4は、イラスト表示部200の構成を示す図である。
The
イラスト表示部200は、受信部201、サムネイル検索部202、サムネイル表示部203、サムネイル選択部204、イラスト検索部205、イラスト表示部206、文脈解析部207、優先度決定部208、サムネイル化部211、イラスト化部213、3次元データ入力部214、キーワード化部215、及び登録文字入力部216を備える。
The
これら各部は、HD504からRAM503上に展開されたプログラム500aに従ったCPU501からの命令によって動作することで実現される機能または手段である。
Each of these units is a function or means that is realized by operating according to instructions from the
また、イラスト表示部200は、選択傾向蓄積部209、サムネイル蓄積部210、イラスト蓄積部212を備える。これら各部は、ROM502またはRAM503またはHD504によって構築される。
The
サムネイル蓄積部210及びイラスト蓄積部212へのデータ蓄積について図4及び図5を用いて説明する。図5は、画像データの変換を示すデータフロー図である。 The storage of data in the thumbnail storage unit 210 and the illustration storage unit 212 will be explained using Figures 4 and 5. Figure 5 is a data flow diagram showing the conversion of image data.
3次元データ入力部214は、3次元データが入力される。3次元データは、例えば図5(a)に示すようなポリゴンデータであり、複数の空間座標を含む。3次元データは、3次元画像データフォーマット(例えば、OBJフォーマット)に対応している。3次元データ入力部214は、3次元データをイラスト化部213へ供給する。 The three-dimensional data input unit 214 receives three-dimensional data. The three-dimensional data is, for example, polygon data as shown in FIG. 5(a) and includes multiple spatial coordinates. The three-dimensional data corresponds to a three-dimensional image data format (for example, OBJ format). The three-dimensional data input unit 214 supplies the three-dimensional data to the illustration unit 213.
イラスト化部213は、3次元データを3次元イラストデータに変換する。3次元イラストデータは、例えば図5(b)に示すような3次元的な線画データであり、複数の空間座標を含む。3次元イラストデータは、3次元画像データフォーマット(例えば、OBJフォーマット)に対応している。イラスト化部213は、3次元データで示される3次元形状のエッジの3次元位置を特定して線画でつなぎ合わせることなどにより、3次元データから線画の情報を抽出し、3次元イラストデータを生成する。イラスト化部213は、3次元イラストデータをイラスト蓄積部212に追加的に格納する。 The illustration conversion unit 213 converts the three-dimensional data into three-dimensional illustration data. The three-dimensional illustration data is, for example, three-dimensional line drawing data as shown in FIG. 5(b) and includes multiple spatial coordinates. The three-dimensional illustration data corresponds to a three-dimensional image data format (for example, the OBJ format). The illustration conversion unit 213 extracts line drawing information from the three-dimensional data, for example by identifying the three-dimensional positions of the edges of the three-dimensional shape represented by the three-dimensional data and connecting them with line drawing, thereby generating three-dimensional illustration data. The illustration conversion unit 213 additionally stores the three-dimensional illustration data in the illustration storage unit 212.
これにより、イラスト蓄積部212には、図6に示すようなイラスト情報212aが蓄積される。図6は、イラスト蓄積部212に蓄積されるイラスト情報212aのデータ構造を示す図である。イラスト情報212aは、3次元イラストデータとその識別情報とが1以上の3次元イラストデータについて対応付けられている。例えば、イラスト情報212aは、識別情報欄212a1及びアクセス情報欄212a2を有する。識別情報欄212a1には、3次元イラストデータを識別するための情報が記録され、例えば3次元イラストデータのID番号が記録される。アクセス情報欄212a2には、3次元イラストデータにアクセスするための情報が記録され、例えば3次元イラストデータのファイル名が記録される。
As a result,
サムネイル化部211は、イラスト蓄積部212に3次元イラストデータが追加されたタイミングで、又は、所定の周期ごとに、3次元イラストデータをイラスト蓄積部212から取得し、3次元イラストデータを2次元サムネイルデータに変換する。2次元サムネイルデータは、例えば図5(c)に示すような2次元的な線画データであり、3次元イラストデータを縮小し2次元化されたことに相当する線画データである。2次元サムネイルデータは、2次元画像データフォーマット(例えば、BMPフォーマット)に対応している。2次元サムネイルデータは、3次元イラストデータの識別情報に関連付けられる。サムネイル化部211は、3次元イラストデータに含まれた複数の空間座標が所定の平面に投影された複数の平面座標を求め、求められた複数の平面座標に応じた2次元的な線画データを縮小することなどにより、3次元イラストデータから縮小及び2次元化された2次元サムネイルデータを生成する。サムネイル化部211は、2次元サムネイルデータを3次元イラストデータの識別情報に関連付けた形でサムネイル蓄積部210に追加的に格納する。 The thumbnail generating unit 211 acquires the three-dimensional illustration data from the illustration storage unit 212 when the three-dimensional illustration data is added to the illustration storage unit 212 or at predetermined intervals, and converts the three-dimensional illustration data into two-dimensional thumbnail data. The two-dimensional thumbnail data is, for example, two-dimensional line drawing data as shown in FIG. 5(c), and is line drawing data equivalent to the three-dimensional illustration data being reduced and two-dimensionalized. The two-dimensional thumbnail data corresponds to a two-dimensional image data format (for example, BMP format). The two-dimensional thumbnail data is associated with the identification information of the three-dimensional illustration data. The thumbnail generating unit 211 obtains a plurality of plane coordinates in which a plurality of spatial coordinates included in the three-dimensional illustration data are projected onto a predetermined plane, and reduces the two-dimensional line drawing data corresponding to the obtained plurality of plane coordinates, thereby generating two-dimensional thumbnail data that has been reduced and two-dimensionalized from the three-dimensional illustration data. The thumbnail generating unit 211 additionally stores the two-dimensional thumbnail data in the thumbnail storage unit 210 in a form associated with the identification information of the three-dimensional illustration data.
これにより、サムネイル蓄積部210には、図7に示すようなサムネイル情報210aが蓄積される。図7は、サムネイル蓄積部210に蓄積されるサムネイル情報210aのデータ構造を示す図である。サムネイル情報210aは、キーワードと3次元イラストデータと2次元サムネイルデータとが1以上の2次元サムネイルデータについて対応付けられた情報である。サムネイル情報210aは、第1の対応情報として、キーワードと2次元サムネイルデータとが対応付けられた情報を含む。図7に示されるように、一つの2次元サムネイルデータに対して複数のキーワードが設定されていてもよい。また、サムネイル情報210aは、第2の対応情報として、2次元サムネイルデータと3次元イラストデータとが対応付けられた情報を含む。例えば、サムネイル情報210aは、キーワード欄210a1、識別情報欄210a2及びアクセス情報欄210a3を有する。キーワード欄210a1には、2次元サムネイルデータが呼び出されるためのキーワードが記録されるが、キーワードが未登録の状態では空欄になっている。識別情報欄210a2には、2次元サムネイルデータに紐づけられた3次元イラストデータを識別するための情報が記録され、例えば3次元イラストデータのID番号が記録される。アクセス情報欄210a3には、2次元サムネイルデータにアクセスするための情報が記録され、例えば2次元サムネイルデータのファイル名が記録される。
As a result,
登録文字入力部216は、イラスト蓄積部212に3次元イラストデータが追加されたタイミングで、又は、所定の周期ごとに、3次元イラストデータに紐づけるべき文字情報が入力される。登録文字入力部216は、文字情報を3次元イラストデータの識別情報に関連付けられた形で受け付ける。このとき、登録文字入力部216は、点線の矢印で示すように、イラスト蓄積部212から文字情報が紐づけるべき候補となる複数の3次元イラストデータの識別情報を取得して、複数の3次元イラストデータの識別情報から識別情報が選択入力されてもよい。登録文字入力部216は、文字情報を3次元イラストデータの識別情報に関連付けられた形でキーワード化部215へ供給する。 The registered character input unit 216 receives character information to be linked to the three-dimensional illustration data when three-dimensional illustration data is added to the illustration storage unit 212, or at predetermined intervals. The registered character input unit 216 accepts the character information in a form associated with identification information of the three-dimensional illustration data. At this time, as indicated by the dotted arrow, the registered character input unit 216 may obtain identification information of multiple three-dimensional illustration data that are candidates to be linked to the character information from the illustration storage unit 212, and select and input identification information from the identification information of the multiple three-dimensional illustration data. The registered character input unit 216 supplies the character information to the keyword unit 215 in a form associated with the identification information of the three-dimensional illustration data.
キーワード化部215は、文字情報を3次元イラストデータの識別情報に関連付けられた形で受けると、サムネイル蓄積部210にアクセスして、3次元イラストデータの識別情報に対応したキーワード欄210a1に文字情報を追加的に書き込む。 When the keyword generation unit 215 receives the text information associated with the identification information of the three-dimensional illustration data, it accesses the thumbnail storage unit 210 and writes the text information into the keyword field 210a1 that corresponds to the identification information of the three-dimensional illustration data.
これにより、サムネイル蓄積部210に蓄積されるサムネイル情報210aにおいて、キーワード欄210a1には、図7に示すように、1以上のキーワードが追加的に記録される。
As a result, in the
ここで、2次元サムネイルデータのデータサイズは、3次元イラストデータのデータサイズより大幅に小さい。言語情報からのイラスト検索時にデータサイズの軽いサムネイルを使用することで画像呼び出し時のタイムラグを最小限に抑えることを可能とする。 The data size of the 2D thumbnail data is significantly smaller than the data size of the 3D illustration data. By using thumbnails with a small data size when searching for illustrations based on language information, it is possible to minimize the time lag when retrieving images.
選択傾向蓄積部209へのデータ蓄積について図4を用いて説明する。受信部201は、言語情報認識結果を受信すると、言語情報認識結果を文脈解析部207へ供給する。文脈解析部207は、言語情報認識結果を基に文脈を解析する。また、サムネイル選択部204での選択情報を選択傾向蓄積部209でユーザの選択傾向として蓄積する。この文脈解析部207の解析結果と選択傾向蓄積部209の蓄積結果とを基に、優先度決定部208は、2次元サムネイルデータを表示する際の優先度を決定し、決定結果をサムネイル表示部203へ供給する。サムネイル表示部203は、優先度決定部208の決定結果に応じて、優先度の高い順に2次元サムネイルデータをディスプレイに表示させる。
The data storage in the selection
優先度の例としては、言語情報としての異国語に対応して決定された優先度であってもよい。優先度決定部208は、言語の種類に応じて、出現サムネイルが変化されるような優先度を決定しても良い。例えば、アフリカ語で「学校」という言葉を検知した際には、日本の一般的な学校を示すイラストではなくアフリカに多く見られる学校を示すイラストが優先的に表示されるように優先度が決定される。
An example of the priority may be a priority determined in response to a foreign language as language information. The
イラストの表示方法について図4を用いて説明する。受信部201は、言語情報認識結果を受信すると、言語情報認識結果をサムネイル検索部202へ供給する。サムネイル検索部202は、言語情報認識結果を基に2次元サムネイルデータを検索する。サムネイル検索部202は、サムネイル蓄積部210にアクセスし、言語情報認識結果に応じた文字情報をキーワードとしてサムネイル情報210aを検索し、その文字情報(例えば、キーワード)に対応した1以上の2次元サムネイルデータとそれに関連付けられた3次元イラストデータの識別情報とを検索結果として呼び出しサムネイル表示部203へ供給する。第1の表示制御手段としてのサムネイル表示部203は、検索された1以上の2次元サムネイルデータを接続部3経由で描画表示部400(図1参照)へ供給する。これに応じて、描画表示部400は、検索された1以上の2次元サムネイルデータをクライアント端末1のディスプレイの特定場所に表示させる。選択手段としてのサムネイル選択部204は、ユーザによる選択操作、一例としてディスプレイ上に表示された2次元サムネイルデータをポインティングデバイスで選択する操作に応じて、ディスプレイに表示された1以上の2次元サムネイルデータから2次元サムネイルデータを選択し、選択された2次元サムネイルデータに関連付けられた3次元イラストデータの識別情報をイラスト検索部205へ供給する。イラスト検索部205は、3次元イラストデータの識別情報を基に3次元イラストデータを検索する。イラスト検索部205は、イラスト蓄積部212にアクセスし、その識別情報に対応した3次元イラストデータを検索結果として呼び出しイラスト表示部206へ供給する。第2の表示制御手段としてのイラスト表示部206は、検索された3次元イラストデータを接続部3経由で描画表示部400(図1参照)へ供給する。これに応じて、描画表示部400は、検索された3次元イラストデータをクライアント端末1のディスプレイ上に表示させる。
The method of displaying the illustration will be described with reference to FIG. 4. When the receiving
図1に示す描画操作部300は、機能的に、図8に示すように構成され得る。図8は、描画操作部300の構成を示す図である。
The
描画操作部300は、イラスト編集部301、固定化部302、描画部303、手描き入力部304、及び出力部305を備える。
The
第1の編集手段(3次元データ編集入力手段)としてのイラスト編集部301は、3次元イラストデータをイラスト表示部200から受け、3次元イラストデータに対する3次元的な編集処理を行う。イラスト編集部301は、3次元的な編集処理において、ユーザによる、3次元的な回転操作、3次元的な移動操作、3次元的な拡大操作、3次元的な縮小操作などを受け付け、それらの操作要求を描画部303、出力部305、接続部3経由で描画表示部400(図1参照)へ供給する。3次元的な回転操作は、3次元イラストデータに含まれた複数の空間座標がそれらの相対的な位置関係を維持しながら所定の軸周りに3次元的に回転されるように変更される操作である。3次元的な拡大操作は、3次元イラストデータに含まれた複数の空間座標が所定の点から等しい距離割合で放射状に遠ざかるように変更される操作である。3次元的な縮小操作は、3次元イラストデータに含まれた複数の空間座標が所定の点に対して等しい距離割合で放射状に近づくように変更される操作である。これらの操作要求に応じて、描画表示部400は、クライアント端末1の描画部303における3次元イラストデータの表示形態を変更する。これにより、クライアント端末1のディスプレイ上における3次元イラストデータの位置、大きさ、向きが3次元的に変更され得る。
The
変換手段としての固定化部302は、所定の操作(例えば、2次元的な編集処理が活性化される操作、より具体的には2次元的な編集処理が可能な状態へ移行する操作)に応じて、3次元的な編集処理が可能な3次元イラストデータを2次元的な編集処理が可能な2次元イラストデータへ変換(固定化)する。2次元イラストデータは、図5(d)に示すような2次元的な線画データであり、3次元イラストデータに3次元的な編集処理が施され2次元化されたことに相当する線画データである。2次元イラストデータは、2次元画像データフォーマット(例えば、BMPフォーマット)に対応している。固定化部302は、3次元イラストデータに含まれた複数の空間座標がディスプレイの画面に対応した平面に投影された複数の平面座標を求め、求められた複数の平面座標に応じた2次元的な線画データを生成することなどにより、3次元イラストデータを2次元イラストデータへ変換して描画部303に固定する。
The fixing
第2の編集手段(2次元データ編集入力手段)としての2次元データ編集入力部304は、2次元イラストデータに対する2次元的な編集処理を行う。2次元データ編集入力部304は、2次元的な編集処理において、ユーザによる、2次元的な回転操作、2次元的な移動操作、2次元的な拡大操作、2次元的な縮小操作、一部を消す操作、手書きの線画を付け加える操作、色を塗る操作などを受け付け、それらの操作要求を描画部303、出力部305、接続部3経由で描画表示部400(図1参照)へ供給する。2次元的な回転操作は、2次元イラストデータに含まれた複数の平面座標がそれらの相対的な位置関係を維持しながら所定の点周りに2次元的に回転されるように変更される操作である。2次元的な拡大操作は、2次元イラストデータに含まれた複数の平面座標が所定の点から等しい距離割合で放射状に遠ざかるように変更される操作である。2次元的な縮小操作は、2次元イラストデータに含まれた複数の平面座標が所定の点に対して等しい距離割合で放射状に近づくように変更される操作である。一部を消す操作は、2次元イラストデータに含まれた複数の平面座標の一部が削除される操作である。手書きの線画を付け加える操作は、2次元イラストデータに含まれた複数の平面座標に、手書きの線画に対応した複数の平面座標が追加される操作である。色を塗る操作は、2次元イラストデータに含まれた複数の平面座標に、所定の色属性に紐づけられた複数の平面座標が追加される操作である。これらの操作要求に応じて、描画表示部400は、クライアント端末1の描画部303における2次元イラストデータの表示形態を変更する。これにより、クライアント端末1のディスプレイ上における2次元イラストデータの位置、大きさ、向きが2次元的に変更されたり、2次元イラストデータの一部が消されたり、2次元イラストデータに手書きの線画が付け加えたり、2次元イラストデータに色が塗られたりする。
The two-dimensional data editing input unit 304 as the second editing means (two-dimensional data editing input means) performs two-dimensional editing processing on the two-dimensional illustration data. In the two-dimensional editing processing, the two-dimensional data editing input unit 304 accepts two-dimensional rotation operations, two-dimensional movement operations, two-dimensional enlargement operations, two-dimensional reduction operations, partial erasure operations, operations to add hand-drawn lines, coloring operations, and the like, performed by the user, and supplies these operation requests to the drawing display unit 400 (see FIG. 1) via the
描画部303には、マウスや指やスタイラスペンやジェスチャーなどによって入力も可能である。描画部303の情報を出力部305にて描画表示部400に出力する。これに応じて、描画表示部400は、クライアント端末1の描画部303における手書き入力された線画等が追加される。これにより、クライアント端末1のディスプレイ上に手書き入力された線画等が表示される。
Input to the
これら各部は、HD504からRAM503上に展開されたプログラムに従ったCPU501からの命令によって動作することで実現される機能または手段である。
Each of these units is a function or means that is realized by operating according to instructions from the
次に、ビジュアルコミュニケーションシステム4の動作について図9を用いて説明する。図9は、ビジュアルコミュニケーションシステムの動作を示すフローチャートである。
Next, the operation of the
ビジュアルコミュニケーションシステム4は、コミュニケーションを支援するための準備として、所定の情報が登録される登録処理(S1)を行う。その後、ビジュアルコミュニケーションシステム4は、ユーザから起動要求があるまで(S2でNo)待機する。ビジュアルコミュニケーションシステム4は、ユーザから起動要求があると(S2でYes)、プログラム500aを起動し、コミュニケーション支援処理(S3)を開始する。ビジュアルコミュニケーションシステム4は、ユーザから終了要求があるまで(S4でNo)コミュニケーション支援処理(S3)を継続的に行う。ビジュアルコミュニケーションシステム4は、ユーザから終了要求があると(S4でYes)、処理を終了する。
The
次に、登録処理(S1)の詳細について図10を用いて説明する。図10は、登録処理の流れを示すフローチャートである。 Next, the details of the registration process (S1) will be explained using FIG. 10. FIG. 10 is a flowchart showing the flow of the registration process.
ビジュアルコミュニケーションシステム4は、プログラム500aが起動されると、3次元データの登録要求があるまで(S11でNo)待機する。ビジュアルコミュニケーションシステム4は、3次元データの登録要求があると(S11でYes)、3次元データが入力される(S12)。3次元データは、例えばポリゴンデータ(図5(a)参照)である。ビジュアルコミュニケーションシステム4は、3次元データをイラスト化する(S13)。すなわち、ビジュアルコミュニケーションシステム4は、3次元データを3次元イラストデータに変換する。3次元イラストデータは、例えば3次元的な線画データ(図5(b)参照)である。ビジュアルコミュニケーションシステム4は、3次元イラストデータをイラスト蓄積部212に追加的に格納する。これにより、イラスト蓄積部212には、イラスト情報212a(図6参照)が登録される。
When program 500a is started,
ビジュアルコミュニケーションシステム4は、3次元イラストデータをサムネイル化する(S14)。すなわち、ビジュアルコミュニケーションシステム4は、3次元イラストデータを2次元サムネイルデータに変換する。2次元サムネイルデータは、例えば2次元的な線画データ(図5(c)参照)である。ビジュアルコミュニケーションシステム4は、2次元サムネイルデータを3次元イラストデータの識別情報に関連付けた形でサムネイル蓄積部210に追加的に格納する。これにより、サムネイル蓄積部210に、サムネイル情報210a(図7参照)における2次元サムネイルデータと3次元イラストデータの識別情報とが登録される。
The
そして、ビジュアルコミュニケーションシステム4は、キーワードの登録要求があるまで(S15でNo)待機する。ビジュアルコミュニケーションシステム4は、キーワードの登録要求があると(S15でYes)、文字情報が3次元イラストデータの識別情報に関連付けられた形で入力される(S16)。ビジュアルコミュニケーションシステム4は、文字情報をキーワード化する(S17)。すなわち、ビジュアルコミュニケーションシステム4は、サムネイル蓄積部210にアクセスして、3次元イラストデータの識別情報に対応したキーワード欄210a1に文字情報を追加的に書き込む。これにより、サムネイル蓄積部210に、サムネイル情報210a(図7参照)における文字情報(キーワード)が登録される。なお、登録処理とコミュニケーション支援処理は、図9に示したように両方行う必要はなく、その時点でサムネイル蓄積部210、イラスト蓄積部212に登録された情報に基づき、コミュニケーション支援処理のみ実行することも可能である。
Then, the
次に、コミュニケーション支援処理(S3)の詳細について図11、図12を用いて説明する。図11、図12は、コミュニケーション支援処理の流れを示すフローチャートである。図11の処理と図12の処理とは、互いに並行して行われ得る。 Next, the details of the communication support process (S3) will be described with reference to Figs. 11 and 12. Figs. 11 and 12 are flowcharts showing the flow of the communication support process. The process of Fig. 11 and the process of Fig. 12 can be performed in parallel with each other.
図11の処理において、ビジュアルコミュニケーションシステム4は、プログラム500aが起動され、ディスプレイに初期画面が表示されると、初期画面を介して、言語情報入力機能のON要求があるまで(S21でNo)待機する。ビジュアルコミュニケーションシステム4は、言語情報入力機能のON要求があると(S21でYes)、言語情報の入力があるまで(S22でNo)待機する。ビジュアルコミュニケーションシステム4は、言語情報の入力があると(S22でYes)、言語情報が音声情報であるか否かを判断する(S23)。ビジュアルコミュニケーションシステム4は、言語情報が音声情報であれば(S23でYes)、音声情報に対して音声認識処理を行い文字情報へ変換し(S24)、その文字情報を認識結果とする。ビジュアルコミュニケーションシステム4は、言語情報が音声情報でなければ(S23でNo)、言語情報が手書き文字画像であるか否かを判断する(S25)。ビジュアルコミュニケーションシステム4は、言語情報が手書き文字画像であれば(S25でYes)、手書き文字画像に対してテキスト認識処理を行い文字情報へ変換し(S26)、その文字情報を認識結果とする。ビジュアルコミュニケーションシステム4は、言語情報が手書き文字画像でなければ、すなわちキーボード541へのタイピングによる文字情報であれば(S25でNo)、その文字情報を認識結果とし、処理をS27へ進める。
In the process of FIG. 11, when the program 500a is started and an initial screen is displayed on the display, the
ビジュアルコミュニケーションシステム4は、サムネイル蓄積部210にアクセスし、認識結果である文字情報をキーワードとして2次元サムネイルデータを検索する(S27)。ビジュアルコミュニケーションシステム4は、検索された1以上の2次元サムネイルデータをディスプレイの特定場所に表示させる(S28)。
The
ビジュアルコミュニケーションシステム4は、言語情報入力機能のOFF要求があるまで(S29でNo)、S22~S28の処理が高速に繰り返され得る。すなわち、ビジュアルコミュニケーションシステム4は、ユーザからの言語情報が受け付けられるたびに、表示画面上のサムネイル画像を新しく切り替えて高速に更新表示できる。これにより、ユーザが会話を止めずにその中から、発話又は文字入力された際の頭の中の情景に近い1以上のサムネイル画像を選択できる。
The
ビジュアルコミュニケーションシステム4は、言語情報入力機能のOFF要求があると(S29でYes)、図11の処理を終了する。
When a request to turn off the language information input function is received (Yes in S29), the
図12の処理において、ビジュアルコミュニケーションシステム4は、S28で表示された1以上の2次元サムネイルデータのうちの2次元サムネイルデータが選択されるまで(S31でNo)待機する。ビジュアルコミュニケーションシステム4は、S28で表示された1以上の2次元サムネイルデータのうちの2次元サムネイルデータが選択されると(S31でYes)、イラスト蓄積部212にアクセスし、選択された2次元サムネイルデータに関連付けられた3次元イラストデータを検索する(S32)。ビジュアルコミュニケーションシステム4は、検索された3次元イラストデータをディスプレイに表示させる(S33)。
In the process of FIG. 12, the
ビジュアルコミュニケーションシステム4は、3次元イラストデータに対する編集操作があるまで(S34でNo)待機し、3次元イラストデータに対する編集操作があると(S34でYes)、第1の編集処理を行う(S35)。第1の編集処理は、3次元的な編集処理である。ビジュアルコミュニケーションシステム4は、第1の編集処理において、3次元的な回転操作、3次元的な移動操作、3次元的な拡大操作、3次元的な縮小操作などを受け付ける。それらの操作要求に応じて、ビジュアルコミュニケーションシステム4は、ディスプレイに表示された3次元イラストデータの表示形態を変更する(S36)。ビジュアルコミュニケーションシステム4は、3次元イラストデータが2次元イラストデータに固定化されるまで(S37でNo)、S34~S36の処理を繰り返す。
The
ビジュアルコミュニケーションシステム4は、3次元イラストデータが2次元イラストデータに固定化されると(S37でYes)、2次元イラストデータに対する編集操作があるまで(S38でNo)待機する。ビジュアルコミュニケーションシステム4は、2次元イラストデータに対する編集操作があると(S38でYes)、第2の編集処理を行う(S39)。第2の編集処理は、2次元的な編集処理である。ビジュアルコミュニケーションシステム4は、第2の編集処理において、2次元的な回転操作、2次元的な移動操作、2次元的な拡大操作、2次元的な縮小操作、一部を消す操作、手書きの線画を付け加える操作、色を塗る操作などを受け付ける。それらの操作要求に応じて、ビジュアルコミュニケーションシステム4は、ディスプレイに表示された2次元イラストデータの表示形態を変更する(S40)。ビジュアルコミュニケーションシステム4は、編集完了の要求があるまで(S41でNo)、S38~S40の処理を繰り返す。すなわち、S34~S37のループによる1段階目の編集処理とS38~S41のループによる2段階目の編集処理とにより、発話又は文字入力された際の頭の中の情景に近いイラストを短時間で正確に表現できる。
When the three-dimensional illustration data is fixed to two-dimensional illustration data (Yes in S37), the
ビジュアルコミュニケーションシステム4は、編集完了の要求があると(S41でYes)、図12の処理を終了する。
When a request to complete editing is received (Yes in S41), the
次に、ビジュアルコミュニケーションシステム4によりクライアント端末1のディスプレイに表示される画面(ビジュアルコミュニケーションシステム4による表示画面)の構成について図13を用いて説明する。図13は、ビジュアルコミュニケーションシステム4による表示画面の構成を示す図である。
Next, the configuration of the screen displayed on the display of the
ビジュアルコミュニケーションシステム4による表示画面は、図13に示すように、描画結果表示エリアS100、操作パレットS200、サムネイル表示エリアS300を含む。
As shown in FIG. 13, the display screen of the
描画結果表示エリアS100は、描画表示部400(図1参照)の結果を出力するエリアである。操作パレットS200は、音声入力部101、文字入力部102(図3参照)、手描き入力部304(図8参照)などの各入力部を呼び出すために使用する機能が配置されている。サムネイル表示エリアS300は、認識部103(図3参照)によって認識された言語情報と、サムネイル表示部203(図4参照)によって出力された2次元サムネイルデータが表示される。
The drawing result display area S100 is an area where the results of the drawing display unit 400 (see FIG. 1) are output. The operation palette S200 has functions used to call up each input unit, such as the
図5で示す各エリアのレイアウトおよび意匠形状はあくまで一例であり、権利範囲を制限するものではないものとする。例えばS300に円状の枠で囲まれた8つのサムネイルが表示されているが、枠の有無と形状や表示数については制限しないものとする。また、認識された言語情報も表示しなくても良いものとする。 The layout and design shape of each area shown in Figure 5 is merely an example and does not limit the scope of rights. For example, eight thumbnails surrounded by circular frames are displayed in S300, but there are no restrictions on the presence or absence of frames, their shape, or the number displayed. In addition, recognized language information does not need to be displayed.
次に、ビジュアルコミュニケーションシステム4によりクライアント端末1のディスプレイに表示される画面(ビジュアルコミュニケーションシステム4による表示画面)の概略動作について図14を用いて説明する。図14は、ビジュアルコミュニケーションシステム4による表示画面の概略動作を示す図である。図14では、言語情報を基に2次元サムネイルデータが呼び出される動作について示す。
Next, the general operation of the screen displayed on the display of the
図14(a)に示す言語情報認識ボタンS201を押す操作を検知すると、ビジュアルコミュニケーションシステム4は、言語情報認識モードに移行する。ビジュアルコミュニケーションシステム4は、言語情報認識モード時に、発話、手書き、タイピングなどによって言語情報(第1の言語情報)を取得すると、サムネイル表示エリアS300にて言語情報認識結果および認識結果に紐づく1以上の2次元サムネイルデータが表示される。また、2次元データ編集ボタンS202を押す操作を検知すると、図13の描画結果表示エリアS100を編集可能な、描画結果編集モードに移行する。
When the
例えば、図14(a)では、ビジュアルコミュニケーションシステム4は、描画結果表示エリアS100上に描画操作された手書き文字を認識し、認識結果の文字情報とそれに紐づけられた1以上の2次元サムネイルデータとをサムネイル表示エリアS300に表示した状態が示されている。
For example, FIG. 14(a) shows the
ビジュアルコミュニケーションシステム4は、さらに、発話、手書き、タイピングなどによって言語情報(第2の言語情報)を取得すると、サムネイル表示エリアS300にて表示されている1以上の2次元サムネイルデータの少なくとも一部が変更されて言語情報認識結果および認識結果に紐づく1以上の2次元サムネイルデータが更新表示される。
When the
例えば、図14(a)の状態で図14(b)の様な発話を認識すると、ビジュアルコミュニケーションシステム4は、認識結果の文字情報に応じて、サムネイル表示エリアS300の状態をリアルタイムに変化させる。図14(b)では、ビジュアルコミュニケーションシステム4が、新たな認識結果の文字情報とそれに紐づけられた1以上の2次元サムネイルデータとに基づきサムネイル表示エリアS301に更新表示した状態が示されている。
For example, when the
具体的には、新たに入力された言語情報(第2の言語情報)に対応するサムネイル画像に応じて、すでに表示されたサムネイル画像の表示のうち、少なくとも一部を変更してディスプレイ(表示手段)に表示させる。 Specifically, in accordance with the thumbnail image corresponding to the newly input language information (second language information), at least a portion of the display of the thumbnail image already displayed is changed and displayed on the display (display means).
すでに表示されたサムネイル画像の表示のうち、少なくとも一部を変更とは、例として、新たに入力された言語情報に対応するサムネイル画像をすでに表示されたサムネイル画像に追加して表示するためにすでに表示されているサムネイル画像の位置や大きさを変更したり、新たに入力された言語情報に対応するサムネイル画像を既に表示された画像に代えて表示するために削除したり、既に表示されているサムネイル画像の周囲の画像を変更する等である。 Changing at least a portion of the display of a thumbnail image that is already displayed means, for example, changing the position or size of a thumbnail image that is already displayed in order to add a thumbnail image that corresponds to newly input language information to the thumbnail image that is already displayed, deleting a thumbnail image that corresponds to newly input language information in order to display it in place of the image that is already displayed, or changing the image around the thumbnail image that is already displayed.
なお、発話だけでなく、新しい手書き文字やタイピングした文字を認識する度に、ビジュアルコミュニケーションシステム4は、サムネイル表示エリアS300の表示を変化させても良い。
In addition to speech, the
また、ビジュアルコミュニケーションシステム4は、2次元サムネイルデータがサムネイル表示エリアS300に表示しきれない場合は、古いものから順番に新しく検索された2次元サムネイルデータに置き換わるようにサムネイル表示エリアS300に表示してもよい。
In addition, if the 2D thumbnail data cannot be displayed in the thumbnail display area S300, the
図14では、言語情報認識モードへの切り替えスイッチを言語情報認識ボタンS201としているが、ボタンではなく特定単語の発話やコマンド入力等、手法は限定しないものとする。 In FIG. 14, the switch to switch to the language information recognition mode is the language information recognition button S201, but the method is not limited to this and can be, for example, speaking specific words or inputting commands instead of using a button.
図14に例示されるように、ビジュアルコミュニケーションシステム4は、ユーザからの言語情報が受け付けられるたびに、表示画面上のサムネイル画像を新しく切り替えて高速に更新表示できる。これにより、ユーザが会話を止めずにその中から、発話又は文字入力された際の頭の中の情景に近い1以上のサムネイル画像を選択できる。
As illustrated in FIG. 14, the
次に、ビジュアルコミュニケーションシステム4によるイラストの2段階の編集処理の流れについて図15を用いて説明する。図15は、2段階の編集処理の流れを示す図である。
Next, the flow of the two-stage illustration editing process by the
図15(a)では、ビジュアルコミュニケーションシステム4は、言語情報「人」に応じて、「人」の文字情報LIとそれに紐づけられた2次元サムネイルデータSM1~SM6とがサムネイル表示エリアS300に表示する。
In FIG. 15(a), the
2次元サムネイルデータSM5の選択操作を受けると、ビジュアルコミュニケーションシステム4は、図15(b)に示すように、2次元サムネイルデータSM5に紐づけられた3次元イラストデータを呼び出して描画結果表示エリアS100に表示する。
When the two-dimensional thumbnail data SM5 is selected, the
3次元的な編集処理において、ビジュアルコミュニケーションシステム4は、3次元的な回転操作、3次元的な移動操作、3次元的な拡大操作、3次元的な縮小操作などを受け付け、それらの操作要求に応じて、図15(c)に示すように、3次元イラストデータの表示形態を3次元的に変化させる。
In three-dimensional editing processing, the
所定のトリガーとなる操作(例えば、2次元的な編集操作のためのボタン(例えば、図14(a)に示す2次元データ編集ボタンS202)が押されることなど)を受けて、ビジュアルコミュニケーションシステム4は、図15(d)に示すように、3次元イラストデータを2次元イラストデータに固定化する。
When a predetermined triggering operation (e.g., pressing a button for a two-dimensional editing operation (e.g., the two-dimensional data editing button S202 shown in FIG. 14(a)) is received, the
2次元的な編集処理において、ビジュアルコミュニケーションシステム4は、2次元的な回転操作、2次元的な移動操作、2次元的な拡大操作、2次元的な縮小操作、一部を消す操作、手書きの線画を付け加える操作、色を塗る操作などを受け付け、それらの操作要求に応じて、図15(e)に示すように、2次元イラストデータの表示形態を2次元的に変化させる。
In two-dimensional editing processing, the
図15に例示されるように、1段階目の編集処理(図15(b)、図15(c))と2段階目の編集処理(図15(e))とにより、発話又は文字入力された際の頭の中の情景に近いイラストを短時間で正確に表現できる。 As shown in FIG. 15, the first stage of editing (FIG. 15(b) and FIG. 15(c)) and the second stage of editing (FIG. 15(e)) can quickly and accurately express an illustration that closely resembles the scene that appears in the user's mind when the speech or text is input.
次に、ビジュアルコミュニケーションシステム4によりクライアント端末1のディスプレイに表示される画面(ビジュアルコミュニケーションシステム4による表示画面)の詳細動作について図16~図23を用いて説明する。図16~図23は、それぞれ、ビジュアルコミュニケーションシステム4による表示画面の詳細動作を示す図である。図14では、言語情報を基に2次元サムネイルデータが呼び出され、サムネイルを選択し、イラスト編集を行う動作について示す。
Next, the detailed operation of the screen (display screen by visual communication system 4) displayed on the display of
図16(a)に示す操作パレットS200における音声入力ボタンS2011が押されたことを検知すると、ビジュアルコミュニケーションシステム4は、言語情報認識機能をONさせ、図16(b)に示すように、音声入力が待機状態にあることを示すアイコンS3021をサムネイル表示エリアS300に表示する。なお、操作パレットS200におけるキー入力ボタン2012が押されると、キーボードによるタイピング入力が可能な状態になり、タイピング入力が待機状態であることを示すアイコンが表示される。これら、アイコンS3021やタイピング入力が待機状態であることを示すアイコンは、言語情報認状態表示アイコンの一例である。
When it is detected that the voice input button S2011 in the operation palette S200 shown in FIG. 16(a) has been pressed, the
「人と乗り物」と発話されたことを検知すると、ビジュアルコミュニケーションシステム4は、図17に示すように、「人と乗り物」の文字情報LI1とそれに紐づけられた2次元サムネイルデータSM11~SM18とをサムネイル表示エリアS300に表示する。なお、文字情報と紐づけられたサムネイルデータとは、「人と乗り物」という文字情報全体と紐づけられたサムネイルデータでもよいし、「人」「乗り物」等のキーワードに分解し、それぞれのキーワードと紐づけられたサムネイルデータからなる群であってもよい。
When it is detected that "people and vehicles" has been spoken, the
さらに「動物」と発話されたことを検知すると、ビジュアルコミュニケーションシステム4は、図18に示すように、「人と乗り物動物」の文字情報LI2とそれに紐づけられた2次元サムネイルデータSM21~SM28とをサムネイル表示エリアS300に更新表示する。すなわち、ビジュアルコミュニケーションシステム4は、言語情報の入力を検知する度に、リアルタイムで2次元サムネイルデータを更新させて表示する。なお、文字情報と紐づけられたサムネイルデータとは、「人と乗り物動物」という文字情報全体と紐づけられたサムネイルデータでもよいし、「人」「乗り物」「動物」等のキーワードに分解し、それぞれのキーワードと紐づけられたサムネイルデータからなる群であってもよい。
When it detects that "animals" has been further uttered, the
図17、図18に例示されるように、ビジュアルコミュニケーションシステム4は、ユーザからの言語情報が受け付けられるたびに、表示画面上のサムネイル画像を新しく切り替えて高速に更新表示できる。これにより、ユーザが会話を止めずにその中から、発話又は文字入力された際の頭の中の情景に近い1以上のサムネイル画像を選択できる。
As illustrated in Figures 17 and 18, the
図17の画面で2次元サムネイルデータSM14が選択されたことを検知すると、ビジュアルコミュニケーションシステム4は、図19に示すように、2次元サムネイルデータSM14に紐づけられた3次元イラストデータIL1を呼び出して描画結果表示エリアS100に表示する。
When it is detected that the 2D thumbnail data SM14 has been selected on the screen of FIG. 17, the
3次元的な編集処理において、ビジュアルコミュニケーションシステム4は、3次元的な回転操作、3次元的な移動操作、3次元的な拡大操作、3次元的な縮小操作などを受け付け、それらの操作要求に応じて、図20に示すように、3次元イラストデータIL1の表示形態を3次元的に変化させる。
In the three-dimensional editing process, the
2次元的な編集処理のためのボタン(加筆ボタンS2013,色塗りボタンS2014,消しゴムボタンS2015)のいずれかが押されたことを検知すると、ビジュアルコミュニケーションシステム4は、図21に示すように、3次元イラストデータIL1が2次元イラストデータIL2に固定化される。本実施形態では一例として、この2次元的な編集処理のためのボタンが押されたことを言語報認識機能のOFF要求受付と判断し、2次元的な編集処理が可能な状態へと移行する。
When the
2次元的な編集処理において、ビジュアルコミュニケーションシステム4は、2次元的な回転操作、2次元的な移動操作、2次元的な拡大操作、2次元的な縮小操作、一部を消す操作、手書きの線画を付け加える操作、色を塗る操作などを受け付け、それらの操作要求に応じて、図21、図22、図23に示すように、2次元イラストデータIL2の表示形態を2次元的に変化させる。
In two-dimensional editing processing, the
図21では、加筆ボタンS2013により、2次元イラストデータIL2の背景となる風景の線画が手書きで追加され、色塗りボタンS2014により、3次元イラストデータIL2に色が塗られる。 In FIG. 21, the retouch button S2013 is used to add handwritten line drawings of the scenery that will form the background of the two-dimensional illustration data IL2, and the color button S2014 is used to add color to the three-dimensional illustration data IL2.
また図21では、図19、図20においてサムネイル表示エリアS300に表示されていた、言語情報認状態表示アイコン、文字情報、サムネイルデータは非表示となっている。サムネイル表示エリアS300の各種情報を非表示とするタイミングは、2次元的な編集処理のためのボタン(加筆ボタンS2013,色塗りボタンS2014,消しゴムボタンS2015)のいずれかが押されたことを検知したタイミング、固定化が実行されたタイミング、ユーザにより2次元的な編集集処理が開始されたタイミング等、適宜選択できる。 In addition, in Fig. 21, the language information recognition status display icon, character information, and thumbnail data that were displayed in the thumbnail display area S300 in Figs. 19 and 20 are not displayed. The timing for hiding the various information in the thumbnail display area S300 can be appropriately selected, such as when it is detected that any of the buttons for two-dimensional editing processes (the Add button S2013, the Color button S2014, the Eraser button S2015) has been pressed, when fixation is performed, when two-dimensional editing processes are started by the user, etc.
また、2次元的な編集を実施した後も、音声入力ボタンS2011、キー入力ボタンS2012を押すことで、言語情報認識機能をONさせ、サムネイル表示エリアS300に各種情報を表示させて、2次元的な編集が行われた画像上に新たな3次元イラストデータを表示、編集し、固定化された新たな2次元イラストデータを追加可能である。 Even after performing two-dimensional editing, the voice input button S2011 or the key input button S2012 can be pressed to turn on the language information recognition function and display various information in the thumbnail display area S300, allowing new three-dimensional illustration data to be displayed and edited on the image that has been two-dimensionally edited, and new fixed two-dimensional illustration data to be added.
図22では、消しゴムボタンS2015により、2次元イラストデータIL2’における線画の一部が削除される。 In FIG. 22, the eraser button S2015 is used to delete part of the line drawing in the two-dimensional illustration data IL2'.
図23では、加筆ボタンS2013により、2次元イラストデータIL2”に線画が追加される。 In FIG. 23, line art is added to the two-dimensional illustration data IL2" by using the Add button S2013.
図19~図23に例示されるように、1段階目の編集処理(図19、図20)と2段階目の編集処理(図21~図23)とにより、発話又は文字入力された際の頭の中の情景に近いイラストを短時間で正確に表現できる。 As shown in Figures 19 to 23, the first stage of editing (Figures 19 and 20) and the second stage of editing (Figures 21 to 23) allow an illustration that closely resembles the scene that occurs in the user's mind when the speech or text is input to be accurately expressed in a short period of time.
以上のように、本実施形態では、ビジュアルコミュニケーションシステム4において、ユーザから受け付けた言語情報に対応するイラストを検索して表示し、表示されたイラストに対して表示形態を変更させながら2段階の編集処理を可能とする。これにより、コミュニケーションの場面における正確な情報伝達を支援できる。
As described above, in this embodiment, the
なお、ビジュアルコミュニケーションシステム4の考え方は、オンライン会議システム24に適用されてもよい。オンライン会議システム24は、図24に示すように構成され得る。図24は、実施形態の変形例にかかるオンライン会議システム24の構成を示す図であり、描画表示部400として、オンライン会議ツールを利用する例を示す。
The concept of the
オンライン会議システム24は、複数のクライアント端末21a,21b、通信監理サーバ22、及び接続部23を有する。接続部23は、複数のクライアント端末21a,21b、通信監理サーバ22を互いに通信可能に接続する。複数のクライアント端末21a,21bは、描画表示部400により実現される表示画面を画面共有することができる。
The
各クライアント端末21a,21bは、言語情報入力部100a,100b、イラスト表示部200a,200b、描画操作部300a,300bを有する。言語情報入力部100a,100b、イラスト表示部200a,200b、描画操作部300a,300bの機能及び動作は、それぞれ、実施形態における言語情報入力部100、イラスト表示部200、描画操作部300の機能及び動作と同様である。
Each
通信監理サーバ22は、描画表示部400及び記憶部500に加えて、通信管理部600を有する。描画表示部400及び記憶部500の機能及び動作は、それぞれ、実施形態における描画表示部400及び記憶部500の機能及び動作と同様である。
The
通信管理部600は、会議参加者である複数のクライアント端末21a,21bそれぞれから受信した音声やカメラ画像を、他のクライアント端末に送信して管理する。描画表示部400は、オンライン会議のカメラ画像に重畳して描画表示する。通信管理部600は、重畳された画像を他のクライアント端末に送信する。
The communication management unit 600 transmits the audio and camera images received from each of the
重畳は画像の一部に重畳しても良いし、画像全体に重畳しても良い。また描画した画像だけでなく、S200,S300等も同時に重畳しても良い。 The overlay may be applied to a portion of the image, or to the entire image. In addition to the drawn image, S200, S300, etc. may also be overlaid at the same time.
例えば、図25~図27に示すように、ユーザが映っているカメラ画像と、動作取得デバイスにより取得されたユーザのジェスチャーによる描画を重畳させることもできる。図25は、実施形態の変形例におけるクライアント端末21aのカメラ520によって撮像されたカメラ画像を示す図であり、クライアント端末21aのユーザが映っているカメラ画像を例示している。図26は、実施形態の変形例における描画表示部400が図25のカメラ画像に重畳する画像を示す図である。図26では、描画結果表示エリアS100、操作パレットS200、サムネイル表示エリアS300のうち、操作パレットS200が重畳されず、描画結果表示エリアS100、サムネイル表示エリアS300が重畳された例が示されている。図27は、実施形態の変形例における他のクライアント端末21bで表示される画像を示す図である。この場合、有るクライアント端末においてユーザが自分のディスプレイに対して行っている指先による手書きが、他のクライアント端末では、ユーザの指先によってカメラ画像内に描画が重畳されていく画像として表示される。
For example, as shown in Figs. 25 to 27, a camera image showing a user and a drawing made by a gesture of the user acquired by a motion acquisition device can be superimposed. Fig. 25 is a diagram showing a camera image captured by the
このように会話しながらジェスチャー操作でイラストを用いたビジュアルコミュニケーションを実現することが可能である。 In this way, visual communication using illustrations can be achieved through gesture control while talking.
上記で説明した実施形態の、ビジュアルコミュニケーションシステム4、オンライン会議システム24は、画像編集システムまたは画像表示システムの例である。またクライアント端末1、クライアント端末21a、クライアント端末21b、サーバ2、通信管理端末22は、画像編集装置または画像表示装置の例である。
In the embodiment described above, the
なお、上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。 Each function of the embodiments described above can be realized by one or more processing circuits. Here, the term "processing circuit" in this specification includes a processor programmed to execute each function by software, such as a processor implemented by an electronic circuit, and devices such as an ASIC (Application Specific Integrated Circuit), DSP (Digital Signal Processor), FPGA (Field Programmable Gate Array), and conventional circuit modules designed to execute each function described above.
また、明細書中の対応テーブル(表)は、機械学習の学習効果によって生成されたものでもよい。ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり,コンピュータが,データ識別等の判断に必要なアルゴリズムを,事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。 The correspondence table in the specification may be one generated by the learning effect of machine learning. Here, machine learning is a technology for enabling a computer to acquire human-like learning capabilities, and refers to a technology in which a computer autonomously generates algorithms required for judgments such as data identification from learning data that is previously loaded, and applies these to new data to make predictions. The learning method for machine learning may be any of supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning, and deep learning, or may be a combination of these learning methods; any learning method for machine learning is acceptable.
また、ビジュアルコミュニケーションシステム4又はオンライン会議システム24で実行されるプログラム500aは、ROM等に予め組み込まれて提供されてもよい。あるいは、プログラム500aは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。あるいは、プログラム500aは、インターネット等のネットワークに接続されたコンピュータ上に格納され、ネットワーク経由でダウンロードされることにより提供するように構成しても良い。また、プログラム500aをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
The program 500a executed by the
1 クライアント端末
2 サーバ
3 接続部
4 ビジュアルコミュニケーションシステム
21a,21b クライアント端末
22 通信監理サーバ
23 接続部
24 オンライン会議システム
Claims (9)
前記音声入力情報、前記テキスト入力情報又は前記動作入力情報に対して文字情報を認識する認識手段と、
前記認識された文字情報を用いて、それぞれが画像データに紐づけられた複数のサムネイル画像を検索する検索手段と、
前記検索された複数のサムネイル画像を表示する表示手段と、
前記表示手段に表示される複数のサムネイル画像のうち選択されたサムネイル画像に紐づけられ且つ第1のデータフォーマットを有する第1の画像データに第1の編集処理を施す第1の編集手段と、
前記表示手段に表示される画像データのうち前記第1のデータフォーマットとは異なる第2のデータフォーマットを有する第2の画像データに第2の編集処理を施す第2の編集手段と、
前記第1のデータフォーマットを前記第2のデータフォーマットに変換する変換手段と、を有し、
前記表示手段は、
前記第1の編集手段によって前記第1の編集処理が施された場合に、前記第1の画像データの表示が前記第1の編集処理後の画像データに表示が変更され、
前記変換手段によって変換された前記第2の画像データに前記第2の編集処理が施された場合に、前記第2の画像データの表示が前記第2の編集処理後の表示に変更される、
画像編集装置。 a first input means for receiving voice input information, text input information or motion input information;
a recognition means for recognizing character information from the voice input information, the text input information, or the action input information;
a search means for searching for a plurality of thumbnail images, each of which is associated with image data, by using the recognized character information;
a display means for displaying the retrieved thumbnail images;
a first editing means for performing a first editing process on first image data that is associated with a thumbnail image selected from among the plurality of thumbnail images displayed on the display means and has a first data format;
a second editing means for performing a second editing process on second image data having a second data format different from the first data format among the image data displayed on the display means;
a conversion means for converting the first data format into the second data format,
The display means includes:
when the first editing process is performed by the first editing means, a display of the first image data is changed to a display of image data after the first editing process;
when the second editing process is performed on the second image data converted by the conversion means, a display of the second image data is changed to a display after the second editing process.
Image editing device.
請求項1に記載の画像編集装置。The image editing device according to claim 1 .
前記表示手段に表示される複数のサムネイル画像に紐づけられる複数の画像データのうち前記選択操作で指定されたサムネイル画像に紐づけられた画像データを選択する選択手段と、a selection means for selecting image data linked to a thumbnail image designated by the selection operation from among a plurality of image data linked to a plurality of thumbnail images displayed on the display means;
をさらに備え、Further equipped with
前記第1の編集手段は、前記表示手段に表示される複数のサムネイル画像に紐づけられた複数の画像データのうち前記選択手段で前記第1の画像データが選択された場合、前記第1の画像データに前記第1の編集処理を施すThe first editing means performs the first editing process on the first image data when the first image data is selected by the selection means from among a plurality of image data linked to a plurality of thumbnail images displayed on the display means.
請求項1に記載の画像編集装置。The image editing device according to claim 1 .
請求項1に記載の画像編集装置。 2. The image editing device according to claim 1, wherein the conversion means converts the first data format into the second data format in response to a state in which the second editing process by the second editing means is enabled.
前記第2の編集手段は、前記表示手段に表示される2次元画像データに前記第2の編集処理を施し、
前記変換手段は、3次元画像データフォーマットを2次元画像データフォーマットに変換する
請求項1から3のいずれか1項に記載の画像編集装置。 the first editing means performs the first editing process on the three-dimensional image data displayed on the display means;
the second editing means performs the second editing process on the two-dimensional image data displayed on the display means;
4. The image editing device according to claim 1 , wherein the conversion means converts a three-dimensional image data format into a two-dimensional image data format.
請求項5に記載の画像編集装置。 6. The image editing device according to claim 5, wherein the conversion means determines a plurality of planar coordinates projected onto a plane corresponding to the display means from a plurality of spatial coordinates contained in the three-dimensional image data, and generates two -dimensional image data including the plurality of planar coordinates.
前記第2の編集処理は、2次元的な編集操作に応じた処理を含む
請求項1から6のいずれか1項に記載の画像編集装置。 the first editing process includes a process corresponding to a three-dimensional editing operation;
The image editing device according to claim 1 , wherein the second editing process includes a process corresponding to a two-dimensional editing operation.
前記音声情報又は前記テキスト入力情報に対して文字情報を認識するステップと、
前記認識された文字情報を用いて、それぞれが画像データに紐づけられた複数のサムネイル画像を検索するステップと、
前記検索された複数のサムネイル画像を表示手段に表示するステップと、
前記表示手段に表示される複数のサムネイル画像のうち選択されたサムネイル画像に紐づけられ且つ第1のデータフォーマットを有する第1の画像データに第1の編集処理を施すステップと、
前記第1の編集処理を施すステップで前記第1の編集処理が施された場合に、前記第1の画像データの表示が前記第1の編集処理後の画像データに表示が変更されるステップと、
前記第1のデータフォーマットを第2のデータフォーマットに変換するステップと、
前記表示手段に表示される画像データのうち前記第2のデータフォーマットを有する第2の画像データに第2の編集処理を施すステップと、
前記変換するステップで変換された前記第2の画像データに前記第2の編集処理を施すステップで前記第2の編集処理が施された場合に、前記第2の画像データの表示が前記第2の編集処理後の表示に変更されるステップと、
を含む画像編集方法。 receiving voice or text input information;
recognizing character information from the voice information or the text input information;
using the recognized character information to search for a plurality of thumbnail images, each of which is associated with an image data;
displaying the retrieved thumbnail images on a display means;
a step of performing a first editing process on first image data that is associated with a thumbnail image selected from the plurality of thumbnail images displayed on the display means and has a first data format;
a step of changing a display of the first image data to a display of image data after the first edit processing when the first edit processing is performed in the step of performing the first edit processing;
converting the first data format into a second data format;
a step of performing a second editing process on second image data having the second data format among the image data displayed on the display means;
a step of changing a display of the second image data to a display after the second editing process when the second editing process is applied to the second image data converted in the converting step in a step of applying the second editing process;
Image editing methods including.
前記音声情報又は前記テキスト入力情報に対して文字情報を認識するステップと、
前記認識された文字情報を用いて、それぞれが画像データに紐づけられた複数のサムネイル画像を検索するステップと、
前記検索された複数のサムネイル画像を表示手段に表示するステップと、
前記表示手段に表示される複数のサムネイル画像のうち選択されたサムネイル画像に紐づけられ且つ第1のデータフォーマットを有する第1の画像データに第1の編集処理を施すステップと、
前記第1の編集処理を施すステップで前記第1の編集処理が施された場合に、前記第1の画像データの表示が前記第1の編集処理後の画像データに表示が変更されるステップと、
前記第1のデータフォーマットを第2のデータフォーマットに変換するステップと、
前記表示手段に表示される画像データのうち前記第2のデータフォーマットを有する第2の画像データに第2の編集処理を施すステップと、
前記変換するステップで変換された前記第2の画像データに前記第2の編集処理を施すステップで前記第2の編集処理が施された場合に、前記第2の画像データの表示が前記第2の編集処理後の表示に変更されるステップと、
をコンピュータに実行させる画像編集プログラム。 receiving voice or text input information;
recognizing character information from the voice information or the text input information;
using the recognized character information to search for a plurality of thumbnail images, each of which is associated with an image data;
displaying the retrieved thumbnail images on a display means;
a step of performing a first editing process on first image data that is associated with a thumbnail image selected from the plurality of thumbnail images displayed on the display means and has a first data format;
a step of changing a display of the first image data to a display of image data after the first edit processing when the first edit processing is performed in the step of performing the first edit processing;
converting the first data format into a second data format;
a step of performing a second editing process on second image data having the second data format among the image data displayed on the display means;
a step of changing a display of the second image data to a display after the second editing process when the second editing process is applied to the second image data converted in the converting step in a step of applying the second editing process;
An image editing program that causes a computer to execute the following:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020172874A JP7651833B2 (en) | 2020-10-13 | 2020-10-13 | IMAGE EDITING DEVICE, IMAGE EDITING METHOD, AND IMAGE EDITING PROGRAM |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020172874A JP7651833B2 (en) | 2020-10-13 | 2020-10-13 | IMAGE EDITING DEVICE, IMAGE EDITING METHOD, AND IMAGE EDITING PROGRAM |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022064243A JP2022064243A (en) | 2022-04-25 |
| JP7651833B2 true JP7651833B2 (en) | 2025-03-27 |
Family
ID=81378587
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020172874A Active JP7651833B2 (en) | 2020-10-13 | 2020-10-13 | IMAGE EDITING DEVICE, IMAGE EDITING METHOD, AND IMAGE EDITING PROGRAM |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7651833B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12321657B2 (en) | 2022-05-19 | 2025-06-03 | Ricoh Company, Ltd. | Communication system, information processing system, and information processing method for displaying language information converted from speech data |
| JP2024135640A (en) | 2023-03-23 | 2024-10-04 | 株式会社リコー | Communication system, program, terminal device, information processing system |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003256865A (en) | 2002-03-01 | 2003-09-12 | Celsys:Kk | Method and program for generating 2D image of cartoon expression from 3D object data |
| US20200066022A1 (en) | 2018-08-27 | 2020-02-27 | Microsoft Technology Licensing, Llc | Playback for embedded and preset 3d animations |
-
2020
- 2020-10-13 JP JP2020172874A patent/JP7651833B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003256865A (en) | 2002-03-01 | 2003-09-12 | Celsys:Kk | Method and program for generating 2D image of cartoon expression from 3D object data |
| US20200066022A1 (en) | 2018-08-27 | 2020-02-27 | Microsoft Technology Licensing, Llc | Playback for embedded and preset 3d animations |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022064243A (en) | 2022-04-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112131988B (en) | Method, apparatus, device and computer storage medium for determining virtual character lip shape | |
| US11978252B2 (en) | Communication system, display apparatus, and display control method | |
| US11463611B2 (en) | Interactive application adapted for use by multiple users via a distributed computer-based system | |
| US12562077B2 (en) | Method, computing device, and non-transitory computer-readable recording medium to translate audio of video into sign language through avatar | |
| JP7596533B2 (en) | Method for generating animal face style images, method for training models, and device | |
| US20140028780A1 (en) | Producing content to provide a conversational video experience | |
| JP2006208696A (en) | Apparatus, method, program and recording medium for remote control of presentation application | |
| JP7651833B2 (en) | IMAGE EDITING DEVICE, IMAGE EDITING METHOD, AND IMAGE EDITING PROGRAM | |
| CN118312044A (en) | Interactive teaching methods, devices, related equipment and computer program products | |
| US20250272046A1 (en) | Communication system, information processing system, and information processing method | |
| TWI703492B (en) | Method, program and device for controlling user interface | |
| JP2020037155A (en) | Gesture control device and gesture control program | |
| JP7786109B2 (en) | Communication system, display device, display control method, and display control program | |
| JP7468360B2 (en) | Information processing device and information processing method | |
| US20210224228A1 (en) | Computer device and method for file control | |
| JP2001154781A (en) | Desktop information device | |
| Rodrigues et al. | Studying natural user interfaces for smart video annotation towards ubiquitous environments | |
| Aziz et al. | Inclusive speech interaction techniques for creative object rotation | |
| US11150923B2 (en) | Electronic apparatus and method for providing manual thereof | |
| US20250200852A1 (en) | Communication system, information processing apparatus, terminal device, and information processing method | |
| US20250308521A1 (en) | Apparatus, method, and non-transitory recording medium | |
| JP2023171250A (en) | Communication systems, programs, terminal devices, information processing systems, information processing methods | |
| KR20210010567A (en) | Method, apparatus, and computer readable medium for propagating cropped images over a web socket connection in a networked collaborative workspace | |
| JP2025097275A (en) | COMMUNICATION SYSTEM, INFORMATION PROCESSING APPARATUS, TERMINAL DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM | |
| JP4635219B2 (en) | Graphics dialogue apparatus and graphics dialogue program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230824 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241105 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241227 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250212 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250225 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7651833 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |