Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7501575B2 - Videoconferencing system, videoconferencing method, and program - Google Patents
[go: Go Back, main page]

JP7501575B2 - Videoconferencing system, videoconferencing method, and program - Google Patents

Videoconferencing system, videoconferencing method, and program Download PDF

Info

Publication number
JP7501575B2
JP7501575B2 JP2022115486A JP2022115486A JP7501575B2 JP 7501575 B2 JP7501575 B2 JP 7501575B2 JP 2022115486 A JP2022115486 A JP 2022115486A JP 2022115486 A JP2022115486 A JP 2022115486A JP 7501575 B2 JP7501575 B2 JP 7501575B2
Authority
JP
Japan
Prior art keywords
person
information
image
identified
person identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022115486A
Other languages
Japanese (ja)
Other versions
JP2022140529A (en
Inventor
直志 合川
智 木村
伸正 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2022115486A priority Critical patent/JP7501575B2/en
Publication of JP2022140529A publication Critical patent/JP2022140529A/en
Application granted granted Critical
Publication of JP7501575B2 publication Critical patent/JP7501575B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、ビデオ会議システム、ビデオ会議方法、およびプログラムに関する。 The present invention relates to a video conferencing system, a video conferencing method, and a program.

離れた場所にいる人物と会議を行う方法の1つとして、ビデオ会議システムが利用されている。ビデオ会議システムでは、それぞれの場所で撮影された映像を互いにやり取りすることにより、互いに離れた場所にいる人物同士で会議を行うことができる。 One method for holding a conference with people in different locations is to use a video conferencing system. With a video conferencing system, people in different locations can hold a conference by exchanging video footage taken at each location.

上述のビデオ会議システムに関連する技術が、例えば、下記特許文献1乃至3に開示されている。 Technologies related to the above-mentioned video conferencing system are disclosed, for example, in the following Patent Documents 1 to 3.

下記特許文献1には、2以上の地点間で双方向コミュニケーションを行う際、双方向コミュニケーションの参加者を容易に把握するための技術が開示されている。具体的には、(1)データベースに記憶されている識別情報を用いて各地点の参加者を認証し、(2)認証された参加者の位置を検出し、(3)各地点で撮影された映像のうち、参加者の検出位置に対応する部分に、データベースに記憶されているその参加者の属性情報を視覚的に表示するデータを付加する技術が開示されている。 The following Patent Document 1 discloses a technology for easily identifying participants in two-way communication when two-way communication is performed between two or more points. Specifically, the technology discloses (1) authenticating participants at each point using identification information stored in a database, (2) detecting the position of the authenticated participant, and (3) adding data that visually displays the attribute information of the participant stored in the database to the portion of the video captured at each point that corresponds to the detected position of the participant.

また、下記特許文献2には、会議の参加者が初対面の相手であっても、その参加者に関する情報を知ることを可能とする技術が開示されている。具体的には、(1)会議の参加者に関する参加者情報の入力を受け付け、(2)各参加者に対して所定の動作(口頭での返事や挙手など)を行わせ、(3)その動作を行った人物を撮影画像上で特定し、(4)特定した人物の顔認識結果と参加者情報とを対応付け、(5)その対応付けに従って各参加者が写る撮影画像上に参加者情報を合成する技術が開示されている。 In addition, the following Patent Document 2 discloses a technology that makes it possible to know information about meeting participants even if the participants are new to the person. Specifically, the technology discloses a technology that (1) accepts input of participant information about meeting participants, (2) has each participant perform a predetermined action (such as responding verbally or raising their hand), (3) identifies the person who performed the action on a captured image, (4) associates the face recognition results of the identified person with participant information, and (5) superimposes the participant information on a captured image in which each participant appears according to the association.

また、下記特許文献3には、会議の参加者として認証された人物が写る範囲を、相手側に表示する映像の範囲として自動的に調整する技術が開示されている。 In addition, the following Patent Document 3 discloses a technology that automatically adjusts the range of the image displayed to the other party to include the image of a person who has been authenticated as a conference participant.

特開2004-129071号公報JP 2004-129071 A 特開2010-028715号公報JP 2010-028715 A 特開2015-177418号公報JP 2015-177418 A

ビデオ会議用のシステムを利用して開催される会議を含め、会議の場では、誰が参加しているかをはっきりさせるべきであり、個人として特定されていない人物がそのままでいることは好ましくない。 In meetings, including those held using videoconferencing systems, it should be clear who is participating, and it is not advisable to leave individuals unidentified.

本発明は、上記の課題に鑑みてなされたものである。本発明の目的の一つは、ビデオ会議システムにおいて、個人として特定されていない人物がそのまま会議の場に残ることを抑制する技術を提供することである。 The present invention has been made in consideration of the above problems. One of the objectives of the present invention is to provide a technology that prevents an unidentified person from remaining at a conference in a video conference system.

本発明のビデオ会議システムは、
会議の参加人物が写る画像を取得する画像取得手段と、
前記画像の中から、人物と認識される領域を検出する人物領域検出手段と、
前記領域に含まれる人物を特定する人物特定処理を実行する人物特定手段と、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報を表示装置に表示させる表示制御手段と、
を備える。
The video conference system of the present invention comprises:
An image acquisition means for acquiring an image showing participants of a conference;
a person area detection means for detecting an area recognized as a person from within the image;
A person identification means for executing a person identification process for identifying a person included in the area;
a display control means for causing a display device to display first information indicating that the person has not been identified in the person identification process;
Equipped with.

本発明のビデオ会議方法は、
コンピュータが、
会議の参加人物が写る画像を取得し、
前記画像の中から、人物と認識される領域を検出し、
前記領域に含まれる人物を特定する人物特定処理を実行し、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報を表示装置に表示させる、
ことを含む。
The video conferencing method of the present invention comprises:
The computer
Acquire images of the people attending the meeting,
Detecting an area recognized as a person from within the image;
execute a person identification process to identify a person included in the area;
displaying, on a display device, first information indicating that the person could not be identified in the person identification process;
This includes:

本発明のプログラムは、コンピュータに、上述のビデオ会議方法を実行させる。 The program of the present invention causes a computer to execute the above-mentioned video conferencing method.

本発明によれば、ビデオ会議システムにおいて、個人として特定されていない人物がそのまま会議の場に残ることを抑制することができる。 According to the present invention, it is possible to prevent a person who has not been identified as an individual from remaining at the conference in a video conference system.

第1実施形態におけるビデオ会議システムの構成例を示す図である。FIG. 1 is a diagram illustrating an example of the configuration of a video conference system according to a first embodiment. ビデオ会議システムのハードウエア構成を例示するブロック図である。FIG. 1 is a block diagram illustrating a hardware configuration of a video conference system. 第1実施形態のビデオ会議システムにより実行される処理の流れを例示するフローチャートである。4 is a flowchart illustrating a flow of a process executed by the video conference system of the first embodiment. 表示制御部により表示される第1情報の一例を示す図である。FIG. 11 is a diagram showing an example of first information displayed by a display control unit. 人物領域検出部により表示される第2情報の一例を示す図である。13 is a diagram showing an example of second information displayed by a person area detection unit. FIG. 表示制御部による表示の一例を示す図である。FIG. 11 is a diagram illustrating an example of a display by a display control unit. 第2情報を一覧形式で表示する例を示す図である。FIG. 11 is a diagram showing an example of displaying second information in a list format. 第3実施形態におけるビデオ会議システムの構成例を示す図である。FIG. 13 is a diagram illustrating an example of the configuration of a video conference system according to a third embodiment. 第3実施形態のビデオ会議システムにより実行される処理の流れを例示するフローチャートである。13 is a flowchart illustrating a flow of a process executed by the video conference system according to the third embodiment. 第4実施形態におけるビデオ会議システムの構成例を示す図である。FIG. 13 is a diagram illustrating an example of the configuration of a video conference system according to a fourth embodiment. 第4実施形態のビデオ会議システムにより実行される処理の流れを例示するフローチャートである。13 is a flowchart illustrating a flow of a process executed by a video conference system according to a fourth embodiment.

以下、本発明の実施形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、各ブロック図において、各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。 The following describes an embodiment of the present invention with reference to the drawings. In all drawings, similar components are given similar reference numerals and descriptions are omitted where appropriate. In addition, unless otherwise specified, in each block diagram, each block represents a functional configuration, not a hardware configuration.

[第1実施形態]
〔システム構成例〕
図1は、第1実施形態におけるビデオ会議システム1の構成例を示す図である。図1に例示されるビデオ会議システム1では、サーバ装置10が、通信端末20Aおよび通信端末20Bと接続されている。通信端末20Aおよび通信端末20Bは、それぞれ、互いに離れた場所に位置する地点Aおよび地点Bに設けられている端末である。ビデオ会議は、これらの端末を用いて行われる。通信端末20Aには、撮像装置30Aおよび表示装置40Aが接続されている。また、通信端末20Bには、撮像装置30Bおよび表示装置40Bが接続されている。撮像装置30Aおよび撮像装置30Bは、それぞれの地点における会議の参加人物を撮影するために利用される。撮像装置30Aにより生成された地点Aの参加人物の画像は、サーバ装置10を経由して、地点Bの表示装置40Bに表示される。また、撮像装置30Bにより生成された地点Bの参加人物の画像は、サーバ装置10を経由して、地点Aの表示装置40Aに表示される。なお、地点Aの参加人物の画像は、地点Aの参加人物が撮影された画像を確認できるように、地点Aの表示装置40Aに表示されてもよい。同様に、地点Bの参加人物の画像は、地点Bの参加人物が撮影された画像を確認できるように、地点Bの表示装置40Bに表示されてもよい。
[First embodiment]
[System configuration example]
FIG. 1 is a diagram showing an example of the configuration of a video conference system 1 in the first embodiment. In the video conference system 1 shown in FIG. 1, a server device 10 is connected to a communication terminal 20A and a communication terminal 20B. The communication terminal 20A and the communication terminal 20B are terminals provided at points A and B, which are located at locations distant from each other, respectively. A video conference is held using these terminals. An imaging device 30A and a display device 40A are connected to the communication terminal 20A. Also, an imaging device 30B and a display device 40B are connected to the communication terminal 20B. The imaging devices 30A and 30B are used to capture participants in a conference at each point. An image of the participant at point A generated by the imaging device 30A is displayed on the display device 40B at point B via the server device 10. Also, an image of the participant at point B generated by the imaging device 30B is displayed on the display device 40A at point A via the server device 10. An image of the participant at point A may be displayed on display device 40A at point A so that the participant at point A can check the photographed image. Similarly, an image of the participant at point B may be displayed on display device 40B at point B so that the participant at point B can check the photographed image.

図1に示されるように、ビデオ会議システム1は、画像取得部110、人物領域検出部120、人物特定部130、および表示制御部140を備える。図1の例において、これらの処理部は、1台のサーバ装置10に備えられているが、ビデオ会議システム1の構成は図1の例に制限されない。図示されていないが、これらの処理部の全部または一部は、複数のサーバ装置に分散して或いは重複して設けられていてもよい。 As shown in FIG. 1, the video conference system 1 includes an image acquisition unit 110, a person area detection unit 120, a person identification unit 130, and a display control unit 140. In the example of FIG. 1, these processing units are provided in one server device 10, but the configuration of the video conference system 1 is not limited to the example of FIG. 1. Although not shown, all or part of these processing units may be distributed or overlapped among multiple server devices.

画像取得部110は、会議の参加人物が写る画像を取得する。図1の例では、画像取得部110は、会議の参加人物が写る画像を、ネットワークを介して接続された通信端末20Aおよび通信端末20Bから取得することができる。 The image acquisition unit 110 acquires images showing the people participating in the conference. In the example of FIG. 1, the image acquisition unit 110 can acquire images showing the people participating in the conference from communication terminals 20A and 20B that are connected via a network.

人物領域検出部120は、画像取得部110により取得された画像の中から、人物と認識される領域を検出する。人物領域検出部120は、既知の一般物体検出アルゴリズムを利用して、「人物」と認識(分類)される領域を検出することができる。また、人物領域検出部120は、例えば、動きのある物体の領域を、人物の領域として検出してもよい。人物領域検出部120は、「動きのある物体」を、例えば、時系列で並ぶ複数の画像間での特徴点の移動量に基づいて判断することができる。具体的には、人物領域検出部120は、時系列で並ぶ複数の画像間において、基準値以上移動している特徴点が含まれる物体の領域を、人物の領域として推定することができる。 The person area detection unit 120 detects an area recognized as a person from the image acquired by the image acquisition unit 110. The person area detection unit 120 can detect an area recognized (classified) as a "person" by using a known general object detection algorithm. The person area detection unit 120 may also detect, for example, an area of a moving object as a person area. The person area detection unit 120 can determine a "moving object" based on, for example, the amount of movement of a feature point between multiple images arranged in chronological order. Specifically, the person area detection unit 120 can estimate, as a person area, an area of an object that includes a feature point that has moved by more than a reference value between multiple images arranged in chronological order.

人物特定部130は、人物領域検出部120により「人物」と認識された領域に含まれる人物を特定する処理(人物特定処理)を実行する。言い換えると、人物特定部130は、画像取得部110により取得された画像に写る参加人物を個々に特定(認証)する。人物特定部130は、人物領域検出部120により検出された領域から抽出される特徴量と、予め登録された参加人物の特徴量とを照合した結果に基づいて、各領域に含まれる人物が誰であるかを特定することができる。なお、会議の参加人物の特徴量は、その参加人物の情報(氏名、所属など)と対応付けて、サーバ装置10のストレージデバイスなどに予め記憶されている。ここで、人物特定部130は、人物領域検出部120で検出された領域に含まれる人物が特定できなかった場合、その領域に含まれる人物が特定できなかったことを示す情報(特定失敗情報)をその領域に関連付ける。なお、「人物が特定できなかった場合」とは、例えば、照合の結果として算出されるスコアが基準値以上となる人物が存在しなかった場合などである。 The person identification unit 130 executes a process (person identification process) for identifying a person included in an area recognized as a "person" by the person area detection unit 120. In other words, the person identification unit 130 identifies (authenticates) each participant appearing in an image acquired by the image acquisition unit 110. The person identification unit 130 can identify who is included in each area based on the result of comparing the feature amount extracted from the area detected by the person area detection unit 120 with the feature amount of the participant registered in advance. The feature amount of the participant of the meeting is associated with the information of the participant (such as name and affiliation) and is stored in advance in the storage device of the server device 10. Here, if the person identification unit 130 is unable to identify a person included in an area detected by the person area detection unit 120, it associates information (identification failure information) indicating that the person included in the area could not be identified with the area. Note that "if a person cannot be identified" refers to, for example, a case where there is no person whose score calculated as a result of the comparison is equal to or greater than a reference value.

表示制御部140は、各地点に設けられた撮像装置30により生成された画像を、その他の地点に設けられた通信端末20に送信する。また、表示制御部140は、各地点に設けられた撮像装置30により生成された画像を、各々の撮像装置30が設けられている地点の通信端末20に送信してもよい。各地点の通信端末20は、受け取った画像を、当該通信端末20に接続された表示装置40に表示させる。図1の例では、表示制御部140は、通信端末20Bを介して取得した地点Bの画像を通信端末20Aに送信する。また、表示制御部140は、通信端末20Aを介して取得した地点Aの画像を通信端末20Bに送信する。また、表示制御部140は、人物特定部130の人物特定処理で特定できなかった人物が存在する場合、人物特定処理で人物が特定できなかったことを示す情報(第1情報)を少なくともいずれかの地点に設けられた表示装置に表示させる。なお、表示制御部140は、例えば、特定失敗情報が関連付けられた領域が存在するか否かに基づいて、人物特定処理で特定できなかった人物が存在するか否かを判断することができる。表示制御部140により表示される第1情報は、ビデオ会議システム1が、ある人物の存在を認識しているが、その人物が誰かまでは特定できていないことを示す情報と言える。 The display control unit 140 transmits the images generated by the imaging devices 30 provided at each point to the communication terminals 20 provided at other points. The display control unit 140 may also transmit the images generated by the imaging devices 30 provided at each point to the communication terminals 20 at the points where the imaging devices 30 are provided. The communication terminals 20 at each point display the received images on the display devices 40 connected to the communication terminals 20. In the example of FIG. 1, the display control unit 140 transmits the image of point B acquired via the communication terminal 20B to the communication terminal 20A. The display control unit 140 also transmits the image of point A acquired via the communication terminal 20A to the communication terminal 20B. If there is a person who could not be identified by the person identification process of the person identification unit 130, the display control unit 140 displays information (first information) indicating that the person could not be identified by the person identification process on a display device provided at least at one of the points. The display control unit 140 can determine whether there is a person who could not be identified by the person identification process, for example, based on whether there is an area associated with the identification failure information. The first information displayed by the display control unit 140 can be said to be information indicating that the video conference system 1 recognizes the presence of a certain person, but is unable to identify who that person is.

〔ハードウエア構成例〕
ビデオ会議システム1の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、ビデオ会議システム1の各機能構成部が、サーバ装置10においてハードウエアとソフトウエアとの組み合わせによって実現される場合について、さらに説明する。
[Hardware configuration example]
Each functional component of the video conference system 1 may be realized by hardware that realizes each functional component (e.g., a hardwired electronic circuit, etc.), or may be realized by a combination of hardware and software (e.g., a combination of an electronic circuit and a program that controls it, etc.). Below, a further description will be given of the case where each functional component of the video conference system 1 is realized by a combination of hardware and software in the server device 10.

図2は、ビデオ会議システム1のハードウエア構成を例示するブロック図である。図2の例において、サーバ装置10は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060を有する。 FIG. 2 is a block diagram illustrating an example of the hardware configuration of the video conference system 1. In the example of FIG. 2, the server device 10 has a bus 1010, a processor 1020, a memory 1030, a storage device 1040, an input/output interface 1050, and a network interface 1060.

バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。 The bus 1010 is a data transmission path for the processor 1020, memory 1030, storage device 1040, input/output interface 1050, and network interface 1060 to transmit and receive data to and from each other. However, the method of connecting the processor 1020 and other components to each other is not limited to a bus connection.

プロセッサ1020は、CPU(Central Processing Unit) やGPU(Graphics Processing Unit)などで実現されるプロセッサである。 The processor 1020 is a processor realized by a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit).

メモリ1030は、RAM(Random Access Memory)などで実現される主記憶装置である。 Memory 1030 is a main storage device realized by RAM (Random Access Memory) or the like.

ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などで実現される補助記憶装置である。ストレージデバイス1040はビデオ会議システム1の各機能(画像取得部110、人物領域検出部120、人物特定部130、および表示制御部140など)を実現するプログラムモジュールを記憶している。プロセッサ1020がこれら各プログラムモジュールをメモリ1030上に読み込んで実行することで、そのプログラムモジュールに対応する各機能が実現される。 The storage device 1040 is an auxiliary storage device realized by a hard disk drive (HDD), a solid state drive (SSD), a memory card, a read only memory (ROM), or the like. The storage device 1040 stores program modules that realize each function of the videoconferencing system 1 (such as the image acquisition unit 110, the person area detection unit 120, the person identification unit 130, and the display control unit 140). The processor 1020 loads each of these program modules into the memory 1030 and executes them to realize each function corresponding to the program module.

入出力インタフェース1050は、サーバ装置10と各種入出力デバイスとを接続するためのインタフェースである。入出力インタフェース1050には、キーボードやマウスといった入力装置(図示せず)、または、ディスプレイやスピーカーといった出力装置(図示せず)などが接続され得る。 The input/output interface 1050 is an interface for connecting the server device 10 to various input/output devices. The input/output interface 1050 can be connected to input devices (not shown) such as a keyboard or a mouse, or output devices (not shown) such as a display or a speaker.

ネットワークインタフェース1060は、サーバ装置10をネットワークに接続するためのインタフェースである。このネットワークは、例えばLAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1060がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。図示されるように、サーバ装置10は、ネットワークインタフェース1060を介して、通信端末20Aおよび通信端末20Bと通信可能に接続されている。各通信端末20には、会議の参加人物を撮影するための撮像装置30、各撮像装置30により生成された画像を表示させるための表示装置40、および、会議中の音声を拾うための集音装置50が接続されている。また、通信端末20には、会議の音声を出力するための音声出力装置(図示せず)が更に接続されている。 The network interface 1060 is an interface for connecting the server device 10 to a network. This network is, for example, a LAN (Local Area Network) or a WAN (Wide Area Network). The network interface 1060 may be connected to the network wirelessly or by wire. As shown in the figure, the server device 10 is communicably connected to the communication terminals 20A and 20B via the network interface 1060. Each communication terminal 20 is connected to an imaging device 30 for photographing participants in the conference, a display device 40 for displaying images generated by each imaging device 30, and a sound collection device 50 for picking up sounds during the conference. In addition, an audio output device (not shown) for outputting the sound of the conference is further connected to the communication terminal 20.

画像取得部110は、ネットワークインタフェース1060を介して各通信端末20から会議の参加人物が写る画像を取得することができる。また、表示制御部140は、ネットワークインタフェース1060を介して、各通信端末20に相手の参加人物の画像を送信することができる。また、表示制御部140は、ネットワークインタフェース1060を介して、各通信端末20にその通信端末20が備えられている地点の参加人物の画像を送信することができる。 The image acquisition unit 110 can acquire images of participants in the conference from each communication terminal 20 via the network interface 1060. The display control unit 140 can also transmit images of the other participants to each communication terminal 20 via the network interface 1060. The display control unit 140 can also transmit images of participants at the location where each communication terminal 20 is installed to each communication terminal 20 via the network interface 1060.

〔処理の流れ〕
図3を用いて、第1実施形態のビデオ会議システム1により実行される処理の流れについて説明する。図3は、第1実施形態のビデオ会議システム1により実行される処理の流れを例示するフローチャートである。
[Processing flow]
The flow of processing executed by the video conference system 1 of the first embodiment will be described with reference to Fig. 3. Fig. 3 is a flowchart illustrating the flow of processing executed by the video conference system 1 of the first embodiment.

画像取得部110は、通信端末20Aまたは通信端末20Bから、会議の参加人物が写る画像を取得する(S102)。そして、人物領域検出部120は、S102の処理で取得された画像の中から、人物と認識される領域を検出する(S104)。 The image acquisition unit 110 acquires an image showing the people participating in the conference from the communication terminal 20A or the communication terminal 20B (S102). Then, the person area detection unit 120 detects an area recognized as a person from the image acquired in the process of S102 (S104).

人物特定部130は、S104の処理で検出された領域について、人物特定処理を実行する(S106)。人物特定部130は、人物が特定できなかった場合(S108:NO)、人物特定処理の対象となった領域に対して、その領域に含まれる人物が特定できなかったことを示す情報(特定失敗情報)を関連付ける(S110)。一方、人物が特定できなかった場合(S108:NO)、上述の特定失敗情報を関連付ける処理は実行されない。なお、S106からS110の処理は、S104の処理で検出された人物の領域の全てが処理されるまで繰り返される(S112:NO)。 The person identification unit 130 executes person identification processing for the area detected in the processing of S104 (S106). If the person cannot be identified (S108: NO), the person identification unit 130 associates information indicating that the person contained in the area was not identified (identification failure information) with the area that was the subject of the person identification processing (S110). On the other hand, if the person cannot be identified (S108: NO), the processing of associating the above-mentioned identification failure information is not executed. Note that the processing from S106 to S110 is repeated until all areas of the person detected in the processing of S104 have been processed (S112: NO).

S104の処理で検出された人物の領域の全てが処理された後(S112:YES)、表示制御部140は、各地点で撮影された参加人物の画像を、互いの相手いる地点に備えられた表示装置にそれぞれ表示させる(S114)。ここで、表示制御部140は、S108の処理で特定失敗情報が関連づけられた領域が存在する場合、その人物が特定されていないことが分かるように、例えば、その領域の人物の位置に合わせて第1情報を重畳表示させる(例:図4)。 After all of the areas of the people detected in the process of S104 have been processed (S112: YES), the display control unit 140 causes the images of the participants taken at each location to be displayed on the display devices provided at the locations where the participants are located (S114). Here, if there is an area to which identification failure information is associated in the process of S108, the display control unit 140 causes, for example, the first information to be superimposed on the position of the person in that area so that it is clear that the person has not been identified (e.g., FIG. 4).

図4は、表示制御部140により表示される第1情報の一例を示す図である。図4の例では、画像において後ろ姿が写っている2人の人物に対して、第1情報「Unknown」が重畳表示されている様子が描かれている。なお、第1情報は、その人物が特定できなかったことを示す特定の印であればよく、「Unknwon」という表示に制限されない。この図では、次のようにして、「Unknwon」という第1情報が表示される。まず、人物領域検出部120が、図4の画像から、4人の人物領域を検出する。検出された4人のうちの2人は後ろ向き(目、鼻、口といった個人を特定するために利用される特徴量が抽出できない状況)で写っているため、人物特定部130は、人物特定処理でこれらの人物の特定に失敗する。人物特定部130は、人物特定処理の結果に基づいて、これら二人の領域に対して特定失敗情報を関連付ける。表示制御部140は、各人物の領域に関連付けられた特定失敗情報に基づいて画像上に第1情報を重畳させて、表示装置に向けて出力する。このデータを受け取った表示装置は、例えば、図4に例示されるような画像を、その表示面に表示することができる。 4 is a diagram showing an example of the first information displayed by the display control unit 140. In the example of FIG. 4, the first information "Unknown" is superimposed on two people whose backs are shown in the image. The first information may be any specific mark indicating that the person could not be identified, and is not limited to the display "Unknown". In this figure, the first information "Unknown" is displayed as follows. First, the person area detection unit 120 detects the areas of four people from the image of FIG. 4. Since two of the detected four people are facing away from the viewer (a situation in which features used to identify individuals, such as eyes, nose, and mouth, cannot be extracted), the person identification unit 130 fails to identify these people in the person identification process. The person identification unit 130 associates identification failure information with the areas of these two people based on the result of the person identification process. The display control unit 140 superimposes the first information on the image based on the identification failure information associated with the area of each person, and outputs the information to the display device. A display device that receives this data can display an image, such as the one shown in Figure 4, on its display surface.

本実施形態では、ビデオ会議システム1を利用して開催される会議の参加人物の中に特定できていない人物が存在する場合、その会議で利用される表示装置に第1情報が表示される。この第1情報は、人物が特定されていないことを示す情報(例えば、「Unknown」などの表示)である。つまり、会議の参加人物は、ビデオ会議システム1で特定されていない人物がいることを、この第1情報によって一目で把握することができる。また、第1情報は画像の中で特定できなかった人物の領域の位置に合わせて表示される。これにより、会議の参加人物は、どの人物が特定されていないかを認識できる。そして、会議の参加人物は、ビデオ会議システム1がその人物を特定できるように適切な措置を取ることができる。例えば、会議の参加人物は、特定されていない人物に対して、顔(人物特定時に利用される特徴点を含む領域)がはっきりと画像に写り込むように、顔の向きや姿勢を変えるように促すことができる。 In this embodiment, when an unidentified person is present among the participants of a conference held using the video conference system 1, first information is displayed on the display device used in the conference. This first information is information indicating that the person has not been identified (for example, a display such as "Unknown"). In other words, the participants of the conference can at a glance know from this first information that there is a person who has not been identified by the video conference system 1. In addition, the first information is displayed according to the position of the area of the person who has not been identified in the image. This allows the participants of the conference to recognize which person has not been identified. The participants of the conference can then take appropriate measures to enable the video conference system 1 to identify that person. For example, the participants of the conference can urge the unidentified person to change the direction or posture of their face so that their face (the area including the feature points used in identifying the person) is clearly reflected in the image.

ここで、表示制御部140は、画像に写っている会議の参加人物が見る表示装置に、第1情報を表示させてもよい。すなわち、人物特定処理で特定できなかった人物がいた場合、表示制御部140は、その人物がいる地点に設けられた表示装置に第1情報を表示させてもよい。例えば、地点Aにいる会議の参加人物を人物特定処理で特定できなかったとする。この場合、表示制御部140は、撮像装置30Aで生成された画像に第1情報を重畳させたデータを、通信端末20Aに送信する。通信端末20Aは、表示装置40Aに、撮像装置30Aで生成された画像と、その画像に重畳された第1情報とを表示させる。このようにすることで、地点A側にいる会議の参加人物が、特定されていない(認証されていない)人物がいることを容易に把握することができる。その結果、例えば、特定されなかった人物は、自身の顔(人物特定時に利用される特徴点を含む領域)がはっきりと画像に写り込むように、顔の向きや姿勢を自発的に変えるといった措置を取ることができる。 Here, the display control unit 140 may display the first information on a display device seen by the person participating in the meeting who is shown in the image. That is, if there is a person who could not be identified by the person identification process, the display control unit 140 may display the first information on a display device provided at the location where the person is located. For example, it is assumed that a person participating in the meeting at point A could not be identified by the person identification process. In this case, the display control unit 140 transmits data in which the first information is superimposed on an image generated by the imaging device 30A to the communication terminal 20A. The communication terminal 20A displays the image generated by the imaging device 30A and the first information superimposed on the image on the display device 40A. In this way, it is possible for the person participating in the meeting at the side of point A to easily grasp that there is a person who has not been identified (not authenticated). As a result, for example, the person who has not been identified can take measures such as voluntarily changing the direction or posture of the face so that his or her face (an area including feature points used in person identification) is clearly reflected in the image.

[第2実施形態]
本実施形態は、以下の点を除き、上述の第1実施形態と同様の構成を有する。
[Second embodiment]
This embodiment has the same configuration as the above-described first embodiment, except for the following points.

本実施形態の表示制御部140は、人物特定部130の人物特定処理で会議の参加人物が特定された場合、その人物の氏名を含む情報(第2情報)を表示装置に更に表示させる(例:図5)。図5は、人物領域検出部120により表示される第2情報の一例を示す図である。図5の例において、画像中の奥側に座っている2人の人物については、目、鼻、口といった特徴点がはっきりと写っており、人物特定部130はこれら2人の人物を特定できたとする。この場合、人物特定部130は、特定した人物の氏名を含む第2情報を取得し、その人物の領域に関連付ける。なお、第2情報は、会議の開催前に参加人物の特徴量と関連付けて取得され、ストレージデバイス1040などに事前に登録されている。第2情報は、人物の氏名のほか、その人物が所属するグループ(会社や部署など)の名称、その人物の役職名などを更に含んでいてもよい。そして、表示制御部140は、人物特定部130の人物特定処理の結果に基づいて、第2情報が関連付けられた領域の人物の位置に合わせて、その第2情報を重畳表示させる。その結果、例えば、図5に例示されるような画像が、ビデオ会議システム1を利用して開催される会議の参加人物が見る表示装置40に表示される。これにより、会議の参加人物の名前や所属といった、その人物に関する情報が一目で把握できるようになる。 In the present embodiment, when a participant of a meeting is identified by the person identification process of the person identification unit 130, the display control unit 140 further displays information (second information) including the name of the person on the display device (example: FIG. 5). FIG. 5 is a diagram showing an example of the second information displayed by the person area detection unit 120. In the example of FIG. 5, it is assumed that the two people sitting at the back of the image have clear feature points such as eyes, nose, and mouth, and the person identification unit 130 has been able to identify these two people. In this case, the person identification unit 130 acquires second information including the name of the identified person and associates it with the area of the person. The second information is acquired in association with the feature amount of the participant before the meeting is held, and is registered in advance in the storage device 1040 or the like. In addition to the person's name, the second information may further include the name of the group (company, department, etc.) to which the person belongs, the person's job title, etc. Then, based on the result of the person identification process by the person identification unit 130, the display control unit 140 superimposes and displays the second information according to the position of the person in the area to which the second information is associated. As a result, for example, an image as shown in FIG. 5 is displayed on the display device 40 to be viewed by the participants in the conference held using the video conference system 1. This allows information about the participants in the conference, such as their names and affiliations, to be grasped at a glance.

表示制御部140は、第1情報と第2情報とを併せて表示させる際、第1情報の表示態様を、第2情報の表示態様と異ならせてもよい。言い換えると、表示制御部140は、視覚的に第1情報と第2情報とを異ならせてもよい。一例として、表示制御部140は、第1情報を第2情報よりも目立たせてもよい。具体的には、表示制御部140は、第1情報の外形、大きさ、色、言語、およびフォントの少なくともいずれを、第2情報と異ならせることにより、第1情報を第2情報よりも目立たせることができる。例えば、表示制御部140は、第1情報を第2情報よりも大きく表示したり、第1情報の色を目立つ色に設定したり、第1情報のフォントを標準的なフォントとは異なる特殊なフォントに設定したりして、第1情報を第2情報よりも目立たせることができる。図6は、表示制御部140による表示の一例を示す図である。図6の例では、第1表示の背景色を変えることにより、第2表示よりも目立たせている様子が描かれている。このようにすることで、会議の参加人物が、ビデオ会議システム1で特定できていない人物の存在に気づき易くなる。 When the display control unit 140 displays the first information and the second information together, the display control unit 140 may make the display mode of the first information different from the display mode of the second information. In other words, the display control unit 140 may visually make the first information different from the second information. As an example, the display control unit 140 may make the first information more prominent than the second information. Specifically, the display control unit 140 can make the first information more prominent than the second information by making at least one of the outer shape, size, color, language, and font of the first information different from that of the second information. For example, the display control unit 140 can make the first information more prominent than the second information by displaying the first information larger than the second information, setting the color of the first information to a prominent color, or setting the font of the first information to a special font different from the standard font. FIG. 6 is a diagram showing an example of a display by the display control unit 140. In the example of FIG. 6, a state in which the first information is made more prominent than the second information by changing the background color of the first display is depicted. This makes it easier for conference participants to notice the presence of people who have not been identified by the video conference system 1.

また、表示制御部140は、人物特定処理で特定された、会議の参加人物の数が所定の閾値以上である場合、第2情報を一覧形式で表示させてもよい(例:図7)。図7は、第2情報を一覧形式で表示する例を示す図である。図7に示されるように、表示制御部140は、画像中の空き領域(人物の領域以外の領域)を特定して、その領域に一覧形式の第2情報を表示することができる。表示制御部140は、空き領域のサイズに応じて、一覧の大きさを決定してもよい。また、表示制御部140は、一覧をスクロールバーと共に表示させて、一覧を表示する領域を節約してもよい。このようにすることで、第2情報が多数表示されることにより会議の参加人物の顔(画像の主となる情報)の視認性の低下を抑制できる。 In addition, the display control unit 140 may display the second information in a list format when the number of people participating in the meeting identified by the person identification process is equal to or greater than a predetermined threshold (e.g., FIG. 7). FIG. 7 is a diagram showing an example of displaying the second information in a list format. As shown in FIG. 7, the display control unit 140 can identify an empty area in the image (an area other than the area of people) and display the second information in a list format in that area. The display control unit 140 may determine the size of the list according to the size of the empty area. In addition, the display control unit 140 may display the list together with a scroll bar to save the area for displaying the list. In this way, it is possible to suppress a decrease in visibility of the faces of people participating in the meeting (the main information of the image) due to a large amount of second information being displayed.

〔第2実施形態の変形例〕
表示制御部140は、第1情報を第2情報よりも目立たなくさせてもよい。特に、表示制御部140は、ある地点の参加人物の画像を相手側の地点に送信する場合において、第1情報を第2情報よりも目立たなくさせると好ましい。例えば、表示制御部140は、相手側に送信する画像において、第1情報を小さくしたり、第1情報の色を薄くしたり、第1情報を非表示としたりして、第1情報を第2情報よりも目立たなくさせることができる。ある地点の参加人物の画像を相手側の地点に送信する場合に第1情報を目立たなくすることによって、その相手側にとってより重要度の高い情報(人物の顔または人物の動作など、会議で本来必要な情報)の視認性が低下することを抑制できる。
[Modification of the second embodiment]
The display control unit 140 may make the first information less noticeable than the second information. In particular, when transmitting an image of a participant at a certain location to the location of the other party, it is preferable that the display control unit 140 makes the first information less noticeable than the second information. For example, the display control unit 140 can make the first information less noticeable than the second information by making the first information smaller, fading the color of the first information, or hiding the first information in the image to be transmitted to the other party. By making the first information less noticeable when transmitting an image of a participant at a certain location to the location of the other party, it is possible to suppress a decrease in visibility of information that is more important to the other party (information that is originally necessary in the conference, such as a person's face or a person's movement).

[第3実施形態]
本実施形態のビデオ会議システム1は、ビデオ会議システム1で特定できなかった人物がいる場合にその人物を特定するための構成を更に有している点を除き、上述の各実施形態と同様の構成を有する。
[Third embodiment]
The video conferencing system 1 of this embodiment has the same configuration as each of the above-described embodiments, except that it further has a configuration for identifying a person if there is a person who could not be identified by the video conferencing system 1.

〔システム構成〕
図8は、第3実施形態におけるビデオ会議システム1の構成例を示す図である。図8に例示されるビデオ会議システム1では、上述の撮像装置30(30A、30B)とは別に、移動型の撮像装置32(32A、32B)が各地点に更に備えられている。移動型の撮像装置32は、例えば、カメラ機能付き携帯端末(スマートフォンやタブレット端末など)、或いは、カメラ付きノートPC(Personal Computer)などといった、個人が所有する装置である。
〔System configuration〕
Fig. 8 is a diagram showing an example of the configuration of a video conference system 1 according to the third embodiment. In the video conference system 1 shown in Fig. 8, mobile imaging devices 32 (32A, 32B) are further provided at each location in addition to the above-mentioned imaging devices 30 (30A, 30B). The mobile imaging devices 32 are, for example, devices owned by individuals, such as a mobile terminal with a camera function (such as a smartphone or a tablet terminal) or a notebook PC (Personal Computer) with a camera.

本実施形態において、画像取得部110は、撮像装置30を介して取得された画像に基づく人物特定処理で特定されなかった会議の参加人物が存在する場合、その参加人物が写る追加の画像を、移動型の撮像装置32Aまたは撮像装置32Bから取得する。そして、画像取得部110は、画像取得部110により取得された追加画像に基づいて、特定されなかった参加人物を特定する。 In this embodiment, when there is a participant in the meeting who was not identified in the person identification process based on the image acquired via the imaging device 30, the image acquisition unit 110 acquires an additional image showing the participant from the mobile imaging device 32A or imaging device 32B. Then, the image acquisition unit 110 identifies the participant who was not identified based on the additional image acquired by the image acquisition unit 110.

〔処理の流れ〕
図9を用いて、本実施形態のビデオ会議システム1により実行される処理の流れについて説明する。図9は、第3実施形態のビデオ会議システム1により実行される処理の流れを例示するフローチャートである。
[Processing flow]
The flow of processing executed by the video conference system 1 of the third embodiment will be described with reference to Fig. 9. Fig. 9 is a flowchart illustrating the flow of processing executed by the video conference system 1 of the third embodiment.

まず、図3のS106の人物特定処理で特定されなかった人物の追加画像が、移動型の撮像装置32により生成される(S202)。なお、会議の参加人物は、表示装置40上に表示された第1情報に基づいて、自身がビデオ会議システム1において個人として特定されているか否かを把握することができる。表示装置40上に表示された第1情報から、自分が特定されていないことを認識した人物は、例えば、スマートフォンやノートPCにインストールされた専用のアプリケーションを立ち上げて、追加画像を撮影する。撮影された追加画像は、ネットワークを介してサーバ装置10に送信され、画像取得部110により取得される(S204)。ここで、撮像装置30により生成された画像の中に複数の未特定人物が存在する場合もある。この場合には、追加画像がどの未特定人物に対応する画像かを示す情報が必要となる。そこで、撮像装置30により生成された画像の中に複数の未特定人物が存在する場合、一例として、スマートフォンやノートPC上で立ち上げたアプリケーションで、追加画像に対応する未特定人物を指定する操作を更に受け付けてもよい。例えば、スマートフォンやノートPC上で立ち上げたアプリケーションは、追加画像の撮影前または撮影後に図4から図6などに例示される画面をスマートフォンやノートPCの表示面に表示させ、その画像の中から未特定人物を選択する操作を受け付けてもよい。この場合、画像取得部110は、追加画像と、その追加画像に対応する未特定人物を示す情報とを取得することができる。 First, an additional image of a person who was not identified in the person identification process of S106 in FIG. 3 is generated by the mobile imaging device 32 (S202). The participants in the conference can know whether or not they have been identified as an individual in the video conference system 1 based on the first information displayed on the display device 40. A person who recognizes that he or she has not been identified from the first information displayed on the display device 40 launches a dedicated application installed on, for example, a smartphone or a notebook PC to capture an additional image. The captured additional image is transmitted to the server device 10 via the network and acquired by the image acquisition unit 110 (S204). Here, there may be multiple unidentified persons in the image generated by the imaging device 30. In this case, information indicating which unidentified person the additional image corresponds to is required. Therefore, when multiple unidentified persons are present in the image generated by the imaging device 30, an operation to specify the unidentified person corresponding to the additional image may be further accepted in an application launched on a smartphone or a notebook PC, for example. For example, an application launched on a smartphone or a notebook PC may display the screens exemplified in FIGS. 4 to 6 on the display surface of the smartphone or notebook PC before or after capturing an additional image, and accept an operation to select an unidentified person from the image. In this case, the image acquisition unit 110 can acquire the additional image and information indicating the unidentified person corresponding to the additional image.

人物特定部130は、スマートフォンやノートPCといった移動型の撮像装置32により生成された追加画像を用いて、人物特定処理を実行する(S206)。具体的には、図3のS106の人物特定処理と同様に、追加画像から抽出される特徴量と、予め登録された参加人物の特徴量とを照合することによって、その追加画像の人物を特定することができる。ここで、追加画像が不鮮明であって人物が特定できない場合などには、人物特定部130は、その追加画像の送信元の装置に対し、画像の撮り直しを促すメッセージを出力するように構成されていてもよい。また、人物特定部130は、追加画像の取り直しを予め決められた回数行ったにもかかわらず未特定人物が特定できなかった場合、その未特定人物を部外者(会議の参加人物として予め登録された人物以外の人物)と判断してもよい。この場合、人物特定部130は、表示装置40や図示しないスピーカーなどを用いて、部外者の存在を報知する処理を実行してもよい。このようにすることで、会議の参加人物が、会議の場に紛れ込んだ部外者の存在を認識することができる。 The person identification unit 130 executes a person identification process using an additional image generated by a mobile imaging device 32 such as a smartphone or a notebook PC (S206). Specifically, as in the person identification process of S106 in FIG. 3, the person in the additional image can be identified by matching the feature amount extracted from the additional image with the feature amount of the participant registered in advance. Here, if the additional image is unclear and the person cannot be identified, the person identification unit 130 may be configured to output a message to the device that sent the additional image, prompting the person to retake the image. In addition, if the person identification unit 130 has not been able to identify an unidentified person despite retaking the additional image a predetermined number of times, the person identification unit 130 may determine that the unidentified person is an outsider (a person other than a person registered in advance as a participant of the meeting). In this case, the person identification unit 130 may execute a process of notifying the presence of an outsider using the display device 40 or a speaker (not shown). In this way, the participants in the meeting can recognize the presence of an outsider who has infiltrated the meeting.

以上、本実施形態によれば、移動型の撮像装置32から、ビデオ会議システム1が特定できていない人物について、その人物を特定するための追加画像を取得することができる。なお、移動型の撮像装置32を利用することにより、その人物の特徴点がより鮮明に写る画像を取得することができる。結果として、ビデオ会議システム1が特定できていない人物を、精度よく特定することができる。 As described above, according to this embodiment, it is possible to obtain additional images from the mobile imaging device 32 to identify a person who has not been identified by the video conference system 1. By using the mobile imaging device 32, it is possible to obtain images that more clearly show the characteristic points of the person. As a result, it is possible to accurately identify a person who has not been identified by the video conference system 1.

なお、人物特定部130は、会議の参加人物を一度特定すれば、その後に取得された画像から人物の特徴量が抽出できないような場合(例えば、俯いてしまって顔の特徴点が見えなくなった場合など)であっても、その人物が特定された状態を維持することができる。例えば、人物特定部130は、複数の画像間で、特定した人物の領域を画像中の位置などに基づいて追跡することにより、その人物が特定された状態を維持することができる。 Once the person identification unit 130 has identified a participant in a meeting, it can maintain the state in which the person has been identified even if the person's features cannot be extracted from an image acquired thereafter (for example, if the person looks down and facial features become invisible). For example, the person identification unit 130 can maintain the state in which the person has been identified by tracking the area of the identified person across multiple images based on the position in the image, etc.

〔第3実施形態の変形例〕
本実施形態において、移動型の撮像装置32により生成された追加画像を用いる代わりに、会議の参加人物のいずれかが、特定できなかった人物を特定するための情報を直接入力してもよい。一例として、次のような動作が実行されてもよい。まず、会議の参加人物は、表示装置40上で「Unknown」といった第1情報が関連付けられている人物を確認した後、その人物の氏名といった情報を携帯型端末(スマートフォンやノートPCなど)上で立ち上げたアプリケーションを介して入力する。なお、特定できていない人物が複数存在する場合には、それら複数の人物の中で対象とする人物を選択する入力が更に実行される。そして、人物特定部130は、特定できなかった人物の領域に関連付けられている特定失敗情報を、入力された情報を用いて更新する。これにより、特定できていなかった人物は、ビデオ会議システム1で特定(認証)された状態となる。また、この結果、「Unknown」といった第1情報の表示は、入力された人物の氏名に置き換わることになる。
[Modification of the third embodiment]
In this embodiment, instead of using the additional image generated by the mobile imaging device 32, one of the participants in the conference may directly input information for identifying the person who could not be identified. As an example, the following operation may be executed. First, the participant in the conference checks the person with whom the first information such as "Unknown" is associated on the display device 40, and then inputs information such as the name of the person through an application launched on a portable terminal (such as a smartphone or a notebook PC). If there are multiple people who have not been identified, an input is further executed to select a target person from among the multiple people. Then, the person identification unit 130 updates the identification failure information associated with the area of the person who could not be identified using the input information. As a result, the person who could not be identified is identified (authenticated) by the video conference system 1. As a result, the display of the first information such as "Unknown" is replaced with the name of the person who was input.

[第4実施形態]
本実施形態では、自動的に議事録を作成する機能を更に有する点を除き、上述の各実施形態と同様の構成を有する。
[Fourth embodiment]
This embodiment has the same configuration as each of the above-described embodiments, except that it further has a function of automatically creating minutes.

図10は、第4実施形態におけるビデオ会議システム1の構成例を示す図である。図10に例示されるビデオ会議システム1は、リスト作成部150、音声取得部160、発言者特定部170、議事録作成部180を更に備える。 Fig. 10 is a diagram showing an example of the configuration of a video conference system 1 in the fourth embodiment. The video conference system 1 shown in Fig. 10 further includes a list creation unit 150, a voice acquisition unit 160, a speaker identification unit 170, and a minutes creation unit 180.

リスト作成部150は、人物特定部130の人物特定処理によって特定された人物のリストを作成する。リスト作成部150は、例えば次のように動作する。まず、リスト作成部150は、人物特定部130の人物特定処理で人物が特定された場合に、人物特定部130からその結果を取得する。そして、リスト作成部150は、人物特定部130から取得した人物の特定結果を、メモリ1030などに保持されるリストに追加する。これにより、ビデオ会議システム1を利用して開催される会議の参加者のリストを自動的に生成することができる。 The list creation unit 150 creates a list of people identified by the person identification process of the person identification unit 130. The list creation unit 150 operates, for example, as follows. First, when a person is identified by the person identification process of the person identification unit 130, the list creation unit 150 acquires the result from the person identification unit 130. Then, the list creation unit 150 adds the person identification result acquired from the person identification unit 130 to a list stored in the memory 1030 or the like. This makes it possible to automatically generate a list of participants in a conference held using the videoconferencing system 1.

音声取得部160は、図示しないマイクにより生成された、会議中の会話の音声データを取得する。発言者特定部170は、音声取得部160により取得された音声データに関する発言者を特定する。一例として、発言者特定部170は、例えば会議の開催前にストレージデバイス1040などに予め登録された各参加人物の声紋データとの照合を行うことにより、音声取得部160が取得した音声データに関する発言者を特定することができる。他の一例として、発言者特定部170は、音声データと同期して取得される画像(撮像装置30により生成される画像)を解析することによって、音声取得部160が取得した音声データに関する発言者を特定することができる。具体的には、発言者特定部170は、音声データと同期して取得された画像を解析した結果、口の部分が動いている人物の領域を特定する。そして、口の部分が動いている人物の領域についての人物特定処理の結果から、その発話者を特定することができる。議事録作成部180は、発言者特定部170による発言者の特定結果と、音声取得部160により取得された音声データに基づいて生成されたテキストデータとを対応付けることにより、議事録データを生成する。また、議事録作成部180は、リスト作成部150により生成された人物のリストを、会議の参加者として議事録データに付加することができる。 The voice acquisition unit 160 acquires voice data of a conversation during a conference, generated by a microphone (not shown). The speaker identification unit 170 identifies the speaker of the voice data acquired by the voice acquisition unit 160. As an example, the speaker identification unit 170 can identify the speaker of the voice data acquired by the voice acquisition unit 160 by comparing the voice data with voiceprint data of each participant registered in advance in the storage device 1040 before the conference is held. As another example, the speaker identification unit 170 can identify the speaker of the voice data acquired by the voice acquisition unit 160 by analyzing an image (an image generated by the imaging device 30) acquired in synchronization with the voice data. Specifically, the speaker identification unit 170 identifies the area of a person whose mouth is moving as a result of analyzing the image acquired in synchronization with the voice data. Then, the speaker can be identified from the result of the person identification process for the area of the person whose mouth is moving. The minutes-taking unit 180 generates minutes-taking data by associating the speaker identification result by the speaker identification unit 170 with text data generated based on the voice data acquired by the voice acquisition unit 160. The minutes-taking unit 180 can also add the list of people generated by the list creation unit 150 to the minutes-taking data as participants of the meeting.

〔ハードウエア構成例〕
本実施形態のビデオ会議システム1は、第1実施形態と同様のハードウエア構成(例:図2)を有する。本実施形態のストレージデバイス1040は、上述のリスト作成部150、音声取得部160、発言者特定部170および議事録作成部180の機能を実現するためのプログラムモジュールを更に記憶している。プロセッサ1020が、これらのプログラムモジュールをメモリ1030上に読み出して実行することにより、上述の本実施形態の各機能が実現される。
[Hardware configuration example]
The video conference system 1 of this embodiment has the same hardware configuration (e.g., FIG. 2) as that of the first embodiment. The storage device 1040 of this embodiment further stores program modules for realizing the functions of the list creation unit 150, the voice acquisition unit 160, the speaker identification unit 170, and the minutes creation unit 180 described above. The processor 1020 reads these program modules onto the memory 1030 and executes them to realize each of the functions of this embodiment described above.

〔処理の流れ〕
図11を用いて、本実施形態のビデオ会議システム1により実行される処理の流れについて説明する。図11は、第4実施形態のビデオ会議システム1により実行される処理の流れを例示するフローチャートである。
[Processing flow]
The flow of processing executed by the video conference system 1 of the fourth embodiment will be described with reference to Fig. 11. Fig. 11 is a flowchart illustrating the flow of processing executed by the video conference system 1 of the fourth embodiment.

まず、音声取得部160は会議の音声データを取得する(S302)。会議の音声データは、各地点に設けられている集音装置50により生成される。集音装置50は、通信端末20に接続されている。音声取得部160は、ネットワークインタフェース1060を介して各地点の通信端末20と通信して、その地点の集音装置50により生成された音声データを取得することができる。 First, the voice acquisition unit 160 acquires voice data of the conference (S302). The voice data of the conference is generated by a sound collection device 50 provided at each location. The sound collection device 50 is connected to the communication terminal 20. The voice acquisition unit 160 communicates with the communication terminal 20 at each location via the network interface 1060, and can acquire the voice data generated by the sound collection device 50 at that location.

そして、発言者特定部170は、音声取得部160により取得された音声データに関する発言者を特定する(S304)。一例として、発言者特定部170は、次のようにして、音声取得部160により取得された音声データに関する発言者を特定することができる。まず、発言者特定部170は、ストレージデバイス1040などに事前に登録された各参加人物の声紋データと音声データとを照合して、当該音声データの声紋との一致度が基準を満たす声紋データを特定する。そして、発言者特定部170は、特定した声紋データに関連付けられている参加人物の識別情報(人物の氏名、または、人物毎に割り当てられたIDなど)を取得することにより、音声取得部160により取得された音声データの発言者を特定することができる。他の一例として、発言者特定部170は、次のようにして、音声取得部160により取得された音声データに関する発言者を特定することができる。まず、発言者特定部170は、音声データと同期して画像取得部110により取得された画像を解析する。具体的には、発言者特定部170は、画像の中から人物の口の領域を検出し、その領域(すなわち、口)が時系列で並ぶ複数の画像間で動いているか否かを判定する。そして、発言者特定部170は、口の領域が動いていると判定された人物の領域について、人物特定部130の人物特定処理の結果を取得することにより、音声取得部160により取得された音声データの発言者を特定することができる。なお、ここでは、例えば、第3実施形態で説明したような構成を利用して、全ての人物が特定されているものと仮定している。 Then, the speaker identification unit 170 identifies the speaker of the voice data acquired by the voice acquisition unit 160 (S304). As an example, the speaker identification unit 170 can identify the speaker of the voice data acquired by the voice acquisition unit 160 as follows. First, the speaker identification unit 170 compares the voice data with the voiceprint data of each participant registered in advance in the storage device 1040 or the like, and identifies voiceprint data whose degree of match with the voiceprint of the voice data meets a criterion. Then, the speaker identification unit 170 can identify the speaker of the voice data acquired by the voice acquisition unit 160 by acquiring identification information of the participant associated with the identified voiceprint data (such as the name of the person or an ID assigned to each person). As another example, the speaker identification unit 170 can identify the speaker of the voice data acquired by the voice acquisition unit 160 as follows. First, the speaker identification unit 170 analyzes the image acquired by the image acquisition unit 110 in synchronization with the voice data. Specifically, the speaker identification unit 170 detects the mouth area of a person from within an image, and determines whether or not that area (i.e., the mouth) is moving between multiple images arranged in time series. The speaker identification unit 170 can then identify the speaker of the voice data acquired by the voice acquisition unit 160 by acquiring the results of the person identification process by the person identification unit 130 for the area of the person whose mouth area is determined to be moving. Note that it is assumed here that all people have been identified using, for example, the configuration described in the third embodiment.

議事録作成部180は、音声取得部160および発言者特定部170の処理結果に基づいて、議事録データを生成する(S306)。具体的には、議事録作成部180は、音声データをテキスト化するAPI(Application Programming Interface)などを利用して、音声取得部160により取得された音声データをテキストデータ化する。また、議事録作成部180は、発言者特定部170によって特定された、当該音声データの発言者の情報(例えば、発言者の氏名など)を取得する。そして、議事録作成部180は、音声取得部160により取得された音声データから生成されたテキストデータと、その音声データに関する発言者として特定された人物の情報とを対応付けて、議事録データに追加する。また、議事録作成部180は、リスト作成部150により生成された、会議の参加人物リストを読み出し、議事録データに参加人物の情報を付加してもよい。 The minutes-taking unit 180 generates minutes-taking data based on the processing results of the voice acquisition unit 160 and the speaker identification unit 170 (S306). Specifically, the minutes-taking unit 180 converts the voice data acquired by the voice acquisition unit 160 into text data using an API (Application Programming Interface) that converts voice data into text. The minutes-taking unit 180 also acquires information on the speaker of the voice data identified by the speaker identification unit 170 (e.g., the speaker's name, etc.). The minutes-taking unit 180 then associates the text data generated from the voice data acquired by the voice acquisition unit 160 with the information on the person identified as the speaker of the voice data, and adds the text data to the minutes-taking data. The minutes-taking unit 180 may also read the list of participants in the meeting generated by the list creation unit 150, and add the information on the participants to the minutes-taking data.

以上、本実施形態の構成によれば、ビデオ会議システム1を利用した開催される会議の議事録を、自動で作成することができる。これにより、会議の参加人物が議事録の作成する手間を削減することができる。 As described above, according to the configuration of this embodiment, minutes of a conference held using the videoconferencing system 1 can be automatically created. This reduces the effort required for conference participants to create minutes.

以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。 The above describes the embodiments of the present invention with reference to the drawings, but these are merely examples of the present invention, and various configurations other than those described above can also be adopted.

また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。 In addition, in the multiple flow charts used in the above explanation, multiple steps (processing) are described in order, but the order of execution of the steps performed in each embodiment is not limited to the order described. In each embodiment, the order of the illustrated steps can be changed to the extent that does not cause any problems in terms of content. In addition, each of the above-mentioned embodiments can be combined to the extent that the content is not contradictory.

上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1.
会議の参加人物が写る画像を取得する画像取得手段と、
前記画像の中から、人物と認識される領域を検出する人物領域検出手段と、
前記領域に含まれる人物を特定する人物特定処理を実行する人物特定手段と、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報を表示装置に表示させる表示制御手段と、
を備えるビデオ会議システム。
2.
前記表示制御手段は、前記人物特定処理で特定された前記会議の参加人物の氏名を含む第2情報を前記表示装置に更に表示させる、
1.に記載のビデオ会議システム。
3.
前記表示制御手段は、前記第1情報の表示態様を、前記第2情報の表示態様と異ならせる、
2.に記載のビデオ会議システム。
4.
前記表示制御手段は、前記第1情報を前記第2情報よりも目立たせる、
3.に記載のビデオ会議システム。
5.
前記表示制御手段は、前記第1情報の外形、大きさ、色、言語、およびフォントの少なくとも1つを前記第2情報と異ならせることにより、前記第1情報を目立たせる、
4.に記載のビデオ会議システム。
6.
前記表示制御手段は、前記人物特定処理により特定された前記会議の参加人物の数が所定の閾値以上である場合、前記第2情報を一覧形式で表示させる、
2.から5.のいずれか1つに記載のビデオ会議システム。
7.
前記表示制御手段は、前記画像に写っている前記会議の参加人物が見る表示装置に、前記第1情報を表示させる、
1.から6.のいずれか1つに記載のビデオ会議システム。
8.
前記画像取得手段は、前記画像に基づく前記人物特定処理で特定されなかった参加人物が写る追加画像を、前記画像を生成した撮像装置とは異なる移動型の撮像装置から取得し、
前記人物特定手段は、前記追加画像に基づいて前記画像に基づく前記人物特定処理で特定されなかった参加人物を特定する、
1.から7.のいずれか1つに記載のビデオ会議システム。
9.
前記人物特定処理によって特定された人物のリストを作成するリスト作成手段を更に備える、
8.に記載のビデオ会議システム。
10.
音声データを取得する音声取得手段と、
前記音声データまたは前記音声データと同期して取得された画像を解析することによって、前記音声データに関する発言者を特定する発言者特定手段と、
前記発言者の特定結果と前記音声データに基づいて生成されたテキストデータとを対応付けることにより、議事録データを生成する議事録作成手段と、を更に備える、
8.または9.に記載のビデオ会議システム。
11.
前記表示制御手段は、前記第1情報を前記第2情報よりも目立たなくさせる、
3.に記載のビデオ会議システム。
12.
コンピュータが、
会議の参加人物が写る画像を取得し、
前記画像の中から、人物と認識される領域を検出し、
前記領域に含まれる人物を特定する人物特定処理を実行し、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報を表示装置に表示させる、
ことを含むビデオ会議方法。
13.
前記コンピュータが、
前記人物特定処理で特定された前記会議の参加人物の氏名を含む第2情報を前記表示装置に更に表示させる、
ことを含む12.に記載のビデオ会議方法。
14.
前記コンピュータが、
前記第1情報の表示態様を、前記第2情報の表示態様と異ならせる処理を実行する、
ことを含む13.に記載のビデオ会議方法。
15.
前記コンピュータが、前記第1情報を前記第2情報よりも目立たせる処理を実行する、
ことを含む14.に記載のビデオ会議方法。
16.
前記コンピュータが、
前記第1情報の外形、大きさ、色、言語、およびフォントの少なくとも1つを前記第2情報と異ならせることにより、前記第1情報を目立たせる、
ことを含む15.に記載のビデオ会議方法。
17.
前記コンピュータが、
前記人物特定処理により特定された前記会議の参加人物の数が所定の閾値以上である場合、前記第2情報を一覧形式で表示させる、
ことを含む13.から16.のいずれか1つに記載のビデオ会議方法。
18.
前記コンピュータが、
前記画像に写っている前記会議の参加人物が見る表示装置に、前記第1情報を表示させる、
ことを含む12.から17.のいずれか1つに記載のビデオ会議方法。
19.
前記コンピュータが、
前記画像に基づく前記人物特定処理で特定されなかった参加人物が写る追加画像を、前記画像を生成した撮像装置とは異なる移動型の撮像装置から取得し、
前記追加画像に基づいて前記画像に基づく前記人物特定処理で特定されなかった参加人物を特定する、
ことを含む12.から18.のいずれか1つに記載のビデオ会議方法。
20.
前記コンピュータが、
前記人物特定処理によって特定された人物のリストを作成する、
ことを含む19.に記載のビデオ会議方法。
21.
前記コンピュータが、
音声データを取得し、
前記音声データまたは前記音声データと同期して取得された画像を解析することによって、前記音声データに関する発言者を特定し、
前記発言者の特定結果と前記音声データに基づいて生成されたテキストデータとを対応付けることにより、議事録データを生成する、
ことを含む19.または20.に記載のビデオ会議方法。
22.
前記コンピュータが、
前記第1情報を前記第2情報よりも目立たなくさせる処理を実行する、
ことを含む14.に記載のビデオ会議方法。
23.
コンピュータに、12.から22.のいずれか1つに記載のビデオ会議方法を実行させるプログラム。
A part or all of the above-described embodiments may be described as, but is not limited to, the following supplementary notes.
1.
An image acquisition means for acquiring an image showing participants of a conference;
a person area detection means for detecting an area recognized as a person from within the image;
A person identification means for executing a person identification process for identifying a person included in the area;
a display control means for causing a display device to display first information indicating that the person has not been identified in the person identification process;
A video conferencing system comprising:
2.
The display control means further causes the display device to display second information including names of the participants of the conference identified in the person identification process.
1. The video conference system according to claim 1.
3.
The display control means causes a display mode of the first information to differ from a display mode of the second information.
2. The video conference system according to claim 1.
4.
The display control means makes the first information more prominent than the second information.
3. The video conference system according to claim 1.
5.
the display control means makes the first information stand out by making at least one of an outer shape, a size, a color, a language, and a font of the first information different from that of the second information;
4. The video conference system according to claim 1.
6.
the display control means displays the second information in a list format when the number of participants of the meeting identified by the person identification process is equal to or greater than a predetermined threshold.
2. The video conference system according to any one of 2. to 5.
7.
the display control means causes the first information to be displayed on a display device viewed by the participants of the conference who are shown in the image;
1. The video conference system according to any one of claims 1 to 6.
8.
the image acquisition means acquires an additional image, in which a participant not identified in the person identification process based on the image, from a mobile imaging device different from the imaging device that generated the image;
the person identification means identifies a participant who has not been identified in the person identification process based on the image, based on the additional image;
8. The video conference system according to any one of 1 to 7.
9.
The system further includes a list creation means for creating a list of the people identified by the person identification process.
8. The video conference system according to claim 1.
10.
A voice acquisition means for acquiring voice data;
a speaker identification means for identifying a speaker of the voice data by analyzing the voice data or an image acquired in synchronization with the voice data;
and a minutes creating means for creating minutes data by associating the speaker identification result with text data created based on the voice data.
8. The video conference system according to claim 9.
11.
The display control means makes the first information less noticeable than the second information.
3. The video conference system according to claim 1.
12.
The computer
Acquire images of the people attending the meeting,
Detecting an area recognized as a person from within the image;
execute a person identification process to identify a person included in the area;
displaying, on a display device, first information indicating that the person could not be identified in the person identification process;
23. A video conferencing method comprising:
13.
The computer,
and displaying, on the display device, second information including names of the participants of the conference identified in the person identification process.
13. The video conferencing method according to claim 12, comprising:
14.
The computer,
executing a process of making a display mode of the first information different from a display mode of the second information;
13. The video conferencing method according to claim 12, further comprising:
15.
The computer executes a process for making the first information more prominent than the second information.
14. The video conferencing method according to claim 13, further comprising:
16.
The computer,
At least one of the outer shape, size, color, language, and font of the first information is made different from that of the second information, thereby making the first information stand out.
15. The video conferencing method according to claim 15, comprising:
17.
The computer,
When the number of participants in the conference identified by the person identification process is equal to or greater than a predetermined threshold, the second information is displayed in a list format.
17. The video conferencing method according to any one of claims 13 to 16, comprising:
18.
The computer,
displaying the first information on a display device viewed by a participant of the conference who is shown in the image;
18. The video conferencing method according to any one of claims 12 to 17, comprising:
19.
The computer,
acquiring an additional image, in which a participant who was not identified in the person identification process based on the image is captured, from a mobile imaging device different from the imaging device that generated the image;
identifying a participant who was not identified in the person identification process based on the image based on the additional image;
19. The video conferencing method according to any one of claims 12 to 18, comprising:
20.
The computer,
Creating a list of people identified by the person identification process;
19. The video conferencing method according to claim 19, comprising:
21.
The computer,
Acquire audio data,
Identifying a speaker of the voice data by analyzing the voice data or an image acquired in synchronism with the voice data;
generating minutes data by associating the speaker identification result with text data generated based on the voice data;
21. The video conferencing method according to claim 19 or 20, comprising:
22.
The computer,
performing a process to make the first information less noticeable than the second information;
14. The video conferencing method according to claim 13, further comprising:
23.
A program for causing a computer to execute the video conference method according to any one of 12. to 22.

1 ビデオ会議システム
10 サーバ装置
1010 バス
1020 プロセッサ
1030 メモリ
1040 ストレージデバイス
1050 入出力インタフェース
1060 ネットワークインタフェース
110 画像取得部
120 人物領域検出部
130 人物特定部
140 表示制御部
150 リスト作成部
160 音声取得部
170 発言者特定部
180 議事録作成部
20 通信端末
30 撮像装置
32 撮像装置
40 表示装置
50 集音装置
1 Video conference system 10 Server device 1010 Bus 1020 Processor 1030 Memory 1040 Storage device 1050 Input/output interface 1060 Network interface 110 Image acquisition unit 120 Person area detection unit 130 Person identification unit 140 Display control unit 150 List creation unit 160 Audio acquisition unit 170 Speaker identification unit 180 Minutes creation unit 20 Communication terminal 30 Imaging device 32 Imaging device 40 Display device 50 Sound collection device

Claims (11)

会議の参加人物が写る画像を取得する画像取得手段と、
前記画像の中から、人物と認識される領域を検出する人物領域検出手段と、
前記領域に含まれる人物を特定する人物特定処理を実行する人物特定手段と、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報と、前記人物特定処理で特定された前記会議の参加人物の氏名を含む第2情報と、を表示装置に表示させる表示制御手段と、
を備え、
前記表示制御手段は、前記第1情報を前記第2情報よりも目立たせ
前記表示制御手段は、前記人物特定処理により特定された前記会議の参加人物の数が所定の閾値以上である場合、前記第2情報を一覧形式で表示させるビデオ会議システム。
An image acquisition means for acquiring an image showing participants of a conference;
a person area detection means for detecting an area recognized as a person from within the image;
A person identification means for executing a person identification process for identifying a person included in the area;
a display control means for causing a display device to display first information indicating that the person could not be identified by the person identification process and second information including the names of the participants of the conference identified by the person identification process;
Equipped with
The display control means makes the first information more prominent than the second information ,
The display control means displays the second information in a list format when the number of participants in the conference identified by the person identification process is equal to or greater than a predetermined threshold .
前記表示制御手段は、前記第1情報の外形、大きさ、色、言語、およびフォントの少なくとも1つを前記第2情報と異ならせることにより、前記第1情報を目立たせる、
請求項1に記載のビデオ会議システム。
the display control means makes the first information stand out by making at least one of an outer shape, a size, a color, a language, and a font of the first information different from that of the second information;
The video conferencing system of claim 1 .
前記表示制御手段は、特定された前記領域以外の領域に前記第2情報を表示させる、
請求項1または2に記載のビデオ会議システム。
The display control means displays the second information in an area other than the specified area.
3. A video conference system according to claim 1 or 2.
前記表示制御手段は、前記画像中の空き領域のサイズに応じて前記第2情報の大きさを変更する、
請求項1から3いずれか1項に記載のビデオ会議システム。
the display control means changes a size of the second information in accordance with a size of a free area in the image.
A video conference system according to any one of claims 1 to 3 .
前記表示制御手段は、前記画像に写っている前記会議の参加人物が見る表示装置に、前記第1情報を表示させる、
請求項1から4のいずれか1項に記載のビデオ会議システム。
the display control means causes the first information to be displayed on a display device viewed by the participants of the conference who are shown in the image;
A video conferencing system according to any one of claims 1 to 4 .
前記画像取得手段は、前記画像に基づく前記人物特定処理で特定されなかった参加人物が写る追加画像を、前記画像を生成した撮像装置とは異なる移動型の撮像装置から取得し、
前記人物特定手段は、前記追加画像に基づいて前記画像に基づく前記人物特定処理で特定されなかった参加人物を特定する、
請求項1から5のいずれか1項に記載のビデオ会議システム。
the image acquisition means acquires an additional image, in which a participant not identified in the person identification process based on the image, from a mobile imaging device different from the imaging device that generated the image;
the person identification means identifies a participant who has not been identified in the person identification process based on the image, based on the additional image;
A video conferencing system according to any one of claims 1 to 5 .
前記人物特定処理によって特定された人物のリストを作成するリスト作成手段を更に備える、
請求項6に記載のビデオ会議システム。
The system further includes a list creation means for creating a list of the people identified by the person identification process.
The video conferencing system of claim 6 .
音声データを取得する音声取得手段と、
前記音声データまたは前記音声データと同期して取得された画像を解析することによって、前記音声データに関する発言者を特定する発言者特定手段と、
前記発言者の特定結果と前記音声データに基づいて生成されたテキストデータとを対応付けることにより、議事録データを生成する議事録作成手段と、を更に備える、
請求項6または7に記載のビデオ会議システム。
A voice acquisition means for acquiring voice data;
a speaker identification means for identifying a speaker of the voice data by analyzing the voice data or an image acquired in synchronization with the voice data;
and a minutes creating means for creating minutes data by associating the speaker identification result with text data created based on the voice data.
8. A video conference system according to claim 6 or 7 .
会議の参加人物が写る画像を取得する画像取得手段と、
前記画像の中から、人物と認識される領域を検出する人物領域検出手段と、
前記領域に含まれる人物を特定する人物特定処理を実行する人物特定手段と、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報と、前記人物特定処理で特定された前記会議の参加人物の氏名を含む第2情報と、を表示装置に表示させる表示制御手段と、
を備え、
前記表示制御手段は、前記第1情報を前記第2情報よりも目立たなくさせ
前記表示制御手段は、前記人物特定処理により特定された前記会議の参加人物の数が所定の閾値以上である場合、前記第2情報を一覧形式で表示させるビデオ会議システム。
An image acquisition means for acquiring an image showing participants of a conference;
a person area detection means for detecting an area recognized as a person from within the image;
A person identification means for executing a person identification process for identifying a person included in the area;
a display control means for causing a display device to display first information indicating that the person could not be identified by the person identification process and second information including the names of the participants of the conference identified by the person identification process;
Equipped with
the display control means makes the first information less noticeable than the second information ,
The display control means displays the second information in a list format when the number of participants in the conference identified by the person identification process is equal to or greater than a predetermined threshold .
コンピュータが、
会議の参加人物が写る画像を取得し、
前記画像の中から、人物と認識される領域を検出し、
前記領域に含まれる人物を特定する人物特定処理を実行し、
前記人物特定処理で前記人物が特定できなかったことを示す第1情報と、前記人物特定処理で特定された前記会議の参加人物の氏名を含む第2情報と、を表示装置に表示させ、
前記第1情報を前記第2情報よりも目立た
前記人物特定処理により特定された前記会議の参加人物の数が所定の閾値以上である場合、前記第2情報を一覧形式で表示させる、
ことを含むビデオ会議方法。
The computer
Acquire images of the people attending the meeting,
Detecting an area recognized as a person from within the image;
execute a person identification process to identify a person included in the area;
displaying, on a display device, first information indicating that the person could not be identified by the person identification process and second information including the names of the participants of the conference identified by the person identification process;
Making the first information more prominent than the second information;
When the number of participants in the conference identified by the person identification process is equal to or greater than a predetermined threshold, the second information is displayed in a list format.
23. A video conferencing method comprising:
コンピュータに、請求項10に記載のビデオ会議方法を実行させるプログラム。 A program for causing a computer to execute the video conferencing method according to claim 10 .
JP2022115486A 2018-03-29 2022-07-20 Videoconferencing system, videoconferencing method, and program Active JP7501575B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022115486A JP7501575B2 (en) 2018-03-29 2022-07-20 Videoconferencing system, videoconferencing method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018065248A JP7110669B2 (en) 2018-03-29 2018-03-29 Video conferencing system, video conferencing method, and program
JP2022115486A JP7501575B2 (en) 2018-03-29 2022-07-20 Videoconferencing system, videoconferencing method, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018065248A Division JP7110669B2 (en) 2018-03-29 2018-03-29 Video conferencing system, video conferencing method, and program

Publications (2)

Publication Number Publication Date
JP2022140529A JP2022140529A (en) 2022-09-26
JP7501575B2 true JP7501575B2 (en) 2024-06-18

Family

ID=68169773

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018065248A Active JP7110669B2 (en) 2018-03-29 2018-03-29 Video conferencing system, video conferencing method, and program
JP2022115486A Active JP7501575B2 (en) 2018-03-29 2022-07-20 Videoconferencing system, videoconferencing method, and program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018065248A Active JP7110669B2 (en) 2018-03-29 2018-03-29 Video conferencing system, video conferencing method, and program

Country Status (1)

Country Link
JP (2) JP7110669B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021184601A (en) * 2020-05-21 2021-12-02 株式会社リアライズカンパニー Information processing unit
JP2022089216A (en) * 2020-12-04 2022-06-16 日本電気株式会社 Monitoring device, monitoring system, monitoring method, and monitoring program
JP7816537B2 (en) * 2022-08-31 2026-02-18 日本電気株式会社 Image processing system, image processing device, image processing method, and image processing program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195165A (en) 2000-01-14 2001-07-19 Nec Corp Gui control system and device and recording medium
JP2003023612A (en) 2001-07-10 2003-01-24 Mitsubishi Electric Corp Image communication terminal device
JP2009206924A (en) 2008-02-28 2009-09-10 Fuji Xerox Co Ltd Information processing apparatus, information processing system and information processing program
JP2011004007A (en) 2009-06-16 2011-01-06 Ricoh Co Ltd Television conference device, television conference method, and program for the same
JP2011045028A (en) 2009-08-24 2011-03-03 Sharp Corp Conference relay device, conference system, and computer program
WO2015033599A1 (en) 2013-09-06 2015-03-12 日本電気株式会社 Information input device, control method, and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195165A (en) 2000-01-14 2001-07-19 Nec Corp Gui control system and device and recording medium
JP2003023612A (en) 2001-07-10 2003-01-24 Mitsubishi Electric Corp Image communication terminal device
JP2009206924A (en) 2008-02-28 2009-09-10 Fuji Xerox Co Ltd Information processing apparatus, information processing system and information processing program
JP2011004007A (en) 2009-06-16 2011-01-06 Ricoh Co Ltd Television conference device, television conference method, and program for the same
JP2011045028A (en) 2009-08-24 2011-03-03 Sharp Corp Conference relay device, conference system, and computer program
WO2015033599A1 (en) 2013-09-06 2015-03-12 日本電気株式会社 Information input device, control method, and program

Also Published As

Publication number Publication date
JP2019176415A (en) 2019-10-10
JP7110669B2 (en) 2022-08-02
JP2022140529A (en) 2022-09-26

Similar Documents

Publication Publication Date Title
JP7501575B2 (en) Videoconferencing system, videoconferencing method, and program
US9894320B2 (en) Information processing apparatus and image processing system
JP7400886B2 (en) Video conferencing systems, video conferencing methods, and programs
WO2010010736A1 (en) Conference image creating method, conference system, server device, conference device, and so forth
JP7068710B2 (en) Information processing equipment, information processing method, information processing program
KR20160025768A (en) Attendance Management System Using Face Recognition
US20190147251A1 (en) Information processing apparatus, monitoring system, method, and non-transitory computer-readable storage medium
JP2004129071A (en) Two-way communication system
US20250252782A1 (en) Image processing apparatus, control method, and non-transitory storage medium
US11582274B2 (en) Videoconferencing system
JP2018081662A (en) Image print system
JP3245447U (en) face recognition system
JP5088463B2 (en) Monitoring system
JP2013182450A (en) Location management program and location management device
KR101431651B1 (en) Apparatus and method for mobile photo shooting for a blind person
JP2012049774A (en) Video monitoring device
US20230135997A1 (en) Ai monitoring and processing system
JP2021060691A (en) Program, video processing apparatus, and authentication method
CN114040145B (en) Video conference portrait display method, system, terminal and storage medium
JP2020166590A (en) Monitoring system, monitoring device, monitoring method and monitoring program
US12261840B2 (en) Authentication terminal, entrance/exit management system, entrance/exit management method, and program
US12106619B2 (en) Server device, entry/exit management method and program recording medium
TWI727337B (en) Electronic device and face recognition method
US20230005301A1 (en) Control apparatus, control method, and non-transitory computer readable medium
JP2022080502A (en) Host terminal, electronic meeting system, method for authentication of entry into electronic meeting, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240520

R150 Certificate of patent or registration of utility model

Ref document number: 7501575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150