Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7654983B2 - WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM - Google Patents
[go: Go Back, main page]

JP7654983B2 - WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM - Google Patents

WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM Download PDF

Info

Publication number
JP7654983B2
JP7654983B2 JP2021009138A JP2021009138A JP7654983B2 JP 7654983 B2 JP7654983 B2 JP 7654983B2 JP 2021009138 A JP2021009138 A JP 2021009138A JP 2021009138 A JP2021009138 A JP 2021009138A JP 7654983 B2 JP7654983 B2 JP 7654983B2
Authority
JP
Japan
Prior art keywords
work
prediction
workplace
image
worker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021009138A
Other languages
Japanese (ja)
Other versions
JP2022113042A (en
Inventor
火炎 木焦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2021009138A priority Critical patent/JP7654983B2/en
Priority to PCT/JP2021/007816 priority patent/WO2022157988A1/en
Publication of JP2022113042A publication Critical patent/JP2022113042A/en
Application granted granted Critical
Publication of JP7654983B2 publication Critical patent/JP7654983B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Program-control systems
    • G05B19/02Program-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Manufacturing & Machinery (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Factory Administration (AREA)

Description

本発明は、作業場において作業者が行っている作業の内容を推定する作業推定装置等に関する。 The present invention relates to a work estimation device that estimates the work being performed by a worker in a workplace.

従来、工場等の生産現場における作業工程の実施状況を撮像した撮像データを、当該作業工程の改善等に利用する種々の試みが知られている。例えば、下掲の特許文献1には、画像データの解析結果を利用して作業者の行動を判別する安全管理システムが開示されている。また、撮像画像から、撮像画像に撮像されている人間とオブジェクトとの間の相互作用(HOI、Human Object Interaction)として、人間がオブジェクトについて行っている動作を検出するHOI検出についても、研究が進められている。 Conventionally, various attempts have been made to use imaging data that captures the state of work processes in production sites such as factories to improve the work processes. For example, Patent Document 1 listed below discloses a safety management system that uses the results of analyzing image data to determine the behavior of workers. Research is also being conducted into HOI detection, which detects the actions of a human being with respect to an object captured in a captured image as an interaction between the human and the object (HOI).

特開2018-173957号JP 2018-173957 A

しかしながら、HOI検出による作業内容の予測は、それ単体では、精度が十分とはいえないとの問題がある。 However, there is a problem in that prediction of work content based on HOI detection alone is not sufficiently accurate.

本発明の一態様は、撮像画像から、十分な精度をもって、作業者が作業対象物について行っている作業の内容を推定することのできる作業推定装置等を実現することを目的とする。 One aspect of the present invention aims to realize a task estimation device that can estimate with sufficient accuracy the task content that a worker is performing on a task object from a captured image.

上記の課題を解決するために、本発明の一態様に係る作業推定装置は、作業場において作業者が行っている作業の内容を推定する作業推定装置であって、前記作業場を撮像した作業場画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場画像に撮像されている前記作業者が、前記作業場画像に撮像されている作業対象物について行っている作業の内容を出力とする学習済モデルである作業予測モデルを用いて、前記作業場画像または前記特徴情報から、前記作業者が前記作業対象物について行っている作業の内容を予測する予測部と、前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場に前記作業者が存在するか否かの判定結果の少なくとも一方を用いて、前記予測部の予測の正否を判定する判定部と、前記判定部によって前記予測部の予測が正しいと判定されると、前記予測部によって予測された前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容として推定する推定部と、を備える。 In order to solve the above problems, a task estimation device according to one aspect of the present invention is a task estimation device that estimates the content of a task being performed by a worker in a workplace, and includes: a prediction unit that uses a task prediction model, which is a trained model that receives an image of the workplace or feature information generated from the workplace image as an input and outputs the content of the task being performed by the worker captured in the workplace image on the work object captured in the workplace image, from the workplace image or the feature information; a determination unit that determines whether the prediction by the prediction unit is correct or not, using at least one of the task content predicted without using the task prediction model and the determination result of whether the worker is present in the workplace; and an estimation unit that, when the determination unit determines that the prediction by the prediction unit is correct, estimates the task content predicted by the prediction unit as the task content being performed by the worker in the workplace.

前記の構成によれば、前記作業推定装置は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場における前記作業者の存否の判定結果の少なくとも一方を用いて判定する。そして、前記作業推定装置は、前記作業予測モデルを用いた予測が正しいと判定されると、前記作業予測モデルを用いて予測した前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容であると推定する。 According to the above configuration, the work estimation device determines whether the work content predicted using the work prediction model is correct using at least one of the work content predicted without using the work prediction model and the determination result of the presence or absence of the worker in the workplace. Then, when it is determined that the prediction using the work prediction model is correct, the work estimation device estimates that the work content predicted using the work prediction model is the work content being performed by the worker in the workplace.

つまり、前記作業推定装置は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場に前記作業者が存在するか否かの判定結果の少なくとも一方を用いて検証する。 In other words, the work estimation device verifies the accuracy of the work content predicted using the work prediction model using at least one of the work content predicted without using the work prediction model and the determination result of whether or not the worker is present in the workplace.

したがって、前記作業推定装置は、前記作業場画像から、前記作業場において前記作業者が行っている前記作業の内容を、高精度に推定することができるとの効果を奏する。 Therefore, the work estimation device has the effect of being able to estimate with high accuracy the content of the work being performed by the worker in the workplace from the workplace image.

本発明の一態様に係る作業推定装置は、前記作業に用いられる工具、前記作業対象物、および、前記作業場の少なくとも1つの状態を検知するセンサの検知情報から、前記作業場において前記作業者が行っている前記作業の内容を予測する作業検知部をさらに備えてもよく、前記判定部は、前記予測部によって予測された前記作業の内容と、前記作業検知部によって予測された前記作業の内容とが一致すると、前記予測部の予測が正しいと判定してもよい。 The work estimation device according to one aspect of the present invention may further include a work detection unit that predicts the content of the work being performed by the worker in the work area from detection information of a sensor that detects at least one state of the tool used in the work, the work object, and the work area, and the determination unit may determine that the prediction by the prediction unit is correct when the content of the work predicted by the prediction unit matches the content of the work predicted by the work detection unit.

前記の構成によれば、前記作業推定装置は、前記センサの検知情報から予測した前記作業の内容と、前記作業予測モデルを用いて予測した前記作業の内容とが一致するか否かを判定する。そして、前記作業推定装置は、両者が一致すると判定すると、前記作業予測モデルを用いて予測した前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容であると推定する。 According to the above configuration, the work estimation device determines whether the work content predicted from the detection information of the sensor matches the work content predicted using the work prediction model. Then, when the work estimation device determines that the two match, it estimates that the work content predicted using the work prediction model is the work content being performed by the worker in the workplace.

つまり、前記作業推定装置は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記センサの検知情報から予測した前記作業の内容によって検証する。 In other words, the task estimation device verifies the accuracy of the task content predicted using the task prediction model based on the task content predicted from the sensor detection information.

したがって、前記作業推定装置は、前記作業場画像から、前記作業場において前記作業者が行っている前記作業の内容を、高精度に推定することができるとの効果を奏する。 Therefore, the work estimation device has the effect of being able to estimate with high accuracy the content of the work being performed by the worker in the workplace from the workplace image.

本発明の一態様に係る作業推定装置は、(A)前記作業場を含む複数の作業場を撮像した全体画像、または、(B)前記作業場画像、または、(C)前記全体画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場に前記作業者が存在するか否かを出力とする学習済モデルである存否モデルを用いて、前記全体画像、または、前記作業場画像、または、前記全体画像または前記作業場画像から生成された特徴情報から、前記作業場に前記作業者が存在するか否かを予測する存否予測部をさらに備えてもよく、前記判定部は、前記存否予測部によって前記作業場に前記作業者が存在すると予測されると、前記予測部の予測が正しいと判定してもよい。 The work estimation device according to one aspect of the present invention may further include a presence/absence prediction unit that predicts whether the worker is present in the workplace from the overall image, the workplace image, or the feature information generated from the overall image or the workplace image, using a presence/absence model that is a trained model that receives as input (A) an overall image of a plurality of workplaces including the workplace, or (B) the workplace image, or (C) feature information generated from the overall image or the workplace image, and outputs whether the worker is present in the workplace, and the determination unit may determine that the prediction by the prediction unit is correct when the presence/absence prediction unit predicts that the worker is present in the workplace.

前記の構成によれば、前記作業推定装置は、前記存否モデルを用いて、前記作業場に前記作業者が存在するか否かを予測する。そして、前記作業推定装置は、前記作業場に前記作業者が存在すると予測すると、前記作業予測モデルを用いて予測した前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容であると推定する。 According to the above configuration, the work estimation device predicts whether or not the worker is present in the workplace using the presence/absence model. Then, when the work estimation device predicts that the worker is present in the workplace, it estimates that the content of the work predicted using the work prediction model is the content of the work being performed by the worker in the workplace.

つまり、前記作業推定装置は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記存否モデルを用いて予測した前記作業場における前記作業者の存否によって検証する。 In other words, the work estimation device verifies the accuracy of the work content predicted using the work prediction model based on the presence or absence of the worker in the workplace predicted using the presence or absence model.

したがって、前記作業推定装置は、前記作業場画像から、前記作業場において前記作業者が行っている前記作業の内容を、高精度に推定することができるとの効果を奏する。 Therefore, the work estimation device has the effect of being able to estimate with high accuracy the content of the work being performed by the worker in the workplace from the workplace image.

本発明の一態様に係る作業推定装置は、前記作業に用いられる工具、前記作業対象物、および、前記作業場の少なくとも1つの状態を検知するセンサの検知情報から、前記作業場において前記作業者が行っている前記作業の内容を予測する作業検知部と、(A)前記作業場を含む複数の作業場を撮像した全体画像、または、(B)前記作業場画像、または、(C)前記全体画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場に前記作業者が存在するか否かを出力とする学習済モデルである存否モデルを用いて、前記全体画像、または、前記作業場画像、または、前記全体画像または前記作業場画像から生成された特徴情報から、前記作業場に前記作業者が存在するか否かを予測する存否予測部と、をさらに備えてもよく、前記判定部は、前記存否予測部によって前記作業場に前記作業者が存在すると予測され、かつ、前記予測部によって予測された前記作業の内容と、前記作業検知部によって予測された前記作業の内容とが一致すると、前記予測部の予測が正しいと判定してもよい。 The work estimation device according to one aspect of the present invention may further include a work detection unit that predicts the content of the work being performed by the worker in the work area from detection information from a sensor that detects at least one state of the tool used in the work, the work object, and the work area, and a presence/absence prediction unit that predicts whether the worker is present in the work area from the overall image, the work area image, or the feature information generated from the overall image or the work area image using a presence/absence model that is a trained model that receives as input (A) an overall image of a plurality of work areas including the work area, or (B) the work area image, or (C) feature information generated from the overall image or the work area image and outputs whether the worker is present in the work area. The determination unit may determine that the prediction by the prediction unit is correct when the presence/absence prediction unit predicts that the worker is present in the work area and the content of the work predicted by the prediction unit matches the content of the work predicted by the work detection unit.

前記の構成によれば、前記作業推定装置は、前記センサの検知情報から予測した前記作業の内容、および、前記作業場における前記作業者の存否を予測する。そして、前記作業推定装置は、前記作業場に前記作業者が存在すると予測し、かつ、前記センサの検知情報から予測した内容と前記作業予測モデルを用いて予測した内容とが一致すると、前記作業予測モデルを用いて予測した内容が正しいと判定する。 According to the above configuration, the work estimation device predicts the content of the work predicted from the detection information of the sensor, and predicts the presence or absence of the worker in the workplace. Then, when the work estimation device predicts that the worker is present in the workplace and the content predicted from the detection information of the sensor matches the content predicted using the work prediction model, it determines that the content predicted using the work prediction model is correct.

つまり、前記作業推定装置は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記センサの検知情報から予測した前記作業の内容と、前記存否モデルを用いて予測した前記作業場における前記作業者の存否とによって検証する。 In other words, the work estimation device verifies the accuracy of the work content predicted using the work prediction model based on the work content predicted from the detection information of the sensor and the presence or absence of the worker in the workplace predicted using the presence or absence model.

したがって、前記作業推定装置は、前記作業場画像から、前記作業場において前記作業者が行っている前記作業の内容を、高精度に推定することができるとの効果を奏する。 Therefore, the work estimation device has the effect of being able to estimate with high accuracy the content of the work being performed by the worker in the workplace from the workplace image.

本発明の一態様に係る作業推定装置において、前記作業予測モデルは、前記作業に用いられる工具、前記作業対象物、および、前記作業場の少なくとも1つの状態を検知するセンサの検知情報から予測された、前記作業場において前記作業者が行っている前記作業の内容が、前記作業場画像または前記作業場画像から生成された特徴情報に対してラベルとして付された学習用データセットを用いた機械学習によって、構築されてもよい。 In a work estimation device according to one aspect of the present invention, the work prediction model may be constructed by machine learning using a learning dataset in which the content of the work being performed by the worker in the work area, predicted from detection information from a sensor that detects the tool used in the work, the work object, and at least one state of the work area, is labeled to the work area image or feature information generated from the work area image.

前記の構成によれば、前記作業推定装置は、前記センサの検知情報から予測した「前記作業場において前記作業者が行っている前記作業の内容」がラベルとして付された学習用データセットを用いた機械学習によって、前記作業予測モデルを構築する。 According to the above configuration, the work estimation device constructs the work prediction model by machine learning using a learning dataset that is labeled with "the content of the work being performed by the worker in the workplace" predicted from the detection information of the sensor.

教師あり学習のためには、大量の教師データ(学習用データセット)が必要であることが知られており、そのような教師データの生成に必要なラベリング作業、および、教師データに付されているラベル(メタデータ)は、「アノテーション」とも呼ばれる。 It is known that supervised learning requires a large amount of training data (training dataset), and the labeling process required to generate such training data and the labels (metadata) attached to the training data are also called "annotations."

例えば、前記作業予測モデルの構築に際して学習される教師データには、前記作業者を検出するためのバウンディングボックス(Bounding Box)の設定が不要であったとしても、前記作業場画像に対して以下の5つのアノテーションが必要となる。すなわち、前記作業場画像に対して、前記作業対象物を検出するためのバウンディングボックスの範囲を示す4点のうち、左下の点および右上の点の各々のX座標およびY座標を設定することが必要であり、つまり、4つのアノテーションが必要となる。さらに、前記作業場画像に対して、「前記作業場画像に撮像されている前記作業者が、前記作業場画像に撮像されている作業対象物について行っている作業の内容」を示す情報(ラベル)の付与が必要であり、つまり、1つのアノテーションが必要となる。 For example, even if the teacher data learned when constructing the work prediction model does not require the setting of a bounding box for detecting the worker, the following five annotations are required for the work area image. That is, it is necessary to set the X and Y coordinates of the lower left and upper right points of the four points that indicate the range of the bounding box for detecting the work object for the work area image, that is, four annotations are required. Furthermore, it is necessary to assign information (label) to the work area image that indicates "the content of the work that the worker captured in the work area image is performing on the work object captured in the work area image," that is, one annotation is required.

そして、大量の前記作業場画像の各々について、「前記作業場画像に撮像されている前記作業者が、前記作業場画像に撮像されている作業対象物について行っている作業の内容」を人間に判定させようとする場合、それに要するコストは極めて大きい。 And if we were to have a human determine "the work that the worker captured in the workplace image is performing on the work object captured in the workplace image" for each of the large number of workplace images, the cost required would be extremely high.

そこで、前記作業予測モデルの構築に際して学習される教師データの生成に際しては、前記作業場画像から人間が判定した「作業の内容」ではなく、前記センサの検知情報から予測された「作業の内容」が、前記「作業の内容」を示すラベルとして付与される。つまり、前記作業予測モデルの構築に際して学習される教師データにおいては、前記作業場画像から人間が判定した「作業の内容」ではなく、前記センサの検知情報から予測された「作業の内容」が、前記「作業の内容」を示すラベルとして付されている。 Therefore, when generating the teacher data to be learned when constructing the work prediction model, the "work content" predicted from the detection information of the sensor, rather than the "work content" determined by a human from the workplace image, is assigned as a label indicating the "work content." In other words, in the teacher data to be learned when constructing the work prediction model, the "work content" predicted from the detection information of the sensor, rather than the "work content" determined by a human from the workplace image, is assigned as a label indicating the "work content."

そのため、前記作業予測モデルの構築に必要となるコスト(特に、前記学習用データセットの生成に必要なアノテーションコスト)は、前記「作業の内容」を示すラベルとして「前記作業場画像から人間が判定した内容」を用いる場合と比べて、大幅に抑制できる。例えば、前記作業場画像に対して必要な上述の5つのアノテーションの内の1つを、「人間による判定内容」から「前記作業推定装置等の装置が前記センサの検知情報から予測した内容」へと変更するので、アノテーションコストを20%抑制することができる。 Therefore, the cost required to construct the task prediction model (particularly the annotation cost required to generate the learning dataset) can be significantly reduced compared to the case where "content determined by a human from the workplace image" is used as a label indicating the "task content". For example, one of the above-mentioned five annotations required for the workplace image is changed from "content determined by a human" to "content predicted by a device such as the task estimation device from the detection information of the sensor", thereby reducing annotation costs by 20%.

したがって、前記の構成によれば、前記作業推定装置は、アノテーションコストが大幅に抑制された前記作業予測モデルを用いて、前記作業場画像から、前記作業場で前記作業者が行っている前記作業の内容を、高精度に推定することができるとの効果を奏する。 Therefore, with the above configuration, the task estimation device has the effect of being able to estimate with high accuracy the content of the task being performed by the worker in the workplace from the workplace image using the task prediction model with significantly reduced annotation costs.

上記の課題を解決するために、本発明の一態様に係る制御方法は、作業場において作業者が行っている作業の内容を推定する作業推定装置の制御方法であって、前記作業場を撮像した作業場画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場画像に撮像されている前記作業者が、前記作業場画像に撮像されている作業対象物について行っている作業の内容を出力とする学習済モデルである作業予測モデルを用いて、前記作業場画像または前記特徴情報から、前記作業者が前記作業対象物について行っている作業の内容を予測する予測ステップと、前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場に前記作業者が存在するか否かの判定結果の少なくとも一方を用いて、前記予測ステップでの予測の正否を判定する判定ステップと、前記判定ステップにて前記予測ステップでの予測が正しいと判定されると、前記予測ステップにて予測された前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容として推定する推定ステップと、を含む。 In order to solve the above problem, a control method according to one aspect of the present invention is a control method for a work estimation device that estimates the content of work being performed by a worker in a workplace, and includes a prediction step of predicting the content of work being performed by the worker on the work object captured in the workplace image from the workplace image or the feature information using a work prediction model, which is a trained model that receives an image of the workplace or feature information generated from the workplace image and outputs the content of work being performed by the worker captured in the workplace image on the work object captured in the workplace image, from the workplace image or the feature information; a determination step of determining whether the prediction in the prediction step is correct or not, using at least one of the content of work predicted without using the work prediction model and the determination result of whether the worker is present in the workplace; and an estimation step of estimating the content of the work predicted in the prediction step as the content of the work being performed by the worker in the workplace, if it is determined in the determination step that the prediction in the prediction step is correct.

前記の構成によれば、前記制御方法は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場における前記作業者の存否の判定結果の少なくとも一方を用いて判定する。そして、前記制御方法は、前記作業予測モデルを用いた予測が正しいと判定されると、前記作業予測モデルを用いて予測した前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容であると推定する。 According to the above configuration, the control method determines whether the work content predicted using the work prediction model is correct using at least one of the work content predicted without using the work prediction model and the determination result of the presence or absence of the worker in the workplace. Then, when it is determined that the prediction using the work prediction model is correct, the control method estimates that the work content predicted using the work prediction model is the work content being performed by the worker in the workplace.

つまり、前記制御方法は、前記作業予測モデルを用いて予測した前記作業の内容の正否を、前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場に前記作業者が存在するか否かの判定結果の少なくとも一方を用いて検証する。 In other words, the control method verifies the accuracy of the work content predicted using the work prediction model using at least one of the work content predicted without using the work prediction model and the determination result of whether or not the worker is present in the workplace.

したがって、前記制御方法は、前記作業場画像から、前記作業場において前記作業者が行っている前記作業の内容を、高精度に推定することができるとの効果を奏する。 The control method thus has the effect of being able to estimate with high accuracy the content of the work being performed by the worker in the workplace from the workplace image.

本発明の一態様によれば、撮像画像から、十分な精度をもって、作業者が作業対象物について行っている作業の内容を推定することができるとの効果を奏する。 According to one aspect of the present invention, it is possible to estimate with sufficient accuracy from the captured image the work that a worker is performing on a work object.

本発明の実施形態1に係る情報処理装置の要部構成を示すブロック図である。1 is a block diagram showing a configuration of a main part of an information processing device according to a first embodiment of the present invention; 図1の情報処理装置を含む制御システム等の全体概要を示す図である。FIG. 2 is a diagram showing an overall outline of a control system including the information processing device of FIG. 1 . 第二予測のうち作業予測のみを用いて第一予測を検証する場合に、図1の情報処理装置が実行する処理の全体概要を説明するフロー図である。10 is a flow diagram illustrating an overall overview of a process executed by the information processing device in FIG. 1 when verifying a first prediction using only a task prediction of a second prediction. 第二予測のうち存否予測のみを用いて第一予測を検証する場合に、図1の情報処理装置が実行する処理の全体概要を説明するフロー図である。10 is a flow diagram illustrating an overall outline of a process executed by the information processing device in FIG. 1 when the first prediction is verified using only the presence/absence prediction of the second prediction. 存否予測および作業予測の両方を用いて第一予測を検証する場合に、図1の情報処理装置が実行する処理の全体概要を説明するフロー図である。10 is a flow diagram illustrating an overall outline of a process executed by the information processing device of FIG. 1 when a first prediction is verified using both presence/absence prediction and work prediction. 教師データの生成に必要なアノテーションの一例を説明する図である。FIG. 10 is a diagram illustrating an example of annotations required for generating teacher data.

〔実施形態1〕
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。本実施の形態においては、情報処理装置10を、「作業場Arにおいて作業者Huが行っている作業Opの内容を推定する作業推定装置」の典型例として説明を行なう。
[Embodiment 1]
Hereinafter, an embodiment according to one aspect of the present invention (hereinafter also referred to as "the present embodiment") will be described with reference to the drawings. Note that the same or corresponding parts in the drawings are given the same reference numerals and their description will not be repeated. In the present embodiment, an information processing device 10 will be described as a typical example of "an operation estimation device that estimates the content of an operation Op being performed by a worker Hu at a work site Ar."

以下の説明において、「n」、「m」、「p」、「q」、「x」、「y」は、各々、「1」以上の整数を示すものとし、「p」と「q」とは互いに異なる整数であり、「x」と「y」とは互いに異なる整数であるものとする。 In the following description, "n", "m", "p", "q", "x", and "y" each represent an integer greater than or equal to 1, with "p" and "q" being different integers and "x" and "y" being different integers.

§1.適用例
本発明の一態様に係る情報処理装置10(作業推定装置)についての理解を容易にするため、先ず、情報処理装置10が適用される環境について説明する。情報処理装置10は、例えば、作業場Arを撮像した作業場画像Icの解析結果を利用して、作業者Huが作業対象物Obについて行う作業Opの効率化等に資する情報(支援情報)を生成する。そこで先ず、作業者Hu、作業対象物Ob、作業Op、作業場Ar、および、1つ以上の作業場Arを含む工場Fa等について、説明する。
§1. Application Example In order to facilitate understanding of the information processing device 10 (task estimation device) according to one aspect of the present invention, first, an environment in which the information processing device 10 is applied will be described. For example, the information processing device 10 uses the analysis results of a work site image Ic obtained by capturing an image of a work site Ar to generate information (support information) that contributes to the efficiency of a work Op performed by a worker Hu on a work object Ob. First, a worker Hu, a work object Ob, a work Op, a work site Ar, and a factory Fa including one or more work sites Ar will be described.

(工場および作業工程について)
生産現場である工場Faにおいては、例えば、各種の製品が、1つ以上の作業工程Pr(1)、Pr(2)、Pr(3)、・・・Pr(n)を経て生産される。工場Faにおいて実施される複数の作業工程Pr(1)、Pr(2)、Pr(3)、・・・Pr(n)の各々は、例えば、「塗装」工程、「主要ワークの組み立て」工程、「主要ワークの本体への組み込み」工程、「検査」工程である。
(About the factory and work process)
In a factory Fa, which is a production site, for example, various products are produced through one or more work processes Pr(1), Pr(2), Pr(3), ..., Pr(n). Each of the multiple work processes Pr(1), Pr(2), Pr(3), ..., Pr(n) carried out in the factory Fa is, for example, a "painting" process, a "main work assembly" process, a "installation of the main work into the main body" process, and an "inspection" process.

複数の工場Faを互いに区別する必要がある場合には、符号に「(A)」、「(B)」、「(C)」、・・・、「(Z)」等の添え字を付して区別する。例えば、「工場Fa(A)」、「工場Fa(B)」、「工場Fa(X)」、・・・、「工場Fa(Z)」と記載して区別する。複数の工場Faの各々を特に区別する必要がない場合は単に「工場Fa」と称する。 When it is necessary to distinguish between multiple factories Fa, they will be distinguished by adding suffixes such as "(A)", "(B)", "(C)", ..., "(Z)" to the reference numerals. For example, they will be distinguished by notation such as "Factory Fa(A)", "Factory Fa(B)", "Factory Fa(X)", ..., "Factory Fa(Z)". When there is no particular need to distinguish between each of the multiple factories Fa, they will simply be referred to as "Factory Fa".

また、作業工程Prについて、複数の作業工程Prの各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別する。例えば、「作業工程Pr(1)」、「作業工程Pr(2)」、「作業工程Pr(3)」、・・・、「作業工程Pr(n)」と記載して区別する。複数の作業工程Prの各々を特に区別する必要がない場合は単に「作業工程Pr」と称する。 In addition, when it is necessary to distinguish between multiple work processes Pr, they are distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numeral. For example, they are distinguished by notation such as "work process Pr(1)", "work process Pr(2)", "work process Pr(3)", ..., "work process Pr(n)". When there is no particular need to distinguish between multiple work processes Pr, they are simply referred to as "work process Pr".

(作業について)
作業工程Prにおいて、作業者Huは、1つ以上の作業Op(1)、Op(2)、Op(3)、・・・Op(n)を行う。例えば、作業工程Pr(x)において、作業者Huは、作業Op(x1)、Op(x2)、Op(x3)を行う。一例を挙げれば、作業工程Pr(m)が「塗装」工程の場合、作業Op(x1)は、作業対象物Obの「把持」であってもよいし、作業Op(x2)は、作業対象物Obの「塗装」であってもよいし、作業Op(x3)は、作業対象物Obの「運搬」であってもよい。
(About the work)
In a work process Pr, a worker Hu performs one or more operations Op(1), Op(2), Op(3), ... Op(n). For example, in a work process Pr(x), a worker Hu performs operations Op(x1), Op(x2), and Op(x3). For example, when a work process Pr(m) is a "painting" process, the operation Op(x1) may be "holding" the work object Ob, the operation Op(x2) may be "painting" the work object Ob, and the operation Op(x3) may be "transporting" the work object Ob.

作業Opについて、複数の作業Opの各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「作業Op」と称する。 When it is necessary to distinguish between multiple work Ops, they will be distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they will simply be referred to as "work Ops".

(作業場について)
工場Faは、1つ以上の作業場Ar(1)、Ar(2)、Ar(3)、・・・Ar(n)を含む。作業場Arは「セル」とも呼ばれ、つまり、工場Faは、1つ以上のセルを含む。1つ以上の作業場Ar(1)、Ar(2)、Ar(3)、・・・Ar(n)の各々は、1つ以上の作業工程Pr(1)、Pr(2)、Pr(3)、・・・Pr(n)の各々に対応付けられている。すなわち、作業場Ar(m)は、作業工程Pr(m)に含まれる作業Op(m)を、作業者Huが行う領域である。
(About the workplace)
The factory Fa includes one or more work sites Ar(1), Ar(2), Ar(3), ..., Ar(n). The work sites Ar are also called "cells", that is, the factory Fa includes one or more cells. Each of the one or more work sites Ar(1), Ar(2), Ar(3), ..., Ar(n) is associated with one or more operation processes Pr(1), Pr(2), Pr(3), ..., Pr(n). That is, the work site Ar(m) is an area where the worker Hu performs the operation Op(m) included in the operation process Pr(m).

作業場Arについて、複数の作業場Arの各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「作業場Ar」と称する。 When it is necessary to distinguish between multiple workplaces Ar, they will be distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they will simply be referred to as "workplace Ar".

(作業対象物について)
作業場Arには、作業者Huが行う作業Opの対象である作業対象物Obが1つ以上配置され、例えば、作業場Ar(x)には、作業対象物Ob(x1)、Ob(x2)、Ob(x3)、・・・、Ob(xn)が配置されている。
(About the work object)
In the work area Ar, one or more work objects Ob that are the targets of the work Op performed by the worker Hu are placed. For example, in the work area Ar(x), work objects Ob(x1), Ob(x2), Ob(x3), ..., Ob(xn) are placed.

作業対象物Obは、作業者Hu以外の存在であり、例えば、いわゆる「ワーク」であり、また、例えば、作業者Huが作業Opを行う際に用いる工具である。 The work object Ob is an entity other than the worker Hu, for example, a so-called "workpiece," or, for example, a tool used by the worker Hu when performing the work Op.

作業対象物Obについて、複数の作業対象物Obの各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「作業対象物Ob」と称する。 When it is necessary to distinguish between multiple work objects Ob, the reference numerals are followed by suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to distinguish between them. When no particular distinction is required, they are simply referred to as "work objects Ob".

(作業者について)
工場Faには、作業工程Prに含まれる作業Opを実行する作業者Huが1人以上存在し、例えば、作業者Hu(1)、Hu(2)、Hu(3)、・・・、Hu(n)が存在する。作業者Huは、例えば、作業者Huが被っている帽子の頭頂部などに付された作業者IDによって識別されてもよい。具体的には、工場Faに存在する作業者Hu(1)と作業者Hu(2)とは、作業者Hu(1)が被る帽子に付された作業者ID(1)と、作業者Hu(2)が被る帽子に付された作業者ID(2)とにより、各々が識別されてもよい。また、或る作業者Hu(1)を、別の作業者Hu(2)にとっての作業対象物Obとみなしてもよい。
(About the workers)
In the factory Fa, there are one or more workers Hu who perform the work Op included in the work process Pr, for example, workers Hu(1), Hu(2), Hu(3), ..., Hu(n). The workers Hu may be identified, for example, by a worker ID attached to the top of the hat worn by the worker Hu. Specifically, the workers Hu(1) and Hu(2) in the factory Fa may be identified by the worker ID(1) attached to the hat worn by the worker Hu(1) and the worker ID(2) attached to the hat worn by the worker Hu(2). In addition, a certain worker Hu(1) may be regarded as a work object Ob for another worker Hu(2).

作業者Huについて、複数の作業者Huの各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「作業者Hu」と称する。 When it is necessary to distinguish between multiple workers Hu, they will be distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they will simply be referred to as "worker Hu".

(機器および動作について)
工場Faは、1つ以上の機器40(1)、40(2)、40(3)、・・・40(n)を備える。機器40は、センサなどの入力デバイス41と、アクチュエータなどの出力デバイス42とを含む。
(About equipment and operation)
The factory Fa includes one or more devices 40(1), 40(2), 40(3), ... 40(n). The devices 40 include an input device 41 such as a sensor, and an output device 42 such as an actuator.

出力デバイス42は、PLC20によって出力を制御されるデバイスである。作業者Huは、作業Opを行う際に、出力デバイス42の出力を利用してもよく、具体的には、作業者Huは、出力デバイス42が実行する動作Acを利用して、作業Opを行ってもよい。すなわち、作業者Huは、作業Opを行う際に、出力デバイス42を工具として利用してもよく、言い換えれば、出力デバイス42は、作業者Huが作業Opを行う際に作業者Huが利用する工具であってもよい。例えば、作業工程Pr(x)に含まれる作業Op(x)を作業者Huが行う際には、出力デバイス42(x)が利用されてもよく、具体的には、出力デバイス42(x)が実行する動作Ac(x)を利用して、作業者Huは作業Op(x)を行ってもよい。 The output device 42 is a device whose output is controlled by the PLC 20. The worker Hu may use the output of the output device 42 when performing the work Op. Specifically, the worker Hu may use the operation Ac executed by the output device 42 to perform the work Op. That is, the worker Hu may use the output device 42 as a tool when performing the work Op. In other words, the output device 42 may be a tool used by the worker Hu when performing the work Op. For example, when the worker Hu performs the work Op(x) included in the work process Pr(x), the output device 42(x) may be used. Specifically, the worker Hu may perform the work Op(x) by using the operation Ac(x) executed by the output device 42(x).

入力デバイス41は、作業Opに用いられる工具(例えば、出力デバイス42、および、後述する出力デバイス42以外の器具90)、作業対象物Ob、および、作業場Arの少なくとも1つの状態を検知するセンサ(検知装置)である。例えば、入力デバイス41は、工具の消費電力、工具・作業対象物Ob等の作業者Huによる把持、工具・作業場Ar・作業対象物Ob等が備えるボタンの作業者Huによる押下、工具・作業場Ar・作業対象物Ob等が備える開閉機構の開閉などを検知する。 The input device 41 is a sensor (detection device) that detects at least one state of the tools (e.g., the output device 42 and the tools 90 other than the output device 42 described below) used in the operation Op, the work object Ob, and the work area Ar. For example, the input device 41 detects the power consumption of the tools, the gripping of the tools, work object Ob, etc. by the worker Hu, the pressing of a button provided on the tools, work area Ar, work object Ob, etc. by the worker Hu, the opening and closing of the opening and closing mechanism provided on the tools, work area Ar, work object Ob, etc.

具体的には、入力デバイス41は、例えば電流検知センサであり、作業者Huが「作業Op(x):ネジ締め作業」を行う際に利用する「器具90(x):電動ドライバ」に流れる電流を検知してもよい。また、入力デバイス41は、例えば把持センサであり、「器具90(x):電動ドライバ」が作業者Huによって把持されたのを検知してもよい。さらに、入力デバイス41は、例えば開始/終了ボタンであり、作業者Huによる押下を検知してもよい。また、入力デバイス41は、例えば光電センサであり、工具・作業場Ar・作業対象物Ob等が備える開閉機構の開閉を検知してもよい。 Specifically, the input device 41 may be, for example, a current detection sensor, and may detect the current flowing through the "tool 90(x): electric screwdriver" used by the worker Hu when performing the "task Op(x): screw tightening task". The input device 41 may also be, for example, a grip sensor, and may detect that the "tool 90(x): electric screwdriver" is gripped by the worker Hu. Furthermore, the input device 41 may be, for example, a start/end button, and may detect pressing by the worker Hu. The input device 41 may also be, for example, a photoelectric sensor, and may detect the opening and closing of an opening/closing mechanism provided on a tool, a work area Ar, a work object Ob, etc.

入力デバイス41は、検知した状態を示す情報(以下、「検知情報Id」とも称する)を、制御ネットワーク50を介して、PLC20へと周期的に出力する。特に、入力デバイス41は、「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態を検知した時刻(検知時刻Td)」を、検知情報Idに含めてPLC20へと周期的に出力する。 The input device 41 periodically outputs information indicating the detected state (hereinafter also referred to as "detection information Id") to the PLC 20 via the control network 50. In particular, the input device 41 periodically outputs to the PLC 20 the detection information Id including the "time at which at least one state of the tool used in the work Op, the work object Ob, and the work area Ar was detected (detection time Td)."

機器40について、複数の機器40の各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「機器40」と称する。同様に、入力デバイス41について、複数の入力デバイス41の各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「入力デバイス41」と称する。また、出力デバイス42について、複数の出力デバイス42の各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「出力デバイス42」と称する。 When it is necessary to distinguish between the multiple devices 40, the devices 40 are distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they are simply referred to as "devices 40". Similarly, when it is necessary to distinguish between the multiple input devices 41, the devices 40 are distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they are simply referred to as "input devices 41". Furthermore, when it is necessary to distinguish between the multiple output devices 42, the devices 42 are distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they are simply referred to as "output devices 42".

さらに、動作Acについて、複数の動作Acの各々を区別する必要がある場合には、符号に「(1)」、「(2)」、「(3)」、・・・、「(n)」等の添え字を付して区別し、特に区別する必要がない場合は単に「動作Ac」と称する。 Furthermore, when it is necessary to distinguish between multiple operations Ac, they are distinguished by adding suffixes such as "(1)", "(2)", "(3)", ..., "(n)" to the reference numerals, and when there is no particular need to distinguish between them, they are simply referred to as "operations Ac".

また、「作業Op(x)に用いられる工具(例えば、出力デバイス42(x)または器具90(x))、作業対象物Ob(x)、および、作業場Ar(x)の少なくとも1つの状態」を示す検知情報Idを、特に「検知情報Id(x)」と表現することがある。 In addition, the detection information Id indicating "at least one state of the tool (e.g., output device 42(x) or tool 90(x)) used in the operation Op(x), the work object Ob(x), and the work area Ar(x)" may be specifically referred to as "detection information Id(x)."

(工具について)
工場Faは、出力デバイス42に加えて、出力デバイス42以外の器具90(不図示)を備えてもよい。作業者Huは、作業Opを行う際、器具90を利用してもよく、具体的には、作業者Huは、器具90が実行する動作Acを利用して、作業Opを行ってもよい。例えば、作業工程Pr(x)に含まれる作業Op(x)を作業者Huが行う際には、器具90(x)が利用されてもよく、具体的には、器具90(x)が実行する動作Ac(x)を利用して、作業者Huは作業Op(x)を行ってもよい。一例を挙げれば、作業者Huは、「器具90(x):電動ドライバ」の実行する「動作Ac(x):回転動作」を利用して、「作業Op(x):ネジ締め作業」を行ってもよい。
(About tools)
In addition to the output device 42, the factory Fa may include a tool 90 (not shown) other than the output device 42. When performing an operation Op, the worker Hu may use the tool 90. Specifically, the worker Hu may perform the operation Op by using an action Ac performed by the tool 90. For example, when the worker Hu performs an operation Op(x) included in a work process Pr(x), the tool 90(x) may be used. Specifically, the worker Hu may perform the operation Op(x) by using an action Ac(x) performed by the tool 90(x). As an example, the worker Hu may perform "operation Op(x): screw tightening operation" by using "action Ac(x): rotation operation" performed by "tool 90(x): electric screwdriver".

前述の通り、器具90の状態(例えば、作業者Huによって使用されているとの状態)は、入力デバイス41によって検知され、入力デバイス41は、検知した「器具90の状態」を、制御ネットワーク50を介して、PLC20へと周期的に出力する。すなわち、入力デバイス41は、「器具90の状態」を検知すると、検知した「器具90の状態」と、その「器具90の状態」を検知した時刻(検知時刻Td)とを含む検知情報Idを、PLC20へと周期的に出力する。 As described above, the state of the tool 90 (e.g., the state of being used by the worker Hu) is detected by the input device 41, and the input device 41 periodically outputs the detected "tool 90 state" to the PLC 20 via the control network 50. That is, when the input device 41 detects the "tool 90 state", it periodically outputs detection information Id including the detected "tool 90 state" and the time when the "tool 90 state" was detected (detection time Td) to the PLC 20.

(作業場画像について)
作業場画像Icは、作業場Arを撮像した撮像画像であり、複数の作業場画像Icの各々は、複数の作業場Arの各々を撮像した撮像画像である。例えば、作業場画像Icは、作業場Arにおいて作業Opを行っている作業者Huを略正面から撮像した撮像画像であり、作業場画像Icは作業場Arごとに生成される撮像画像である。
(About the workshop images)
The work place image Ic is a captured image of the work place Ar, and each of the multiple work place images Ic is a captured image of each of the multiple work places Ar. For example, the work place image Ic is a captured image of a worker Hu performing a task Op in the work place Ar from a substantially frontal view, and the work place image Ic is a captured image generated for each work place Ar.

複数の作業場画像Icは、各々に撮像されている作業場Arによって区別されてもよい。例えば、複数の作業場画像Icの各々と、各々の作業場画像Icに撮像されている作業場Arとを対応付けることによって、複数の作業場画像Icの各々を区別してもよい。 The multiple work area images Ic may be distinguished from each other by the work area Ar captured in each of the multiple work area images Ic. For example, the multiple work area images Ic may be distinguished from each other by associating each of the multiple work area images Ic with the work area Ar captured in each of the work area images Ic.

すなわち、作業場Ar(1)を撮像した作業場画像Icを作業場画像Ic(1)と記載し、作業場Ar(2)を撮像した作業場画像Icを作業場画像Ic(2)と記載してもよい。同様に、作業場Ar(n)を撮像した作業場画像Icを作業場画像Ic(n)と記載してもよい。 That is, the work area image Ic captured in the work area Ar(1) may be referred to as work area image Ic(1), and the work area image Ic captured in the work area Ar(2) may be referred to as work area image Ic(2). Similarly, the work area image Ic captured in the work area Ar(n) may be referred to as work area image Ic(n).

複数の作業場画像Icについて、各々に撮像されている作業場Arによって複数の作業場画像Icを互いに区別する必要がない場合には、単に「作業場画像Ic」と称する。 When there is no need to distinguish between multiple work area images Ic based on the work area Ar captured in each of them, they are simply referred to as "work area images Ic."

(全体画像について)
作業場画像Icが作業場Arごとの撮像画像であるのに対して、全体画像Iaは、複数の作業場Arが撮像されている撮像画像であり、例えば、工場Faの天井から見下ろした、工場Faの全体が撮像されている撮像画像である。
(About the whole image)
While the work area image Ic is an image of each work area Ar, the overall image Ia is an image in which multiple work areas Ar are captured, for example, an image in which the entire factory Fa is captured as viewed from the ceiling of the factory Fa.

以下では先ず、図2を用いて、情報処理装置10を含む制御システム1等の概要について説明する。 First, the following describes an overview of the control system 1 including the information processing device 10 using FIG. 2.

(情報処理装置を含むシステムの全体概要について)
図2は、情報処理装置10を含む制御システム1等の全体概要を示す図である。これまで説明してきた環境について、情報処理装置10は、作業場Arを撮像した作業場画像Icから、作業場画像Icに撮像されている作業者Huが行っている作業Opの内容を高精度に推定する。
(Overview of the system including the information processing device)
2 is a diagram showing an overall overview of the control system 1 and the like including the information processing device 10. In the environment described above, the information processing device 10 estimates with high accuracy, from a workplace image Ic obtained by capturing an image of a workplace Ar, the content of an operation Op being performed by a worker Hu captured in the workplace image Ic.

セルカメラ30は、作業場Ar(つまり、セル)に設置され、作業場画像Icを生成する。例えば、作業場Arごとにセルカメラ30が設置され、複数のセルカメラ30の各々は、作業場Arごとに、作業場Arにおいて作業Opを行っている作業者Huを略正面から撮像可能な位置に設置される。セルカメラ30は、生成した作業場画像Icを、情報処理装置10へと出力し、特に、作業場Arを撮像した時刻である撮像時刻Tpと共に、作業場画像Icを、情報処理装置10へと出力する。 The cell camera 30 is installed in the workplace Ar (i.e., the cell) and generates a workplace image Ic. For example, a cell camera 30 is installed for each workplace Ar, and each of the multiple cell cameras 30 is installed in a position for each workplace Ar where it can capture an image of a worker Hu performing an operation Op in the workplace Ar from approximately the front. The cell camera 30 outputs the generated workplace image Ic to the information processing device 10, and in particular outputs the workplace image Ic to the information processing device 10 together with the image capture time Tp, which is the time when the workplace Ar was captured.

工場Faにおいて作業場Arごとに設置されたセルカメラ30を互いに区別する場合、複数のセルカメラ30の各々と、各々のセルカメラ30が設置されている作業場Arとを対応付けることによって、複数のセルカメラ30の各々を区別してもよい。例えば、作業場Ar(1)に設置されているセルカメラ30をセルカメラ30(1)と記載し、作業場Ar(2)に設置されているセルカメラ30をセルカメラ30(2)と記載してもよい。同様に、作業場Ar(n)に設置されているセルカメラ30をセルカメラ30(n)と記載してもよい。 When distinguishing between the cell cameras 30 installed in each work area Ar in the factory Fa, each of the multiple cell cameras 30 may be distinguished by associating each of the multiple cell cameras 30 with the work area Ar in which the cell camera 30 is installed. For example, the cell camera 30 installed in work area Ar(1) may be described as cell camera 30(1), and the cell camera 30 installed in work area Ar(2) may be described as cell camera 30(2). Similarly, the cell camera 30 installed in work area Ar(n) may be described as cell camera 30(n).

天井カメラ80は、例えば工場Faの天井に設置され、複数の作業場Arを斜め上から見下ろす全体画像Iaを生成し、例えば、1台の天井カメラ80によって工場Faの全体を撮像した全体画像Iaを生成する。ただし、天井カメラ80が工場Faの天井に1台設置されることは必須ではなく、工場Faの天井に設置された複数の天井カメラ80の各々が、工場Fa内の複数の作業場Arを撮像した全体画像Iaを生成してもよい。つまり、天井カメラ80は、複数の作業場Arを撮像した全体画像Iaを生成できればよい。 The ceiling camera 80 is installed, for example, on the ceiling of the factory Fa and generates an overall image Ia looking down diagonally from above on the multiple work areas Ar, for example, generating an overall image Ia capturing the entire factory Fa using a single ceiling camera 80. However, it is not essential that a single ceiling camera 80 is installed on the ceiling of the factory Fa, and each of multiple ceiling cameras 80 installed on the ceiling of the factory Fa may generate an overall image Ia capturing multiple work areas Ar in the factory Fa. In other words, it is sufficient for the ceiling camera 80 to be able to generate an overall image Ia capturing multiple work areas Ar.

以下の説明においては、工場Faの天井に、広域撮像カメラである天井カメラ80を1台設置し、1台の天井カメラ80が、工場Faの全体を俯瞰して撮像した全体画像Iaを生成する例を説明する。天井カメラ80は、生成した全体画像Iaを、情報処理装置10へと出力し、特に、工場Faの全体を撮像した時刻(つまり、全体画像Iaを生成した時刻)である全体時刻Taと共に、全体画像Iaを、情報処理装置10へと出力する。 In the following explanation, an example will be described in which one ceiling camera 80, which is a wide-area imaging camera, is installed on the ceiling of the factory Fa, and the ceiling camera 80 generates an overall image Ia by capturing an image of the entire factory Fa from above. The ceiling camera 80 outputs the generated overall image Ia to the information processing device 10, and in particular outputs the overall image Ia to the information processing device 10 together with the overall time Ta, which is the time when the entire factory Fa was captured (i.e., the time when the overall image Ia was generated).

(作業場画像に対する画像解析による、作業内容の予測)
情報処理装置10は、制御システム1に含まれ、例えばUSB(Universal Serial Bus)ケーブルを介して、セルカメラ30と通信可能に接続されている。情報処理装置10は、セルカメラ30から、作業場Arを撮像した作業場画像Icを取得し、取得した作業場画像Icに対し画像解析を実行して、作業場画像Icに撮像されている作業者Huが作業対象物Obについて行っている作業Opの内容を予測する。情報処理装置10は、HOI(Human Object Interaction)検出アルゴリズムを用いて、作業場画像Icから、「作業場画像Icに撮像されている作業者Huが作業対象物Obについて行っている作業Opの内容」を予測する。特に、情報処理装置10は、セルカメラ30から、作業場画像Icと共に、作業場画像Icが生成された時刻である撮像時刻Tpを取得し、取得した作業場画像Icと撮像時刻Tpとから、以下の予測を実行する。すなわち、情報処理装置10は、「撮像時刻Tpにおいて、作業場画像Icに撮像されている作業者Huが、作業場Arで、作業対象物Obについて行っている作業Opの内容」を予測する。作業場画像Icから予測される「作業者Huが作業対象物Obについて行っている作業Opの内容」を、特に、「撮像時刻Tpにおいて、作業者Huが、作業場Arで作業対象物Obについて行っている作業Opの内容」を、第一予測Pfとも称する。
(Prediction of work content through image analysis of workplace images)
The information processing device 10 is included in the control system 1 and is communicatively connected to the cell camera 30 via, for example, a USB (Universal Serial Bus) cable. The information processing device 10 acquires a work area image Ic of the work area Ar from the cell camera 30, performs image analysis on the acquired work area image Ic, and predicts the content of the work Op performed by the worker Hu captured in the work area image Ic on the work object Ob. The information processing device 10 predicts "the content of the work Op performed by the worker Hu captured in the work area image Ic on the work object Ob" from the work area image Ic using a HOI (Human Object Interaction) detection algorithm. In particular, the information processing device 10 acquires from the cell camera 30 the capture time Tp, which is the time when the work area image Ic was generated, together with the work area image Ic, and executes the following predictions from the acquired work area image Ic and the capture time Tp. That is, the information processing device 10 predicts "the content of the work Op being performed by the worker Hu on the work object Ob in the work place image Ic at the imaging time Tp" The "content of the work Op being performed by the worker Hu on the work object Ob in the work place image Ic" predicted from the work place image Ic, particularly the "content of the work Op being performed by the worker Hu on the work object Ob in the work place Ar at the imaging time Tp" is also referred to as a first prediction Pf.

例えば、情報処理装置10は、作業場Ar(x)を撮像した作業場画像Ic(x)に対し画像解析を実行して、作業場Ar(x)において作業者Hu(x)が作業対象物Ob(x)について行っている作業Op(x)の内容を予測する。特に、情報処理装置10は、作業場画像Ic(x)から、「作業場画像Ic(x)が撮像された撮像時刻Tpにおいて、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」を予測する。作業場画像Ic(x)から予測される、「作業場画像Ic(x)が撮像された撮像時刻Tpにおいて、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」を、特に「第一予測Pf(x)」と称することがある。 For example, the information processing device 10 performs image analysis on a workplace image Ic(x) captured of the workplace Ar(x) to predict the content of the work Op(x) being performed by a worker Hu(x) on a work object Ob(x) in the workplace Ar(x). In particular, the information processing device 10 predicts, from the workplace image Ic(x), "the content of the work Op(x) being performed by a worker Hu(x) on a work object Ob(x) in the workplace Ar(x) at the imaging time Tp when the workplace image Ic(x) is captured." The "content of the work Op(x) being performed by a worker Hu(x) on a work object Ob(x) in the workplace Ar(x) at the imaging time Tp when the workplace image Ic(x) is captured," predicted from the workplace image Ic(x), may be referred to as "first prediction Pf(x)."

(全体画像に対する画像解析による、作業者の存否の予測)
情報処理装置10は、制御システム1に含まれ、例えばUSB(Universal Serial Bus)ケーブルを介して、天井カメラ80と通信可能に接続されている。情報処理装置10は、天井カメラ80から、工場Faの全体を俯瞰して撮像した全体画像Iaを取得し、取得した全体画像Iaに対し画像解析を実行して、作業者Huが作業場Arに居るかを予測する。情報処理装置10は、例えばYOLOなどの動線検出アルゴリズム(物体検出アルゴリズム)を利用して、全体画像Iaから、「全体画像Iaに撮像されている作業場Arに、作業者Huが居るか」を予測する。特に、情報処理装置10は、天井カメラ80から、全体画像Iaと共に、全体画像Iaが生成された時刻である全体時刻Taを取得し、取得した全体画像Iaと全体時刻Taとから、以下の予測を実行する。すなわち、情報処理装置10は、「全体時刻Taにおいて、作業者Huが作業場Ar(特に、作業場画像Icに撮像されている作業場Ar)に居るか」を予測する。
(Prediction of worker presence or absence through image analysis of the entire image)
The information processing device 10 is included in the control system 1 and is communicatively connected to the ceiling camera 80 via, for example, a USB (Universal Serial Bus) cable. The information processing device 10 acquires an overall image Ia captured from the ceiling camera 80 overlooking the entire factory Fa, and performs image analysis on the acquired overall image Ia to predict whether the worker Hu is in the work area Ar. The information processing device 10 predicts, from the overall image Ia, "whether the worker Hu is in the work area Ar captured in the overall image Ia" using, for example, a movement line detection algorithm (object detection algorithm) such as YOLO. In particular, the information processing device 10 acquires, from the ceiling camera 80, the overall image Ia together with the overall time Ta, which is the time when the overall image Ia was generated, and executes the following prediction from the acquired overall image Ia and the overall time Ta. That is, the information processing device 10 predicts "whether the worker Hu is in the work area Ar (particularly, the work area Ar captured in the work area image Ic) at the overall time Ta".

したがって、情報処理装置10は、「撮像時刻Tpに対応する全体時刻Taにおいて、作業場Ar(特に、作業場画像Icに撮像されている作業場Ar)に作業者Huが居るか否か」を予測することができる。 Therefore, the information processing device 10 can predict "whether or not a worker Hu is present in the workplace Ar (particularly, the workplace Ar captured in the workplace image Ic) at the overall time Ta corresponding to the imaging time Tp."

全体画像Iaから予測される「作業場Arにおける作業者Huの存否」を、特に、「撮像時刻Tpに対応する全体時刻Taにおいて、作業場Arに作業者Huが居るか否か」の予測を、存否予測Paとも称する。 The "presence or absence of worker Hu in the workplace Ar" predicted from the overall image Ia, and in particular the prediction of "whether or not worker Hu is in the workplace Ar at the overall time Ta corresponding to the imaging time Tp", is also referred to as the presence or absence prediction Pa.

例えば、情報処理装置10は、「セルカメラ30(x)が生成した作業場画像Ic(x)に撮像されている作業場Ar(x)に作業者Hu(x)が居るか」を、天井カメラ80が生成した全体画像Iaに対する画像解析によって予測する。特に、情報処理装置10は、全体画像Iaから、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する全体時刻Taにおいて、作業者Hu(x)が、作業場Ar(x)に居るか」を予測する。全体画像Iaから予測される、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する全体時刻Taにおいて、作業者Hu(x)が作業場Ar(x)に居るか」の予測を、特に「存否予測Pa(x)」と称することがある。 For example, the information processing device 10 predicts "whether worker Hu(x) is in the workplace Ar(x) captured in the workplace image Ic(x) generated by the cell camera 30(x)" by image analysis of the overall image Ia generated by the ceiling camera 80. In particular, the information processing device 10 predicts "whether worker Hu(x) is in the workplace Ar(x) at the overall time Ta corresponding to the 'imaging time Tp at which the workplace image Ic(x) was captured'" from the overall image Ia. The prediction of "whether worker Hu(x) is in the workplace Ar(x) at the overall time Ta corresponding to the 'imaging time Tp at which the workplace image Ic(x) was captured'" predicted from the overall image Ia is sometimes referred to as "presence prediction Pa(x)".

(検知情報を用いた、作業内容の予測)
また、情報処理装置10は、PLC(Programmable Logic Controller)20から、PLC20によって動作Acを制御される機器40が実行した動作Acの内容および結果を示す動作結果Laから生成された工程情報Ipを取得する。工程情報Ipには、例えば、「機器40が動作Acを実行した時刻」、および、「機器40による動作Acの実行が、入力デバイス41等によって検知された時刻」の少なくとも一方が、検知時刻Tdとして含まれている。
(Prediction of work content using detection information)
Furthermore, the information processing device 10 acquires, from a PLC (Programmable Logic Controller) 20, process information Ip generated from operation results La indicating the contents and results of operations Ac executed by devices 40 whose operations Ac are controlled by the PLC 20. The process information Ip includes, for example, at least one of "the time when the devices 40 executed the operations Ac" and "the time when the execution of the operations Ac by the devices 40 was detected by the input device 41 or the like" as a detection time Td.

情報処理装置10は、PLC20から取得する工程情報Ipによって、出力デバイス42の状態(例えば、動作Acの内容および結果を含む動作状態)を把握し、把握した状態から、作業者Huが出力デバイス42を用いて行っている作業Opの内容を予測する。特に、情報処理装置10は、検知時刻Tdを含む工程情報Ipから、「『撮像時刻Tpに対応する検知時刻Td』における出力デバイス42の状態」を把握する。そして、情報処理装置10は、把握した「『撮像時刻Tpに対応する検知時刻Td』における出力デバイス42の状態」から、「『撮像時刻Tpに対応する検知時刻Td』において、作業者Huが出力デバイス42を用いて行っている作業Opの内容」を予測する。 The information processing device 10 grasps the state of the output device 42 (e.g., the operation state including the content and result of the operation Ac) from the process information Ip acquired from the PLC 20, and predicts the content of the work Op being performed by the worker Hu using the output device 42 from the grasped state. In particular, the information processing device 10 grasps the "state of the output device 42 at 'detection time Td corresponding to the image capture time Tp'" from the process information Ip including the detection time Td. Then, the information processing device 10 predicts the "content of the work Op being performed by the worker Hu using the output device 42 at 'detection time Td corresponding to the image capture time Tp'" from the grasped "state of the output device 42 at 'detection time Td corresponding to the image capture time Tp'".

ただし、PLC20が、機器40の出力等から出力デバイス42の状態を把握し、把握した状態から作業者Huが出力デバイス42を用いて行っている作業Opの内容を予測してもよい。そして、PLC20は、予測した作業Opの内容を含む工程情報Ipを、情報処理装置10に出力してもよい。すなわち、出力デバイス42の状態から作業者Huが出力デバイス42を用いて行っている作業Opの内容を予測するのは、PLC20であっても、情報処理装置10であってもよい。情報処理装置10は、出力デバイス42の状態から予測される「作業者Huが出力デバイス42を用いて行っている作業Opの内容」を取得または生成できればよい。 However, the PLC 20 may grasp the state of the output device 42 from the output of the equipment 40, and predict the content of the work Op being performed by the worker Hu using the output device 42 from the grasped state. The PLC 20 may then output process information Ip including the predicted content of the work Op to the information processing device 10. In other words, it may be the PLC 20 or the information processing device 10 that predicts the content of the work Op being performed by the worker Hu using the output device 42 from the state of the output device 42. It is sufficient for the information processing device 10 to acquire or generate the "content of the work Op being performed by the worker Hu using the output device 42" predicted from the state of the output device 42.

ここで、工程情報Ipは、「PLC20の制御する機器40の出力、および、PLC20による出力デバイス42に対する制御内容」等から生成される、出力デバイス42等の状態を示す情報である。そのため、PLC20は、「出力デバイス42からフィードバックとして取得する出力デバイス42の出力、および、出力デバイス42に対する制御内容」等から、出力デバイス42の状態を検知する検知装置と捉えることもできる。また、工程情報Ipは、「作業Opに用いられる工具(例えば、出力デバイス42、および、器具90)、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す情報である「検知情報Id」の一種と捉えることもできる。 Here, the process information Ip is information indicating the state of the output device 42, etc., generated from "the output of the equipment 40 controlled by the PLC 20, and the control contents of the output device 42 by the PLC 20", etc. Therefore, the PLC 20 can also be considered as a detection device that detects the state of the output device 42 from "the output of the output device 42 obtained as feedback from the output device 42, and the control contents of the output device 42", etc. In addition, the process information Ip can also be considered as a type of "detection information Id", which is information indicating "the state of at least one of the tools (e.g., the output device 42 and the tool 90) used in the work Op, the work object Ob, and the work area Ar".

さらに、情報処理装置10は、PLC20から、入力デバイス41によって検知された「作業Opに用いられる工具(例えば、出力デバイス42、および、器具90)、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す検知情報Idを取得する。 Furthermore, the information processing device 10 acquires detection information Id from the PLC 20, which indicates "at least one state of the tools (e.g., the output device 42 and the equipment 90) used in the work Op, the work object Ob, and the work area Ar" detected by the input device 41.

なお、情報処理装置10は、PLC20を介さずに、入力デバイス41から直接、入力デバイス41の検知した状態を示す検知情報Idを取得してもよい。 In addition, the information processing device 10 may obtain the detection information Id indicating the detected state of the input device 41 directly from the input device 41 without going through the PLC 20.

検知情報Idには、入力デバイス41が「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を検知した時刻である検知時刻Tdが含まれる。 The detection information Id includes a detection time Td, which is the time when the input device 41 detects "at least one state of the tool used in the work Op, the work object Ob, and the work area Ar."

情報処理装置10は、PLC20から取得する検知情報Idによって、作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態を把握し、把握した状態から、作業者Huが行っている作業Opの内容を予測する。 The information processing device 10 grasps the state of at least one of the tools used in the work Op, the work object Ob, and the work area Ar based on the detection information Id acquired from the PLC 20, and predicts the content of the work Op being performed by the worker Hu from the grasped state.

ただし、入力デバイス41から取得した検知情報Idによって、工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態を把握し、把握した状態から作業者Huが行っている作業Opの内容を予測するのは、PLC20であってもよい。そして、PLC20が、予測した作業Opの内容を含む工程情報Ipを、情報処理装置10に出力してもよい。すなわち、工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態から作業者Huが行っている作業Opの内容を予測するのは、PLC20であっても、情報処理装置10であってもよい。情報処理装置10は、工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態から予測される「作業者Huが行っている作業Opの内容」を取得または生成できればよい。 However, it may be the PLC 20 that grasps the state of at least one of the tools, the work object Ob, and the work area Ar using the detection information Id acquired from the input device 41, and predicts the content of the work Op being performed by the worker Hu from the grasped state. The PLC 20 may then output process information Ip including the predicted content of the work Op to the information processing device 10. In other words, it may be the PLC 20 or the information processing device 10 that predicts the content of the work Op being performed by the worker Hu from the state of at least one of the tools, the work object Ob, and the work area Ar. It is sufficient for the information processing device 10 to acquire or generate the "content of the work Op being performed by the worker Hu" predicted from the state of at least one of the tools, the work object Ob, and the work area Ar.

すなわち、情報処理装置10は、PLC20から取得する、「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す検知情報Id(工程情報Ipを含む)を取得する。情報処理装置10は、取得した検知情報Idから、「作業者Huが行っている作業Opの内容」を予測し、特に、「『撮像時刻Tpに対応する検知時刻Td』において、作業者Huが行っている作業Opの内容」を予測する。ただし、情報処理装置10は、PLC20が検知情報Idから予測した「作業者Huが行っている作業Opの内容」を、検知情報Idと共に、または、検知情報Idに代えて、PLC20から取得してもよい。例えば、情報処理装置10は、「『撮像時刻Tpに対応する検知時刻Td』において、作業者Huが行っている作業Opの内容」を、検知情報Idと共に、または、検知情報Idに代えて、PLC20から取得してもよい。 That is, the information processing device 10 acquires from the PLC 20 the detection information Id (including the process information Ip) indicating "at least one state of the tool used in the work Op, the work object Ob, and the work area Ar." The information processing device 10 predicts "the content of the work Op being performed by the worker Hu" from the acquired detection information Id, and in particular, predicts "the content of the work Op being performed by the worker Hu at the 'detection time Td corresponding to the image capture time Tp'." However, the information processing device 10 may acquire from the PLC 20 the "content of the work Op being performed by the worker Hu" predicted from the detection information Id by the PLC 20 together with the detection information Id or instead of the detection information Id. For example, the information processing device 10 may acquire from the PLC 20 the "content of the work Op being performed by the worker Hu at the 'detection time Td corresponding to the image capture time Tp'" together with the detection information Id or instead of the detection information Id.

検知情報Id(工程情報Ipを含む)から予測される「作業者Huが行っている作業Opの内容」を、特に、「『撮像時刻Tpに対応する検知時刻Td』において、作業者Huが行っている作業Opの内容」を、作業予測Poとも称する。 The "contents of the work Op being performed by the worker Hu" predicted from the detection information Id (including the process information Ip), and in particular the "contents of the work Op being performed by the worker Hu at the 'detection time Td corresponding to the imaging time Tp'", is also referred to as the work prediction Po.

例えば、情報処理装置10は、作業場Ar(x)において作業者Hu(x)が行っている作業Op(x)の内容を、以下の検知情報Id(x)(工程情報Ip(x)を含む)から予測する。すなわち、情報処理装置10は、「作業場Ar(x)に備えられた工具、作業場Ar(x)に配置されている作業対象物Ob(x)、および、作業場Ar(x)の少なくとも1つの状態」を示す検知情報Id(x)から、作業Op(x)の内容を予測する。「作業場Ar(x)に備えられた工具(例えば、出力デバイス42(x)、および、器具90(x)の少なくとも一方)」は、作業者Hu(x)が作業Op(x)を行う際に用いる工具である。特に、情報処理装置10は、工程情報Ip(x)から、「『撮像時刻Tpに対応する検知時刻Td』において、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」を予測する。検知情報Id(x)(工程情報Ip(x)を含む)から予測される「『撮像時刻Tpに対応する検知時刻Td』において、作業者Hu(x)が行っている作業Op(x)の内容」を、「作業予測Po(x)」と称することがある。 For example, the information processing device 10 predicts the content of the work Op(x) being performed by a worker Hu(x) in a workplace Ar(x) from the following detection information Id(x) (including process information Ip(x)). That is, the information processing device 10 predicts the content of the work Op(x) from the detection information Id(x) indicating "the tools provided in the workplace Ar(x), the work object Ob(x) placed in the workplace Ar(x), and at least one state of the workplace Ar(x)." The "tools provided in the workplace Ar(x) (for example, at least one of the output device 42(x) and the tool 90(x))" are the tools used by the worker Hu(x) when performing the work Op(x). In particular, the information processing device 10 predicts "the content of the work Op(x) being performed by the worker Hu(x) on the work object Ob(x) in the work area Ar(x) at the 'detection time Td' corresponding to the imaging time Tp'" from the process information Ip(x). The "content of the work Op(x) being performed by the worker Hu(x) at the 'detection time Td' corresponding to the imaging time Tp'" predicted from the detection information Id(x) (including the process information Ip(x)) may be referred to as the "work prediction Po(x)."

(予測した作業内容の検証と、推定結果の出力)
情報処理装置10は、作業場画像Icから予測した「作業者Huが作業対象物Obについて行っている作業Opの内容」を、以下の2つの予測の少なくとも一方を用いて、検証する。すなわち、情報処理装置10は、作業場画像Icから予測した内容を、全体画像Iaから予測した「作業者Huの存否」の予測、および、検知情報Idから予測された「作業者Huが行っている作業Opの内容」の少なくとも一方を用いて、検証する。つまり、情報処理装置10は、第一予測Pfの正否を、存否予測Paおよび作業予測Poの少なくとも一方を用いて検証し、特に、第一予測Pf(x)の正否を、存否予測Pa(x)および作業予測Po(x)の少なくとも一方を用いて検証する。
(Verifying predicted work content and outputting estimated results)
The information processing device 10 verifies the "contents of the work Op being performed by the worker Hu on the work object Ob" predicted from the work place image Ic, using at least one of the following two predictions. That is, the information processing device 10 verifies the contents predicted from the work place image Ic, using at least one of the "presence or absence of the worker Hu" predicted from the overall image Ia, and the "contents of the work Op being performed by the worker Hu" predicted from the detection information Id. That is, the information processing device 10 verifies the accuracy of the first prediction Pf, using at least one of the presence or absence prediction Pa and the work prediction Po, and in particular, verifies the accuracy of the first prediction Pf(x), using at least one of the presence or absence prediction Pa(x) and the work prediction Po(x).

第一予測Pf(x)は、情報処理装置10が作業場画像Ic(x)から予測した、「作業場Ar(x)において作業者Hu(x)が作業対象物Ob(x)について行っている作業Op(x)の内容」の予測である。「第一予測Pf(x)」は、例えば、作業場画像Ic(x)から予測された、「作業場画像Ic(x)が撮像された撮像時刻Tpにおいて、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」である。 The first prediction Pf(x) is a prediction of "the content of the work Op(x) being performed by a worker Hu(x) on a work object Ob(x) in the workplace Ar(x)" predicted by the information processing device 10 from the workplace image Ic(x). The "first prediction Pf(x)" is, for example, "the content of the work Op(x) being performed by a worker Hu(x) on a work object Ob(x) in the workplace Ar(x) at the imaging time Tp when the workplace image Ic(x) is captured" predicted from the workplace image Ic(x).

存否予測Pa(x)は、情報処理装置10が全体画像Iaから予測した、「作業場Ar(x)に作業者Huが存在するか否か」の予測である。存否予測Pa(x)は、例えば、全体画像Iaから予測された、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する全体時刻Taにおいて、作業者Hu(x)が作業場Ar(x)に居るか」の予測である。 The presence/absence prediction Pa(x) is a prediction of "whether or not a worker Hu is present in the workplace Ar(x)" predicted by the information processing device 10 from the overall image Ia. The presence/absence prediction Pa(x) is, for example, a prediction of "whether a worker Hu(x) is in the workplace Ar(x) at the overall time Ta corresponding to the 'imaging time Tp at which the workplace image Ic(x) was captured'" predicted from the overall image Ia.

作業予測Po(x)は、情報処理装置10が検知情報Id(x)から予測した、「作業場Ar(x)において作業者Hu(x)が行っている作業Op(x)の内容」の予測である。作業予測Po(x)は、例えば、検知情報Id(x)から予測された、「『撮像時刻Tpに対応する検知時刻Td』において、作業者Hu(x)が作業場Ar(x)で行っている作業Op(x)の内容」である。 The work prediction Po(x) is a prediction of "the content of the work Op(x) being performed by the worker Hu(x) at the workplace Ar(x)" predicted by the information processing device 10 from the detection information Id(x). The work prediction Po(x) is, for example, "the content of the work Op(x) being performed by the worker Hu(x) at the workplace Ar(x) at 'the detection time Td corresponding to the imaging time Tp'" predicted from the detection information Id(x).

例えば、情報処理装置10(特に、後述する判定部150)は、存否予測Pa(x)において、「作業場Ar(x)に作業者Huが存在する」と予測されていると、「第一予測Pf(x)は正しい」と判定する。より具体的には、情報処理装置10は、存否予測Pa(x)として、「『撮像時刻Tpに対応する全体時刻Ta』において、作業者Hu(x)が作業場Ar(x)に居る」と予測されていると、「第一予測Pf(x)は正しい」と判定する。そして、情報処理装置10(特に、後述する推定部160)は、判定部150によって正しいと判定された第一予測Pf(x)を、推定結果として、外部へと出力する。 For example, if the presence/absence prediction Pa(x) predicts that "worker Hu is present in the workplace Ar(x)", the information processing device 10 (particularly, the determination unit 150 described later) determines that "the first prediction Pf(x) is correct". More specifically, if the presence/absence prediction Pa(x) predicts that "worker Hu(x) is in the workplace Ar(x) at 'overall time Ta corresponding to the imaging time Tp'", the information processing device 10 determines that "the first prediction Pf(x) is correct". Then, the information processing device 10 (particularly, the estimation unit 160 described later) outputs the first prediction Pf(x) determined to be correct by the determination unit 150 to the outside as an estimation result.

例えば、情報処理装置10(特に、後述する判定部150)は、作業予測Po(x)における作業Op(x)と第一予測Pf(x)における作業Op(x)とが一致すると、「第一予測Pf(x)は正しい」と判定する。より具体的には、情報処理装置10は、存否予測Pa(x)における「『撮像時刻Tpに対応する検知時刻Td』での作業Op(x)の内容」と、第一予測Pf(x)における「撮像時刻Tpでの作業Op(x)の内容」とが一致しているか否かを確認する。そして、情報処理装置10は、両者が一致していることを確認すると、「第一予測Pf(x)は正しい」と判定する。そして、情報処理装置10(特に、後述する推定部160)は、判定部150によって正しいと判定された第一予測Pf(x)を、推定結果として、外部へと出力する。 For example, when the work Op(x) in the work prediction Po(x) and the work Op(x) in the first prediction Pf(x) match, the information processing device 10 (particularly, the determination unit 150 described later) determines that the "first prediction Pf(x) is correct." More specifically, the information processing device 10 checks whether the "contents of the work Op(x) at the 'detection time Td corresponding to the imaging time Tp'" in the presence/absence prediction Pa(x) match with the "contents of the work Op(x) at the imaging time Tp" in the first prediction Pf(x). Then, when the information processing device 10 confirms that the two match, it determines that the "first prediction Pf(x) is correct." Then, the information processing device 10 (particularly, the estimation unit 160 described later) outputs the first prediction Pf(x) determined to be correct by the determination unit 150 to the outside as an estimation result.

例えば、情報処理装置10(特に、後述する判定部150)は、存否予測Pa(x)において「作業場Ar(x)に作業者Huが存在する」と予測された場合に、作業予測Po(x)と第一予測Pf(x)とが一致するかを確認する。より具体的には、情報処理装置10は、存否予測Pa(x)として、「『撮像時刻Tpに対応する全体時刻Ta』において、作業者Hu(x)が作業場Ar(x)に居る」と予測された場合に、作業予測Po(x)と第一予測Pf(x)との一致を確認する。情報処理装置10は、存否予測Pa(x)における「撮像時刻Tpに対応する検知時刻Tdでの作業Op(x)の内容」と、第一予測Pf(x)における「撮像時刻Tpでの作業Op(x)の内容」との一致を確認すると、第一予測Pf(x)は正しいと判定する。そして、情報処理装置10(特に、後述する推定部160)は、判定部150によって正しいと判定された第一予測Pf(x)を、推定結果として、外部へと出力する。 For example, when the presence/absence prediction Pa(x) predicts that "worker Hu is present in the workplace Ar(x)," the information processing device 10 (particularly the determination unit 150 described later) checks whether the work prediction Po(x) and the first prediction Pf(x) match. More specifically, when the presence/absence prediction Pa(x) predicts that "worker Hu(x) is in the workplace Ar(x) at 'total time Ta corresponding to the imaging time Tp,'" the information processing device 10 checks whether the work prediction Po(x) and the first prediction Pf(x) match. When the information processing device 10 confirms whether the "contents of work Op(x) at the detection time Td corresponding to the imaging time Tp" in the presence/absence prediction Pa(x) match with the "contents of work Op(x) at the imaging time Tp" in the first prediction Pf(x), the information processing device 10 determines that the first prediction Pf(x) is correct. Then, the information processing device 10 (particularly the estimation unit 160 described later) outputs the first prediction Pf(x) determined to be correct by the determination unit 150 to the outside as an estimation result.

(マスタスレーブ制御システムについて)
制御システム1において、工場Faにおける作業工程Prを実施するのに用いられる機器40は、ラインコントローラとしてのPLC20により制御される。すなわち、PLC20をマスタとし、複数の機器40の各々をスレーブとするマスタスレーブ制御システムとしての制御システム1が構築され、複数の機器40の各々はネットワーク(制御ネットワーク50)を介してPLC20に通信可能に接続されている。PLC20は、制御ネットワーク50を介したデータ伝送を管理しているという意味で「マスタ」と呼ばれる。「マスタ」および「スレーブ」は、制御ネットワーク50上のデータ伝送の制御機能に着目して定義されるものであり、各装置間でどのような情報が送受信されるかについては、特に限定されない。
(Master-slave control system)
In the control system 1, the devices 40 used to perform the work process Pr in the factory Fa are controlled by the PLC 20 as a line controller. That is, the control system 1 is constructed as a master-slave control system in which the PLC 20 is the master and each of the devices 40 is a slave, and each of the devices 40 is communicatively connected to the PLC 20 via a network (control network 50). The PLC 20 is called a "master" in the sense that it manages data transmission via the control network 50. The terms "master" and "slave" are defined with a focus on the control function of data transmission on the control network 50, and there is no particular limitation on the type of information transmitted and received between the devices.

PLC20は、制御システム1全体を制御する制御装置(コントローラ)であり、複数の機器40の各々と通信可能に接続されている。PLC20は、入力デバイス41(計測デバイス)としての複数の機器40の各々からの情報を入力データとして取得する。PLC20は、予め組み込まれたユーザプログラムに従って、取得した入力データを用いた演算処理を実行する。PLC20は、前記演算処理を実行して、制御システム1に対する制御内容を決定し、例えば、アクチュエータなどの出力デバイス42としての複数の機器40の各々への制御内容を決定する。そして、PLC20は、決定した制御内容に対応する制御データを、複数の機器40(特に、出力デバイス42)の各々へと出力する。PLC20は、複数の機器40(具体的には、入力デバイス41)の各々からの入力データの取得と、複数の機器40(具体的には、出力デバイス42)の各々への制御データの取得とを、所定の周期(制御周期)で繰り返し実行する。PLC20には、例えば、不図示の表示部および操作部が接続されてもよい。表示部は、画像を表示可能な液晶パネル等で構成され、また、操作部は、典型的には、タッチパネル、キーボード、マウス等で構成される。 The PLC 20 is a control device (controller) that controls the entire control system 1, and is connected to each of the multiple devices 40 so as to be able to communicate with them. The PLC 20 acquires information from each of the multiple devices 40 as input devices 41 (measurement devices) as input data. The PLC 20 executes arithmetic processing using the acquired input data according to a user program previously incorporated. The PLC 20 executes the arithmetic processing to determine the control content for the control system 1, and for example, determines the control content for each of the multiple devices 40 as output devices 42 such as actuators. The PLC 20 then outputs control data corresponding to the determined control content to each of the multiple devices 40 (particularly, the output device 42). The PLC 20 repeatedly acquires input data from each of the multiple devices 40 (specifically, the input device 41) and acquires control data for each of the multiple devices 40 (specifically, the output device 42) at a predetermined period (control period). For example, a display unit and an operation unit (not shown) may be connected to the PLC 20. The display unit is composed of a liquid crystal panel capable of displaying images, and the operation unit is typically composed of a touch panel, keyboard, mouse, etc.

機器40は、PLC20をマスタとするマスタスレーブ制御システムとしての制御システム1におけるスレーブである。機器40は、所定の制御周期ごとに繰り返し入力データをPLC20へと送信する入力デバイス41であり、または、所定の制御周期ごとに繰り返し制御データをPLC20から受信し、受信した制御データにしたがって動作する出力デバイス42である。 The device 40 is a slave in the control system 1, which is a master-slave control system with the PLC 20 as the master. The device 40 is an input device 41 that repeatedly transmits input data to the PLC 20 at a predetermined control period, or an output device 42 that repeatedly receives control data from the PLC 20 at a predetermined control period and operates according to the received control data.

機器40(特に、入力デバイス41)は、例えば、入力データとして、PLC20に検知結果等を送信するセンサである。例えば、入力デバイス41は、光電センサであってもよく、また、読み取り結果を送信するバーコードリーダであってもよく、さらに、検査結果を送信する検査機(テスター)であってもよい。 The equipment 40 (particularly, the input device 41) is, for example, a sensor that transmits detection results, etc., as input data to the PLC 20. For example, the input device 41 may be a photoelectric sensor, a barcode reader that transmits the read results, or even an inspection machine (tester) that transmits the inspection results.

機器40(具体的には、出力デバイス42)は、ネジ締め、ピッキング等を実行する出力デバイスとしてのロボット等であってもよいし、各種のアクチュエータであってもよい。 The device 40 (specifically, the output device 42) may be a robot or the like that serves as an output device for performing operations such as screw tightening and picking, or may be any type of actuator.

また、機器40は、複数の入力デバイス41が接続されたPT(Programmable Terminal)であってもよい。 In addition, the device 40 may be a PT (Programmable Terminal) to which multiple input devices 41 are connected.

制御ネットワーク50は、PLC20が受信し、またはPLC20が送信する各種データを伝送し、典型的には、各種の産業用イーサネット(登録商標)を用いることができ、フィールドネットワークと称されることもある。産業用イーサネット(登録商標)としては、たとえば、EtherCAT(登録商標)、Profinet IRT、MECHATROLINK(登録商標)-III、Powerlink、SERCOS(登録商標)-III、CIP Motionなどが知られており、これらのうちのいずれを採用してもよい。さらに、産業用イーサネット(登録商標)以外のフィールドネットワークを用いてもよい。たとえば、モーション制御を行わない場合であれば、DeviceNet、CompoNet/IP(登録商標)などを用いてもよい。 The control network 50 transmits various data received by the PLC 20 or transmitted by the PLC 20, and typically may use various types of industrial Ethernet (registered trademark), and may also be referred to as a field network. Known industrial Ethernet (registered trademark) include, for example, EtherCAT (registered trademark), Profinet IRT, MECHATROLINK (registered trademark)-III, Powerlink, SERCOS (registered trademark)-III, and CIP Motion, and any of these may be adopted. Furthermore, a field network other than the industrial Ethernet (registered trademark) may also be used. For example, if motion control is not performed, DeviceNet, CompoNet/IP (registered trademark), etc. may be used.

本実施形態では、制御ネットワーク50上をデータフレームが順次転送されることで、PLC20(マスタ)と機器40(スレーブ)との間でデータが送受信される制御システム1について説明を行う。すなわち、制御ネットワーク50上をデータフレームが所定の制御周期で順次転送されることで、PLC20と機器40との間でデータが制御周期ごとに繰り返し送受信される。制御ネットワーク50上をデータフレームが順次転送されることで、複数の機器40の間で、つまり、複数のスレーブ間で、データが送受信されてもよい。 In this embodiment, a control system 1 is described in which data frames are transferred sequentially over a control network 50, thereby transmitting and receiving data between a PLC 20 (master) and a device 40 (slave). That is, data frames are transferred sequentially over the control network 50 at a predetermined control period, thereby repeatedly transmitting and receiving data between the PLC 20 and the device 40 at each control period. Data may be transmitted and received between multiple devices 40, i.e., multiple slaves, by transferring data frames sequentially over the control network 50.

情報処理装置10は、制御システム1に含まれるが、情報処理装置10は、制御システム1におけるスレーブでなくともよい。 The information processing device 10 is included in the control system 1, but the information processing device 10 does not have to be a slave in the control system 1.

機器40をスレーブとするマスタスレーブ制御システムである制御システム1において、マスタであるPLC20は、例えば所定の制御周期ごとに繰り返し、スレーブである機器40から、動作結果Laおよび検知情報Idを受信する。 In control system 1, which is a master-slave control system in which device 40 is a slave, PLC 20, which is the master, receives operation results La and detection information Id from device 40, which is a slave, for example, repeatedly at predetermined control intervals.

(工程情報について)
機器40をスレーブとするマスタスレーブ制御システムである制御システム1において、マスタであるPLC20は、例えば所定の制御周期ごとに繰り返し、スレーブである機器40から、動作結果Laを受信する。動作結果Laは、「機器40の実行した動作Acの内容および結果」を示す情報である。すなわち、機器40は、作業工程Prの実施に際して実際に実行した動作Acの内容および結果を示す動作結果Laを、所定の周期で繰り返し、PLC20へと送信する。例えば、機器40(x)は、作業工程Pr(x)の実施の際に実行した動作Ac(x)の内容および結果を示す動作結果La(x)を、制御周期で繰り返し、PLC20へと送信する。
(Regarding process information)
In the control system 1, which is a master-slave control system in which the device 40 is a slave, the PLC 20, which is the master, receives an operation result La from the device 40, which is a slave, for example, repeatedly at a predetermined control period. The operation result La is information indicating "the content and result of the operation Ac performed by the device 40." That is, the device 40 transmits the operation result La, which indicates the content and result of the operation Ac actually performed when performing the work process Pr, to the PLC 20 at a predetermined period. For example, the device 40(x) transmits the operation result La(x), which indicates the content and result of the operation Ac(x) performed when performing the work process Pr(x), to the PLC 20 at a control period.

PLC20は、例えば、入力デバイス41(計測デバイス)としての機器40が実行した計測動作の結果である計測結果を、機器40の動作結果Laとして取得する。また、機器40が検査機である場合、PLC20は、機器40が実行した検査動作の結果を、例えば、「検査基準を満たした、または、満たさなかった」といった検査結果を、機器40の動作結果Laとして取得する。さらに、PLC20は、例えば、出力デバイス42としての機器40が実行した出力動作の結果を、機器40の動作結果Laとして取得する。機器40がネジ締め、ピッキング等を実行するロボットである場合、PLC20は、ネジ締め回数、ピッキング結果(ピッキングの成功またはピッキングエラー)等の動作結果Laを、機器40の動作結果Laとして取得する。 The PLC 20 acquires, for example, the measurement result, which is the result of the measurement operation performed by the equipment 40 as the input device 41 (measurement device), as the operation result La of the equipment 40. Furthermore, if the equipment 40 is an inspection machine, the PLC 20 acquires the result of the inspection operation performed by the equipment 40, for example, the inspection result, such as "whether the inspection criteria were met or not met," as the operation result La of the equipment 40. Furthermore, the PLC 20 acquires, for example, the result of the output operation performed by the equipment 40 as the output device 42, as the operation result La of the equipment 40. If the equipment 40 is a robot that performs screw tightening, picking, etc., the PLC 20 acquires the operation result La, such as the number of screw tightenings, the picking result (picking success or picking error), etc., as the operation result La of the equipment 40.

PLC20は、作業工程Prの実施に際して機器40が実際に実行した動作Acの内容および結果を示す動作結果Laを、機器40から所定の周期で繰り返し受信し、受信した動作結果Laを、工程情報Ipとして情報処理装置10へと送信し、つまり転送する。また、PLC20は、機器40から所定の周期で繰り返し受信した動作結果Laを用いて生成した情報を、工程情報Ipとして情報処理装置10へ送信する。 The PLC 20 repeatedly receives operation results La from the equipment 40 at a predetermined cycle, which indicate the content and results of the operations Ac actually performed by the equipment 40 when carrying out the work process Pr, and transmits, i.e., transfers, the received operation results La to the information processing device 10 as process information Ip. The PLC 20 also transmits information generated using the operation results La repeatedly received at a predetermined cycle from the equipment 40 to the information processing device 10 as process information Ip.

さらに、PLC20は、機器40から所定の周期で繰り返し受信した動作結果Laを、工程情報Ipとして、制御システム1の外部に送信してもよい。例えば、PLC20は、機器40から所定の周期で繰り返し受信した動作結果Laを、工程情報Ipとして、MES(Manufacturin g Execution System、製造実行システム)などに接続した、図2に示す社内LAN(Local Area Network)に送信してもよい。 Furthermore, the PLC 20 may transmit the operation result La repeatedly received from the device 40 at a predetermined cycle as process information Ip to the outside of the control system 1. For example, the PLC 20 may transmit the operation result La repeatedly received from the device 40 at a predetermined cycle as process information Ip to an in-house LAN (Local Area Network) shown in FIG. 2 connected to a MES (Manufacturing Execution System) or the like.

情報処理装置10は、PLC20から取得する工程情報Ip(動作結果La)から、作業工程Prの実施に際し機器40が実行した動作Acの動作開始時刻Tms、動作完了時刻Tme、動作期間Daを特定する。そして、情報処理装置10は、特定した動作開始時刻Tms、動作完了時刻Tme、動作期間Da、および、動作Acに対応する所定の動作基準Saを用いて、動作Acに対する種々の判定を実行する。 The information processing device 10 identifies the operation start time Tms, operation completion time Tme, and operation period Da of the operation Ac performed by the equipment 40 when carrying out the work process Pr from the process information Ip (operation result La) acquired from the PLC 20. Then, the information processing device 10 performs various judgments on the operation Ac using the identified operation start time Tms, operation completion time Tme, operation period Da, and a predetermined operation standard Sa corresponding to the operation Ac.

しかしながら、工程情報Ipに含まれる動作結果La(特に、動作Ac)に対する上述の判定は、PLC20が実行してもよく、PLC20は、上述の判定の結果を、工程情報Ipに含めて、または、工程情報Ipに代えて、情報処理装置10へと送信してもよい。 However, the above-mentioned judgment on the operation result La (particularly, operation Ac) included in the process information Ip may be performed by PLC 20, and PLC 20 may transmit the result of the above-mentioned judgment to the information processing device 10 by including it in the process information Ip or instead of the process information Ip.

上述の説明において、動作開始時刻Tmsとは、作業工程Prに用いられる機器40が、作業工程Prの実施に際して、動作Acの実行を開始した時点であり、動作完了時刻Tmeとは、動作Acの実行を完了した時点である。動作期間Daは、動作開始時刻Tmsから動作完了時刻Tmeまでの期間である。 In the above description, the operation start time Tms is the time when the device 40 used in the work process Pr starts to perform the operation Ac when carrying out the work process Pr, and the operation completion time Tme is the time when the operation Ac is completed. The operation period Da is the period from the operation start time Tms to the operation completion time Tme.

前述の通り、工程情報Ipは、「作業Opに用いられる工具(特に、出力デバイス42)の状態」を示す情報と捉えることもできる。工程情報Ipは、例えば、「『撮像時刻Tpに対応する検知時刻Td』における、作業Opに用いられる工具(特に、出力デバイス42)の状態」を示す情報と捉えることもできる。そのため、工程情報Ipは、「作業Opに用いられる工具(例えば、出力デバイス42、および、器具90)、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す検知情報Idの一種と理解することができる。 As described above, the process information Ip can also be considered as information indicating "the state of the tools (particularly, the output device 42) used in the work Op." The process information Ip can also be considered as information indicating, for example, "the state of the tools (particularly, the output device 42) used in the work Op at 'the detection time Td corresponding to the imaging time Tp.'" Therefore, the process information Ip can be understood as a type of detection information Id indicating "the state of at least one of the tools (e.g., the output device 42 and the tool 90), the work object Ob, and the work area Ar used in the work Op."

(検知情報について)
制御システム1において、PLC20は、例えば所定の制御周期ごとに繰り返し、スレーブである機器40(特に、入力デバイス41)から、検知情報Idを受信する。検知情報Idは、入力デバイス41が検知した「作業Opに用いられる工具(例えば、出力デバイス42、および、後述する出力デバイス42以外の器具90)、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す情報である。すなわち、機器40(特に、入力デバイス41)は、「作業者Huによって作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を、所定の周期で繰り返し、PLC20へと送信する。検知情報Idには、入力デバイス41が「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を検知した時刻(すなわち、検知時刻Td)を示す情報が含まれる。
(Regarding detection information)
In the control system 1, the PLC 20 receives detection information Id from the slave device 40 (particularly, the input device 41) at a predetermined control cycle, for example. The detection information Id is information indicating "at least one state of the tool used in the work Op (e.g., the output device 42 and an instrument 90 other than the output device 42 described later), the work object Ob, and the work area Ar" detected by the input device 41. That is, the device 40 (particularly, the input device 41) transmits "at least one state of the tool used in the work Op by the worker Hu, the work object Ob, and the work area Ar" to the PLC 20 at a predetermined cycle. The detection information Id includes information indicating the time (i.e., the detection time Td) at which the input device 41 detected "at least one state of the tool used in the work Op, the work object Ob, and the work area Ar".

PLC20は、例えば、入力デバイス41(y)としての機器40(y)から、器具90(x)に流れる電流の大きさ(器具90(x)の消費電力等)を示す情報を、器具90(x)についての検知情報Id(x)として、取得する。 The PLC 20 acquires, for example, information indicating the magnitude of the current flowing through the appliance 90(x) (such as the power consumption of the appliance 90(x)) from the equipment 40(y) serving as the input device 41(y) as detection information Id(x) about the appliance 90(x).

PLC20は、例えば、入力デバイス41(y)としての機器40(y)から、器具90(x)が作業者Huによって把持されたか否かを示す情報を、器具90(x)についての検知情報Id(x)として、取得する。 The PLC 20 acquires, for example, information indicating whether the tool 90(x) is held by the worker Hu from the equipment 40(y) serving as the input device 41(y), as detection information Id(x) about the tool 90(x).

PLC20は、例えば、入力デバイス41(y)としての機器40(y)から、作業対象物Ob(x)が備える開閉機構の開閉を示す情報を、作業対象物Ob(x)についての検知情報Id(x)として、取得する。 The PLC 20 acquires, for example, information indicating the opening and closing of the opening and closing mechanism of the work object Ob(x) from equipment 40(y) serving as an input device 41(y), as detection information Id(x) for the work object Ob(x).

PLC20は、例えば、入力デバイス41(y)としての機器40(y)から、作業対象物Ob(x)が備えるボタンが押下されたか否かを示す情報を、作業対象物Ob(x)についての検知情報Id(x)として、取得する。 The PLC 20 acquires, for example, information indicating whether a button on the work object Ob(x) has been pressed from the equipment 40(y) serving as the input device 41(y), as detection information Id(x) about the work object Ob(x).

PLC20は、例えば、入力デバイス41(y)としての機器40(y)から、作業場Ar(x)が備える開閉機構の開閉を示す情報を、作業場Ar(x)についての検知情報Id(x)として、取得する。 The PLC 20 acquires, for example, information indicating the opening and closing of the opening and closing mechanism provided in the workplace Ar(x) from equipment 40(y) as an input device 41(y), as detection information Id(x) for the workplace Ar(x).

PLC20は、例えば、入力デバイス41(y)としての機器40(y)から、作業場Ar(x)が備えるボタンが押下されたか否かを示す情報を、作業場Ar(x)についての検知情報Id(x)として、取得する。 The PLC 20 acquires, for example, information indicating whether a button provided in the workplace Ar(x) has been pressed from equipment 40(y) serving as an input device 41(y), as detection information Id(x) for the workplace Ar(x).

PLC20は、検知情報Idを入力デバイス41から所定の周期で繰り返し受信し、受信した検知情報Idを、情報処理装置10へと送信し、つまり、転送する。 The PLC 20 repeatedly receives the detection information Id from the input device 41 at a predetermined period and transmits, i.e., transfers, the received detection information Id to the information processing device 10.

さらに、PLC20は、入力デバイス41から所定の周期で繰り返し受信した検知情報Idを、工程情報Ipと同様に、制御システム1の外部に送信してもよい。例えば、PLC20は、入力デバイス41から所定の周期で繰り返し受信した検知情報Idを、MES(Manufacturing Execution System、製造実行システム)などに接続した、図2に示す社内LAN(Local Area Network)に送信してもよい。 Furthermore, the PLC 20 may transmit the detection information Id repeatedly received from the input device 41 at a predetermined cycle to the outside of the control system 1, similar to the process information Ip. For example, the PLC 20 may transmit the detection information Id repeatedly received from the input device 41 at a predetermined cycle to an in-house LAN (Local Area Network) shown in FIG. 2 connected to a MES (Manufacturing Execution System) or the like.

情報処理装置10は、PLC20から取得する検知情報Idから、「作業者Huによって作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」と、入力デバイス41がその状態を検知した時刻である検知時刻Tdを特定する。そして、情報処理装置10は、特定した検知時刻Tdと、「作業者Huによって作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」とから、検知時刻Tdにおいて作業者Huが行っている作業Opの内容を予測する。つまり、情報処理装置10は、PLC20から取得する検知情報Idから、検知時刻Tdにおいて作業者Huが行っている作業Opの内容を予測する。 The information processing device 10 identifies "at least one state of the tools used by the worker Hu in the work Op, the work object Ob, and the work area Ar" from the detection information Id acquired from the PLC 20, and the detection time Td, which is the time when the input device 41 detected that state. Then, the information processing device 10 predicts the content of the work Op being performed by the worker Hu at the detection time Td from the identified detection time Td and "at least one state of the tools used by the worker Hu in the work Op, the work object Ob, and the work area Ar". In other words, the information processing device 10 predicts the content of the work Op being performed by the worker Hu at the detection time Td from the detection information Id acquired from the PLC 20.

しかしながら、検知情報Idから、検知時刻Tdにおいて作業者Huが行っている作業Opの内容を予測する処理は、PLC20が実行してもよい。その場合、PLC20は、予測結果を、検知情報Idに含めて、または、検知情報Idに代えて、情報処理装置10へと送信してもよい。 However, the process of predicting the content of the work Op being performed by the worker Hu at the detection time Td from the detection information Id may be performed by the PLC 20. In this case, the PLC 20 may transmit the prediction result to the information processing device 10 by including it in the detection information Id or instead of the detection information Id.

(マスタスレーブ制御システム以外のシステムおよび装置について)
図2には、マスタスレーブ制御システムとしての制御システム1に加えて、社内LANシステム、他ネットワークシステム等が示されている。社内LANは、MESとも称される工程情報DB(Database)等に接続している。工程情報DBには、「作業工程Prの実施に用いられる機器40が実行すべき標準的な動作」を示す情報が、動作基準Saとして格納されている。
(For systems and devices other than master-slave control systems)
2 shows an in-house LAN system, other network systems, etc., in addition to the control system 1 as a master-slave control system. The in-house LAN is connected to a process information DB (Database) also called MES. The process information DB stores information indicating "standard operations that should be performed by the equipment 40 used to perform the work process Pr" as an operation standard Sa.

また、図2に示す例では、MESとしての工程情報DBに、工場Faにおいて発生した各種のイベントを監視し、管理するイベント管理装置60が、社内LANを介して接続している。ただし、イベント管理装置60が社内LANを介して工程情報DBに接続していることは必須ではなく、イベント管理装置60は設けなくてもよい。 In the example shown in FIG. 2, an event management device 60 that monitors and manages various events that occur in the factory Fa is connected to the process information DB as the MES via an in-house LAN. However, it is not essential that the event management device 60 is connected to the process information DB via an in-house LAN, and the event management device 60 does not have to be provided.

さらに、工程情報DBには、社内LANを介して、PLC20が接続している。図示はしていないが、工程情報DBと情報処理装置10とは接続されていてもよい。また、社内LANには、MESに加えて、不図示のERP(Enterprise Resources Planning)、WMS(Warehouse Management System)等が接続されていてもよい。 Furthermore, the process information DB is connected to the PLC 20 via an in-house LAN. Although not shown, the process information DB and the information processing device 10 may be connected. In addition to the MES, the in-house LAN may also be connected to an ERP (Enterprise Resources Planning), WMS (Warehouse Management System), etc. (not shown).

図2において、工程情報DBには、制御ネットワーク50とも社内LANとも異なる「他ネットワーク」を介して、動画保存サーバ等が接続されている。動画保存サーバ等には、他ネットワークを介して情報処理装置10が接続されており、情報処理装置10から送信された作業場画像Ic、全体画像Ia、情報処理装置10が推定した作業Opの内容、および、支援情報などが動画保存サーバ等に格納される。また、動画保存サーバ等には、PC(Personal Computer)等によって実現される外部装置70が接続される。外部装置70は、例えば、作業場画像Ic、全体画像Ia、情報処理装置10が推定した作業Opの内容、および、支援情報などを表示し、工程情報Ip等の可視化を実行する。すなわち、外部装置70は、作業工程Prの改善に必要な情報を一覧表示し、ボトルネックとなっている作業工程Pr、作業工程Prに発生したエラーの日時等を示す情報を、対応する作業場画像Icと対応付けて表示する。 In FIG. 2, the process information DB is connected to a video storage server, etc., via an "other network" different from the control network 50 and the in-house LAN. The information processing device 10 is connected to the video storage server, etc., via the other network, and the work site image Ic, the overall image Ia, the contents of the work Op estimated by the information processing device 10, and support information, etc. transmitted from the information processing device 10 are stored in the video storage server, etc. In addition, an external device 70 realized by a PC (Personal Computer) or the like is connected to the video storage server, etc. The external device 70 displays, for example, the work site image Ic, the overall image Ia, the contents of the work Op estimated by the information processing device 10, and support information, etc., and performs visualization of the process information Ip, etc. That is, the external device 70 displays a list of information necessary for improving the work process Pr, and displays information indicating the work process Pr that is a bottleneck, the date and time of an error that occurred in the work process Pr, etc., in association with the corresponding work site image Ic.

セルカメラ30は、前述の通り、作業場Arを撮像して作業場画像Icを生成し、生成した作業場画像Icを、例えば例えばUSB(Universal Serial Bus)ケーブルである通信ケーブルを介して、情報処理装置10へと送信する。 As described above, the cell camera 30 captures an image of the workplace Ar to generate a workplace image Ic, and transmits the generated workplace image Ic to the information processing device 10 via a communication cable, such as a USB (Universal Serial Bus) cable.

また、天井カメラ80は、工場Faの全体を俯瞰して撮像して全体画像Iaを生成し、生成した全体画像Iaを、例えば例えばUSBケーブルである通信ケーブルを介して、情報処理装置10へと送信する。 The ceiling camera 80 also captures an overhead image of the entire factory Fa to generate an overall image Ia, and transmits the generated overall image Ia to the information processing device 10 via a communication cable, such as a USB cable.

情報処理装置10は、例えば、PC等によって実現され、PLC20から取得する工程情報Ipと、セルカメラ30から取得する作業場画像Icとを組み合わせて、両者の効率的な利用を可能とするデータ抽出装置であってもよい。情報処理装置10は、「工場Faにおける複数の機器40の実際の動作Acの内容および結果を示す動作結果La」を含む工程情報Ipを、「作業場画像Ic」および「作業場画像Icから推定した作業Opの内容」と組み合わせることで、作業工程Prを可視化する。情報処理装置10は、PLC20から取得する工程情報Ip、セルカメラ30から取得する作業場画像Ic、および、作業場画像Icから推定した作業Opの内容などを組み合わせることで、作業工程Prを可視化し、また、作業工程Prを効率的かつ精緻に分析する。 The information processing device 10 may be, for example, a data extraction device realized by a PC or the like, which combines the process information Ip acquired from the PLC 20 and the work area image Ic acquired from the cell camera 30 to enable efficient use of both. The information processing device 10 visualizes the work process Pr by combining the process information Ip, including the "operation result La showing the content and result of the actual operation Ac of the multiple devices 40 in the factory Fa," with the "work area image Ic" and the "content of the work Op estimated from the work area image Ic." The information processing device 10 visualizes the work process Pr by combining the process information Ip acquired from the PLC 20, the work area image Ic acquired from the cell camera 30, and the content of the work Op estimated from the work area image Ic, and also analyzes the work process Pr efficiently and precisely.

例えば、情報処理装置10は、工程情報Ipの可視化に加え、ボトルネックとなっている作業工程Prを抽出し、抽出した作業工程Prの実施状況を撮像した作業場画像Icと、抽出した作業工程Prの工程情報Ipとを組み合わせる。したがって、ユーザは、例えば、ボトルネックとなっている作業工程Prについて、ボトルネックとなっている原因、不具合要因を特定するのが容易になり、作業工程Prの改善作業を効率的に行うことができるようになる。加えて、情報処理装置10は、不良発生時のトレイサビリティにも用いることができる。 For example, the information processing device 10, in addition to visualizing the process information Ip, extracts the work process Pr that is a bottleneck, and combines a workplace image Ic that captures the implementation status of the extracted work process Pr with the process information Ip of the extracted work process Pr. Therefore, for example, it becomes easy for the user to identify the cause of the bottleneck and the cause of the defect for the work process Pr that is a bottleneck, and the user can efficiently carry out improvement work for the work process Pr. In addition, the information processing device 10 can also be used for traceability when a defect occurs.

また、情報処理装置10は、作業場画像Icと、複数の機器40の各々の工程情報Ipとを組み合わせることにより、作業場画像Icに対する解析と工程情報Ipに対する解析との両方の解析制度を向上させることができる。例えば、情報処理装置10は、PLC20から取得する工程情報Ip(動作結果La)を用いて、機器40が動作Acを開始した動作開始時刻Tms、および、動作Acを完了した動作完了時刻Tmeを特定する。情報処理装置10は、動作開始時刻Tmsから動作完了時刻Tmeまでの期間である動作期間Daに撮像された作業場画像Icに対し解析を実行することで、動作期間Daにおける機器40の動作Acと作業者Huの作業Opとを高精度で対応付けることができる。 In addition, the information processing device 10 can improve the accuracy of both the analysis of the workplace image Ic and the analysis of the process information Ip by combining the workplace image Ic and each of the process information Ip of the multiple devices 40. For example, the information processing device 10 uses the process information Ip (operation result La) acquired from the PLC 20 to identify the operation start time Tms at which the device 40 starts the operation Ac and the operation completion time Tme at which the operation Ac is completed. The information processing device 10 performs an analysis on the workplace image Ic captured during the operation period Da, which is the period from the operation start time Tms to the operation completion time Tme, and can associate the operation Ac of the device 40 during the operation period Da with the work Op of the worker Hu with high accuracy.

さらに、情報処理装置10は、工程情報DBから、「作業工程Prの実施に用いられる機器40が実行すべき標準的な動作」を示す動作基準Saを取得する。そして、情報処理装置10は、取得した動作基準Saを用いて、「作業工程Prの実施に用いられる機器40が実行した実際の動作Ac」に対する判定を実行する。情報処理装置10は、動作基準Saが示す標準的な動作とは異なると判定した動作Acに対応する作業工程Prの実施状況を撮像した作業場画像Icについて、解析を実行してもよい。 Furthermore, the information processing device 10 acquires a motion standard Sa indicating "standard motion that should be performed by the equipment 40 used to perform the work process Pr" from the process information DB. Then, the information processing device 10 uses the acquired motion standard Sa to perform a judgment on "actual motion Ac performed by the equipment 40 used to perform the work process Pr". The information processing device 10 may perform an analysis on a work site image Ic capturing the implementation status of the work process Pr corresponding to the motion Ac that is determined to be different from the standard motion indicated by the motion standard Sa.

(作業内容の推定について)
情報処理装置10は、作業場画像Icを解析して、作業者Huが作業対象物Obについて行った作業Opの内容を予測する。特に、情報処理装置10は、作業場Ar(x)を撮像した作業場画像Ic(x)から、「作業場画像Ic(x)が撮像された撮像時刻Tpに、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」を予測する。作業場Arにおいて作業者Huが行う作業Opは、一般に、作業対象物Obについて行う作業Opである。そのため、作業Opは、作業者Huと作業対象物Obとの組合せ(ペア)についての、作業者Huと作業対象物Obとの間の相互作用として捉えることができる。
(Estimation of work content)
The information processing device 10 analyzes the workplace image Ic to predict the content of the work Op performed by the worker Hu on the work object Ob. In particular, the information processing device 10 predicts "the content of the work Op(x) performed by the worker Hu(x) on the work object Ob(x) in the workplace Ar(x) at the image capturing time Tp when the workplace image Ic(x) is captured" from the workplace image Ic(x) capturing the workplace Ar(x). The work Op performed by the worker Hu in the workplace Ar is generally a work Op performed on the work object Ob. Therefore, the work Op can be regarded as an interaction between the worker Hu and the work object Ob for a combination (pair) of the worker Hu and the work object Ob.

ここで、従来、作業場画像Icから、作業場画像Icに撮像されている人間と、作業場画像Icに撮像されているオブジェクトとの間の相互作用であるHOI(Human Object Interaction)を検出する方法が研究されている。例えば、人間とオブジェクトとの両方をローカライズし、両者の間の相互作用を特定するHOI検出技術が知られている。 Here, conventionally, methods have been researched for detecting a human object interaction (HOI), which is an interaction between a human captured in the workplace image Ic and an object captured in the workplace image Ic, from the workplace image Ic. For example, a HOI detection technique is known that localizes both the human and the object and identifies the interaction between the two.

情報処理装置10は、作業者Huが作業対象物Obについて行っている作業Opの内容を推定するのに、HOI検出アルゴリズムを利用することができる。すなわち、情報処理装置10は、作業場画像Icに撮像されている「作業者Huと作業対象物Obとのペア」について、作業者Huが作業対象物Obについて行っている作業Opの内容を、HOIを検出するHOI検出アルゴリズムを利用して、予測することができる。 The information processing device 10 can use an HOI detection algorithm to estimate the content of the work Op that the worker Hu is performing on the work object Ob. That is, the information processing device 10 can predict the content of the work Op that the worker Hu is performing on the work object Ob for a "pair of worker Hu and work object Ob" captured in the work area image Ic, by using an HOI detection algorithm that detects the HOI.

ただし、HOI検出アルゴリズムを用いた予測の精度は、十分に高いとは言い難い。すなわち、作業場画像Icから、作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容を予測するHOI検出アルゴリズムの予測精度は、十分に高いとは言い難い。特に、作業場画像Icに以下の現象が発生すると、一般に、その作業場画像Icに対するHOI検出の精度は低下する傾向にあることが知られている。 However, it is difficult to say that the accuracy of predictions using the HOI detection algorithm is sufficiently high. In other words, it is difficult to say that the prediction accuracy of the HOI detection algorithm, which predicts from the workplace image Ic the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic, is sufficiently high. In particular, it is known that when the following phenomena occur in the workplace image Ic, the accuracy of HOI detection for that workplace image Ic generally tends to decrease.

すなわち、手前にある障害物等が、作業者Huおよび作業対象物Obの少なくとも一方の全部または一部を隠す「オクルージョン(occlusion)」が発生した作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。 That is, it is known that the accuracy of HOI detection for a work area image Ic in which an obstacle or the like in the foreground hides all or part of at least one of the worker Hu and the work object Ob, i.e., "occlusion," generally tends to decrease.

また、作業場画像Icに撮像されている作業者Huおよび作業対象物Obの少なくとも一方のサイズ(スケール)が(極端に)小さかったり大きかったりする場合、その作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。 In addition, it is known that when the size (scale) of at least one of the worker Hu and the work object Ob captured in the work area image Ic is (extremely) small or large, the accuracy of HOI detection for that work area image Ic generally tends to decrease.

作業者Huおよび作業対象物Obの少なくとも一方の全部または一部が、撮像範囲外に飛び出すなどして撮像されない「トランケーション(truncation)」が発生した作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。 It is known that the accuracy of HOI detection for a work area image Ic where "truncation" occurs, in which all or part of at least one of the worker Hu and the work object Ob is not captured because it goes outside the imaging range, tends to generally decrease.

作業者Huおよび作業対象物Obの少なくとも一方の全部または一部が透明体である場合、作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。 It is known that when at least one of the worker Hu and the work object Ob is wholly or partially transparent, the accuracy of HOI detection for the work area image Ic generally tends to decrease.

さらに、通常は撮像されない角度・大きさ等で作業対象物Obが撮像されている作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。例えば、作業場画像Icに撮像されている作業対象物Obの角度(回転)・大きさ等がレアタイプである場合、その作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。 Furthermore, it is known that the accuracy of HOI detection for a work area image Ic in which a work object Ob is captured at an angle, size, etc. that is not normally captured tends to generally decrease. For example, it is known that if the angle (rotation), size, etc. of the work object Ob captured in the work area image Ic is of a rare type, the accuracy of HOI detection for that work area image Ic generally tends to decrease.

また、撮像時点での照明が明るすぎたり、暗すぎたりした場合にも、その作業場画像Icに対するHOI検出の精度は、一般に低下する傾向があることが知られている。 It is also known that if the lighting at the time of capturing an image is too bright or too dark, the accuracy of HOI detection for that work area image Ic generally tends to decrease.

以下の説明においては、HOI検出(つまり、作業Opの内容の予測)のために、情報処理装置10が、作業者Huおよび作業対象物Obを、バウンディングボックス(Bounding Box)を用いて作業場画像Icから検出する例を説明する。ただし、情報処理装置10が作業者Huおよび作業対象物Obの検出にバウンディングボックスを用いることは必須ではない。情報処理装置10は、「Mask R-CNN」を利用して、作業場画像Icについて、作業者Huおよび作業対象物Obの分類タスク(セグメンテーション)を実行してもよい。また、情報処理装置10は、「Mask R-CNN」と同時に、深層学習において用いられるAttention機構を利用して、作業場画像Icから作業者Huおよび作業対象物Obを検出してもよい。情報処理装置10は、「Mask R-CNN」、Attention機構などを利用して、HOI検出の予測精度を改善してもよい。 In the following description, an example will be described in which the information processing device 10 detects the worker Hu and the work object Ob from the work site image Ic using a bounding box for HOI detection (i.e., prediction of the contents of the work Op). However, it is not essential for the information processing device 10 to use a bounding box to detect the worker Hu and the work object Ob. The information processing device 10 may use "Mask R-CNN" to execute a classification task (segmentation) of the worker Hu and the work object Ob for the work site image Ic. In addition, the information processing device 10 may detect the worker Hu and the work object Ob from the work site image Ic using an Attention mechanism used in deep learning, simultaneously with "Mask R-CNN". The information processing device 10 may improve the prediction accuracy of HOI detection by using "Mask R-CNN", an Attention mechanism, etc.

(HOI検出結果の検証)
前述の通り、HOI検出アルゴリズムを用いた予測の精度は、十分に高いとは言い難い。そこで、情報処理装置10は、HOI検出アルゴリズムを用いて予測したHOI(つまり、作業Op)の内容(つまり、第一予測Pf(x))を、存否予測Pa(x)および作業予測Po(x)の少なくとも一方を用いて検証する。
(Verification of HOI detection results)
As described above, it is difficult to say that the accuracy of prediction using the HOI detection algorithm is sufficiently high. Therefore, the information processing device 10 verifies the content (i.e., the first prediction Pf(x)) of the HOI (i.e., the operation Op) predicted using the HOI detection algorithm using at least one of the presence/absence prediction Pa(x) and the operation prediction Po(x).

情報処理装置10は、HOI検出アルゴリズムを、「YOLOなどの動線検出アルゴリズム」および「入力デバイス41等からの検知情報Id」と組み合わせて用いることで、「作業Opの内容」の推定について、ロバスト性および推定精度を向上させる。つまり、情報処理装置10は、動線検出アルゴリズムによる存否予測Pa、および、検知情報Idから予測した作業予測Poの少なくとも一方を、HOI検出アルゴリズムによる第一予測Pf(HOI検出結果)に対するノイズフィルターとして利用する。 The information processing device 10 improves the robustness and estimation accuracy of the estimation of the "contents of the work Op" by using the HOI detection algorithm in combination with a "movement line detection algorithm such as YOLO" and "detection information Id from the input device 41, etc." In other words, the information processing device 10 uses at least one of the presence/absence prediction Pa by the movement line detection algorithm and the work prediction Po predicted from the detection information Id as a noise filter for the first prediction Pf (HOI detection result) by the HOI detection algorithm.

情報処理装置10は、HOI検出アルゴリズムに加えて、「動線検出アルゴリズム」および「入力デバイス41等からの検知情報Id」の少なくとも一方を用いて、「作業Opの内容」を推定する作業推定装置である。 The information processing device 10 is a work estimation device that estimates the "contents of the work Op" using at least one of a "traffic flow detection algorithm" and "detection information Id from an input device 41, etc." in addition to the HOI detection algorithm.

(アノテーションコストの抑制)
HOI検出アルゴリズムで用いられる学習済モデルとしての作業予測モデル171は、例えば、作業場画像Icまたはその特徴情報に対して以下のラベルが付された教師データDt1の集合(学習用データセットDS1)に対する教師あり学習によって構築される。すなわち、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」がラベルとして付された教師データDt1の集合を用いた機械学習によって、作業予測モデル171は構築される。教師データDt1において作業場画像Icまたはその特徴情報に対して付されている「ラベル」は、「アノテーション」または「メタデータ」とも称される。
(Reduction of annotation costs)
The task prediction model 171 as a trained model used in the HOI detection algorithm is constructed by supervised learning on a set of teacher data Dt1 (learning data set DS1) in which the following labels are attached to the workplace image Ic or its feature information. That is, the task prediction model 171 is constructed by machine learning using a set of teacher data Dt1 in which the "contents of the task Op performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic" are attached as labels. The "label" attached to the workplace image Ic or its feature information in the teacher data Dt1 is also referred to as an "annotation" or "metadata".

本実施形態において、ラベルとして付される「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」は、検知情報Idから予測される作業予測Poである。すなわち、「検知情報Idから予測された『作業者Huが行っている作業Opの内容』が、作業場画像Icまたはその特徴情報に対してラベルとして付された」教師データDt1の集合に対する教師あり学習によって、作業予測モデル171は構築される。 In this embodiment, the "content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic" that is attached as a label is a work prediction Po predicted from the detection information Id. In other words, the work prediction model 171 is constructed by supervised learning on a set of teacher data Dt1 in which "the 'content of the work Op being performed by the worker Hu' predicted from the detection information Id is attached as a label to the workplace image Ic or its feature information."

一般に、学習済モデルの構築に必要となる大量の教師データDt1の生成には、ひじょうに手間がかかることが知られており、いわゆるアノテーションコストは極めて大きいことが知られている。例えば、大量の作業場画像Icの各々について、人間に、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を判定させようとする場合、それに要するコストは極めて大きい。 It is generally known that generating the large amount of training data Dt1 required to build a trained model is extremely time-consuming, and the so-called annotation cost is extremely high. For example, if one were to have a human determine "the content of the work Op that a worker Hu captured in the workplace image Ic is performing on a work object Ob captured in the workplace image Ic" for each of a large number of workplace images Ic, the cost required would be extremely high.

そこで、本実施形態では、検知情報Idから予測される「作業者Huが行っている作業Opの内容」を、作業場画像Icまたはその特徴情報に対して付される「ラベル」として利用する。これによって、大量の教師データDt1の生成に必要となるコスト(アノテーションコスト)を抑制することができ、つまり、作業予測モデル171の構築に際して必要となるコストを抑制することができる。そのため、情報処理装置10は、低コストで構築された作業予測モデル171を用いて、高精度かつロバスト性の高い、「作業Opの内容」の推定を実現することができる。 Therefore, in this embodiment, the "contents of the work Op being performed by the worker Hu" predicted from the detection information Id is used as a "label" to be attached to the workplace image Ic or its feature information. This makes it possible to reduce the cost (annotation cost) required to generate a large amount of training data Dt1, that is, the cost required to construct the work prediction model 171. Therefore, the information processing device 10 can realize highly accurate and robust estimation of the "contents of the work Op" using the work prediction model 171 constructed at low cost.

(本実施形態に係る情報処理装置についての整理)
これまでに図2を用いて説明してきた内容は、以下のように整理することができる。すなわち、情報処理装置10は、作業場Arにおいて作業者Huが行っている作業Opの内容を推定する作業推定装置であって、第一予測部120(予測部)と、判定部150と、推定部160と、を備える。
(Summary of the information processing device according to this embodiment)
The contents described above with reference to Fig. 2 can be summarized as follows: That is, the information processing device 10 is an operation estimation device that estimates the contents of an operation Op being performed by a worker Hu at a workplace Ar, and includes a first prediction unit 120 (prediction unit), a determination unit 150, and an estimation unit 160.

第一予測部120は、作業予測モデル171を用いて、「作業場画像Ic、または、作業場画像Icから生成された特徴情報」から、「作業者Huが作業対象物Obについて行っている作業Opの内容」を予測する。作業予測モデル171は、「作業場Arを撮像した作業場画像Ic」または「作業場画像Icから生成された特徴情報」を入力とし、以下の情報を出力とする学習済モデルである。すなわち、作業予測モデル171は、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を出力とする学習済モデルである。 The first prediction unit 120 predicts "the content of the work Op being performed by the worker Hu on the work object Ob" from "the workplace image Ic or the feature information generated from the workplace image Ic" using the work prediction model 171. The work prediction model 171 is a trained model that receives as input "the workplace image Ic captured of the workplace Ar" or "the feature information generated from the workplace image Ic" and outputs the following information. In other words, the work prediction model 171 is a trained model that outputs "the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic".

判定部150は、「作業予測モデル171を用いずに予測された作業Opの内容」、および、「作業場Arに作業者Huが存在するか否かの判定結果」の少なくとも一方を用いて、第一予測部120の予測の正否を判定する。つまり、判定部150は、作業予測Poおよび存否予測Paの少なくとも一方を用いて、第一予測Pfの正否を判定する。 The determination unit 150 determines whether the prediction by the first prediction unit 120 is correct or not by using at least one of the "contents of the work Op predicted without using the work prediction model 171" and the "determination result of whether or not the worker Hu is present in the workplace Ar." In other words, the determination unit 150 determines whether the first prediction Pf is correct or not by using at least one of the work prediction Po and the presence/absence prediction Pa.

推定部160は、判定部150によって第一予測部120の予測が正しいと判定されると、第一予測部120によって予測された作業Opの内容を、「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定する。つまり、推定部160は、作業予測Poおよび存否予測Paの少なくとも一方を用いて第一予測Pfが正しいことが検証されると、第一予測Pfを、「作業場Arにおいて作業者Huが行っている作業Opの内容」についての推定結果として出力する。 When the determination unit 150 determines that the prediction by the first prediction unit 120 is correct, the estimation unit 160 estimates that the content of the work Op predicted by the first prediction unit 120 is "the content of the work Op being performed by the worker Hu at the workplace Ar." In other words, when the estimation unit 160 verifies that the first prediction Pf is correct using at least one of the work prediction Po and the presence/absence prediction Pa, it outputs the first prediction Pf as an estimation result for "the content of the work Op being performed by the worker Hu at the workplace Ar."

前記の構成によれば、情報処理装置10は、作業予測モデル171を用いて予測した作業Opの内容(つまり、第一予測Pf)の正否を、以下の2つの予測の少なくとも一方を用いて判定する。すなわち、情報処理装置10は、作業予測モデル171を用いずに予測された作業Opの内容(作業予測Po)、および、作業場Arにおける作業者Huの存否の判定結果(存否予測Pa)の少なくとも一方を用いて、第一予測Pfの正否を判定する。 According to the above configuration, the information processing device 10 determines whether the content of the work Op predicted using the work prediction model 171 (i.e., the first prediction Pf) is correct or not using at least one of the following two predictions. That is, the information processing device 10 determines whether the first prediction Pf is correct or not using at least one of the content of the work Op predicted without using the work prediction model 171 (work prediction Po) and the judgment result of the presence or absence of the worker Hu in the workplace Ar (presence prediction Pa).

そして、情報処理装置10は、作業予測モデル171を用いた予測が正しいと判定すると、作業予測モデル171を用いて予測した作業Opの内容を、「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定する。 Then, when the information processing device 10 determines that the prediction using the work prediction model 171 is correct, it estimates that the content of the work Op predicted using the work prediction model 171 is "the content of the work Op being performed by the worker Hu at the workplace Ar."

つまり、情報処理装置10は、作業予測モデル171を用いて予測した作業Opの内容の正否を、作業予測モデル171を用いずに予測された作業Opの内容、および、作業場Arに作業者Huが存在するか否かの判定結果の少なくとも一方を用いて検証する。 In other words, the information processing device 10 verifies the accuracy of the content of the work Op predicted using the work prediction model 171 using at least one of the content of the work Op predicted without using the work prediction model 171 and the determination result of whether or not a worker Hu is present in the workplace Ar.

したがって、情報処理装置10は、作業場画像Icから、「作業場Arにおいて作業者Huが行っている作業Opの内容」を、高精度に推定することができるとの効果を奏する。 Therefore, the information processing device 10 has the effect of being able to estimate with high accuracy the "contents of the work Op being performed by the worker Hu in the workplace Ar" from the workplace image Ic.

情報処理装置10は、検知情報Idから、「作業場Arにおいて作業者Huが行っている作業Opの内容」を予測する作業予測部142(作業検知部)をさらに備える。検知情報Idは、入力デバイス41(センサ)によって検知された「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す情報である。 The information processing device 10 further includes a work prediction unit 142 (work detection unit) that predicts "the contents of the work Op being performed by the worker Hu in the work area Ar" from the detection information Id. The detection information Id is information that indicates "the tool used in the work Op, the work object Ob, and at least one state of the work area Ar" detected by the input device 41 (sensor).

判定部150は、第一予測部120によって予測された作業Opの内容(つまり、第一予測Pf)と、作業予測部142によって予測された作業Opの内容(つまり、作業予測Po)とが一致すると、第一予測部120の予測が正しいと判定する。 When the content of the work Op predicted by the first prediction unit 120 (i.e., the first prediction Pf) matches the content of the work Op predicted by the work prediction unit 142 (i.e., the work prediction Po), the determination unit 150 determines that the prediction by the first prediction unit 120 is correct.

前記の構成によれば、情報処理装置10は、入力デバイス41の検知情報Idから予測した作業Opの内容と、作業予測モデル171を用いて予測した作業Opの内容とが一致するか否かを判定する。そして、情報処理装置10は、両者が一致すると判定すると、作業予測モデル171を用いて予測した作業Opの内容を、「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定する。 According to the above configuration, the information processing device 10 determines whether the content of the work Op predicted from the detection information Id of the input device 41 matches the content of the work Op predicted using the work prediction model 171. Then, when the information processing device 10 determines that the two match, it estimates that the content of the work Op predicted using the work prediction model 171 is "the content of the work Op being performed by the worker Hu at the workplace Ar."

つまり、情報処理装置10は、作業予測モデル171を用いて予測した作業Opの内容の正否を、入力デバイス41の検知情報Idから予測した作業Opの内容によって検証する。 In other words, the information processing device 10 verifies whether the content of the work Op predicted using the work prediction model 171 is correct or not based on the content of the work Op predicted from the detection information Id of the input device 41.

したがって、情報処理装置10は、作業場画像Icから、「作業場Arにおいて作業者Huが行っている作業Opの内容」を、高精度に推定することができるとの効果を奏する。 Therefore, the information processing device 10 has the effect of being able to estimate with high accuracy the "contents of the work Op being performed by the worker Hu in the workplace Ar" from the workplace image Ic.

情報処理装置10は、存否予測部141をさらに備え、判定部150は、存否予測部141によって「作業場Arに作業者Huが存在する」と予測されると、第一予測部120の予測が正しいと判定する。存否予測部141は、存否モデル172を用いて、全体画像Ia、または、作業場画像Ic、または、全体画像Iaまたは作業場画像Icから生成された特徴情報から、「作業場Arに作業者Huが存在するか否か」を予測する。存否モデル172は、学習済モデルであり、その入力は、(A)作業場Arを含む複数の作業場Arを撮像した全体画像Ia、または、(B)作業場画像Ic、または、(C)全体画像Iaまたは作業場画像Icから生成された特徴情報である。また、存否モデル172の出力は、「作業場Arに作業者Huが存在するか否か」を示す情報である。 The information processing device 10 further includes a presence/absence prediction unit 141, and when the presence/absence prediction unit 141 predicts that "the worker Hu is present in the workplace Ar", the determination unit 150 determines that the prediction of the first prediction unit 120 is correct. The presence/absence prediction unit 141 predicts "whether the worker Hu is present in the workplace Ar" using the presence/absence model 172 from the overall image Ia, or the workplace image Ic, or feature information generated from the overall image Ia or the workplace image Ic. The presence/absence model 172 is a trained model, and its input is (A) the overall image Ia of a plurality of workplaces Ar including the workplace Ar, or (B) the workplace image Ic, or (C) feature information generated from the overall image Ia or the workplace image Ic. The output of the presence/absence model 172 is information indicating "whether the worker Hu is present in the workplace Ar".

前記の構成によれば、情報処理装置10は、存否モデル172を用いて、「作業場Arに作業者Huが存在するか否か」を予測する。そして、情報処理装置10は、「作業場Arに作業者Huが存在する」と予測すると、作業予測モデル171を用いて予測した作業Opの内容を、「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定する。 According to the above configuration, the information processing device 10 predicts "whether or not a worker Hu is present in the workplace Ar" using the presence/absence model 172. Then, when the information processing device 10 predicts that "a worker Hu is present in the workplace Ar", it estimates that the content of the work Op predicted using the work prediction model 171 is "the content of the work Op being performed by the worker Hu in the workplace Ar".

つまり、情報処理装置10は、作業予測モデル171を用いて予測した作業Opの内容の正否を、存否モデル172を用いて予測した「作業場Arにおける作業者Huの存否」によって検証する。 In other words, the information processing device 10 verifies the accuracy of the content of the work Op predicted using the work prediction model 171 based on the "presence or absence of the worker Hu in the work area Ar" predicted using the presence or absence model 172.

したがって、情報処理装置10は、作業場画像Icから、「作業場Arにおいて作業者Huが行っている作業Opの内容」を、高精度に推定することができるとの効果を奏する。 Therefore, the information processing device 10 has the effect of being able to estimate with high accuracy the "contents of the work Op being performed by the worker Hu in the workplace Ar" from the workplace image Ic.

情報処理装置10は、作業予測部142と存否予測部141とを共に備えてもよい。判定部150は、存否予測部141によって作業場Arに作業者Huが存在すると予測され、かつ、以下の条件が満たされると、第一予測部120の予測が正しいと判定する。すなわち、判定部150は、第一予測部120によって予測された作業Opの内容と、作業予測部142によって予測された作業Opの内容とが一致すると、第一予測部120の予測が正しいと判定する。 The information processing device 10 may include both the work prediction unit 142 and the presence prediction unit 141. When the presence prediction unit 141 predicts that the worker Hu is present in the workplace Ar and the following condition is satisfied, the determination unit 150 determines that the prediction of the first prediction unit 120 is correct. In other words, when the content of the work Op predicted by the first prediction unit 120 matches the content of the work Op predicted by the work prediction unit 142, the determination unit 150 determines that the prediction of the first prediction unit 120 is correct.

前記の構成によれば、情報処理装置10は、入力デバイス41の検知情報Idから予測した作業Opの内容、および、作業場Arにおける作業者Huの存否を予測する。そして、情報処理装置10は、作業場Arに作業者Huが存在すると予測し、かつ、以下の条件が満たされると、第一予測部120の予測が正しいと判定する。すなわち、情報処理装置10は、入力デバイス41の検知情報Idから予測した内容と、作業予測モデル171を用いて予測した内容とが一致すると、作業予測モデル171を用いて予測した内容が正しいと判定する。 According to the above configuration, the information processing device 10 predicts the content of the work Op from the detection information Id of the input device 41, and predicts the presence or absence of the worker Hu in the workplace Ar. Then, when the information processing device 10 predicts that the worker Hu is present in the workplace Ar and the following condition is satisfied, it determines that the prediction of the first prediction unit 120 is correct. In other words, when the content predicted from the detection information Id of the input device 41 matches the content predicted using the work prediction model 171, the information processing device 10 determines that the content predicted using the work prediction model 171 is correct.

つまり、情報処理装置10は、作業予測モデル171を用いて予測した作業Opの内容の正否を、入力デバイス41の検知情報Idから予測した作業Opの内容と、存否モデル172を用いて予測した作業場Arにおける作業者Huの存否とによって検証する。 In other words, the information processing device 10 verifies the accuracy of the content of the work Op predicted using the work prediction model 171 based on the content of the work Op predicted from the detection information Id of the input device 41 and the presence or absence of the worker Hu in the workplace Ar predicted using the presence or absence model 172.

したがって、情報処理装置10は、作業場画像Icから、「作業場Arにおいて作業者Huが行っている作業Opの内容」を、高精度に推定することができるとの効果を奏する。 Therefore, the information processing device 10 has the effect of being able to estimate with high accuracy the "contents of the work Op being performed by the worker Hu in the workplace Ar" from the workplace image Ic.

§2.構成例
これまでに概要を説明してきた情報処理装置10について、次に、図1を用いてその詳細を説明していく。
§2. Configuration Example The information processing device 10, the outline of which has been explained above, will now be explained in detail with reference to FIG.

図1は、情報処理装置10の要部構成を示すブロック図である。図1に例示する情報処理装置10は、機能ブロックとして、例えば、第一取得部110、第一予測部120、第二取得部130、第二予測部140、判定部150、推定部160、および、記憶部170を備えている。 FIG. 1 is a block diagram showing the main components of an information processing device 10. The information processing device 10 illustrated in FIG. 1 includes, as functional blocks, a first acquisition unit 110, a first prediction unit 120, a second acquisition unit 130, a second prediction unit 140, a determination unit 150, an estimation unit 160, and a storage unit 170, for example.

情報処理装置10は、上述の各機能ブロックに加えて、以下の各部を備えてもよい。すなわち、情報処理装置10は、作業場画像Icの、所定の格納領域(保存領域)への格納(保存)を制御する管理部、作業者Huが作業場Arに滞在している時間(滞在時間)を測定する測定部、工程情報Ipと滞在時間とを対応付ける分析部等を備えてもよい。記載の簡潔性を担保するため、本実施の形態に直接関係のない情報処理装置10の構成は、説明およびブロック図から省略している。ただし、実施の実情に則して、情報処理装置10は、これらの省略された構成を備えてもよい。 In addition to the above-mentioned functional blocks, the information processing device 10 may include the following units. That is, the information processing device 10 may include a management unit that controls the storage (saving) of the work area image Ic in a predetermined storage area (storage area), a measurement unit that measures the time (stay time) that the worker Hu stays in the work area Ar, an analysis unit that associates the process information Ip with the stay time, and the like. To ensure conciseness of the description, configurations of the information processing device 10 that are not directly related to this embodiment are omitted from the description and block diagram. However, the information processing device 10 may include these omitted configurations in accordance with the actual implementation situation.

情報処理装置10の備える上述の機能ブロックは、例えば、演算装置が、ROM(read only memory)、NVRAM(non-Volatile random access memory)等で実現された記憶装置(記憶部170)に記憶されているプログラムを不図示のRAM(random access memory)等に読み出して実行することで実現できる。演算装置として利用可能なデバイスとしては、例えば、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、FPU(Floating point number Processing Unit)、PPU(Physics Processing Unit)、マイクロコントローラ、又は、これらの組み合わせを挙げることができる。 The above-mentioned functional blocks of the information processing device 10 can be realized, for example, by the arithmetic unit reading out a program stored in a storage device (storage unit 170) realized by a ROM (read only memory), NVRAM (non-volatile random access memory), etc., into a RAM (random access memory) (not shown) or the like, and executing the program. Examples of devices that can be used as the arithmetic unit include a CPU (Central Processing Unit), a GPU (Graphic Processing Unit), a DSP (Digital Signal Processor), an MPU (Micro Processing Unit), an FPU (Floating point number Processing Unit), a PPU (Physics Processing Unit), a microcontroller, or a combination of these.

以下に先ず、第一取得部110、第一予測部120、第二取得部130、第二予測部140、判定部150、および、推定部160の各々について、その詳細を説明する。 First, the first acquisition unit 110, the first prediction unit 120, the second acquisition unit 130, the second prediction unit 140, the determination unit 150, and the estimation unit 160 will be described in detail below.

(記憶部以外の機能ブロックについて)
第一取得部110は、セルカメラ30から、セルカメラ30が作業場Arを撮像した作業場画像Icを取得し、取得した作業場画像Icを、第一予測部120へと出力する。
(Function blocks other than the memory unit)
The first acquisition unit 110 acquires from the cell camera 30 a workplace image Ic captured by the cell camera 30 of the workplace Ar, and outputs the acquired workplace image Ic to the first prediction unit 120.

第一予測部120は、セルカメラ30が撮像した作業場画像Icに対する画像解析を実行し、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を予測する。第一予測部120は、例えば、作業場画像Icに対してモデルベースの画像解析を実行し、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を予測する。 The first prediction unit 120 performs image analysis on the work place image Ic captured by the cell camera 30, and predicts "the content of the work Op being performed by the worker Hu captured in the work place image Ic on the work object Ob captured in the work place image Ic." The first prediction unit 120 performs, for example, model-based image analysis on the work place image Ic, and predicts "the content of the work Op being performed by the worker Hu captured in the work place image Ic on the work object Ob captured in the work place image Ic."

モデルベースの画像解析を実行する第一予測部120は、例えば、ニューラルネットワーク(Neural Network)として実現され、HOI検出アルゴリズムを実行することによって、HOIとして作業Opを検出する。具体的には、第一予測部120は、記憶部170を参照して、作業予測モデル171を取得する。作業予測モデル171は、作業場画像Icを入力とし、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を出力とする、学習済モデルである。第一予測部120は、記憶部170を参照して取得した作業予測モデル171を用いて、作業場画像Icから、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を予測する。以下、「ニューラルネットワーク」は、「NN」と略記することがある。 The first prediction unit 120, which performs model-based image analysis, is realized as, for example, a neural network, and detects a task Op as an HOI by executing a HOI detection algorithm. Specifically, the first prediction unit 120 refers to the storage unit 170 to acquire a task prediction model 171. The task prediction model 171 is a trained model that receives the work place image Ic as input and outputs "the content of the task Op performed by the worker Hu captured in the work place image Ic on the work object Ob captured in the work place image Ic". The first prediction unit 120 uses the task prediction model 171 acquired by referring to the storage unit 170 to predict "the content of the task Op performed by the worker Hu captured in the work place image Ic on the work object Ob captured in the work place image Ic" from the work place image Ic. Hereinafter, "neural network" may be abbreviated as "NN".

例えば、第一予測部120は、作業場画像Ic(x)から作業予測モデル171を用いて、以下の第一予測Pf(x)を生成する。すなわち、第一予測部120は、「作業場画像Ic(x)に撮像されている作業者Huが、作業場画像Ic(x)に撮像されている作業対象物Ob(x)について行っている作業Op(x)の内容」についての予測である第一予測Pf(x)を生成する。 For example, the first prediction unit 120 generates the following first prediction Pf(x) from the workplace image Ic(x) using the work prediction model 171. That is, the first prediction unit 120 generates the first prediction Pf(x), which is a prediction of "the content of the work Op(x) being performed by the worker Hu, who is captured in the workplace image Ic(x), on the work object Ob(x), which is captured in the workplace image Ic(x)."

特に、第一予測部120は、「セルカメラ30が作業場Ar(x)を撮像して作業場画像Ic(x)を生成した時刻」である撮像時刻Tpを用いて、作業場画像Ic(x)から、以下の予測を実行する。すなわち、第一予測部120は、作業場画像Ic(x)から、「撮像時刻Tpにおいて、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」を予測する。 In particular, the first prediction unit 120 performs the following prediction from the workplace image Ic(x) using the imaging time Tp, which is the time when the cell camera 30 captures the workplace Ar(x) and generates the workplace image Ic(x). That is, the first prediction unit 120 predicts from the workplace image Ic(x) the "contents of the work Op(x) being performed by the worker Hu(x) on the work object Ob(x) in the workplace Ar(x) at the imaging time Tp."

第一予測部120は、作業場画像Icから作業予測モデル171を用いて予測した作業Opの内容を、第一予測Pfとして、判定部150へと出力する。例えば、第一予測部120は、作業場画像Ic(x)から生成した第一予測Pf(x)を、判定部150へと出力する。 The first prediction unit 120 outputs the content of the work Op predicted from the work place image Ic using the work prediction model 171 to the determination unit 150 as a first prediction Pf. For example, the first prediction unit 120 outputs the first prediction Pf(x) generated from the work place image Ic(x) to the determination unit 150.

第二取得部130は、第二予測Psを生成するための各種の情報を外部から取得し、取得した各種の情報を第二予測部140へと出力する。第二予測Psは、第一予測Pf(の正否)を検証するための予測であり、存否予測Paおよび作業予測Poの少なくとも一方を含む。図1に例示する第二取得部130は、全体画像取得部131と、検知情報取得部132とを含む。 The second acquisition unit 130 acquires various pieces of information for generating the second prediction Ps from the outside, and outputs the acquired various pieces of information to the second prediction unit 140. The second prediction Ps is a prediction for verifying the first prediction Pf (whether it is correct or not), and includes at least one of a presence/absence prediction Pa and a work prediction Po. The second acquisition unit 130 illustrated in FIG. 1 includes an overall image acquisition unit 131 and a detection information acquisition unit 132.

全体画像取得部131は、天井カメラ80から、天井カメラ80が工場Faの全体を俯瞰して撮像した全体画像Iaを取得し、取得した全体画像Iaを、第二予測部140へと、特に存否予測部141へと、出力する。 The overall image acquisition unit 131 acquires an overall image Ia from the ceiling camera 80, which is captured by the ceiling camera 80 overlooking the entire factory Fa, and outputs the acquired overall image Ia to the second prediction unit 140, in particular to the presence/absence prediction unit 141.

検知情報取得部132は、PLC20から、「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す検知情報Id(工程情報Ipを含む)を取得する。前述の通り、検知情報Idは、例えば、検知装置(測定装置)としての入力デバイス41が検知した、「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す情報である。検知情報取得部132は、取得した検知情報Idを、第一予測部120へと出力する。 The detection information acquisition unit 132 acquires detection information Id (including process information Ip) indicating "at least one state of the tools used in the work Op, the work object Ob, and the work area Ar" from the PLC 20. As described above, the detection information Id is information indicating "at least one state of the tools used in the work Op, the work object Ob, and the work area Ar" detected, for example, by the input device 41 as a detection device (measuring device). The detection information acquisition unit 132 outputs the acquired detection information Id to the first prediction unit 120.

第二予測部140は、存否予測Paおよび作業予測Poの少なくとも一方を含む第二予測Psを生成し、生成した第二予測Psを判定部150へと出力する。第二予測部140は、存否予測部141と、作業予測部142とを含む。 The second prediction unit 140 generates a second prediction Ps including at least one of the presence/absence prediction Pa and the work prediction Po, and outputs the generated second prediction Ps to the determination unit 150. The second prediction unit 140 includes a presence/absence prediction unit 141 and a work prediction unit 142.

存否予測部141は、第二取得部130(特に、全体画像取得部131)から取得した全体画像Iaに対して画像解析を実行し、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測し、つまり、存否予測Paを生成する。存否予測部141は、例えば、全体画像Iaに対してモデルベースの画像解析を実行し、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測する。 The presence/absence prediction unit 141 performs image analysis on the overall image Ia acquired from the second acquisition unit 130 (particularly the overall image acquisition unit 131) to predict "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic," that is, to generate a presence/absence prediction Pa. The presence/absence prediction unit 141, for example, performs model-based image analysis on the overall image Ia to predict "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic."

モデルベースの画像解析を実行する存否予測部141は、例えば、NNとして実現され、YOLOなどの動線検出アルゴリズム(物体検出アルゴリズム)を実行することによって、作業場Arにおける作業者Huの存否を予測する。具体的には、存否予測部141は、記憶部170を参照して、存否モデル172を取得する。存否モデル172は、全体画像Iaを入力とし、「作業場Ar(より正確には、工場Faにおける複数の作業場Arの各々)に作業者Huが居るか」を出力とする、学習済モデルである。存否予測部141は、記憶部170を参照して取得した存否モデル172を用いて、全体画像Iaから、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測する。例えば、存否予測部141は、全体画像Iaから存否モデル172を用いて、「作業場画像Ic(x)に撮像されている作業場Ar(x)に作業者Huが居るか」についての予測である存否予測Pa(x)を、生成する。 The presence/absence prediction unit 141, which performs model-based image analysis, is realized, for example, as a neural network, and predicts the presence/absence of a worker Hu in the workplace Ar by executing a movement line detection algorithm (object detection algorithm) such as YOLO. Specifically, the presence/absence prediction unit 141 refers to the memory unit 170 to acquire a presence/absence model 172. The presence/absence model 172 is a trained model that receives the entire image Ia as input and outputs "whether a worker Hu is present in the workplace Ar (more precisely, each of the multiple workplaces Ar in the factory Fa)." The presence/absence prediction unit 141 uses the presence/absence model 172 acquired by referring to the memory unit 170 to predict "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic" from the entire image Ia. For example, the presence/absence prediction unit 141 uses the presence/absence model 172 from the overall image Ia to generate a presence/absence prediction Pa(x), which is a prediction as to whether a worker Hu is present in the workplace Ar(x) captured in the workplace image Ic(x).

特に、存否予測部141は、「天井カメラ80が、『作業場画像Ic(x)に撮像されている作業場Ar(x)』を含む複数の作業場Arを撮像して全体画像Iaを生成した時刻」である全体時刻Taを用いて、全体画像Iaから、以下の予測を実行する。すなわち、存否予測部141は、全体画像Iaから、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する全体時刻Taにおいて、作業者Hu(x)が作業場Ar(x)に居るか」を予測する。 In particular, the presence/absence prediction unit 141 performs the following prediction from the overall image Ia using the overall time Ta, which is the time when the ceiling camera 80 captures multiple workplaces Ar, including the workplace Ar(x) captured in the workplace image Ic(x), to generate the overall image Ia. That is, the presence/absence prediction unit 141 predicts from the overall image Ia whether the worker Hu(x) is in the workplace Ar(x) at the overall time Ta, which corresponds to the capture time Tp when the workplace image Ic(x) is captured.

存否予測部141は、所定期間(例えば、5秒間)の全体画像Iaから、存否モデル172を用いて、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を、特に、「撮像時刻Tpに、作業場Arに作業者Huが居るか」を、予測してもよい。存否予測部141による存否モデル172を用いた作業者Huの存否の予測には、誤検出および未検出などの失敗があり得る。そのため、存否予測部141が、例えば5秒間の内、1秒間だけ「作業者Huが居る」と予測しても、残りの4秒間で「作業者Huが居ない」と予測した場合には、「作業者Huが居る」との予測は誤検出(つまり、誤った予測)とみなしてもよい。1秒間だけ「作業者Huが居る」と予測しても、残りの4秒間で「作業者Huが居ない」と予測した場合、存否予測部141は、その5秒間の全体画像Iaから、「作業者Huが居ない」と予測してもよい。つまり、存否予測部141は、その5秒間の全体画像Iaから、「その5秒間に、『作業場画像Icに撮像されている作業場Ar』に作業者Huは居なかった」との存否予測Paを生成してもよい。 The presence/absence prediction unit 141 may use the presence/absence model 172 to predict "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic," particularly "whether a worker Hu is present in the workplace Ar at the image capture time Tp," from the overall image Ia for a predetermined period (e.g., 5 seconds). The prediction of the presence/absence of the worker Hu by the presence/absence prediction unit 141 using the presence/absence model 172 may result in failure, such as erroneous detection or non-detection. Therefore, if the presence/absence prediction unit 141 predicts that "the worker Hu is present" for only 1 second out of 5 seconds, but predicts that "the worker Hu is not present" for the remaining 4 seconds, the prediction that "the worker Hu is present" may be considered to be a erroneous detection (i.e., an erroneous prediction). Even if it is predicted that "worker Hu is present" for only one second, if it is predicted that "worker Hu is not present" for the remaining four seconds, the presence/absence prediction unit 141 may predict that "worker Hu is not present" from the entire image Ia for those five seconds. In other words, the presence/absence prediction unit 141 may generate a presence/absence prediction Pa that "worker Hu was not present in 'workplace Ar captured in the work place image Ic' during those five seconds" from the entire image Ia for those five seconds.

整理すると、存否予測部141は、所定期間の全体画像Iaから、その所定期間の内の所定割合(例、5割)以上の期間について「作業者Huが居た」と予測した場合にのみ、その所定期間の全体について、「作業者Huが居た」との存否予測Paを生成してもよい。例えば、存否予測部141は、5秒間の全体画像Iaについて、「作業者Huが居た」と予測した期間が2.5秒以上ある場合にのみ、「その5秒間に、作業者Huは居た」との存否予測Paを生成してもよい。 To summarize, the presence/absence prediction unit 141 may generate a presence/absence prediction Pa that "worker Hu was present" for the entirety of a specified period only when it predicts that "worker Hu was present" for a period of a specified percentage (e.g., 50%) or more of the specified period from the overall image Ia of the specified period. For example, the presence/absence prediction unit 141 may generate a presence/absence prediction Pa that "worker Hu was present during those 5 seconds" only when the period during which it predicted that "worker Hu was present" for a 5-second overall image Ia is 2.5 seconds or more.

存否予測部141が作業者Huの存否を予測するのに用いる動線検出アルゴリズムは、例えばYOLOであるが、存否予測部141が用いる動線検出アルゴリズムがYOLOであることは必須ではなく、YOLO以外の動線検出アルゴリズムであってもよい。存否予測部141は、動線検出アルゴリズムによって、全体画像Iaから「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測できればよい。 The movement line detection algorithm used by the presence/absence prediction unit 141 to predict the presence/absence of the worker Hu is, for example, YOLO, but it is not essential that the movement line detection algorithm used by the presence/absence prediction unit 141 is YOLO, and a movement line detection algorithm other than YOLO may be used. The presence/absence prediction unit 141 only needs to be able to predict, from the overall image Ia, "whether the worker Hu is in the workplace Ar captured in the workplace image Ic" using the movement line detection algorithm.

存否予測部141は、全体画像Iaから存否モデル172を用いて予測した、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」についての予測である存否予測Pa(例えば、存否予測Pa(x))を、判定部150へと出力する。 The presence/absence prediction unit 141 outputs to the determination unit 150 a presence/absence prediction Pa (e.g., presence/absence prediction Pa(x)), which is a prediction as to whether a worker Hu is present in the workplace Ar captured in the workplace image Ic, predicted from the overall image Ia using the presence/absence model 172.

作業予測部142は、第二取得部130(特に、検知情報取得部132)から取得した検知情報Id(工程情報Ipを含む)を用いて、「作業者Huが行っている作業Opの内容」を予測し、つまり、作業予測Poを生成する。前述の通り、検知情報Idは、「作業Opに用いられる工具(例えば、出力デバイス42、および、器具90)、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を示す情報である。例えば、作業予測部142は、検知情報Id(x)から、以下の作業予測Po(x)を生成する。すなわち、作業予測部142は、検知情報Id(x)から、「作業場Ar(x)において作業者Hu(x)が行っている作業Op(x)の内容」についての予測である、作業予測Po(x)を生成する。ここで前述の通り、検知情報Id(x)は、「作業Op(x)に用いられる工具(例えば、出力デバイス42(x)または器具90(x))、作業対象物Ob(x)、および、作業場Ar(x)の少なくとも1つの状態」を示す情報である。 The work prediction unit 142 uses the detection information Id (including the process information Ip) acquired from the second acquisition unit 130 (particularly, the detection information acquisition unit 132) to predict the "contents of the work Op being performed by the worker Hu," that is, to generate a work prediction Po. As described above, the detection information Id is information indicating "the tools (e.g., the output device 42 and the tool 90) used in the work Op, the work object Ob, and at least one state of the work site Ar." For example, the work prediction unit 142 generates the following work prediction Po(x) from the detection information Id(x). That is, the work prediction unit 142 generates a work prediction Po(x), which is a prediction of the "contents of the work Op(x) being performed by the worker Hu(x) in the work site Ar(x)," from the detection information Id(x). As mentioned above, the detection information Id(x) is information that indicates "at least one of the conditions of the tool (e.g., the output device 42(x) or the tool 90(x)) used in the operation Op(x), the work object Ob(x), and the work area Ar(x)."

作業予測部142は、例えば、「器具90(x)等の工具に流れる電流の大きさ」から、「動作Ac(x)が実行され、動作Ac(x)に対応する作業Op(x)を作業場Ar(x)において作業者Huが行った」と予測する。 For example, the work prediction unit 142 predicts that "operation Ac(x) was performed, and work Op(x) corresponding to operation Ac(x) was performed by worker Hu at work site Ar(x)" based on "the magnitude of the current flowing through a tool such as tool 90(x)."

作業予測部142は、例えば、「工具の消費電力」から、「動作Ac(x)が実行され、動作Ac(x)に対応する作業Op(x)を作業場Ar(x)において作業者Huが行った」と予測する。 The work prediction unit 142 predicts, for example, from the "power consumption of the tool" that "an operation Ac(x) was executed, and an operation Op(x) corresponding to the operation Ac(x) was performed by a worker Hu at a work site Ar(x)."

作業予測部142は、例えば、「工具、または、作業対象物Ob(x)が把持された」ことから、「作業Op(x)が作業場Ar(x)において作業者Huによって行われた」と予測する。 For example, the work prediction unit 142 predicts that "work Op(x) was performed by worker Hu in work area Ar(x)" based on the fact that "a tool or work object Ob(x) was grasped."

作業予測部142は、例えば、「工具、または、作業対象物Ob(x)、または、作業場Ar(x)の備える開閉機構が開閉された」ことから、「作業Op(x)が作業場Ar(x)において作業者Huによって行われた」と予測する。 The work prediction unit 142 predicts that "work Op(x) was performed by a worker Hu at a work site Ar(x)" based on, for example, "the tool, the work object Ob(x), or the opening/closing mechanism of the work site Ar(x) was opened or closed."

作業予測部142は、例えば、「工具、または、作業対象物Ob(x)、または、作業場Ar(x)の備えるボタンが押下された」ことから、「作業Op(x)が作業場Ar(x)において作業者Huによって行われた」と予測する。 The work prediction unit 142 predicts that "work Op(x) was performed by worker Hu at work site Ar(x)" based on, for example, "a tool, work object Ob(x), or a button on work site Ar(x) was pressed."

以上に説明した通り、作業予測部142は、検知情報Idから「作業者Huが行っている作業Opの内容」を予測し、例えば、検知情報Id(x)から「作業場Ar(x)において作業者Hu(x)が行っている作業Op(x)の内容」を予測する。 As described above, the work prediction unit 142 predicts "the content of the work Op being performed by the worker Hu" from the detection information Id, for example, predicts "the content of the work Op(x) being performed by the worker Hu(x) at the workplace Ar(x)" from the detection information Id(x).

特に、作業予測部142は、検知情報Id(x)に含まれる、「作業Op(x)に用いられる工具、作業対象物Ob(x)、および、作業場Ar(x)の少なくとも1つの状態」が検知された時刻である検知時刻Tdを用いて、以下の予測を実行する。すなわち、作業予測部142は、検知情報Id(x)から、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する検知時刻Tdにおいて、作業者Hu(x)が行っている作業Op(x)の内容」を予測する。 In particular, the work prediction unit 142 performs the following prediction using the detection time Td, which is the time when "at least one state of the tool used in the work Op(x), the work object Ob(x), and the work area Ar(x)" contained in the detection information Id(x) was detected. That is, the work prediction unit 142 predicts "the content of the work Op(x) being performed by the worker Hu(x) at the detection time Td corresponding to the imaging time Tp when the work area image Ic(x) was captured" from the detection information Id(x).

作業予測部142は、検知情報Idから予測した「作業者Huが行っている作業Opの内容」を、作業予測Poとして、判定部150へと出力する。例えば、作業予測部142は、検知情報Id(x)から予測した「作業場Ar(x)において作業者Hu(x)が行っている作業Op(x)の内容」である作業予測Po(x)を、判定部150へと出力する。 The work prediction unit 142 outputs the "contents of the work Op being performed by the worker Hu" predicted from the detection information Id to the determination unit 150 as a work prediction Po. For example, the work prediction unit 142 outputs the work prediction Po(x), which is the "contents of the work Op(x) being performed by the worker Hu(x) at the work site Ar(x)" predicted from the detection information Id(x), to the determination unit 150.

判定部150は、第一予測Pf(の正否)を、第二予測Psを用いて検証し、つまり、第一予測Pf(の正否)を、存否予測Paおよび作業予測Poの少なくとも一方を用いて検証する。具体的には、判定部150は、第一予測Pf(x)(の正否)を、存否予測Pa(x)および作業予測Po(x)の少なくとも一方を用いて検証する。 The determination unit 150 verifies the first prediction Pf (whether it is correct or not) using the second prediction Ps, that is, verifies the first prediction Pf (whether it is correct or not) using at least one of the presence/absence prediction Pa and the work prediction Po. Specifically, the determination unit 150 verifies the first prediction Pf(x) (whether it is correct or not) using at least one of the presence/absence prediction Pa(x) and the work prediction Po(x).

前述の通り、第一予測Pf(x)は、例えば、作業場画像Ic(x)から予測される、「撮像時刻Tpにおいて、作業者Hu(x)が、作業場Ar(x)で作業対象物Ob(x)について行っている作業Op(x)の内容」である。存否予測Pa(x)は、例えば、全体画像Iaから予測される、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する全体時刻Taにおいて、作業者Hu(x)が作業場Ar(x)に居るか」についての予測である。作業予測Po(x)は、例えば、検知情報Id(x)から予測される、「『作業場画像Ic(x)が撮像された撮像時刻Tp』に対応する検知時刻Tdにおいて、作業者Hu(x)が行っている作業Op(x)の内容」である。 As described above, the first prediction Pf(x) is, for example, the "contents of the work Op(x) that a worker Hu(x) is performing on a work object Ob(x) in the workplace Ar(x) at the image capture time Tp" predicted from the workplace image Ic(x). The presence/absence prediction Pa(x) is, for example, a prediction of "whether a worker Hu(x) is in the workplace Ar(x) at the overall time Ta corresponding to the 'image capture time Tp at which the workplace image Ic(x) was captured'" predicted from the overall image Ia. The work prediction Po(x) is, for example, the "contents of the work Op(x) that a worker Hu(x) is performing at the detection time Td corresponding to the 'image capture time Tp at which the workplace image Ic(x) was captured'" predicted from the detection information Id(x).

例えば、判定部150は、存否予測Pa(x)において「作業場Ar(x)に作業者Huが存在する」と予測されていると、「第一予測Pf(x)は正しい」と判定する。特に、判定部150は、「セルカメラ30が作業場画像Ic(x)を生成した時刻である撮像時刻Tpにおいて、作業場Ar(x)に作業者Huが存在する」と予測されていると、「第一予測Pf(x)は正しい」と判定する。 For example, if the presence/absence prediction Pa(x) predicts that "worker Hu is present in the workplace Ar(x)," the determination unit 150 determines that "the first prediction Pf(x) is correct." In particular, if the determination unit 150 predicts that "worker Hu is present in the workplace Ar(x) at the image capture time Tp, which is the time when the cell camera 30 generates the workplace image Ic(x)," the determination unit 150 determines that "the first prediction Pf(x) is correct."

例えば、判定部150は、作業予測Po(x)における作業Op(x)と第一予測Pf(x)における作業Op(x)とが一致すると、「第一予測Pf(x)は正しい」と判定する。特に、判定部150は、「作業予測Po(x)における、撮像時刻Tp(x)での作業Op(x)」と「第一予測Pf(x)における、撮像時刻Tp(x)での作業Op(x)」とが一致すると、「第一予測Pf(x)は正しい」と判定する。 For example, when the operation Op(x) in the operation prediction Po(x) matches the operation Op(x) in the first prediction Pf(x), the determination unit 150 determines that "the first prediction Pf(x) is correct." In particular, when "the operation Op(x) at the imaging time Tp(x) in the operation prediction Po(x)" matches the "the operation Op(x) at the imaging time Tp(x) in the first prediction Pf(x)," the determination unit 150 determines that "the first prediction Pf(x) is correct."

例えば、判定部150は、「作業場Ar(x)に作業者Huが存在する」と予測され、かつ、作業予測Po(x)における作業Op(x)と第一予測Pf(x)における作業Op(x)とが一致した場合に、「第一予測Pf(x)は正しい」と判定する。特に、判定部150は、以下の2つの条件がいずれも満たされている場合に「第一予測Pf(x)は正しい」と判定する。すなわち、第一の条件は、作業予測Po(x)において、「セルカメラ30が作業場画像Ic(x)を生成した時刻である撮像時刻Tpにおいて、作業場Ar(x)に作業者Huが存在する」と予測されていることである。第二の条件は、「作業予測Po(x)における、撮像時刻Tp(x)での作業Op(x)」と「第一予測Pf(x)における、撮像時刻Tp(x)での作業Op(x)」とが一致することである。 For example, the determination unit 150 determines that "the worker Hu is present in the work area Ar(x)" when it is predicted that "the worker Hu is present in the work area Ar(x)" and the work Op(x) in the work prediction Po(x) and the work Op(x) in the first prediction Pf(x) match, and determines that "the first prediction Pf(x) is correct". In particular, the determination unit 150 determines that "the first prediction Pf(x) is correct" when both of the following two conditions are satisfied. That is, the first condition is that it is predicted in the work prediction Po(x) that "the worker Hu is present in the work area Ar(x) at the image capture time Tp, which is the time when the cell camera 30 generates the work area image Ic(x)". The second condition is that "the work Op(x at the image capture time Tp(x) in the work prediction Po(x)" and "the work Op(x at the image capture time Tp(x) in the first prediction Pf(x)" match.

判定部150は、判定結果(検証結果)と共に、第一予測Pfを推定部160へと通知する。判定部150は、さらに、第二予測Ps(存否予測Paおよび作業予測Poの少なくとも一方)を推定部160へと通知してもよい。 The determination unit 150 notifies the estimation unit 160 of the first prediction Pf together with the determination result (verification result). The determination unit 150 may further notify the estimation unit 160 of the second prediction Ps (at least one of the presence/absence prediction Pa and the work prediction Po).

推定部160は、判定部150によって「第一予測Pf(x)は正しい」と判定されると、第一予測Pf(x)を「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定し、第一予測Pf(x)を、推定結果として外部に出力する。 When the determination unit 150 determines that "the first prediction Pf(x) is correct," the estimation unit 160 estimates that the first prediction Pf(x) is "the content of the work Op being performed by the worker Hu at the workplace Ar," and outputs the first prediction Pf(x) to the outside as an estimation result.

推定部160は、判定部150によって「第一予測Pf(x)は正しくない」と判定されると、「作業場Ar(x)に作業者Huがいない」との推定結果、または、「所望の精度で推定できた作業Op(x)の内容はない」との推定結果を、外部に出力する。推定部160は、上述の推定結果を、作業場画像Icと共に、図2の動画保存サーバ等に出力してもよい。 When the determination unit 150 determines that the first prediction Pf(x) is incorrect, the estimation unit 160 outputs to the outside the estimation result that there is no worker Hu in the workplace Ar(x) or that there is no content of the work Op(x) that could be estimated with the desired accuracy. The estimation unit 160 may output the estimation result described above together with the workplace image Ic to the video storage server of FIG. 2 or the like.

(記憶部について)
記憶部170は、情報処理装置10が使用する各種データを格納する記憶装置である。なお、記憶部170は、情報処理装置10が実行する(1)制御プログラム、(2)OSプログラム、(3)情報処理装置10が有する各種機能を実行するためのアプリケーションプログラム、および、(4)該アプリケーションプログラムを実行するときに読み出す各種データを非一時的に記憶してもよい。上記の(1)~(4)のデータは、例えば、ROM(read only memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(登録商標)(Electrically EPROM)、HDD(Hard Disc Drive)等の不揮発性記憶装置に記憶される。情報処理装置10は、図示しない一時記憶部を備えていてもよい。一時記憶部は、情報処理装置10が実行する各種処理の過程で、演算に使用するデータおよび演算結果等を一時的に記憶するいわゆるワーキングメモリであり、RAM(Random Access Memory)等の揮発性記憶装置で構成される。どのデータをどの記憶装置に記憶するのかについては、情報処理装置10の使用目的、利便性、コスト、または、物理的な制約等から適宜決定される。記憶部170はさらに、作業予測モデル171および存否モデル172を格納している。
(Regarding the memory unit)
The storage unit 170 is a storage device that stores various data used by the information processing device 10. The storage unit 170 may non-temporarily store (1) a control program, (2) an OS program, (3) application programs for executing various functions possessed by the information processing device 10, and (4) various data read when executing the application programs, which are executed by the information processing device 10. The above data (1) to (4) are stored in a non-volatile storage device such as a read only memory (ROM), a flash memory, an erasable programmable ROM (EPROM), an electrically EPROM (EEPROM (registered trademark)), or a hard disk drive (HDD). The information processing device 10 may include a temporary storage unit (not shown). The temporary storage unit is a so-called working memory that temporarily stores data used for calculations and calculation results, etc., during the course of various processes executed by the information processing device 10, and is composed of a volatile storage device such as a random access memory (RAM). Which data is to be stored in which storage device is appropriately determined based on the purpose of use, convenience, cost, physical constraints, etc. of the information processing device 10. The storage unit 170 further stores an operation prediction model 171 and a presence/absence model 172.

作業予測モデル171は、第一予測部120が、作業場画像Icから「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を予測するためのモデルである。作業予測モデル171は、例えば、作業場画像Icを入力とし、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示す情報を出力とする学習済モデルである。 The work prediction model 171 is a model that the first prediction unit 120 uses to predict "the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic" from the workplace image Ic. The work prediction model 171 is, for example, a trained model that receives the workplace image Ic as input and outputs information indicating "the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic".

存否モデル172は、存否予測部141が、全体画像Iaから「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測するためのモデルである。存否モデル172は、全体画像Iaを入力とし、「作業場Ar(より正確には、工場Faにおける複数の作業場Arの各々)に作業者Huが居るか」を出力とする、学習済モデルである。 The presence/absence model 172 is a model that the presence/absence prediction unit 141 uses to predict "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic" from the overall image Ia. The presence/absence model 172 is a trained model that receives the overall image Ia as input and outputs "whether a worker Hu is present in the workplace Ar (more precisely, each of the multiple workplaces Ar in the factory Fa)."

§3.動作例
図3、図4、および図5は、それぞれ、情報処理装置10が実行する処理の全体概要を説明するフロー図である。情報処理装置10は、第二予測Psを用いて第一予測Pf(の正否)を検証することによって、「作業者Huが行っている作業Opの内容」を高精度に推定することができる。
§3. Operational Example Figures 3, 4, and 5 are flow diagrams each illustrating an overview of the process executed by the information processing device 10. The information processing device 10 can estimate "the content of the work Op being performed by the worker Hu" with high accuracy by verifying the first prediction Pf (whether it is correct or not) using the second prediction Ps.

(作業予測Poのみを用いて検証を行う場合の処理例)
図3は、第二予測Psのうち作業予測Poのみを用いて第一予測Pf(の正否)を検証する場合に、情報処理装置10が実行する処理の全体概要を説明するフロー図である。図3に例示するように、情報処理装置10(特に、判定部150)は、第一予測Pf(の正否)を、作業予測Poのみを用いて検証してもよい。
(Processing example when verification is performed using only the work forecast Po)
3 is a flow diagram illustrating an overview of a process executed by the information processing device 10 when verifying (the correctness of) the first prediction Pf using only the work prediction Po of the second prediction Ps. As illustrated in FIG. 3, the information processing device 10 (particularly, the determination unit 150) may verify (the correctness of) the first prediction Pf using only the work prediction Po.

図3に示すように、判定部150は先ず、作業予測Poにおいて「作業者Huが行っている作業Opの内容」が予測されているか否か、つまり、「検知情報Idから、何らかの作業Opが行われていると予測されたか否か」を確認する(S110)。 As shown in FIG. 3, the determination unit 150 first checks whether the "contents of the work Op being performed by the worker Hu" are predicted in the work prediction Po, that is, whether "it is predicted from the detection information Id that some work Op is being performed" (S110).

「検知情報Idから、何らかの作業Opが行われていると予測された」ことを確認すると(S110でYES)、判定部150はさらに、第一予測Pfにおいて「作業者Huが行っている作業Opの内容」が予測されているか否かを確認する。つまり、判定部150は、「作業予測モデル171を用いて、何らかの作業Opが行われていると予測されたか否か」を確認する(S120)。 When it is confirmed that "the detection information Id predicts that some work Op is being performed" (YES in S110), the determination unit 150 further checks whether or not "the content of the work Op being performed by the worker Hu" has been predicted in the first prediction Pf. In other words, the determination unit 150 checks "whether or not it has been predicted that some work Op is being performed using the work prediction model 171" (S120).

「作業予測モデル171を用いて、何らかの作業Opが行われていると予測された」ことを確認すると(S120でYES)、判定部150は、以下の判定を実行する。すなわち、判定部150は、「検知情報Idから予測された作業Opの内容と、作業予測モデル171を用いて予測された作業Opの内容とが一致するか否か」を判定する(S130)。つまり、判定部150は、「作業予測Poにおける作業Op」と「第一予測Pfにおける作業Op(x)」とが一致するか否かを判定する。 When it is confirmed that "the work prediction model 171 has been used to predict that some work Op is being performed" (YES in S120), the determination unit 150 executes the following determination. That is, the determination unit 150 determines whether "the content of the work Op predicted from the detection information Id matches the content of the work Op predicted using the work prediction model 171" (S130). That is, the determination unit 150 determines whether "the work Op in the work prediction Po" matches "the work Op(x) in the first prediction Pf".

判定部150によって、「検知情報Idから予測された作業Opの内容と、作業予測モデル171を用いて予測された作業Opの内容とが一致する」と判定されると(S130でYES)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、第一取得部110が作業場画像Icから作業予測モデル171を用いて予測した作業Opの内容を、推定結果として出力し(S140)、つまり、第一予測Pf(x)を、推定結果として出力する。 When the determination unit 150 determines that "the content of the work Op predicted from the detection information Id matches the content of the work Op predicted using the work prediction model 171" (YES in S130), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the content of the work Op predicted by the first acquisition unit 110 using the work prediction model 171 from the workplace image Ic as the estimation result (S140), that is, outputs the first prediction Pf(x) as the estimation result.

「検知情報Idからは、何らかの作業Opが行われているとは予測されなかった」ことを確認すると(S110でNO)、つまり、作業予測部142が検知情報Idから作業Opの内容を予測できなかった場合、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S150)。 When it is confirmed that "the detection information Id did not predict that any work Op was being performed" (NO in S110), that is, when the work prediction unit 142 was unable to predict the content of the work Op from the detection information Id, the estimation unit 160 outputs the following estimation result. In other words, the estimation unit 160 outputs the estimation result that "the content of the work Op could not be estimated with the desired accuracy" (S150).

「作業予測モデル171を用いて、何らかの作業Opが行われているとは予測されなかった」ことを確認すると(S120でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S150)。つまり、第一予測部120が作業場画像Icから作業Opの内容を予測できなかった場合、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する。 When it is confirmed that "using the work prediction model 171, it was not predicted that any work Op was being performed" (NO in S120), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the contents of the work Op were not able to be estimated with the desired accuracy" (S150). In other words, if the first prediction unit 120 cannot predict the contents of the work Op from the workplace image Ic, the estimation unit 160 outputs the estimation result that "the contents of the work Op were not able to be estimated with the desired accuracy."

「検知情報Idから予測された作業Opの内容と、作業予測モデル171を用いて予測された作業Opの内容とが一致しない」と判定されると(S130でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S150)。 When it is determined that "the contents of the work Op predicted from the detection information Id do not match the contents of the work Op predicted using the work prediction model 171" (NO in S130), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the contents of the work Op could not be estimated with the desired accuracy" (S150).

情報処理装置10は、作業予測Poを用いて第一予測Pf(の正否)を検証し、つまり、HOI検出アルゴリズムを、「入力デバイス41等からの検知情報Id」と組み合わせて用いる。情報処理装置10は、HOI検出アルゴリズムを実行する第一予測部120と、検知情報Idから作業予測Poを生成する作業予測部142とを備えることによって、第一予測部120による誤検出(予測の誤り)をキャンセルする。そのため、情報処理装置10は、HOI検出アルゴリズムの誤検出(予測の誤り)をキャンセルし、精度の高い推定を実現することができる。 The information processing device 10 verifies the first prediction Pf (whether it is correct or not) using the work prediction Po, that is, uses the HOI detection algorithm in combination with "detection information Id from the input device 41, etc." The information processing device 10 includes a first prediction unit 120 that executes the HOI detection algorithm and a work prediction unit 142 that generates the work prediction Po from the detection information Id, thereby canceling false detections (prediction errors) by the first prediction unit 120. Therefore, the information processing device 10 can cancel false detections (prediction errors) by the HOI detection algorithm and achieve highly accurate estimation.

作業予測部142は、入力デバイス41等からの検知情報Idから、「作業者Huが行っている作業Opの内容」を予測し、つまり、作業予測Poを生成する。そして、HOI検出アルゴリズムを実行する第一予測部120による「作業者Huが行っている作業Opの内容」の予測よりも、検知情報Idを用いた作業予測部142による「作業者Huが行っている作業Opの内容」の予測の方が、予測精度が高い。つまり、第一予測Pfの予測精度よりも、作業予測Poの予測精度の方が高い。 The work prediction unit 142 predicts the "contents of the work Op being performed by the worker Hu" from the detection information Id from the input device 41, etc., i.e., generates a work prediction Po. The prediction accuracy of the "contents of the work Op being performed by the worker Hu" by the work prediction unit 142 using the detection information Id is higher than the prediction accuracy of the "contents of the work Op being performed by the worker Hu" by the first prediction unit 120 that executes the HOI detection algorithm. In other words, the prediction accuracy of the work prediction Po is higher than the prediction accuracy of the first prediction Pf.

そのため、情報処理装置10は、第一予測Pfと作業予測Poとを用いることによって、「作業者Huが行っている作業Opの内容」を、高精度に推定することができる。第一予測部120がHOI検出アルゴリズムを実行して予測可能な「作業者Huが行っている作業Op」の種類は、作業予測部142が検知情報Idから予測可能な「作業者Huが行っている作業Op」の種類と同じであってもよく、前者が後者より多くてもよい。 Therefore, by using the first prediction Pf and the work prediction Po, the information processing device 10 can estimate the "contents of the work Op being performed by the worker Hu" with high accuracy. The types of "work Op being performed by the worker Hu" that the first prediction unit 120 can predict by executing the HOI detection algorithm may be the same as the types of "work Op being performed by the worker Hu" that the work prediction unit 142 can predict from the detection information Id, or the former may be greater than the latter.

一般に、HOI検出アルゴリズムによるHOI検出(つまり、「作業Opの内容」の予測)は、作業場画像Icから、作業者Huおよび作業対象物Obの少なくとも一方を検出(物体検出)できなかった場合、失敗する。そのため、HOI検出の失敗を、つまり、「作業予測モデル171を用いて、何らかの作業Opが行われているとは予測されなかった」ことを、「物体(例えば、作業者Hu)の検出失敗(つまり、不在)」とみなしてもよい。 In general, HOI detection by a HOI detection algorithm (i.e., prediction of the "contents of the work Op") fails if at least one of the worker Hu and the work object Ob cannot be detected (object detection) from the work site image Ic. Therefore, failure of HOI detection, that is, "the work prediction model 171 was not used to predict that some work Op was being performed," may be regarded as "failure to detect an object (e.g., worker Hu) (i.e., absence)."

(存否予測Paのみを用いて検証を行う場合の処理例)
図4は、第二予測Psのうち存否予測Paのみを用いて第一予測Pf(の正否)を検証する場合に、情報処理装置10が実行する処理の全体概要を説明するフロー図である。図4に例示するように、情報処理装置10(特に、判定部150)は、第一予測Pf(の正否)を、存否予測Paのみを用いて検証してもよい。
(Processing example when verification is performed using only the presence/absence prediction Pa)
4 is a flow diagram illustrating an overview of a process executed by the information processing device 10 when verifying the first prediction Pf (correctness or incorrectness) using only the presence/absence prediction Pa of the second prediction Ps. As illustrated in FIG. 4, the information processing device 10 (particularly, the determination unit 150) may verify the first prediction Pf (correctness or incorrectness) using only the presence/absence prediction Pa.

図4に示すように、判定部150は先ず、存否予測Paにおいて「作業場Arに作業者Huが存在する」と予測されているか否か、つまり、「存否モデル172を用いて、作業場Arに作業者Huが存在すると予測されたか否か」を確認する(S210)。 As shown in FIG. 4, the determination unit 150 first checks whether the presence/absence prediction Pa predicts that "the worker Hu is present in the workplace Ar," that is, whether "the presence/absence model 172 is used to predict that the worker Hu is present in the workplace Ar" (S210).

前述の通り、存否予測部141は、所定期間(例えば、5秒間)の全体画像Iaから、「その所定期間に、作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測してもよい。存否予測部141は、その所定期間の内の所定割合(例えば、5割)の期間以上、「作業者Huが居る」と予測した場合にのみ、「その所定期間に、作業場画像Icに撮像されている作業場Arに作業者Huが居た」と予測してもよい。 As described above, the presence/absence prediction unit 141 may predict "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic during a predetermined period of time" from the overall image Ia for a predetermined period of time (e.g., 5 seconds). The presence/absence prediction unit 141 may predict "that a worker Hu was present in the workplace Ar captured in the workplace image Ic during the predetermined period of time" only if it predicts that "a worker Hu is present" for a period of at least a predetermined percentage (e.g., 50%) of the predetermined period of time.

「存否モデル172を用いて、作業場Arに作業者Huが存在すると予測された」ことを確認すると(S210でYES)、判定部150はさらに、第一予測Pfにおいて「作業者Huが行っている作業Opの内容」が予測されているか否かを確認する。つまり、判定部150は、「作業予測モデル171を用いて、何らかの作業Opが行われていると予測されたか否か」を確認する(S220)。 When it is confirmed that "using the presence model 172, it has been predicted that the worker Hu is present in the work area Ar" (YES in S210), the determination unit 150 further checks whether or not "the contents of the work Op being performed by the worker Hu" have been predicted in the first prediction Pf. In other words, the determination unit 150 checks whether "using the work prediction model 171, it has been predicted that some work Op is being performed" (S220).

判定部150によって、「作業予測モデル171を用いて、何らかの作業Opが行われていると予測された」ことが確認されると(S220でYES)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、第一取得部110が作業場画像Icから作業予測モデル171を用いて予測した作業Opの内容を、推定結果として出力し(S230)、つまり、第一予測Pf(x)を、推定結果として出力する。 When the determination unit 150 confirms that "using the work prediction model 171, it has been predicted that some work Op is being performed" (YES in S220), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the content of the work Op predicted by the first acquisition unit 110 using the work prediction model 171 from the workplace image Ic as the estimation result (S230), that is, outputs the first prediction Pf(x) as the estimation result.

「存否モデル172を用いて、作業場Arに作業者Huが存在しないと予測された」ことを確認すると(S210でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「作業場Arに作業者Huがいない」との推定結果を出力する(S250)。つまり、存否予測部141が全体画像Iaから「作業場画像Icに撮像されている作業場Arに作業者Huが居ない」と予測する場合、推定部160は、「作業場Arに作業者Huがいない」との推定結果を出力する。 When it is confirmed that "using the presence/absence model 172, it was predicted that the worker Hu is not present in the workplace Ar" (NO in S210), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the worker Hu is not present in the workplace Ar" (S250). In other words, when the presence/absence prediction unit 141 predicts from the overall image Ia that "the worker Hu is not present in the workplace Ar captured in the workplace image Ic", the estimation unit 160 outputs the estimation result that "the worker Hu is not present in the workplace Ar".

「作業予測モデル171を用いて、何らかの作業Opが行われているとは予測されなかった」ことを確認すると(S220でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S240)。つまり、第一予測部120が作業場画像Icから作業Opの内容を予測できなかった場合、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する。 When it is confirmed that "using the work prediction model 171, it was not predicted that any work Op was being performed" (NO in S220), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the contents of the work Op were not able to be estimated with the desired accuracy" (S240). In other words, if the first prediction unit 120 could not predict the contents of the work Op from the workplace image Ic, the estimation unit 160 outputs the estimation result that "the contents of the work Op were not able to be estimated with the desired accuracy."

情報処理装置10は、存否予測Paを用いて第一予測Pf(の正否)を検証し、つまり、HOI検出アルゴリズムを、「YOLOなどの動線検出アルゴリズム」と組み合わせて用いる。すなわち、情報処理装置10は、HOI検出アルゴリズムを実行する第一予測部120と、動線検出アルゴリズムを実行する存否予測部141とを備えることによって、第一予測部120による誤検出(予測の誤り)をキャンセルすることができる。動線検出アルゴリズムで予測(検出)できるのは、作業者Huの存否のみである代わりに、動線検出アルゴリズムの予測精度は、HOI検出アルゴリズムの予測精度よりも高い。そのため、情報処理装置10は、第一予測Pfと存否予測Paとを用いることによって、「作業者Huが行っている作業Opの内容」を、高精度に推定することができる。 The information processing device 10 verifies the first prediction Pf (whether it is correct or not) using the presence/absence prediction Pa, that is, uses the HOI detection algorithm in combination with a "movement line detection algorithm such as YOLO". That is, the information processing device 10 is equipped with a first prediction unit 120 that executes the HOI detection algorithm and a presence/absence prediction unit 141 that executes the movement line detection algorithm, thereby being able to cancel false detections (prediction errors) by the first prediction unit 120. The movement line detection algorithm can only predict (detect) the presence/absence of the worker Hu, but the prediction accuracy of the movement line detection algorithm is higher than that of the HOI detection algorithm. Therefore, by using the first prediction Pf and the presence/absence prediction Pa, the information processing device 10 can estimate the "contents of the work Op being performed by the worker Hu" with high accuracy.

(存否予測Paおよび作業予測Poの両方を用いて検証を行う場合の処理例)
図5は、存否予測Paおよび作業予測Poの両方を用いて第一予測Pf(の正否)を検証する場合に、情報処理装置10が実行する処理の全体概要を説明するフロー図である。図5に例示するように、情報処理装置10(特に、判定部150)は、第一予測Pf(の正否)を、存否予測Paおよび作業予測Poの両方を用いて検証してもよい。
(Processing example when verification is performed using both presence/absence prediction Pa and work prediction Po)
5 is a flow diagram illustrating an overview of a process executed by the information processing device 10 when verifying the first prediction Pf (whether it is correct or not) using both the presence/absence prediction Pa and the work prediction Po. As illustrated in FIG. 5, the information processing device 10 (particularly, the determination unit 150) may verify the first prediction Pf (whether it is correct or not) using both the presence/absence prediction Pa and the work prediction Po.

図5に示すように、判定部150は先ず、存否予測Paにおいて「作業場Arに作業者Huが存在する」と予測されているか否か、つまり、「存否モデル172を用いて、作業場Arに作業者Huが存在すると予測されたか否か」を確認する(S310)。 As shown in FIG. 5, the determination unit 150 first checks whether the presence/absence prediction Pa predicts that "the worker Hu is present in the workplace Ar," that is, whether "the presence/absence model 172 is used to predict that the worker Hu is present in the workplace Ar" (S310).

前述の通り、存否予測部141は、所定期間の全体画像Iaから、「その所定期間に、作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測してもよい。存否予測部141は、その所定期間の内の所定割合の期間以上、「作業者Huが居る」と予測した場合にのみ、「その所定期間に、作業場画像Icに撮像されている作業場Arに作業者Huが居た」と予測してもよい。 As described above, the presence/absence prediction unit 141 may predict, from the overall image Ia for a specified period, "whether a worker Hu is present in the workplace Ar captured in the workplace image Ic during that specified period." The presence/absence prediction unit 141 may predict that "a worker Hu was present in the workplace Ar captured in the workplace image Ic during that specified period" only if it predicts that "a worker Hu is present" for at least a specified percentage of the specified period.

「存否モデル172を用いて、作業場Arに作業者Huが存在すると予測された」ことを確認すると(S310でYES)、判定部150は、次に、作業予測Poにおいて「作業者Huが行っている作業Opの内容」が予測されているか否かを確認する。すなわち、判定部150は、「検知情報Idから、何らかの作業Opが行われていると予測されたか否か」を確認する(S320)。 When it is confirmed that "using the presence/absence model 172, it has been predicted that the worker Hu is present in the work area Ar" (YES in S310), the determination unit 150 then checks whether or not "the contents of the work Op being performed by the worker Hu" have been predicted in the work prediction Po. In other words, the determination unit 150 checks "whether or not it has been predicted from the detection information Id that some work Op is being performed" (S320).

「検知情報Idから、何らかの作業Opが行われていると予測された」ことを確認すると(S320でYES)、判定部150は、第一予測Pfにおいて「作業者Huが行っている作業Opの内容」が予測されているか否かを確認する。つまり、判定部150は、「作業予測モデル171を用いて、何らかの作業Opが行われていると予測されたか否か」を確認する(S330)。 When it is confirmed that "the detection information Id predicts that some work Op is being performed" (YES in S320), the determination unit 150 checks whether or not "the content of the work Op being performed by the worker Hu" has been predicted in the first prediction Pf. In other words, the determination unit 150 checks "whether or not it has been predicted that some work Op is being performed using the work prediction model 171" (S330).

「作業予測モデル171を用いて、何らかの作業Opが行われていると予測された」ことを確認すると(S330でYES)、判定部150は、以下の判定を実行する。すなわち、判定部150は、「検知情報Idから予測された作業Opの内容と、作業予測モデル171を用いて予測された作業Opの内容とが一致するか否か」を判定する(S340)。つまり、判定部150は、「作業予測Poにおける作業Op」と「第一予測Pfにおける作業Op(x)」とが一致するか否かを判定する。 When it is confirmed that "the work prediction model 171 has been used to predict that some work Op is being performed" (YES in S330), the determination unit 150 executes the following determination. That is, the determination unit 150 determines whether "the content of the work Op predicted from the detection information Id matches the content of the work Op predicted using the work prediction model 171" (S340). That is, the determination unit 150 determines whether "the work Op in the work prediction Po" matches "the work Op(x) in the first prediction Pf".

判定部150によって、「検知情報Idから予測された作業Opの内容と、作業予測モデル171を用いて予測された作業Opの内容とが一致する」と判定されると(S340でYES)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、第一取得部110が作業場画像Icから作業予測モデル171を用いて予測した作業Opの内容を、推定結果として出力し(S350)、つまり、第一予測Pf(x)を、推定結果として出力する。 When the determination unit 150 determines that "the content of the work Op predicted from the detection information Id matches the content of the work Op predicted using the work prediction model 171" (YES in S340), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the content of the work Op predicted by the first acquisition unit 110 using the work prediction model 171 from the workplace image Ic as the estimation result (S350), that is, outputs the first prediction Pf(x) as the estimation result.

「存否モデル172を用いて、作業場Arに作業者Huが存在しないと予測された」ことを確認すると(S310でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「作業場Arに作業者Huがいない」との推定結果を出力する(S360)。つまり、存否予測部141が全体画像Iaから「作業場画像Icに撮像されている作業場Arに作業者Huが居ない」と予測する場合、推定部160は、「作業場Arに作業者Huがいない」との推定結果を出力する。 When it is confirmed that "using the presence/absence model 172, it was predicted that the worker Hu is not present in the workplace Ar" (NO in S310), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the worker Hu is not present in the workplace Ar" (S360). In other words, when the presence/absence prediction unit 141 predicts from the overall image Ia that "the worker Hu is not present in the workplace Ar captured in the workplace image Ic", the estimation unit 160 outputs the estimation result that "the worker Hu is not present in the workplace Ar".

「検知情報Idからは、何らかの作業Opが行われているとは予測されなかった」ことを確認すると(S320でNO)、つまり、作業予測部142が検知情報Idから作業Opの内容を予測できなかった場合、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S370)。 When it is confirmed that "the detection information Id did not predict that any work Op was being performed" (NO in S320), that is, when the work prediction unit 142 was unable to predict the content of the work Op from the detection information Id, the estimation unit 160 outputs the following estimation result. In other words, the estimation unit 160 outputs the estimation result that "the content of the work Op could not be estimated with the desired accuracy" (S370).

「作業予測モデル171を用いて、何らかの作業Opが行われているとは予測されなかった」ことを確認すると(S330でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S370)。つまり、第一予測部120が作業場画像Icから作業Opの内容を予測できなかった場合、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する。 When it is confirmed that "using the work prediction model 171, it was not predicted that any work Op was being performed" (NO in S330), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the contents of the work Op were not able to be estimated with the desired accuracy" (S370). In other words, if the first prediction unit 120 could not predict the contents of the work Op from the workplace image Ic, the estimation unit 160 outputs the estimation result that "the contents of the work Op were not able to be estimated with the desired accuracy."

「検知情報Idから予測された作業Opの内容と、作業予測モデル171を用いて予測された作業Opの内容とが一致しない」と判定されると(S340でNO)、推定部160は、以下の推定結果を出力する。すなわち、推定部160は、「所望の精度で推定できた作業Opの内容はない」との推定結果を出力する(S370)。 When it is determined that "the content of the work Op predicted from the detection information Id does not match the content of the work Op predicted using the work prediction model 171" (NO in S340), the estimation unit 160 outputs the following estimation result. That is, the estimation unit 160 outputs the estimation result that "the content of the work Op could not be estimated with the desired accuracy" (S370).

前述の通り、検知情報Id(工程情報Ipを含む)から予測可能な事象と、動線検出アルゴリズムによって予測可能な事象とは異なる。具体的には、作業予測部142が検知情報Idから生成する作業予測Poは、「作業者Huが行っている作業Opの内容」についての予測である。これに対して、存否予測部141が動線検出アルゴリズムを用いて生成する存否予測Paは、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」についての予測である。 As mentioned above, events that can be predicted from the detection information Id (including process information Ip) are different from events that can be predicted using a movement line detection algorithm. Specifically, the work prediction Po generated by the work prediction unit 142 from the detection information Id is a prediction of "the content of the work Op being performed by the worker Hu." In contrast, the presence/absence prediction Pa generated by the presence/absence prediction unit 141 using the movement line detection algorithm is a prediction of "whether the worker Hu is in the work area Ar captured in the work area image Ic."

そのため、情報処理装置10(特に、判定部150)は、第一予測Pf(の正否)を検証するのに、作業予測Poおよび存否予測Paの少なくとも一方を用いることができる。具体的には、判定部150は、図3に示すように、作業予測Poのみを用いて第一予測Pf(の正否)を検証してもよいし、図4に示すように、存否予測Paのみを用いて第一予測Pf(の正否)を検証してもよい。 Therefore, the information processing device 10 (particularly, the determination unit 150) can use at least one of the work prediction Po and the presence/absence prediction Pa to verify the first prediction Pf (whether it is correct or not). Specifically, the determination unit 150 may verify the first prediction Pf (whether it is correct or not) using only the work prediction Po as shown in FIG. 3, or may verify the first prediction Pf (whether it is correct or not) using only the presence/absence prediction Pa as shown in FIG. 4.

また、判定部150は、存否予測Paおよび作業予測Poの両方を用いて第一予測Pf(の正否)を検証してもよい。特に、判定部150は、図5に示すように、存否予測Paによって先ず作業者Huの存否をフィルタリングし、作業者Huが存在すると予測した場合にさらに、作業予測Poを利用して、第一予測Pf(の正否)を検証してもよい。 The determination unit 150 may also verify the first prediction Pf (whether it is correct or not) using both the presence/absence prediction Pa and the work prediction Po. In particular, as shown in FIG. 5, the determination unit 150 may first filter the presence/absence of the worker Hu using the presence/absence prediction Pa, and if it predicts that the worker Hu is present, it may further verify the first prediction Pf (whether it is correct or not) using the work prediction Po.

これまで図3、図4、および、図5を用いて説明してきた情報処理装置10の実行する処理は、以下のように整理することができる。すなわち、情報処理装置10の実行する制御方法は、「作業場Arにおいて作業者Huが行っている作業Opの内容」を推定する作業推定装置の制御方法である。情報処理装置10の実行する制御方法は、予測ステップ(S120、S220、S330)と、判定ステップ(S130、S210、S310、S340)と、推定ステップ(S140、S230、S350)とを含む。 The processing performed by the information processing device 10 described above using Figures 3, 4, and 5 can be summarized as follows. That is, the control method performed by the information processing device 10 is a control method of a work estimation device that estimates "the content of the work Op being performed by the worker Hu at the workplace Ar." The control method performed by the information processing device 10 includes prediction steps (S120, S220, S330), determination steps (S130, S210, S310, S340), and estimation steps (S140, S230, S350).

予測ステップは、作業予測モデル171を用いて、「作業場画像Ic、または、作業場画像Icから生成された特徴情報」から、「作業者Huが作業対象物Obについて行っている作業Opの内容」を予測する。作業予測モデル171は、「作業場Arを撮像した作業場画像Ic」または「作業場画像Icから生成された特徴情報」を入力とし、以下の情報を出力とする学習済モデルである。すなわち、作業予測モデル171は、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を出力とする学習済モデルである。 The prediction step predicts "the content of the work Op being performed by the worker Hu on the work object Ob" from "the workplace image Ic or the feature information generated from the workplace image Ic" using the work prediction model 171. The work prediction model 171 is a trained model that receives as input "the workplace image Ic captured of the workplace Ar" or "the feature information generated from the workplace image Ic" and outputs the following information. In other words, the work prediction model 171 is a trained model that outputs "the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic".

判定ステップは、作業予測モデル171を用いずに予測された作業Opの内容、および、作業場Arに作業者Huが存在するか否かの判定結果の少なくとも一方を用いて、予測ステップでの予測の正否を判定する。つまり、判定ステップは、作業予測Poおよび存否予測Paの少なくとも一方を用いて、第一予測Pfの正否を判定する。 The determination step determines whether the prediction in the prediction step is correct or not by using at least one of the content of the work Op predicted without using the work prediction model 171 and the determination result of whether or not the worker Hu is present in the workplace Ar. In other words, the determination step determines whether the first prediction Pf is correct or not by using at least one of the work prediction Po and the presence/absence prediction Pa.

推定ステップは、判定ステップにて「予測ステップでの予測が正しい」と判定されると、予測ステップにて予測された作業Opの内容を、「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定する。つまり、推定ステップは、作業予測Poおよび存否予測Paの少なくとも一方を用いて第一予測Pfが正しいことが検証されると、第一予測Pfを、「作業場Arにおいて作業者Huが行っている作業Opの内容」についての推定結果として出力する。 In the estimation step, if it is determined in the determination step that "the prediction in the prediction step is correct," the content of the work Op predicted in the prediction step is estimated to be "the content of the work Op being performed by the worker Hu at the workplace Ar." In other words, in the estimation step, if it is verified that the first prediction Pf is correct using at least one of the work prediction Po and the presence/absence prediction Pa, the first prediction Pf is output as an estimation result for "the content of the work Op being performed by the worker Hu at the workplace Ar."

前記の構成によれば、前記制御方法は、作業予測モデル171を用いて予測した作業Opの内容の正否を、作業予測モデル171を用いずに予測された作業Opの内容、および、作業場Arにおける作業者Huの存否の判定結果の少なくとも一方を用いて判定する。そして、前記制御方法は、作業予測モデル171を用いた予測が正しいと判定されると、作業予測モデル171を用いて予測した作業Opの内容を、「作業場Arにおいて作業者Huが行っている作業Opの内容」であると推定する。 According to the above configuration, the control method determines whether the content of the work Op predicted using the work prediction model 171 is correct or not using at least one of the content of the work Op predicted without using the work prediction model 171 and the determination result of the presence or absence of the worker Hu in the workplace Ar. Then, when it is determined that the prediction using the work prediction model 171 is correct, the control method estimates that the content of the work Op predicted using the work prediction model 171 is "the content of the work Op being performed by the worker Hu in the workplace Ar."

つまり、前記制御方法は、作業予測モデル171を用いて予測した作業Opの内容の正否を、作業予測モデル171を用いずに予測された作業Opの内容、および、作業場Arに作業者Huが存在するか否かの判定結果の少なくとも一方を用いて検証する。 In other words, the control method verifies the accuracy of the content of the work Op predicted using the work prediction model 171 using at least one of the content of the work Op predicted without using the work prediction model 171 and the determination result of whether or not a worker Hu is present in the workplace Ar.

したがって、前記制御方法は、作業場画像Icから、「作業場Arにおいて作業者Huが行っている作業Opの内容」を、高精度に推定することができるとの効果を奏する。 The control method thus has the effect of being able to estimate with high accuracy the "contents of the work Op being performed by the worker Hu in the workplace Ar" from the workplace image Ic.

(ニューラルネットワーク(NN)として実現した第一予測部および存否予測部の例)
前述の通り、第一予測部120および存否予測部141の少なくとも一方は、NNとして実現されてもよい。特に、第一予測部120および存否予測部141の少なくとも一方は、CNN(Convolution al Neural Network)またはDNN(Deep Neural Network)として、実現されてもよい。
(Example of the first prediction unit and the presence/absence prediction unit realized as a neural network (NN))
As described above, at least one of the first prediction unit 120 and the presence/absence prediction unit 141 may be realized as an NN. In particular, at least one of the first prediction unit 120 and the presence/absence prediction unit 141 may be realized as a Convolutional Neural Network (CNN) or a Deep Neural Network (DNN).

例えば、第一予測部120(作業予測モデル171)は、作業場画像Icから、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示す第一予測Pfを出力する。また、例えば、存否予測部141(存否モデル172)は、全体画像Iaから、「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を示す存否予測Paを出力する。 For example, the first prediction unit 120 (work prediction model 171) outputs a first prediction Pf from the work place image Ic, which indicates "the content of the work Op that the worker Hu captured in the work place image Ic is performing on the work object Ob captured in the work place image Ic." Also, for example, the presence/absence prediction unit 141 (presence model 172) outputs a presence/absence prediction Pa from the overall image Ia, which indicates "whether the worker Hu is in the work place Ar captured in the work place image Ic."

次に、学習済モデルである作業予測モデル171および存否モデル172を構築する学習処理について、以下に説明する。 Next, the learning process for constructing the trained models, the task prediction model 171 and the presence/absence model 172, will be described below.

(学習処理)
(作業予測モデルについて)
NNとして実現された第一予測部120は、学習済モデルである作業予測モデル171を、例えば、教師データDt1の集合である学習用データセットDS1に対する教師あり学習によって構築する。教師データDt1は、作業場画像Icに対し、少なくとも「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示す情報がラベルとして付されたデータである。「教師データ」は「学習用データ」とも呼ばれる。また、「第一予測部120が、学習用データセットDS1に対する教師あり学習によって、作業予測モデル171を構築する」処理を、「学習処理SS1」とも称する。
(Learning process)
(About the work prediction model)
The first prediction unit 120 realized as a neural network constructs an activity prediction model 171, which is a trained model, by, for example, supervised learning on a training data set DS1, which is a collection of training data Dt1. The training data Dt1 is data in which at least information indicating "the content of an activity Op being performed by a worker Hu captured in the workshop image Ic on a task object Ob captured in the workshop image Ic" is attached as a label to the workshop image Ic. The "training data" is also called "training data". In addition, the process in which "the first prediction unit 120 constructs the activity prediction model 171 by supervised learning on the training data set DS1" is also called "learning process SS1".

学習処理SS1において、NNとして実現された第一予測部120は、学習用データセットDS1に対する教師あり学習によって、作業場画像Icの入力に対して、以下の情報を出力する作業予測モデル171を、学習済モデルとして構築する。すなわち、作業予測モデル171は、作業場画像Icを入力とし、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を出力とする学習済モデルである。 In the learning process SS1, the first prediction unit 120 realized as a neural network constructs, through supervised learning on the learning dataset DS1, an operation prediction model 171 that outputs the following information in response to an input of a workplace image Ic, as a learned model. That is, the operation prediction model 171 is a learned model that receives an input of the workplace image Ic, and outputs "the content of the operation Op being performed by a worker Hu captured in the workplace image Ic on a work object Ob captured in the workplace image Ic."

つまり、教師データDt1において作業場画像Icには、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示す情報がラベルとして付されている。教師データDt1において作業場画像Icに対するラベルとして付される情報は、教師データDt1の集合である学習用データセットDS1に対する機械学習により構築される作業予測モデル171が、作業場画像Icの入力に対して出力する情報と同様である。 In other words, the workplace image Ic in the teacher data Dt1 is labeled with information indicating "the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic." The information attached as a label to the workplace image Ic in the teacher data Dt1 is the same as the information output in response to the input of the workplace image Ic by the work prediction model 171 constructed by machine learning on the learning dataset DS1, which is a collection of the teacher data Dt1.

NNとして実現された第一予測部120は、学習処理SS1によって構築した作業予測モデル171を、記憶部170に格納する。 The first prediction unit 120, implemented as a neural network, stores the task prediction model 171 constructed by the learning process SS1 in the memory unit 170.

(教師データの準備について)
図6は、教師データDt1の生成に必要なアノテーションの一例を説明する図である。図6に例示する教師データDt1において、作業場画像Icには、以下のラベル(アノテーション)が付されている。すなわち、作業場画像Icには、一点鎖線で囲んだ、「作業者Huを検出するバウンディングボックスの範囲」を示すラベルが付されている。また、作業場画像Icには、二点鎖線で囲んだ、「作業対象物Obを検出するバウンディングボックスの範囲」を示すラベルが付されている。さらに、作業場画像Icには、両端を矢印とする直線が、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示すラベルとして付されている。両端を矢印とする直線は、「作業者Huを検出するバウンディングボックスの範囲」の略中央と、「作業対象物Obを検出するバウンディングボックスの範囲」の略中央とを結んでいる。
(Regarding preparation of training data)
FIG. 6 is a diagram for explaining an example of annotations required for generating the teacher data Dt1. In the teacher data Dt1 illustrated in FIG. 6, the work place image Ic is given the following labels (annotations). That is, the work place image Ic is given a label indicating the "range of the bounding box for detecting the worker Hu" surrounded by a dashed line. In addition, the work place image Ic is given a label indicating the "range of the bounding box for detecting the work object Ob" surrounded by a dashed line. Furthermore, the work place image Ic is given a straight line with arrows on both ends as a label indicating "the content of the work Op performed by the worker Hu captured in the work place image Ic on the work object Ob captured in the work place image Ic". The straight line with arrows on both ends connects the approximate center of the "range of the bounding box for detecting the worker Hu" and the approximate center of the "range of the bounding box for detecting the work object Ob".

図6に例示するような教師データDt1の準備には、作業者Huを検出するためのバウンディングボックスの設定が不要であったとしても、作業場画像Icに対して以下の5つのアノテーションが必要となる。すなわち、作業場画像Icに対して、作業対象物Obを検出するためのバウンディングボックスの範囲を示す4点のうち、左下の点および右上の点の各々のX座標およびY座標を設定することが必要であり、つまり、4つのアノテーションが必要となる。さらに、作業場画像Icに対して、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示す1つのアノテーションが必要となる。 To prepare the training data Dt1 as exemplified in FIG. 6, the following five annotations are required for the work place image Ic, even if it is not necessary to set a bounding box for detecting the worker Hu. That is, it is necessary to set the X and Y coordinates of the lower left and upper right points of the four points that indicate the range of the bounding box for detecting the work object Ob for the work place image Ic, which means that four annotations are required. In addition, one annotation is required for the work place image Ic that indicates "the content of the work Op that the worker Hu, who is captured in the work place image Ic, is performing on the work object Ob, which is captured in the work place image Ic."

ここで、教師あり学習のためには、一般に大量の教師データDt1が必要であり、大量の教師データDt1を準備するためには、大量の作業場画像Icの各々について、上述の5つのアノテーションを行うことが必要となる。そのため、大量の作業場画像Icの各々について、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を人間に判定させようとする場合、それに要するコストは極めて大きい。 Here, supervised learning generally requires a large amount of training data Dt1, and in order to prepare a large amount of training data Dt1, it is necessary to perform the above-mentioned five annotations for each of the large number of workplace images Ic. Therefore, if a human is to be made to determine "the content of the work Op that the worker Hu captured in the workplace image Ic is performing on the work object Ob captured in the workplace image Ic" for each of the large number of workplace images Ic, the cost required for this is extremely large.

そこで、本実施形態においては、教師データDt1の準備に際して、作業場画像Icから人間が判定した「作業Opの内容」ではなく、検知情報Idから予測された「作業Opの内容」が、「作業Opの内容」を示すラベルとして、作業場画像Icに付与される。つまり、教師データDt1においては、作業場画像Icから人間が判定した「作業Opの内容」ではなく、作業予測部142が検知情報Idから予測した「作業Opの内容」が、「作業Opの内容」を示すラベルとして付されている。 Therefore, in this embodiment, when preparing the teacher data Dt1, the "contents of the work Op" predicted from the detection information Id, rather than the "contents of the work Op" determined by a human from the workplace image Ic, is attached to the workplace image Ic as a label indicating the "contents of the work Op". In other words, in the teacher data Dt1, the "contents of the work Op" predicted by the work prediction unit 142 from the detection information Id, rather than the "contents of the work Op" determined by a human from the workplace image Ic, is attached as a label indicating the "contents of the work Op".

そのため、作業予測モデル171の構築に必要となるコストは、「作業Opの内容」を示すラベルとして「作業場画像Icから人間が判定した内容」を用いる場合と比べて、大幅に抑制できる。特に、学習用データセットDS1の生成に必要なアノテーションコストは、「作業Opの内容」を示すラベルとして「作業場画像Icから人間が判定した内容」を用いる場合と比べて、大幅に抑制できる。例えば、作業場画像Icに対して必要な上述の5つのアノテーションの内の1つを、「人間による判定内容」から「作業予測部142が検知情報Idから予測した内容」へと変更するので、アノテーションコストを20%抑制することができる。 Therefore, the cost required to construct the work prediction model 171 can be significantly reduced compared to when "content determined by a human from the work site image Ic" is used as a label indicating the "content of the work Op". In particular, the annotation cost required to generate the learning dataset DS1 can be significantly reduced compared to when "content determined by a human from the work site image Ic" is used as a label indicating the "content of the work Op". For example, one of the above-mentioned five annotations required for the work site image Ic is changed from "content determined by a human" to "content predicted by the work prediction unit 142 from the detection information Id", thereby reducing the annotation cost by 20%.

例えば、或る撮像時刻Tpにおいてセルカメラ30が作業場Ar(x)を撮像して生成した作業場画像Ic(x)について、以下の「作業Op(x)の内容」が、ラベルとして付されることによって、教師データDt1(x)が生成される。すなわち、作業予測部142が検知情報Id(x)から予測した「撮像時刻Tpにおいて、作業者Hu(x)が、作業場Ar(x)で行っている作業Op(x)の内容」が、作業場画像Ic(x)に対してラベルとして付された教師データDt1(x)が生成される。検知情報Id(x)は、撮像時刻Tpにおける「作業Op(x)に用いられる工具(例えば、出力デバイス42(x)または器具90(x))、作業対象物Ob(x)、および、作業場Ar(x)の少なくとも1つの状態」を示す情報である。 For example, the following "contents of work Op(x)" are attached as labels to a work site image Ic(x) generated by the cell camera 30 capturing an image of the work site Ar(x) at a certain image capturing time Tp, thereby generating teacher data Dt1(x). That is, teacher data Dt1(x) is generated in which the "contents of work Op(x) performed by the worker Hu(x) in the work site Ar(x) at the image capturing time Tp" predicted by the work prediction unit 142 from the detection information Id(x) are attached as labels to the work site image Ic(x). The detection information Id(x) is information indicating "the tool (e.g., the output device 42(x) or the tool 90(x) used in the work Op(x), the work object Ob(x), and at least one state of the work site Ar(x)" at the image capturing time Tp.

具体的には、作業予測部142は、例えば、「撮像時刻Tpにおいて、器具90(x):電動ドライバに流れた電流の大きさ」から、「撮像時刻Tpにおいて、作業者Huが、作業場Ar(x)で作業Op(x):ネジ締め作業を行った」と予測する。この予測内容(つまり、「作業Op(x)の内容::ネジ締め作業」)が、作業場画像Ic(x)に付されることによって、教師データDt1(x)が生成される。 Specifically, the task prediction unit 142 predicts, for example, that "at the image capture time Tp, the worker Hu performed task Op(x): screw tightening in the work area Ar(x)" from "the magnitude of the current flowing through the tool 90(x): electric screwdriver at the image capture time Tp." This predicted content (i.e., "content of task Op(x): screw tightening") is added to the work area image Ic(x) to generate the teacher data Dt1(x).

これまでに説明してきたように、情報処理装置10において、作業予測モデル171は、学習用データセットDS1を用いた機械学習によって構築された学習済モデルである。学習用データセットDS1において、「作業場画像Icまたは作業場画像Icから生成された特徴情報」には、以下の情報がラベルとして付されている。すなわち、「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を検知する入力デバイス41の検知情報Idから予測された、「作業場Arにおいて作業者Huが行っている作業Opの内容」がラベルとして付されている。 As described above, in the information processing device 10, the work prediction model 171 is a trained model constructed by machine learning using the training dataset DS1. In the training dataset DS1, the "workplace image Ic or feature information generated from the workplace image Ic" is labeled with the following information. That is, the "contents of the work Op being performed by the worker Hu in the workplace Ar" predicted from the detection information Id of the input device 41 that detects "the tools used in the work Op, the work object Ob, and at least one state of the workplace Ar" is labeled.

前記の構成によれば、情報処理装置10は、入力デバイス41の検知情報Idから予測した「作業場Arにおいて作業者Huが行っている作業Opの内容」がラベルとして付された学習用データセットを用いた機械学習によって、作業予測モデル171を構築する。 According to the above configuration, the information processing device 10 constructs an operation prediction model 171 by machine learning using a learning dataset labeled with the "contents of the operation Op being performed by the worker Hu in the workplace Ar" predicted from the detection information Id of the input device 41.

教師あり学習のためには、大量の教師データ(学習用データセット)が必要であることが知られており、そのような教師データの生成に必要なラベリング作業、および、教師データに付されているラベル(メタデータ)は、「アノテーション」とも呼ばれる。 It is known that supervised learning requires a large amount of training data (training dataset), and the labeling process required to generate such training data and the labels (metadata) attached to the training data are also called "annotations."

例えば、作業予測モデル171の構築に際して学習される教師データDt1には、作業者Huを検出するためのバウンディングボックス(Bounding Box)の設定が不要であったとしても、作業場画像Icに対して以下の5つのアノテーションが必要となる。すなわち、作業場画像Icに対して、作業対象物Obを検出するためのバウンディングボックスの範囲を示す4点のうち、左下の点および右上の点の各々のX座標およびY座標を設定することが必要であり、つまり、4つのアノテーションが必要となる。さらに、作業場画像Icに対して、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を示す情報(ラベル)の付与が必要であり、つまり、1つのアノテーションが必要となる。 For example, even if the teacher data Dt1 learned when constructing the work prediction model 171 does not require the setting of a bounding box for detecting the worker Hu, the following five annotations are required for the work place image Ic. That is, it is necessary to set the X and Y coordinates of the lower left and upper right points of the four points that indicate the range of the bounding box for detecting the work object Ob for the work place image Ic, that is, four annotations are required. Furthermore, it is necessary to assign information (label) to the work place image Ic that indicates "the content of the work Op that the worker Hu, who is captured in the work place image Ic, is performing on the work object Ob, which is captured in the work place image Ic," that is, one annotation is required.

そして、大量の作業場画像Icの各々について、「作業場画像Icに撮像されている作業者Huが、作業場画像Icに撮像されている作業対象物Obについて行っている作業Opの内容」を人間に判定させようとする場合、それに要するコストは極めて大きい。 The cost of having a human determine "the content of the work Op being performed by the worker Hu captured in the workplace image Ic on the work object Ob captured in the workplace image Ic" for each of the large number of workplace images Ic is extremely high.

そこで、教師データDt1の生成に際しては、作業場画像Icから人間が判定した「作業Opの内容」ではなく、入力デバイス41の検知情報Idから予測された「作業Opの内容」が、「作業Opの内容」を示すラベルとして付与される。つまり、教師データDt1においては、作業場画像Icから人間が判定した「作業Opの内容」ではなく、入力デバイス41の検知情報Idから予測された「作業Opの内容」が、「作業Opの内容」を示すラベルとして付されている。 Therefore, when generating the teacher data Dt1, the "contents of the work Op" predicted from the detection information Id of the input device 41 is assigned as a label indicating the "contents of the work Op", rather than the "contents of the work Op" determined by a human from the workplace image Ic. In other words, in the teacher data Dt1, the "contents of the work Op" predicted from the detection information Id of the input device 41 is assigned as a label indicating the "contents of the work Op", rather than the "contents of the work Op" determined by a human from the workplace image Ic.

そのため、作業予測モデル171の構築に必要となるコストは、「作業Opの内容」を示すラベルとして「作業場画像Icから人間が判定した内容」を用いる場合と比べて、大幅に抑制できる。特に、学習用データセットDS1の生成に必要なアノテーションコストは、「作業Opの内容」を示すラベルとして「作業場画像Icから人間が判定した内容」を用いる場合と比べて、大幅に抑制できる。例えば、作業場画像Icに対して必要な上述の5つのアノテーションの内の1つを、「人間による判定内容」から「情報処理装置10等の装置が検知情報Idから予測した内容」へと変更するので、アノテーションコストを20%抑制することができる。 Therefore, the cost required to construct the work prediction model 171 can be significantly reduced compared to when "content determined by a human from the work site image Ic" is used as a label indicating the "content of the work Op". In particular, the annotation cost required to generate the learning dataset DS1 can be significantly reduced compared to when "content determined by a human from the work site image Ic" is used as a label indicating the "content of the work Op". For example, one of the above-mentioned five annotations required for the work site image Ic is changed from "content determined by a human" to "content predicted by a device such as the information processing device 10 from the detection information Id", thereby reducing the annotation cost by 20%.

したがって、前記の構成によれば、情報処理装置10は、アノテーションコストが大幅に抑制された作業予測モデル171を用いて、作業場画像Icから、「作業者Huが行っている作業Opの内容」を、高精度に推定することができるとの効果を奏する。 Therefore, according to the above configuration, the information processing device 10 has the effect of being able to estimate with high accuracy the "contents of the work Op being performed by the worker Hu" from the workplace image Ic using the work prediction model 171 in which annotation costs are significantly reduced.

(存否モデルについて)
NNとして実現された存否予測部141は、学習済モデルである存否モデル172を、例えば、教師データDt2の集合であるデータセットDS2に対する教師あり学習によって構築する。教師データDt2は、全体画像Iaに対し、「作業場Ar(より正確には、工場Faにおける複数の作業場Arの各々)に作業者Huが居るか」を示す情報がラベルとして付されたデータである。「存否予測部141が、データセットDS2に対する教師あり学習によって、存否モデル172を構築する」処理を、「学習処理SS2」とも称する。
(Regarding the existence model)
The presence/absence prediction unit 141 realized as a neural network constructs the presence/absence model 172, which is a trained model, by, for example, supervised learning on a data set DS2, which is a collection of teacher data Dt2. The teacher data Dt2 is data in which information indicating "whether a worker Hu is present in a workplace Ar (more precisely, in each of the multiple workplaces Ar in the factory Fa)" is attached as a label to the entire image Ia. The process in which "the presence/absence prediction unit 141 constructs the presence/absence model 172 by supervised learning on the data set DS2" is also referred to as "learning process SS2".

学習処理SS2において、NNとして実現された存否予測部141は、データセットDS2に対する教師あり学習によって、全体画像Iaの入力に対して、以下の情報を出力する存否モデル172を、学習済モデルとして構築する。すなわち、存否モデル172は、全体画像Iaを入力とし、「作業場Ar(より正確には、工場Faにおける複数の作業場Arの各々)に作業者Huが居るか」を出力とする学習済モデルである。 In the learning process SS2, the presence/absence prediction unit 141 implemented as a neural network constructs, through supervised learning on the dataset DS2, a presence/absence model 172 that outputs the following information in response to an input of the entire image Ia, as a learned model. That is, the presence/absence model 172 is a learned model that receives an input of the entire image Ia and outputs "whether a worker Hu is present in the workplace Ar (more precisely, in each of the multiple workplaces Ar in the factory Fa)."

つまり、教師データDt2において全体画像Iaには、「作業場Ar(より正確には、工場Faにおける複数の作業場Arの各々)に作業者Huが居るか」を示す情報がラベルとして付されている。教師データDt2において全体画像Iaに対するラベルとして付される情報は、教師データDt2の集合であるデータセットDS2に対する機械学習により構築される存否モデル172が、全体画像Iaの入力に対して出力する情報と同様である。 In other words, in the teacher data Dt2, the whole image Ia is labeled with information indicating whether a worker Hu is present in the work area Ar (more precisely, in each of the multiple work areas Ar in the factory Fa). The information labeled for the whole image Ia in the teacher data Dt2 is the same as the information output by the presence/absence model 172 constructed by machine learning for the dataset DS2, which is a collection of the teacher data Dt2, in response to the input of the whole image Ia.

NNとして実現された存否予測部141は、学習処理SS2によって構築した存否モデル172を、記憶部170に格納する。 The presence/absence prediction unit 141, implemented as a neural network, stores the presence/absence model 172 constructed by the learning process SS2 in the memory unit 170.

ただし、存否予測部141が学習処理SS2によって存否モデル172を構築することは必須ではない。存否予測部141は、動線検出アルゴリズムに用いられる一般的な学習済モデルを存否モデル172として用いて、全体画像Iaから「作業場Ar(より正確には、工場Faにおける複数の作業場Arの各々)に作業者Huが居るか」を予測してもよい。 However, it is not essential that the presence/absence prediction unit 141 constructs the presence/absence model 172 by the learning process SS2. The presence/absence prediction unit 141 may use a general learned model used in a traffic line detection algorithm as the presence/absence model 172 to predict "whether a worker Hu is in the workplace Ar (more precisely, in each of the multiple workplaces Ar in the factory Fa)" from the overall image Ia.

§4.変形例
(機械学習について)
これまで、教師ありデータに対する機械学習によって、学習済データとして作業予測モデル171および存否モデル172を構築する例を説明してきた。しかしながら、作業予測モデル171および存否モデル172を構築するための機械学習は、教師ありデータに対する機械学習に限られない。作業予測モデル171および存否モデル172を構築するための機械学習は、教師あり学習に限らず、教師なし学習、または、強化学習等の他の機械学習であってもよい。
§4. Variations (machine learning)
So far, an example has been described in which the task prediction model 171 and the presence/absence model 172 are constructed as learned data by machine learning on supervised data. However, the machine learning for constructing the task prediction model 171 and the presence/absence model 172 is not limited to machine learning on supervised data. The machine learning for constructing the task prediction model 171 and the presence/absence model 172 is not limited to supervised learning, and may be other machine learning such as unsupervised learning or reinforcement learning.

(全体画像について)
これまで、存否予測部141が、全体画像Iaから「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測する例を説明してきた。しかしながら、存否予測部141は、作業場画像Icから「作業場画像Icに撮像されている作業場Arに作業者Huが居るか」を予測してもよい。すなわち、情報処理装置10が、作業場画像Icとは別に全体画像Iaを取得することは必須ではない。情報処理装置10(特に、判定部150)は、作業場画像Icから生成した第一予測Pfの正否を、全体画像Iaおよび作業場画像Icの少なくとも一方から生成された存否予測Paによって検証することができる。例えば、判定部150は、全体画像Iaおよび作業場画像Ic(x)の少なくとも一方から生成された存否予測Pa(x)が「作業場Ar(x)に作業者Huが存在する」との予測であると、「第一予測Pf(x)は正しい」と判定する。
(About the whole image)
So far, an example has been described in which the presence/absence prediction unit 141 predicts "whether the worker Hu is in the workplace Ar captured in the workplace image Ic" from the entire image Ia. However, the presence/absence prediction unit 141 may predict "whether the worker Hu is in the workplace Ar captured in the workplace image Ic" from the workplace image Ic. That is, it is not essential for the information processing device 10 to acquire the entire image Ia separately from the workplace image Ic. The information processing device 10 (particularly, the determination unit 150) can verify the correctness of the first prediction Pf generated from the workplace image Ic by the presence/absence prediction Pa generated from at least one of the entire image Ia and the workplace image Ic. For example, if the presence/absence prediction Pa(x) generated from at least one of the entire image Ia and the workplace image Ic(x) is a prediction that "the worker Hu is present in the workplace Ar(x)", the determination unit 150 determines that "the first prediction Pf(x) is correct".

(作業予測について)
これまで、検知情報Idから、「作業者Huが行っている作業Opの内容」を予測する主体が、情報処理装置10である例を説明してきた。すなわち、作業予測部142が、検知情報Idから、「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を把握し、把握した状態から、作業予測Poを生成する例を説明してきた。
(Regarding work forecasts)
So far, an example has been described in which the information processing device 10 is the entity that predicts "the contents of the work Op being performed by the worker Hu" from the detection information Id. That is, an example has been described in which the work prediction unit 142 grasps "at least one state of the tool used in the work Op, the work target Ob, and the work site Ar" from the detection information Id, and generates a work prediction Po from the grasped state.

しかしながら、検知情報Idから「作業Opに用いられる工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態」を把握し、把握した状態から、「作業者Huが行っている作業Opの内容」を予測する主体は、情報処理装置10でなくともよい。情報処理装置10は、工具、作業対象物Ob、および、作業場Arの少なくとも1つの状態から予測される「作業者Huが行っている作業Opの内容」を取得または生成できればよい。 However, the entity that grasps "at least one state of the tool used in the work Op, the work object Ob, and the work area Ar" from the detection information Id and predicts "the content of the work Op being performed by the worker Hu" from the grasped state does not have to be the information processing device 10. It is sufficient for the information processing device 10 to acquire or generate "the content of the work Op being performed by the worker Hu" predicted from at least one state of the tool, the work object Ob, and the work area Ar.

例えば、PLC20が、検知情報Idから作業予測Poを生成してもよい。その場合、情報処理装置10(特に、検知情報取得部132)は、PLC20から、PLC20が実行した予測の結果を、つまり、作業予測Poを取得する。そして、判定部150は、PLC20の生成した作業予測Poを用いて、第一予測Pf(の正否)を検証する。 For example, the PLC 20 may generate a work prediction Po from the detection information Id. In this case, the information processing device 10 (particularly the detection information acquisition unit 132) acquires the result of the prediction performed by the PLC 20, that is, the work prediction Po, from the PLC 20. The determination unit 150 then uses the work prediction Po generated by the PLC 20 to verify the first prediction Pf (whether it is correct or not).

つまり、情報処理装置10(特に、判定部150)が第一予測Pf(の正否)を検証するために作業予測Poを用いる場合、検知情報Idから作業予測Poを生成する主体は、情報処理装置10であってもよいし、情報処理装置10でなくともよい。 In other words, when the information processing device 10 (particularly the determination unit 150) uses the work prediction Po to verify the first prediction Pf (whether it is correct or not), the entity that generates the work prediction Po from the detection information Id may be the information processing device 10, or it may not be the information processing device 10.

(第二予測について)
これまで、情報処理装置10が存否予測部141と作業予測部142とを共に備える例を説明してきたが、情報処理装置10が存否予測部141と作業予測部142とを共に備えることは必須ではない。判定部150は、第一予測Pf(の正否)を、第二予測Psを用いて検証できればよく、つまり、第一予測Pf(の正否)を、存否予測Paおよび作業予測Poの少なくとも一方を用いて検証できればよい。そのため、第一予測Pf(の正否)の検証に存否予測Paを用いない場合、情報処理装置10は、存否予測部141を備えなくともよい。また、第一予測Pf(の正否)の検証に作業予測Poを用いない場合、情報処理装置10は、作業予測部142を備えなくともよい。
(Regarding the second prediction)
Up to this point, an example has been described in which the information processing device 10 includes both the presence/absence prediction unit 141 and the work prediction unit 142, but it is not essential that the information processing device 10 includes both the presence/absence prediction unit 141 and the work prediction unit 142. The determination unit 150 only needs to be able to verify the first prediction Pf (whether it is correct or not) using the second prediction Ps, that is, it only needs to be able to verify the first prediction Pf (whether it is correct or not) using at least one of the presence/absence prediction Pa and the work prediction Po. Therefore, if the presence/absence prediction Pa is not used to verify the first prediction Pf (whether it is correct or not), the information processing device 10 does not need to include the presence/absence prediction unit 141. Also, if the work prediction Po is not used to verify the first prediction Pf (whether it is correct or not), the information processing device 10 does not need to include the work prediction unit 142.

〔ソフトウェアによる実現例〕
情報処理装置10の機能ブロック(具体的には、第一取得部110、第一予測部120、第二取得部130、第二予測部140、判定部150、および推定部160)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよい。また、これらの機能ブロックは、CPU、GPU、DSP等を用いてソフトウェアによって実現してもよい。
[Software implementation example]
The functional blocks of the information processing device 10 (specifically, the first acquisition unit 110, the first prediction unit 120, the second acquisition unit 130, the second prediction unit 140, the determination unit 150, and the estimation unit 160) may be realized by a logic circuit (hardware) formed in an integrated circuit (IC chip) or the like. Furthermore, these functional blocks may be realized by software using a CPU, a GPU, a DSP, or the like.

後者の場合、情報処理装置10は、各々、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、GPU、DSP等と、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROMまたは記憶装置(これらを「記録媒体」と称する)と、上記プログラムを展開するRAM等とを備えている。そして、コンピュータ(またはCPU、GPU、DSP等)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路等を用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。 In the latter case, the information processing device 10 includes a CPU, GPU, DSP, etc. that executes the commands of a program, which is software that realizes each function, a ROM or storage device (these are referred to as "recording media") in which the program and various data are recorded so as to be readable by a computer (or CPU), and a RAM or the like that deploys the program. The object of the present invention is achieved by having the computer (or CPU, GPU, DSP, etc.) read and execute the program from the recording media. The recording media may be "non-transient tangible media," such as tapes, disks, cards, semiconductor memories, programmable logic circuits, etc. The program may also be supplied to the computer via any transmission medium (such as a communication network or broadcast waves) that can transmit the program. The present invention may also be realized in the form of a data signal embedded in a carrier wave in which the program is embodied by electronic transmission.

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。 The present invention is not limited to the above-described embodiments, and various modifications are possible within the scope of the claims. The technical scope of the present invention also includes embodiments obtained by appropriately combining the technical means disclosed in different embodiments.

10 情報処理装置(作業推定装置)
41 入力デバイス(センサ)
42 出力デバイス(工具)
90 器具(工具)
120 第一予測部(予測部)
141 存否予測部
142 作業予測部(作業検知部)
150 判定部
160 推定部
171 作業予測モデル
172 存否モデル
Ar 作業場
DS1 学習用データセット
Hu 作業者
Ia 全体画像
Ic 作業場画像
Id 検知情報
Ob 作業対象物
Op 作業
S120 (予測ステップ)
S130 (判定ステップ)
S140 (推定ステップ)
S210 (判定ステップ)
S220 (予測ステップ)
S230 (推定ステップ)
S310 (判定ステップ)
S330 (予測ステップ)
S340 (判定ステップ)
S350 (推定ステップ)
10 Information processing device (work estimation device)
41 Input device (sensor)
42 Output device (tool)
90 Tools
120 First prediction unit (prediction unit)
141 Presence prediction unit 142 Work prediction unit (work detection unit)
150 Determination unit 160 Estimation unit 171 Work prediction model 172 Presence model Ar Work place DS1 Learning data set Hu Worker Ia Whole image Ic Work place image Id Detection information Ob Work object Op Work S120 (Prediction step)
S130 (Determination step)
S140 (Estimation step)
S210 (Determination step)
S220 (Prediction step)
S230 (Estimation step)
S310 (Determination step)
S330 (Prediction step)
S340 (Determination step)
S350 (Estimation step)

Claims (6)

作業場において作業者が行っている作業の内容を推定する作業推定装置であって、
前記作業場を撮像した作業場画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場画像に撮像されている前記作業者が、前記作業場画像に撮像されている作業対象物について行っている作業の内容を出力とする学習済モデルである作業予測モデルを用いて、前記作業場画像または前記特徴情報から、前記作業者が前記作業対象物について行っている作業の内容を予測する予測部と、
前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場に前記作業者が存在するか否かの判定結果の少なくとも一方を用いて、前記予測部の予測の正否を判定する判定部と、
前記判定部によって前記予測部の予測が正しいと判定されると、前記予測部によって予測された前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容として推定する推定部と、
を備えるとともに、
(A)前記作業場を含む複数の作業場を撮像した全体画像を入力、または、(B)前記作業場画像を入力、または、(C)前記全体画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場に前記作業者が存在するか否かを出力とする学習済モデルである存否モデルを用いて、前記全体画像、または、前記作業場画像、または、前記全体画像または前記作業場画像から生成された特徴情報から、前記作業場に前記作業者が存在するか否かを予測する存否予測部をさらに備え、
前記判定部は、前記存否予測部によって前記作業場に前記作業者が存在すると予測されると、前記予測部の予測が正しいと判定する、作業推定装置。
A task estimation device that estimates the content of a task performed by a worker in a workplace,
a prediction unit that predicts the content of the work that the worker is performing on the work object, based on the workplace image or the feature information, using a work prediction model that is a trained model that receives an input of a workplace image obtained by capturing an image of the workplace or feature information generated from the workplace image, and outputs the content of the work that the worker, who is captured in the workplace image, is performing on the work object, which is captured in the workplace image, from the workplace image or the feature information;
a determination unit that determines whether the prediction by the prediction unit is correct or not, using at least one of the work content predicted without using the work prediction model and a determination result of whether the worker is present in the work area; and
an estimation unit that, when the determination unit determines that the prediction by the prediction unit is correct, estimates the content of the work predicted by the prediction unit as the content of the work being performed by the worker in the workplace; and
In addition to providing
a presence/absence prediction unit that predicts whether the worker is present in the workplace from the overall image, or the workplace image , or the feature information generated from the overall image or the workplace image, using a presence/absence model that is a trained model that inputs (A) an overall image of a plurality of workplaces including the workplace, or (B) an image of the workplace, or (C) feature information generated from the overall image or the workplace image, and outputs whether the worker is present in the workplace,
The determination unit determines that the prediction by the presence prediction unit is correct when the presence prediction unit predicts that the worker is present in the work area.
前記作業に用いられる工具、前記作業対象物、および、前記作業場の少なくとも1つの状態を検知するセンサの検知情報から、前記作業場において前記作業者が行っている前記作業の内容を予測する作業検知部、
をさらに備え、
前記判定部は、前記存否予測部によって前記作業場に前記作業者が存在すると予測され、かつ、前記予測部によって予測された前記作業の内容と、前記作業検知部によって予測された前記作業の内容とが一致すると、前記予測部の予測が正しいと判定する
請求項1に記載の作業推定装置。
a work detection unit that predicts the content of the work being performed by the worker in the work area based on detection information from a sensor that detects at least one state of a tool used in the work, the work object, and the work area;
Further equipped with
2. The work estimation device according to claim 1, wherein the determination unit determines that the prediction by the prediction unit is correct when the presence prediction unit predicts that the worker is present in the work area and the content of the work predicted by the prediction unit matches the content of the work predicted by the work detection unit.
前記作業予測モデルは、前記作業に用いられる工具、前記作業対象物、および、前記作業場の少なくとも1つの状態を検知するセンサの検知情報から予測された、前記作業場において前記作業者が行っている前記作業の内容が、前記作業場画像または前記作業場画像から生成された特徴情報に対してラベルとして付された学習用データセットを用いた機械学習によって、構築される
請求項1または2に記載の作業推定装置。
3. The work estimation device according to claim 1 or 2, wherein the work prediction model is constructed by machine learning using a learning dataset in which content of the work being performed by the worker in the workplace, predicted from detection information of a sensor that detects at least one state of a tool used in the work, the work object, and the workplace, is assigned as a label to the workplace image or feature information generated from the workplace image.
作業場において作業者が行っている作業の内容を推定する作業推定装置の制御方法であって、
前記作業場を撮像した作業場画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場画像に撮像されている前記作業者が、前記作業場画像に撮像されている作業対象物について行っている作業の内容を出力とする学習済モデルである作業予測モデルを用いて、前記作業場画像または前記特徴情報から、前記作業者が前記作業対象物について行っている作業の内容を予測する予測ステップと、
前記作業予測モデルを用いずに予測された前記作業の内容、および、前記作業場に前記作業者が存在するか否かの判定結果の少なくとも一方を用いて、前記予測ステップでの予測の正否を判定する判定ステップと、
前記判定ステップにて前記予測ステップでの予測が正しいと判定されると、前記予測ステップにて予測された前記作業の内容を、前記作業場において前記作業者が行っている前記作業の内容として推定する推定ステップと、
を含むとともに、
(A)前記作業場を含む複数の作業場を撮像した全体画像を入力、または、(B)前記作業場画像を入力、または、(C)前記全体画像または前記作業場画像から生成された特徴情報を入力とし、前記作業場に前記作業者が存在するか否かを出力とする学習済モデルである存否モデルを用いて、前記全体画像、または、前記作業場画像、または、前記全体画像または前記作業場画像から生成された特徴情報から、前記作業場に前記作業者が存在するか否かを予測する存否予測ステップをさらに含み、
前記判定ステップは、前記存否予測ステップによって前記作業場に前記作業者が存在すると予測されると、前記予測ステップの予測が正しいと判定する、制御方法。
A control method for an activity estimation device that estimates the content of an activity being performed by a worker in a workplace, comprising:
a prediction step of predicting the content of the work being performed by the worker on the work object, based on the workplace image or the feature information, using a work prediction model which is a trained model that receives an input of a workplace image of the workplace or feature information generated from the workplace image and outputs the content of the work being performed by the worker, whose image is captured in the workplace image, on the work object, whose image is captured in the workplace image;
a determination step of determining whether the prediction in the prediction step is correct or not, using at least one of the work content predicted without using the work prediction model and a determination result of whether the worker is present in the work area;
an estimation step of estimating, when it is determined in the determination step that the prediction in the prediction step is correct, the content of the work predicted in the prediction step as the content of the work being performed by the worker in the workplace;
Including,
(A) an overall image of a plurality of workplaces including the workplace is input , or (B) the workplace image is input, or (C) feature information generated from the overall image or the workplace image is input, and a presence/absence model is used as a trained model that outputs whether the worker is present in the workplace from the overall image, or the workplace image, or the feature information generated from the overall image or the workplace image,
The control method, wherein the judging step judges that the prediction made in the predicting step is correct when the presence of the worker in the work area is predicted by the presence predicting step.
請求項1から3のいずれか1項に記載の作業推定装置としてコンピュータを機能させるための情報処理プログラムであって、前記各部としてコンピュータを機能させるための情報処理プログラム。 An information processing program for causing a computer to function as the task estimation device according to any one of claims 1 to 3, the information processing program causing the computer to function as each of the units. 請求項5に記載の情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium having the information processing program according to claim 5 recorded thereon.
JP2021009138A 2021-01-22 2021-01-22 WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM Active JP7654983B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021009138A JP7654983B2 (en) 2021-01-22 2021-01-22 WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM
PCT/JP2021/007816 WO2022157988A1 (en) 2021-01-22 2021-03-02 Work estimation device, control method for work estimation device, information processing program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021009138A JP7654983B2 (en) 2021-01-22 2021-01-22 WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM

Publications (2)

Publication Number Publication Date
JP2022113042A JP2022113042A (en) 2022-08-03
JP7654983B2 true JP7654983B2 (en) 2025-04-02

Family

ID=82548611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021009138A Active JP7654983B2 (en) 2021-01-22 2021-01-22 WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM

Country Status (2)

Country Link
JP (1) JP7654983B2 (en)
WO (1) WO2022157988A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024025410A (en) * 2022-08-12 2024-02-26 三菱重工業株式会社 Work classification device, work classification method, program and learning device
WO2024085159A1 (en) 2022-10-18 2024-04-25 ソフトバンクグループ株式会社 Work robot adjustment method, sensing system, sensing method, mobile robot, operation modification system, operation modification method, work robot, work reproduction system, work reproduction method, work mastering system, work mastering method, and work reproducing robot

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019012328A (en) 2017-06-29 2019-01-24 株式会社 日立産業制御ソリューションズ Human behavior estimation system
JP2019125013A (en) 2018-01-12 2019-07-25 コニカミノルタ株式会社 Production management system and production management program
JP2019197373A (en) 2018-05-09 2019-11-14 高砂熱学工業株式会社 Notification device, information processing device, information processing system, information processing method, and information processing program
JP6789590B1 (en) 2020-08-14 2020-11-25 株式会社キャッシュフローリノベーション Productivity improvement system and productivity improvement method
JP2020204819A (en) 2019-06-14 2020-12-24 オムロン株式会社 Information processing equipment, information processing methods, information processing programs, and recording media

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3832582B1 (en) * 2018-07-30 2025-03-05 Hitachi, Ltd. Work information management system and work information management method
JP7300617B2 (en) * 2018-12-27 2023-06-30 パナソニックIpマネジメント株式会社 WORK SUPPORT DEVICE, WORK SUPPORT METHOD, AND PROGRAM

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019012328A (en) 2017-06-29 2019-01-24 株式会社 日立産業制御ソリューションズ Human behavior estimation system
JP2019125013A (en) 2018-01-12 2019-07-25 コニカミノルタ株式会社 Production management system and production management program
JP2019197373A (en) 2018-05-09 2019-11-14 高砂熱学工業株式会社 Notification device, information processing device, information processing system, information processing method, and information processing program
JP2020204819A (en) 2019-06-14 2020-12-24 オムロン株式会社 Information processing equipment, information processing methods, information processing programs, and recording media
JP6789590B1 (en) 2020-08-14 2020-11-25 株式会社キャッシュフローリノベーション Productivity improvement system and productivity improvement method

Also Published As

Publication number Publication date
WO2022157988A1 (en) 2022-07-28
JP2022113042A (en) 2022-08-03

Similar Documents

Publication Publication Date Title
JP6450858B2 (en) Equipment management apparatus and method
CN113767407B (en) Information processing device, information processing method, and recording medium
JP6977686B2 (en) Control system and control unit
CN111308925B (en) Information processing device, production instruction support method
US12277143B2 (en) Apparatus, method, and computer readable medium for evaluating the state of a facility
CN107850891A (en) Management system and management program
CN107924178A (en) Management system and management program
US20230289568A1 (en) Providing an alarm relating to an accuracy of a trained function method and system
JP7654983B2 (en) WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM
JP7660586B2 (en) Industrial system, anomaly detection system, and anomaly detection method
JP2019067278A (en) Identification code reader and machine learning apparatus
US20230027840A1 (en) Anomaly detecting method in sequence of control segment of automation equipment using graph autoencoder
US11138805B2 (en) Quantitative quality assurance for mixed reality
Chu et al. Enhancing manual inspection in semiconductor manufacturing with integrated augmented reality solutions
JP7502448B2 (en) Inspection Equipment
WO2020252666A1 (en) Edge computing device and method for industrial internet of things, and computer-readable storage medium
WO2022234678A1 (en) Machine learning device, classification device, and control device
CN116079498A (en) Method for identifying abnormal signals of cutter
WO2016079833A1 (en) Abnormality detection device, abnormality detection method, and abnormality detection program
JP7559511B2 (en) WORK ESTIMATION DEVICE, CONTROL METHOD FOR WORK ESTIMATION DEVICE, INFORMATION PROCESSING PROGRAM, AND RECORDING MEDIUM
CN115617023B (en) Spacecraft attitude control system abnormity positioning method and device
JP2021086219A (en) Cooperative work system, analysis and collection device, and analysis program
CN116583798A (en) Abnormal classification device
CN117718949B (en) Real-time data management system and method for wafer transfer robotic arms based on digital twins
CN120045879A (en) Material flow speed prediction method, material flow speed early warning medium and material flow speed early warning system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250303

R150 Certificate of patent or registration of utility model

Ref document number: 7654983

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150